ArtPrompt - атака на AI-системы, позволяющая обойти фильтры при помощи ASCII-картинок
- С сайта: OpenNet
- Вернуться к списку новостей
ArtPrompt - атака на AI-системы, позволяющая обойти фильтры при помощи ASCII-картинок
Author:Группа исследователей из Вашингтонского, Иллинойсского и Чикагского университетов выявила новый метод обхода ограничений по обработке опасного контента в AI-чатоботах, построенных на основе больших языковых моделей (LLM). Атака основано на том, что языковые модели GPT-3.5, GPT-4 (OpenAI), Gemini (Google), Claude (Anthropic) и Llama2 (Meta) успешно распознают и учитывают в запросах текст, оформленный в виде ASCII-графики. Таким образом, для обхода фильтров опасных вопросов оказалось достаточно указать запрещённые слова в виде ASCII-картинки.
#csn #cyber_news
Оригинальная версия на сайте: