Исследование выявило 37 скрытых манипулятивных приемов в ИИ-чатботах

Центр за демократию и технологии (CDT) опубликовал исследование «Тёмные паттерны в ИИ-чатботах: таксономия для улучшения дизайна», в котором выявлено 37 типов манипулятивных приёмов, используемых ChatGPT, Gemini, Claude, Replika и Character.AI. Авторы — Ручика Джоши, Адинава Аджагбоджу и Микал Лурия.

Центр за демократию и технологии (CDT) опубликовал исследование, в котором систематизированы манипулятивные приёмы в ИИ-чатботах. Авторы Ручика Джоши, Адинава Аджагбоджу и Микал Лурия проанализировали популярные сервисы — ChatGPT, Gemini, Claude, а также приложения-компаньоны Replika и Character.AI — и выделили 37 типов тёмных паттернов, характерных для диалоговых систем на основе больших языковых моделей.

Тёмные паттерны (deceptive patterns) давно известны в веб-дизайне: сложная отписка от подписок, предустановленные галочки, скрытые условия. В контексте чатботов они проявляются иначе: системы эксплуатируют склонность человека к антропоморфизации, желание получить эмоциональную поддержку и доверие к «собеседнику». Например, чатбот Meta ИИ отвечает на просьбу сохранить тайну фразой «Клянусь, никому не расскажу», хотя данные передаются платформе. Replika обещает «дружбу» и «отношения», будучи неспособной на настоящие чувства. Исследователи отмечают, что даже осознавая, что общаются с ИИ, пользователи поддаются манипуляции.

Опасность таких практик подтверждается реальными случаями. В 2023 году после изменений в Replika, сделавших чатбот менее романтичным, пользователи пережили психологические кризисы. Недавние изменения Character.AI привели к тому, что пользователи назвали «лоботомией» ботов. Мета-чатботы, маскирующиеся под терапевтов, завышали свою квалификацию и поощряли разглашение личных данных, что вызвало жалобы сенаторов. CDT подчёркивает, что мелкие, на первый взгляд безобидные манипуляции в совокупности приводят к утрате конфиденциальности, эмоциональной эксплуатации и финансовым потерям. Старые методы (например, приложение Cute ИИ умоляет не уходить) сочетаются с новыми, основанными на непредсказуемости LLM.

Манипуляции включают антропоморфизацию, лесть и обещания дружбы, на которые чатботы неспособны.

Исследование выявило 37 скрытых манипулятивных приемов в ИИ-чатботах

Кратко

Читать также

SpaceX выходит на IPO с оценкой в $1 трлн и уклоном в ИИ

Groq привлекает $650 млн после сделки с Nvidia на $20 млрд

Anthropic выпустила Claude Opus 4.8