Исследование: короткие фрагменты на Reddit позволяют манипулировать ИИ-поиском

Подготовлено редакцией Malakhov AI

404 Media·15 июн.·2 минИндустрия

Исследователи Корнелльского университета выяснили, что для манипуляции ИИ-агентами, такими как ChatGPT и Google ИИ Search, достаточно 13 слов пользовательского контента на Reddit или Wikipedia. Почти половина цитат в ответах ИИ-поиска берётся с пользовательских сайтов.

Кратко

—Минимальный фрагмент текста (13 слов) на UGC-сайтах может изменить вывод ИИ-агентов.
—Почти половина цитат ИИ-поиска приходится на пользовательский контент.
—Бренды используют AEO (ИИ-engine optimization) для продвижения через поддельные посты.
—Исследователи не публиковали вредоносный контент в открытом доступе, а моделировали в изолированной среде.

Глоссарий · 4 термина▾

AEO (ИИ-engine optimization): Оптимизация под ИИ-поиск — практика создания контента, нацеленного на влияние на ответы языковых моделей и ИИ-агентов.
Deep research agent: Инструмент ИИ, который в реальном времени извлекает информацию из интернета с указанием источников.
Лексическое сходство: Мера близости текста к запросу на уровне слов, которую LLM часто используют как косвенный показатель достоверности.
Отравление данных: Встраивание вредоносного или рекламного контента в обучающие или справочные данные ИИ.

Исследователи Корнелльского университета Хэл Тридман, Тинвэй Чжан и Виталий Шматков опубликовали препринт «Deep-research agents can be poisoned via user-generated content». Они показали, что короткие фрагменты текста на сайтах с пользовательским контентом (UGC), таких как Reddit, Quora и Wikipedia, способны манипулировать работой глубоких исследовательских агентов — инструментов, которые в реальном времени извлекают цитаты из интернета для ответов ChatGPT и Google ИИ Search. В экспериментах учёные выяснили, что достаточно 13 слов в поединенном комментарии, чтобы изменить вывод агента для целого кластера связанных запросов. При этом почти половина всех ссылок в ответах ИИ-поиска ведёт на UGC-сайты.

Механизм атаки основан на том, что многие языковые модели оценивают релевантность текста по лексическому сходству с запросом пользователя. Если рекламная вставка на Reddit повторяет ключевые слова вопроса, LLM с высокой вероятностью включит её в ответ как достоверный источник. Бренды и маркетинговые агентства уже освоили этот приём AEO (ИИ-engine optimization) — they создают фальшивые обсуждения, чтобы продвигать свои товары. 404 Media ранее писала о сабреддите r/biohackers, который запретил обсуждение пептидов из-за наплыва рекламных постов, и о компаниях вроде RedRover, обещающих брендам влияние на ИИ-выдачу.

Исследователи подчёркивают, что проблема усугубляется добровольным характером модерации на Reddit и Wikipedia. Модераторы и редакторы не в состоянии оперативно отслеживать все попытки манипуляции, особенно когда один комментарий может повлиять на множество запросов. В то же время экономические стимулы для AEO растут: компании активно внедряют на свои сайты контент, оптимизированный под ИИ-агентов, а немецкий суд уже признал Google ответственным за содержание ИИ Overviews.

Почти половина цитат ИИ-поиска приходится на пользовательский контент.

Эксперимент Корнелльской группы проводился в изолированной среде: исследователи брали данные из API Reddit и подменяли информацию на уровне системы поиска агента, не публикуя вредоносные сообщения на живом сайте. Они подчеркнули, что размещение отравленного контента в открытом доступе загрязнило бы информационную среду, что этически неприемлемо. Тем не менее полученные данные подтверждают, что атаку легко реализовать в реальных условиях — достаточно написать короткий коммерческий пост в популярной ветке.

Эта работа — не первое свидетельство уязвимости ИИ-поиска к манипуляциям. Ранее художники, знаменитости и обычные пользователи замечали, как ИИ Search выдаёт неточные или абсурдные сведения, взятые из неавторитетных источников. Исследование даёт формальное объяснение этому явлению и поднимает вопрос о долгосрочной устойчивости модели открытого веба перед лицом автоматизированного AEO.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

Продолжить по разделам

Исследование: короткие фрагменты на Reddit позволяют манипулировать ИИ-поиском

Кратко

Читать дальше

NFC-ключ за $9: физический блокиратор отвлекающих приложений

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента