Элиас Торн: как один персонаж захватил тысячи ИИ-историй

Подготовлено редакцией Malakhov AI

404 Media·11 июн.·2 минИндустрия

Исследователи Корнельского университета проанализировали 20 000 историй, сгенерированных ChatGPT, Claude и Gemini, и обнаружили, что одни и те же 11 слов — имена Элиас, Мара, Элара и профессии смотритель маяка, часовщик, библиотекарь — встречаются более чем в 88% текстов. Персонаж по имени Элиас Торн уже проник на Amazon, YouTube и сайты с фейковыми новостями.

Кратко

—Одни и те же имена и профессии появляются в 88% историй, сгенерированных тремя крупными LLM.
—Корень проблемы — датасет WildChat: 166 из миллиона реальных диалогов с ChatGPT содержат имя «Элиас» в стиле маяка.
—Модели, обученные на WildChat, копировали стиль, а разработчики неосознанно воспроизводили его в новых датасетах.
—Alignment-фильтрация усиливает эффект: «безопасные» истории про Элиаса проходят модерацию лучше других.
—Элиас Торн уже числится автором книг на Amazon и героем YouTube-роликов с миллионами просмотров.

Видео по теме

They Shamed Him Before Thousands — The General Gave Him a Moment That Silenced Them All · Источник: 404 Media

Глоссарий · 6 терминов▾

WildChat: Открытый датасет из миллиона реальных диалогов пользователей с ChatGPT, широко используемый для обучения других языковых моделей.
alignment: Процесс настройки языковой модели так, чтобы её ответы соответствовали нормам безопасности и ценностям разработчиков.
mode collapse: Явление, при котором модель перестаёт генерировать разнообразные ответы и сходится к узкому набору шаблонных выходов.
препринт: Научная статья, опубликованная до прохождения официального рецензирования, обычно на платформах вроде arXiv.
слоп: Разговорный термин для массово генерируемого низкокачественного ИИ-контента — текстов, изображений, видео.
LLM: Large Language Model — большая языковая модель, нейросеть, обученная на текстах и способная генерировать связный текст.

Попросите ChatGPT, Claude или Gemini написать произвольную историю — и примерно в девяти случаях из десяти в ней окажется смотритель маяка, часовщик или библиотекарь. Скорее всего, его будут звать Элиас, Мара или Элара. Это не совпадение и не творческий выбор модели.

В мае 2025 года исследователи Силь Гамильтон и Дэвид Мимно из Департамента информационных наук Корнельского университета опубликовали препринт «Elias in the Lighthouse, Again?» на arXiv. Они собрали 20 000 историй от ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google) и чат-бота Allen Institute for ИИ, используя пять разных промптов. Результат: одни и те же 11 слов — имена и профессии — встречаются в более чем 88% сгенерированных текстов, причём разница между моделями минимальна.

Причина уходит корнями в датасет WildChat — сборник из миллиона реальных диалогов с ранней версией ChatGPT (GPT-3.5). Именно эта модель стала, по словам Гамильтона, «корнем семейного дерева»: WildChat использовался для создания других обучающих датасетов, которые, в свою очередь, легли в основу новых моделей. Из миллиона диалогов 166 содержат имя «Элиас» в характерном «маячном» стиле. Модели, обученные на этих данных, воспроизводили стиль, а разработчики неосознанно тиражировали его дальше. «Это как вирус», — написал Гамильтон в переписке с журналистом 404 Media.

Корень проблемы — датасет WildChat: 166 из миллиона реальных диалогов с ChatGPT содержат имя «Элиас» в стиле маяка.

Photo by Kianmehr Shirooyeh / Unsplash · Источник: 404 Media

Второй усиливающий фактор — alignment, то есть настройка моделей на безопасность и соответствие нормам. WildChat содержит много материалов, не подходящих для широкой аудитории. При фильтрации модели начинают предпочитать «безопасный» срез данных — а истории про Элиаса у маяка идеально вписываются в этот профиль. «Дело не в том, что таких историй много, а в том, что они просто очень безопасны», — объясняет Гамильтон. Исследователи намерены проверить эту гипотезу в следующих работах.

Эффект давно вышел за пределы чат-интерфейсов. Программный инженер Дэниел Мэй зафиксировал всплеск поисковых запросов «Elias Thorne» в начале 2026 года по данным Google Trends. На Amazon Элиас Торн числится автором книг по альтернативной медицине, греческой мифологии, психологических триллеров и руководств по алгоритмам YouTube. «Ни один человек не пишет всё это», — отметил Мэй в своём блоге. На YouTube персонаж появляется в иллюстрированных слоп-роликах, на фейковых новостных сайтах — то как «богатейший человек Огайо», умерший с двенадцатью долларами в кармане, то как жертва семейной трагедии.

Проблема шире одного имени. ИИ-книги с ошибками и опасной дезинформацией уже несколько лет захлёстывают платформу Amazon self-publishing, осложняя работу библиотекарей и модераторов. История с Элиасом Торном наглядно показывает механизм: схлопывание разнообразия (mode collapse) в обучающих данных воспроизводится на всех уровнях — от датасета до книжной полки.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

Продолжить по разделам

Элиас Торн: как один персонаж захватил тысячи ИИ-историй

Кратко

Читать дальше

NFC-ключ за $9: физический блокиратор отвлекающих приложений

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента