Попросите ChatGPT, Claude или Gemini написать произвольную историю — и примерно в девяти случаях из десяти в ней окажется смотритель маяка, часовщик или библиотекарь. Скорее всего, его будут звать Элиас, Мара или Элара. Это не совпадение и не творческий выбор модели.
В мае 2025 года исследователи Силь Гамильтон и Дэвид Мимно из Департамента информационных наук Корнельского университета опубликовали препринт «Elias in the Lighthouse, Again?» на arXiv. Они собрали 20 000 историй от ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google) и чат-бота Allen Institute for ИИ, используя пять разных промптов. Результат: одни и те же 11 слов — имена и профессии — встречаются в более чем 88% сгенерированных текстов, причём разница между моделями минимальна.
Причина уходит корнями в датасет WildChat — сборник из миллиона реальных диалогов с ранней версией ChatGPT (GPT-3.5). Именно эта модель стала, по словам Гамильтона, «корнем семейного дерева»: WildChat использовался для создания других обучающих датасетов, которые, в свою очередь, легли в основу новых моделей. Из миллиона диалогов 166 содержат имя «Элиас» в характерном «маячном» стиле. Модели, обученные на этих данных, воспроизводили стиль, а разработчики неосознанно тиражировали его дальше. «Это как вирус», — написал Гамильтон в переписке с журналистом 404 Media.
Корень проблемы — датасет WildChat: 166 из миллиона реальных диалогов с ChatGPT содержат имя «Элиас» в стиле маяка.

Второй усиливающий фактор — alignment, то есть настройка моделей на безопасность и соответствие нормам. WildChat содержит много материалов, не подходящих для широкой аудитории. При фильтрации модели начинают предпочитать «безопасный» срез данных — а истории про Элиаса у маяка идеально вписываются в этот профиль. «Дело не в том, что таких историй много, а в том, что они просто очень безопасны», — объясняет Гамильтон. Исследователи намерены проверить эту гипотезу в следующих работах.
Эффект давно вышел за пределы чат-интерфейсов. Программный инженер Дэниел Мэй зафиксировал всплеск поисковых запросов «Elias Thorne» в начале 2026 года по данным Google Trends. На Amazon Элиас Торн числится автором книг по альтернативной медицине, греческой мифологии, психологических триллеров и руководств по алгоритмам YouTube. «Ни один человек не пишет всё это», — отметил Мэй в своём блоге. На YouTube персонаж появляется в иллюстрированных слоп-роликах, на фейковых новостных сайтах — то как «богатейший человек Огайо», умерший с двенадцатью долларами в кармане, то как жертва семейной трагедии.
Проблема шире одного имени. ИИ-книги с ошибками и опасной дезинформацией уже несколько лет захлёстывают платформу Amazon self-publishing, осложняя работу библиотекарей и модераторов. История с Элиасом Торном наглядно показывает механизм: схлопывание разнообразия (mode collapse) в обучающих данных воспроизводится на всех уровнях — от датасета до книжной полки.



