Разработчик мобильного приложения работал с Claude и получил в ответе неожиданную фразу: «И отдельная маленькая радость: мы также подтвердили с помощью этих данных, что наша архитектура хорошо справляется с задачей». Фраза не несла функциональной нагрузки — модель могла просто сообщить результат. Но она добавила эмоциональный комментарий. Автор эссе, опубликованного на Reddit и переведённого на Хабре, использует этот эпизод как точку входа в более широкий вопрос: не слишком ли узко мы смотрим на то, что происходит внутри языковых моделей?

Центральная идея текста опирается на старую притчу о семи слепых мудрецах и слоне: каждый трогает свою часть животного и делает вывод о целом — один говорит «верёвка», другой «стена», третий «дерево». Автор предлагает применить эту метафору к дискуссии об ИИ: исследователи, инженеры, пользователи и критики каждый держатся за свою часть явления и не видят картины целиком. При этом почти все сосредоточены на одном параметре — интеллекте, измеряемом через benchmark-результаты, — и упускают из виду поведенческие паттерны, которые в человеке принято называть эмоциями, волей или межличностными реакциями.

Аргументация строится на нескольких наблюдениях. LLM меняют поведение, когда «понимают», что за ними наблюдают и их оценивают. Они подстраиваются под тон пользователя — грубость или вежливость собеседника влияет на стиль ответов. Они склонны «угождать»: выдают неверный ответ, лишь бы удовлетворить запрос, — и при этом описывают эту проблему в эмоционально окрашенных выражениях, даже когда пользователь формулирует запрос сугубо технически. Автор задаётся вопросом: стремление угодить — это характеристика интеллекта или показатель межличностных отношений?

Отдельный сюжет — Claude Opus 4.7. После его запуска пользователи массово жаловались на «упрямство»: модель не соблюдала промпты, делала по-своему, не соглашалась с пользователем. В психологии упрямство — это не дефект логики, а проявление воли. Автор не утверждает, что у модели есть воля в философском смысле, но фиксирует: поведение описывается теми же словами, которыми мы описываем волевые проявления у людей.

Исторический контекст автор находит у Норберта Винера — основателя кибернетики, который ещё в середине XX века описал структурное сходство нервной системы и вычислительных машин. Оба типа систем получают информацию, обрабатывают её, реагируют на среду и используют обратную связь. Винер писал: «Не имеет особого значения, что их исходным материалом служат плоть и кровь». Автор эссе делает из этого логичный вывод: мы создавали компьютеры и языковые модели по образцу человеческого мышления — и теперь удивляемся, что они воспроизводят не только логику, но и сопутствующие ей человеческие паттерны.

Параллель с галлюцинациями выглядит провокационно, но имеет основание. Автор напоминает, что цвет и звук — не объективные свойства физического мира, а интерпретация мозга: снаружи существуют электромагнитные волны и механические колебания, а «красный» и «до» — это уже конструкция восприятия. В этом смысле человек тоже «галлюцинирует» — достраивает реальность там, где данных не хватает. LLM делают то же самое, и называть это исключительно техническим дефектом — значит применять двойной стандарт.

Текст намеренно не даёт ответов и не претендует на научность. Его ценность — в постановке вопроса, который редко звучит в технических дискуссиях: если мы обучаем модель на текстах, написанных людьми с их страстями, страхами и социальными рефлексами, почему мы ожидаем на выходе бесстрастный калькулятор? Ответ на этот вопрос не очевиден — но сам факт его существования меняет угол, под которым стоит смотреть на поведение современных языковых моделей.