Владимир Крылов: считать LLM предсказателями токенов — техническая безграмотность

Подготовлено редакцией Malakhov AI

Habr AI·19 мая·3 минРоссияКод

Доктор технических наук и научный консультант Artezio Владимир Крылов объяснил, почему колмогоровская сложность не подходит для измерения интеллекта, а тезис о том, что современные LLM «просто предсказывают токены», давно устарел. По его словам, это не скептицизм, а техническая неграмотность.

Кратко

—Колмогоровская сложность применима к символьным последовательностям, но не к абстрактным концепциям вроде интеллекта — математического инструмента для такого измерения не существует.
—Человеческий интеллект — неэргодическая система: среднее по времени одного человека не совпадает со средним по ансамблю людей, что делает стандартные метрики некорректными.
—Илья Суцкевер утверждал: кто повторяет, что LLM лишь предсказывают следующий токен, технически неграмотен — это лишь грубое начальное приближение.
—После предобучения модели «выращиваются» через RLHF и PPO: человек-разметчик оценивает ответы, формируя поведение модели по принципу дрессировки.
—Противопоставление «настоящего» и «имитированного» ИИ Крылов считает терминологической ловушкой: имитация по природе и есть нечто искусственное по отношению к исходному объекту.

Глоссарий · 7 терминов▾

Колмогоровская сложность: Теоретическая мера длины минимальной программы, способной воспроизвести заданный объект или последовательность; является невычислимой функцией на практике.
RLHF: Обучение с подкреплением на основе обратной связи от людей — метод донастройки языковых моделей, при котором разметчики оценивают ответы модели, формируя её поведение.
PPO (Proximal Policy Optimization): Алгоритм оптимизации политики в обучении с подкреплением, широко применявшийся для выравнивания LLM с предпочтениями людей.
GRPO / DAPO: Более современные алгоритмы оптимизации политики, пришедшие на смену PPO в обучении фронтирных моделей вроде DeepSeek-V3.2.
Next Token Prediction: Задача предобучения языковых моделей: предсказать следующий токен (слово или часть слова) по предшествующему контексту.
Inference-time compute: Вычислительные ресурсы, которые модель тратит непосредственно при генерации ответа — в отличие от ресурсов на этапе обучения.
Эргодическая система: Система, у которой среднее значение по времени совпадает со средним по ансамблю состояний; человеческий интеллект этому свойству не удовлетворяет.

Владимир Крылов, доктор технических наук и научный консультант Artezio, дал развёрнутое интервью каналу AI4Dev — и разобрал несколько устойчивых заблуждений, которые продолжают циркулировать в дискуссиях об ИИ.

Один из популярных тезисов: интеллект — это сжатие данных. Его продвигают Илья Суцкевер и последователи Маркуса Хаттера, апеллируя к колмогоровской сложности — теоретической мере длины минимальной программы, способной воспроизвести объект. Крылов с этим подходом не согласен. По его словам, колмогоровская сложность — невычислимая функция, применимая к символьным последовательностям определённой длины. Переносить её на интеллект математически некорректно: у интеллекта нет «длины», нет чёткой области определения, и непонятно, что именно там сжимать. «Мы же не пытаемся вычислить колмогоровскую сложность кирпича или человека», — замечает он.

Отдельный аргумент касается неэргодичности человеческого интеллекта. В теории вероятностей эргодическая система — та, у которой среднее по времени совпадает со средним по ансамблю. Человеческий интеллект таковым не является: у младенца и у учёного в расцвете карьеры он принципиально разный, а усреднение по ансамблю людей даёт нечто совершенно иное, чем усреднение по жизни одного человека. Это делает любые попытки формализовать «средний интеллект» как точку отсчёта для сравнения с ИИ методологически сомнительными.

Человеческий интеллект — неэргодическая система: среднее по времени одного человека не совпадает со средним по ансамблю людей, что делает стандартные метрики некорректными.

Часто звучащий упрёк в адрес LLM — что они «просто предсказывают следующий токен» — Крылов называет устаревшим. Такая характеристика была справедлива для GPT-1 и GPT-2, когда API OpenAI так и назывался Completions и модель статистически завершала фразу. Именно тогда возникла концепция «стохастического попугая». Но современные модели проходят несколько этапов после предобучения. Крылов ссылается на слова самого Суцкевера: тот прямо говорил, что повторять мантру о предсказании токенов сегодня — значит быть технически неграмотным.

После предобучения модели «выращиваются» — Крылов намеренно использует биологическую метафору. Метод RLHF (обучение с подкреплением на основе обратной связи от людей) с алгоритмом PPO работает по принципу дрессировки: модель генерирует ответ, разметчик оценивает его, и эта оценка формирует дальнейшее поведение. Фронтирные модели вроде DeepSeek-V3.2 идут дальше, применяя GRPO и DAPO — более современные алгоритмы оптимизации политики, а также вычисления на этапе вывода (inference-time compute), когда модель тратит дополнительные ресурсы непосредственно при генерации ответа.

Наконец, Крылов предлагает переосмыслить само противопоставление «настоящего» и «имитированного» ИИ. Он указывает на терминологическую ловушку: в английском языке artificial pearl означает одновременно и «искусственный жемчуг», и «имитацию жемчуга». Имитация по природе и есть нечто искусственное по отношению к исходному объекту. Попытки провести жёсткую границу между «подлинным» интеллектом и его «имитацией» упираются не в технические факты, а в размытые внутренние предпосылки тех, кто задаёт этот вопрос.

Дискуссия о природе LLM не утихает с момента выхода GPT-3 в 2020 году. Критики — от философа Джона Сёрла с его аргументом «китайской комнаты» до авторов термина «стохастический попугай» — настаивают, что за впечатляющими результатами скрывается лишь сложная интерполяция по многообразию обучающих данных. Сторонники возражают: граница между «запоминанием» и «обобщением» не является строгой математической категорией, а тест Тьюринга — различение человека и машины в диалоге вслепую — современные модели фактически проходят. Крылов занимает промежуточную позицию: он не утверждает, что LLM обладают сознанием, но настаивает на том, что редукция к «предсказателю токенов» описывает лишь механизм предобучения, игнорируя всё, что происходит после.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ