Байесовский мозг: почему восприятие — это предсказание, а не отражение реальности

Подготовлено редакцией Malakhov AI

Habr AI·2 мая·3 минРоссияКод

Концепция байесовского мозга, которую нейронаука разрабатывает последние двадцать лет, утверждает: мозг никогда не воспринимает мир напрямую — он строит вероятностную модель реальности и сверяет её с сенсорными сигналами. Тот же принцип лежит в основе Stable Diffusion, языковых моделей и диффузионных сетей.

Кратко

—Мозг заперт в черепе и получает только электрохимические импульсы — цвет, звук и боль он достраивает самостоятельно.
—Основной поток информации в коре идёт сверху вниз: высокие уровни посылают предсказания, нижние отправляют наверх только ошибку — то, что не совпало.
—Параметр precision определяет, насколько мозг доверяет сенсорным данным; его сбой ведёт к галлюцинациям и другим нарушениям восприятия.
—Вирусный спор о платье 2015 года — наглядный пример: люди видели разные цвета на одних и тех же пикселях из-за разных априорных ожиданий.
—Stable Diffusion, языковые модели и автоэнкодеры работают по схожему принципу: восстанавливают сигнал из неполных данных, опираясь на выученные распределения.

Глоссарий · 7 терминов▾

Байесовский мозг: Гипотеза в нейронауке о том, что мозг постоянно строит вероятностные предсказания о состоянии мира и обновляет их при расхождении с сенсорными данными.
Априорные знания (priors): Убеждения или ожидания, которые существуют до получения новых данных и влияют на интерпретацию этих данных.
Precision (точность): В контексте байесовского мозга — вес, с которым ошибка предсказания влияет на обновление внутренней модели; определяет, насколько мозг доверяет сенсорному сигналу.
Ошибка предсказания: Разница между тем, что мозг ожидал получить от органов чувств, и тем, что он получил на самом деле.
Диффузионная модель: Класс нейросетей, обученных восстанавливать исходные данные из зашумлённых версий; используется в генераторах изображений, таких как Stable Diffusion.
Автоэнкодер: Нейросетевая архитектура, которая сжимает входные данные в компактное представление и затем восстанавливает их, обучаясь выделять ключевые признаки.
World model: Внутренняя модель среды в системах машинного обучения, позволяющая агенту предсказывать последствия действий без взаимодействия с реальным миром.

Вирусное платье 2015 года — бело-золотое для одних и сине-чёрное для других — оказалось не курьёзом интернета, а наглядной демонстрацией фундаментального принципа работы мозга. Люди смотрели на одни и те же пиксели и видели разные цвета — не интерпретировали по-разному, а именно видели разное. Сетчатка у всех работала штатно, дальтонизм здесь ни при чём. Объяснение лежит глубже.

Немецкий физик и физиолог Герман фон Гельмгольц ещё в XIX веке сформулировал идею, которую назвал «бессознательным умозаключением»: мозг не получает картинку мира, он решает обратную задачу — по косвенным данным угадывает, что именно во внешнем мире вызвало тот или иной паттерн нервных импульсов. Мозг наглухо заперт в черепной коробке. Всё, что до него доходит, — электрохимические импульсы от сетчатки, улитки уха, рецепторов кожи. Цвет, звук, боль — всё это мозг достраивает сам.

Математическую основу для этой идеи задолго до Гельмгольца заложил английский священник и любитель теории вероятностей Томас Байес в XVIII веке. Его теорема описывает, как рационально обновлять убеждения при получении новых данных: итоговая вера в гипотезу складывается из того, насколько в неё верили до, и того, насколько новые данные в неё вписываются. Именно поэтому один и тот же шорох на кухне ночью воспринимается как кот — если район спокойный и кот есть — или как грабитель, если накануне соседи писали о кражах. Сигнал одинаковый, но априорные ожидания разные, и восприятие меняется.

Основной поток информации в коре идёт сверху вниз: высокие уровни посылают предсказания, нижние отправляют наверх только ошибку — то, что не совпало.

Современная нейронаука оформила это в концепцию байесовского мозга. Её ключевое утверждение переворачивает привычную картину восприятия. Принято считать, что сигнал входит через органы чувств, поднимается по иерархии зон коры — от простых признаков к сложным — и в итоге превращается в осознанное восприятие. Байесовский подход говорит обратное: основной поток информации в коре идёт сверху вниз. Высокие уровни постоянно посылают нижним предсказания — «ожидаю здесь увидеть край под таким углом», «ожидаю услышать продолжение фразы таким словом». Нижние уровни сравнивают предсказание с реальным сенсорным входом и отправляют наверх только ошибку — то, что не совпало. Если предсказание точное, наверх не идёт почти ничего. Мозг работает в режиме «всё по плану».

Эта схема исключительно экономична: мозгу не нужно каждый момент заново строить картину мира из пикселей — у него уже есть модель, которую он только сверяет с реальностью. Авторы концепции сравнивают это с видеокодеком, который передаёт не каждый кадр целиком, а только разницу между соседними кадрами. Следствие неудобное: то, что человек «видит» в каждый момент, — преимущественно предсказание мозга о том, что он должен видеть. Сенсорные данные лишь подправляют это предсказание там, где оно ошибается.

Дополнительный параметр в этой системе — precision, или точность: вес, с которым ошибка предсказания влияет на обновление модели. Мозг оценивает не только то, что сообщают сенсоры, но и насколько этим сообщениям можно доверять. В темноте зрение ненадёжно — мозг снижает доверие к глазам, повышает к слуху и к собственным ожиданиям. Отсюда ощущение, что «что-то мерещится»: на место размытых сенсорных данных подставляются априорные знания, и любой куст на секунду становится зловещей фигурой. Если ручку precision крутануть не туда — начинаются галлюцинации или, в другую сторону, симптомы, характерные для аутизма.

Автор материала проводит параллель с современным машинным обучением, и она небессмысленна. Stable Diffusion восстанавливает изображение из шума, опираясь на выученное распределение вероятностей. Языковые модели предсказывают следующий токен, взвешивая правдоподобие вариантов по контексту. Автоэнкодеры и world models строят сжатое представление мира и разворачивают его обратно. Все эти архитектуры решают ту же обратную задачу, что и мозг Гельмгольца: по неполным или зашумлённым данным восстановить наиболее вероятную причину сигнала. Разница в субстрате и масштабе, но не в логике.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США

Продолжить по разделам

Байесовский мозг: почему восприятие — это предсказание, а не отражение реальности

Кратко

Читать дальше

VK вылетел из App Store, а в России готовят регулирование ИИ

«Яндекс» запустил платформу для создания ИИ-агентов в «Алисе ИИ»

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США