Вирусное платье 2015 года — бело-золотое для одних и сине-чёрное для других — оказалось не курьёзом интернета, а наглядной демонстрацией фундаментального принципа работы мозга. Люди смотрели на одни и те же пиксели и видели разные цвета — не интерпретировали по-разному, а именно видели разное. Сетчатка у всех работала штатно, дальтонизм здесь ни при чём. Объяснение лежит глубже.

Немецкий физик и физиолог Герман фон Гельмгольц ещё в XIX веке сформулировал идею, которую назвал «бессознательным умозаключением»: мозг не получает картинку мира, он решает обратную задачу — по косвенным данным угадывает, что именно во внешнем мире вызвало тот или иной паттерн нервных импульсов. Мозг наглухо заперт в черепной коробке. Всё, что до него доходит, — электрохимические импульсы от сетчатки, улитки уха, рецепторов кожи. Цвет, звук, боль — всё это мозг достраивает сам.

Математическую основу для этой идеи задолго до Гельмгольца заложил английский священник и любитель теории вероятностей Томас Байес в XVIII веке. Его теорема описывает, как рационально обновлять убеждения при получении новых данных: итоговая вера в гипотезу складывается из того, насколько в неё верили до, и того, насколько новые данные в неё вписываются. Именно поэтому один и тот же шорох на кухне ночью воспринимается как кот — если район спокойный и кот есть — или как грабитель, если накануне соседи писали о кражах. Сигнал одинаковый, но априорные ожидания разные, и восприятие меняется.

Основной поток информации в коре идёт сверху вниз: высокие уровни посылают предсказания, нижние отправляют наверх только ошибку — то, что не совпало.

Современная нейронаука оформила это в концепцию байесовского мозга. Её ключевое утверждение переворачивает привычную картину восприятия. Принято считать, что сигнал входит через органы чувств, поднимается по иерархии зон коры — от простых признаков к сложным — и в итоге превращается в осознанное восприятие. Байесовский подход говорит обратное: основной поток информации в коре идёт сверху вниз. Высокие уровни постоянно посылают нижним предсказания — «ожидаю здесь увидеть край под таким углом», «ожидаю услышать продолжение фразы таким словом». Нижние уровни сравнивают предсказание с реальным сенсорным входом и отправляют наверх только ошибку — то, что не совпало. Если предсказание точное, наверх не идёт почти ничего. Мозг работает в режиме «всё по плану».

Эта схема исключительно экономична: мозгу не нужно каждый момент заново строить картину мира из пикселей — у него уже есть модель, которую он только сверяет с реальностью. Авторы концепции сравнивают это с видеокодеком, который передаёт не каждый кадр целиком, а только разницу между соседними кадрами. Следствие неудобное: то, что человек «видит» в каждый момент, — преимущественно предсказание мозга о том, что он должен видеть. Сенсорные данные лишь подправляют это предсказание там, где оно ошибается.

Дополнительный параметр в этой системе — precision, или точность: вес, с которым ошибка предсказания влияет на обновление модели. Мозг оценивает не только то, что сообщают сенсоры, но и насколько этим сообщениям можно доверять. В темноте зрение ненадёжно — мозг снижает доверие к глазам, повышает к слуху и к собственным ожиданиям. Отсюда ощущение, что «что-то мерещится»: на место размытых сенсорных данных подставляются априорные знания, и любой куст на секунду становится зловещей фигурой. Если ручку precision крутануть не туда — начинаются галлюцинации или, в другую сторону, симптомы, характерные для аутизма.

Автор материала проводит параллель с современным машинным обучением, и она небессмысленна. Stable Diffusion восстанавливает изображение из шума, опираясь на выученное распределение вероятностей. Языковые модели предсказывают следующий токен, взвешивая правдоподобие вариантов по контексту. Автоэнкодеры и world models строят сжатое представление мира и разворачивают его обратно. Все эти архитектуры решают ту же обратную задачу, что и мозг Гельмгольца: по неполным или зашумлённым данным восстановить наиболее вероятную причину сигнала. Разница в субстрате и масштабе, но не в логике.