Биологическая архитектура нейросетей: кортикальные колонки и Small-World граф на Python

Подготовлено редакцией Malakhov AI

Habr AI·8 часов назад·3 минРоссияКод

На Habr опубликована практическая реализация нейросети, топология которой воспроизводит зрительную кору головного мозга: кортикальные столбы с балансом возбуждения и торможения, граф Уоттса-Строгатца и механизм внимания — всё на Python 3.10 с PyTorch 2.8.0 и NetworkX 3.3.

Кратко

—Архитектура копирует зрительную кору: ~80% возбуждающих и ~20% тормозящих нейронов в каждом кортикальном столбе.
—Связи между столбами строятся по модели Small-World Уоттса-Строгатца: локальные кластеры плюс редкие дальние соединения.
—Механизм AttentionGate позволяет каждой колонке взвешивать сигналы от соседей по текущему состоянию.
—Эталонный тест — датасет MNIST (70 000 изображений); обычные сети дают 80–98%, человеческий мозг — ~99.5–99.7%.
—Код воспроизводим на потребительском GPU или CPU, выпущенном за последнее десятилетие.

Глоссарий · 7 терминов▾

Кортикальный столб (колонка): Базовая функциональная единица коры мозга — вертикальная группа из 80–120 нейронов, совместно обрабатывающих один тип входного сигнала.
E-I Balance (баланс возбуждения и торможения): Соотношение активности возбуждающих и тормозящих нейронов, которое обеспечивает стабильную и помехоустойчивую работу нейронной сети.
Small-World топология: Тип графа, в котором большинство узлов связаны локально, но существуют редкие дальние связи, резко сокращающие среднее расстояние между любыми двумя узлами.
Пластичность Хебба: Правило обучения: синаптическая связь между двумя нейронами усиливается, если они активируются одновременно.
MNIST: Стандартный benchmark для задач распознавания изображений — база из 70 000 рукописных цифр, широко используемая для сравнения архитектур нейросетей.
LayerNorm: Операция нормализации активаций внутри слоя нейросети, стабилизирующая обучение и ускоряющая сходимость.
Граф Уоттса-Строгатца: Математическая модель Small-World сети: строится из регулярного кольца, в котором часть связей случайно перезаписывается на дальние соединения.

Автор материала на Habr предлагает конкретную реализацию идеи, которую исследователи AGI обсуждают давно: взять топологию биологического мозга и перенести её на градиентное обучение. Точкой отсчёта служит датасет MNIST — 70 000 изображений рукописных цифр размером 28×28 пикселей. Обычные сети дают на нём 80–98%, специализированные архитектуры — свыше 99%, а человеческий мозг, по приблизительным оценкам, — 99.5–99.7%.

Ключевой структурной единицей служит класс Column — программная модель кортикального столба. В реальной зрительной коре такой столб объединяет 80–120 нейронов, проходящих вертикально через все слои. Автор воспроизводит биологическое соотношение: 80% нейронов возбуждающие (активируются через ReLU, инициализация Kaiming Normal), 20% — тормозящие (Sigmoid, инициализация Xavier Uniform). Тормозящий сигнал масштабируется коэффициентом e_i_ratio и вычитается из возбуждающего — так реализуется баланс возбуждения и торможения (E-I Balance), который в нейробиологии считается основой помехоустойчивой обработки информации. Слой LayerNorm и Dropout замыкают блок.

Тип сети	Точность на MNIST	Самосознание / модель мира	Скорость обучения
Простые ИИ-сети (CNN, Transformer, Mamba)	80–98%	Нет	Высокая
Специализированные ИИ-сети	99%+	Нет	Высокая
Человеческий мозг	~99.5–99.7%	Есть	Годы
Гибридная (биологическая топология + градиенты)	В процессе проверки	Цель архитектуры	Высокая (градиенты)

Связи между столбами строятся не случайно и не регулярно, а по модели Small-World Уоттса-Строгатца. Функция make_small_world через библиотеку NetworkX создаёт граф: каждый узел соединён с k ближайшими соседями по кольцу, затем с вероятностью p каждая связь перезаписывается на случайную дальнюю. Результат — матрица смежности, где большинство связей локальные, но есть «длинные» переброски между удалёнными колонками. Именно такая топология, по данным нейробиологических исследований, обеспечивает мозгу высокую эффективность при низком энергопотреблении.

Поверх графа работает класс AttentionGate — механизм внимания, вычисляющий веса входящих сигналов от соседних колонок. Каждая колонка формирует query из своего текущего состояния и сравнивает его с key-векторами соседей; связи, отсутствующие в матрице смежности, маскируются значением −1e9 до softmax. Это позволяет сети динамически усиливать релевантные соседние сигналы — аналог того, как в мозге рекуррентные связи передают информацию как снизу вверх, так и сверху вниз по кортикальным столбам.

Архитектура опирается на пластичность Хебба как концептуальный принцип: синаптические веса усиливаются между одновременно активными нейронами. В искусственной реализации этот принцип воплощается через градиентное обучение, которое автор намеренно сохраняет — именно оно даёт искусственным сетям главное преимущество перед биологическими: скорость. Вся кора человека содержит около 300 млн кортикальных колонок; масштаб реализации в статье, разумеется, меньше, но принцип воспроизведён.

Подход вписывается в более широкое направление нейроморфных вычислений, где исследователи пытаются преодолеть разрыв между эффективностью трансформеров на конкретных задачах и отсутствием у них чего-либо похожего на внутреннюю модель мира. Трансформеры и архитектуры типа Mamba хорошо аппроксимируют паттерны в данных, но не имеют ни самосознания, ни долгосрочной внутренней памяти в биологическом смысле. Биологические мозги обладают этими свойствами, но обучаются годами и ограничены в вычислительной мощности. Гибридный подход — попытка взять лучшее из обоих миров, не жертвуя воспроизводимостью на обычном железе.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ