Тернарный KAN и рассуждение без LLM: две модели по 15 КБ с точностью 90%+

Подготовлено редакцией Malakhov AI

Habr AI·16 июн.·3 минРоссияКод

За две недели экспериментов в июне 2026 года удалось создать тернарный KAN весом 15,4 КБ, который превзошёл по точности на MNIST свой float-аналог, и систему многошагового рассуждения без LLM с 90% точностью — обе модели умещаются в кеш микроконтроллера за $0,50.

Кратко

—Тернарный GraphKAN с весами {-1, 0, +1} занимает 15,4 КБ и набирает 96,15% на MNIST — больше, чем float-версия той же архитектуры.
—Квантование до 1,58 бита на параметр неожиданно повысило точность: дискретные веса работают как регуляризатор, отсекая шум в градиентах.
—VSA-Reasoner достигает 90% точности на многошаговых цепочках рассуждений без единого хардкод-правила и без LLM.
—Вся система рассуждения занимает менее 62 КБ и работает на CPU без GPU.
—Оба компонента используют один 4-фазный QAT и одинаковую упаковку весов в uint8.

Глоссарий · 7 терминов▾

KAN (Kolmogorov-Arnold Network): Архитектура нейросети, в которой обучаемые функции размещены на рёбрах графа, а не в узлах — в отличие от классических MLP с фиксированными функциями активации.
Тернарные веса: Параметры нейросети, принимающие только три значения: -1, 0 и +1, что позволяет хранить каждый параметр примерно в 1,58 бита.
QAT (quantization-aware training): Метод обучения, при котором квантование весов симулируется уже в процессе тренировки, а не применяется постфактум — это снижает потери точности.
STE (straight-through estimator): Приём для обучения моделей с дискретными весами: на прямом проходе используются квантованные значения, а градиент на обратном проходе считается как у непрерывной функции.
VSA (Vector-Symbolic Architecture): Подход к представлению знаний, где факты и понятия кодируются как случайные векторы высокой размерности, а операции над ними (связывание, суперпозиция) заменяют логические правила.
Beam search: Алгоритм поиска, который на каждом шаге удерживает несколько наиболее перспективных вариантов (ширина пучка) вместо одного, повышая качество итогового ответа.
MLP (multilayer perceptron): Классическая архитектура нейросети из последовательных полносвязных слоёв с фиксированными нелинейными функциями активации в узлах.

В июне 2026 года независимый исследователь под ником Fakeonomics опубликовал результаты двухнедельных экспериментов с двумя архитектурами: тернарным Kolmogorov-Arnold Network и системой символьного рассуждения на основе Vector-Symbolic Architecture. Обе модели умещаются в 15–16 КБ и не требуют GPU.

Kolmogorov-Arnold Networks — альтернатива классическим многослойным перцептронам (MLP), предложенная в 2024 году. В отличие от MLP, где обучаемые параметры — это веса рёбер, в KAN обучаются сами функции активации на рёбрах графа. Это даёт более компактные и интерпретируемые модели при сопоставимой точности. До этой работы все реализации KAN использовали веса в формате FP32 или 4-битное квантование — ниже 4 бит никто не опускался.

Модель	Веса	Размер	MNIST	Fashion-MNIST
GraphKAN 256→100→10	float	15,4 КБ	94,77%	84,1%
GraphKAN 256→100→10	ternary {-1,0,+1}	15,4 КБ	96,15%	86,68%
MLP 256→100→10	float	106,8 КБ	~93%	—

Ternary GraphKAN использует веса из трёх значений: {-1, 0, +1}, что соответствует 1,58 бита на параметр. Модель с архитектурой 256→100→10 содержит 79 800 параметров, упакованных в 15,4 КБ: четыре тернарных значения кодируются в один байт uint8. На датасете MNIST она набирает 96,15% — на 1,38 процентного пункта больше, чем float-версия той же архитектуры (94,77%). На Fashion-MNIST разрыв сохраняется: 86,68% против 84,1%. При этом float-MLP с аналогичной структурой занимает 106,8 КБ и показывает около 93% на MNIST.

Обучение проходит в четыре фазы QAT (quantization-aware training): сначала веса зажимаются в диапазон [-1, 1], затем применяется STE-тернаризация с float-градиентами на обратном проходе, после — жёсткая фиксация значений, и наконец дообучаются только масштаб и смещение. Неожиданный эффект: точность росла на каждом этапе квантования — +1,01%, +0,31%, +0,06%. Автор объясняет это регуляризующим действием дискретных весов, которые отсекают шум в градиентах. В опубликованной литературе по KAN такой эффект ранее не описывался.

Вторая разработка — VSA-Reasoner — решает другую задачу: многошаговое логическое рассуждение без языковой модели. Vector-Symbolic Architecture кодирует факты как векторы высокой размерности и оперирует ими через связывание (bind) и суперпозицию (bundle). Метод дёшев и интерпретируем, но имеет фундаментальное ограничение: при объединении более ~12 фактов в один вектор возникает шум суперпозиции, и точность поиска падает до 80% независимо от размерности — хоть D=1024, хоть D=8192.

Для преодоления этого ограничения автор собрал пайплайн из трёх learned-компонентов. Предикатно-шардированная память разбивает факты по предикатам, удерживая не более ~12 фактов на шард. Нейронный резонатор (16 КБ, тернарные веса) итеративно уточняет VSA-запрос за пять шагов тернарного матричного умножения и поднимает точность с 80% до 93%. Контроллер на основе float32 MLP выбирает нужный предикат, а ChainScorer на базе Transformer оценивает кандидатов через beam search шириной 1–3.

На тестовом наборе из 96 фактов, 53 сущностей и 30 запросов система достигает 90% общей точности: 100% на одношаговых и двухшаговых цепочках, 70% на трёхшаговых. Чистый VSA без резонатора справляется только с одношаговыми задачами (90%), полностью проваливая 2-hop и 3-hop (0%). Вся система занимает менее 62 КБ и работает на CPU.

Оба компонента — GraphKAN и резонатор — используют одинаковый 4-фазный QAT и одну схему упаковки весов. Тернарный формат оказался универсальным: те же 2 бита работают и для аппроксимации функций в KAN, и для итеративного уточнения символьных запросов. Исходный код остаётся закрытым; на GitHub опубликованы только обзорные репозитории.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

«Мои слова должны быть моими»: Хэнк Грин о нездоровом использовании ИИ

Продолжить по разделам

Тернарный KAN и рассуждение без LLM: две модели по 15 КБ с точностью 90%+

Кратко

Читать дальше

Вайбкодинг на больших задачах: метод субагентов и роли с чистым контекстом

Claude Opus 5 по одному промпту собирает 3D-игру в браузере

«Мои слова должны быть моими»: Хэнк Грин о нездоровом использовании ИИ