Разработчик, ведущий проект в свободное время, представил фреймворк Meta-Spider, реализующий механизм мета-внимания для больших языковых моделей. Идея заключается в том, чтобы через обучаемую сеть-энкодер извлекать из LLM сигнал неуверенности и точечно подавать его обратно на каждом слое, заставляя модель отказываться от ответов, в которых она не уверена. В качестве соавтора фреймворка указан Claude Opus.

Архитектура включает несколько компонентов. Ядро Meta-Core предоставляет функционал для остальных частей. Meta-Loom отвечает за обучение и проверку обвязки. Meta-Agent позволяет использовать модификаторы поведения в агентных сессиях и чатах. Meta-Deploy обеспечивает интеграцию с llama.cpp. Основной модификатор поведения — Doubter (Скептик), который усиливает неуверенность модели, снижая количество ложных ответов.

УровеньЧто кэшируемПочему можноЧто даёт
Обучение, Pass-1hidden-снимки целевых слоёв (collect)база заморожена → Pass-1 константенубирает один полный форвард из каждой эпохи
Обучение, низ Pass-2cut_hidden = выход layer[cut]низ без инъекции одинаков в обоих проходахне считаем нижние ⅔ слоёв
Инференскогнитивные токены + KV-кэш базысостояние базы не меняетсяускоряет повторные запросы

Механизм инъекции работает в два прохода. На первом проходе (Pass 1) промпт проходит через замороженную базу, а хуки снимают скрытые состояния с выбранных слоёв. На втором проходе (Pass 2) когнитивные токены, сгенерированные энкодером, подаются через головы перекрёстного внимания и скалярные множители-врата. Для ускорения применяется кэширование: на обучении Pass-1 константен из-за замороженной базы, а нижние слои не пересчитываются во втором проходе. Обвязка обучается на наборе вопросов, где модель должна отказаться от ответа, если не уверена. Градиент течёт через базу, но её веса не меняются — база выступает функцией потерь для обвязки.

Модификатор Doubter усиливает неуверенность модели, заставляя её чаще отказываться от ответа вместо того, чтобы галлюцинировать.

Фреймворк распространяется с открытым исходным кодом. Разработчик отмечает, что это пет-проект, и приглашает специалистов к обратной связи. Готовые обвязки доступны для Qwen-3.5-4b и Granite 4.1 8B.