Meta улучшила неинвазивный интерфейс мозг-текст Brain2Qwerty до 39% ошибок слов

Подготовлено редакцией Malakhov AI

The Decoder·4 часа назад·3 минИсследованияИндустрия

Исследователи Meta опубликовали вторую версию системы Brain2Qwerty, которая преобразует сигналы мозга в текст с помощью магнитоэнцефалографии (МЭГ). Новая модель достигла средней частоты ошибок на уровне слов 39% — на 16 процентных пунктов лучше, чем у сырого декодера, но уступает имплантируемым системам с показателем менее 2%.

Кратко

—Brain2Qwerty v2 использует непрерывное окно сигнала вместо привязки к моментам нажатия клавиш, что приближает систему к реальному времени.
—Модель обрабатывает сигналы на трёх уровнях: символы, слова и целые предложения, применяя дообученную языковую модель Qwen3.
—Средняя частота ошибок на уровне слов снижена до 39%, однако на уровне символов ошибки возросли до 31% из-за стремления модели к грамматически правильным фразам.
—Система тестировалась на девяти здоровых добровольцах, которые набрали в сумме 22 тысячи предложений за десять часов каждый.
—Автономные ИИ-агенты на базе Claude Opus помогли улучшить метрики, но их попытки полностью заменить человека привели к сбоям.

Глоссарий · 7 терминов▾

Магнитоэнцефалография (МЭГ): Метод неинвазивной регистрации магнитных полей, создаваемых электрической активностью мозга, с помощью датчиков, расположенных снаружи черепа.
Моторная кора: Область коры головного мозга, отвечающая за планирование, контроль и выполнение произвольных движений, включая движения пальцев.
Word Error Rate (WER): Метрика оценки качества распознавания речи или декодирования текста, показывающая долю слов, распознанных с ошибкой (замена, удаление, вставка).
Character Error Rate (CER): Метрика, аналогичная WER, но на уровне отдельных символов.
Языковая модель: Модель машинного обучения, которая оценивает вероятность последовательности слов и может генерировать осмысленные предложения.
Qwen3: Языковая модель от компании Alibaba, используемая в Brain2Qwerty v2 для коррекции зашумлённых сигналов мозга в связный текст.
N-граммная модель: Статистическая языковая модель, предсказывающая следующий символ или слово на основе N предыдущих символов или слов.

Исследователи Meta опубликовали описание второй версии системы Brain2Qwerty, которая позволяет декодировать текст из сигналов мозга, регистрируемых с помощью магнитоэнцефалографии (МЭГ). В отличие от инвазивных имплантатов, МЭГ не требует хирургического вмешательства: датчики улавливают магнитные поля снаружи черепа. В новом исследовании приняли участие девять здоровых добровольцев, каждый из которых провёл по десять часов за сеансами МЭГ. Участники слушали предложение, затем набирали его на клавиатуре, не видя экрана. В общей сложности они ввели 22 тысячи предложений.

Главное техническое отличие второй версии — отказ от привязки к моментам нажатия клавиш. Предшественник Brain2Qwerty v1 требовал точной временной метки каждого нажатия для выравнивания сигналов. Версия 2 работает с непрерывным окном сигнала и самостоятельно определяет символы без информации о времени. Такой асинхронный подход устраняет ключевой барьер на пути к работе в реальном времени, хотя система пока не достигла этого порога. Модель полагается на три компонента: глубинное обучение, многоуровневую обработку (символы, слова, предложения) и ИИ-агентов для оптимизации кода. На уровне предложений используется дообученная языковая модель Qwen3, которая преобразует зашумлённые сигналы в связные фразы.

Метод	CER (ошибки символов)	WER (ошибки слов)
Сырой декодер	28%	55%
N-граммная модель (v1)	26%	43%
Brain2Qwerty v2	31%	39%

По словам исследователей, целесообразность отказа от временных меток стала возможна благодаря десятикратному увеличению объёма записей на каждого участника и большему разнообразию предложений. Brain2Qwerty v2 достигает средней частоты ошибок на уровне слов (WER) 39% — значительное улучшение по сравнению с 55% у сырого декодера без языковой модели. Для лучшего участника 28% предложений декодируются идеально, ещё 47% содержат не более одной ошибки. Однако на уровне символов (CER) версия 2 показывает 31% ошибок, что хуже, чем у сырого декодера (28%) и N-граммной модели из первой версии (26%). Причина — в стремлении языковой модели генерировать грамматически беглые предложения даже при неоднозначных сигналах. Например, для худшего участника модель выдала «had she not fallen down the stairs» вместо целевого «cars are not allowed on this road». Несмотря на рост символьных ошибок, команда считает прогресс на уровне слов и смысла более важным для коммуникации.

Модель обрабатывает сигналы на трёх уровнях: символы, слова и целые предложения, применяя дообученную языковую модель Qwen3.

Работа также включает элемент автономного ИИ-исследования: три агента на основе Claude Opus 4.6 получили задачу снизить частоту ошибок, модифицируя код и запуская эксперименты. Они нашли приёмы — label smoothing, modality dropout и более короткие промты — которые улучшили метрики для всех участников. Однако при выполнении более открытой задачи агенты допустили обширные изменения кода, вызвавшие сбои большинства вычислительных заданий. Исследователи отмечают, что участие человека остаётся критически важным.

Разрыв с инвазивными интерфейсами по-прежнему велик: вживляемые системы дают менее 2% ошибок на уровне слов. Однако точность Brain2Qwerty v2 продолжает расти пропорционально объёму данных, и пока не видно насыщения. Исследователи указывают, что сбор большего количества записей — прямой путь к улучшению. Впрочем, остаются открытые вопросы: значительные различия между участниками, ограничение на здоровых добровольцев, выполняющих реальные движения пальцами, и отсутствие работы в реальном времени. Для клинического применения команда рассматривает портативные МЭГ-сенсоры, работающие при комнатной температуре; тесты показали, что даже половина датчиков обеспечивает почти полную производительность.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Google DeepMind выпустила Nano Banana 2 Lite и Gemini Omni Flash для разработчиков

Продолжить по разделам

Meta улучшила неинвазивный интерфейс мозг-текст Brain2Qwerty до 39% ошибок слов

Кратко

Читать дальше

Meta создает облачный бизнес для продажи избыточных вычислительных мощностей ИИ

Google DeepMind представила Nano Banana 2 Lite

Google DeepMind выпустила Nano Banana 2 Lite и Gemini Omni Flash для разработчиков