Сайт In the Weights проверяет, знают ли языковые модели, кто вы такой

Подготовлено редакцией Malakhov AI

The Decoder·вчера·2 минИсследованияИндустрия

Бывшие сотрудники OpenAI Джои Флинн и Томас Димсон запустили сайт In the Weights, который определяет, насколько глубоко конкретный человек «вшит» в веса крупных языковых моделей. Чем выше балл — тем больше моделей способны вспомнить о вас без поиска в интернете.

Кратко

—Сайт опрашивает несколько LLM и присваивает человеку числовой балл от 0 до 996 по совокупности ответов.
—Максимальный балл 996 получают Моцарт, Шекспир и Тейлор Свифт; журналисты The Decoder набрали 175 и 262.
—Появление в Llama от Meta с миллиардом параметров считается признаком высокой релевантности — маленькие модели запоминают меньше людей.
—Создатели признают ограничения: модели могут галлюцинировать биографические детали, опечатки в имени снижают балл, распространённые имена дают худшие результаты.
—Веса нейросети — это миллиарды числовых значений, в которых модель хранит знания, полученные при обучении на текстах.

Глоссарий · 4 термина▾

Веса нейросети: Миллиарды числовых параметров, в которых языковая модель хранит знания, извлечённые в процессе обучения на текстах.
LLM: Large Language Model — большая языковая модель, нейросеть, обученная предсказывать и генерировать текст на основе огромных массивов данных.
Галлюцинация модели: Ситуация, когда языковая модель уверенно выдаёт фактически неверную информацию, не имея реальных данных для ответа.
Llama: Семейство открытых языковых моделей от Meta, доступных для скачивания и локального запуска; существуют версии от одного миллиарда параметров и выше.

Джои Флинн и Томас Димсон, оба в прошлом работавшие в OpenAI, запустили сайт In the Weights. Инструмент отвечает на вопрос, который сложно проверить напрямую: закодированы ли сведения о конкретном человеке в параметрах языковых моделей — или модель просто ничего о нём не знает.

Чтобы понять, как это работает, нужно разобраться, что такое веса нейросети. Когда LLM обучается на огромных массивах текста, она не сохраняет тексты дословно — она сжимает знания в миллиарды числовых значений, которые называются весами. Именно в них «живут» факты, которые модель может воспроизвести без обращения к поисковику или базе данных. Если человек достаточно часто и в достаточно разных контекстах упоминался в обучающих данных, след от него остаётся в весах.

In the Weights автоматически запрашивает несколько языковых моделей, просит их рассказать о конкретном человеке, сравнивает ответы и вычисляет итоговый балл — «силу присутствия» в весах. Шкала идёт от нуля до 996. На вершине — Моцарт, Шекспир и Тейлор Свифт. Журналисты The Decoder, написавшие об этом инструменте, проверили себя: один получил 175 баллов, другой — 262.

Максимальный балл 996 получают Моцарт, Шекспир и Тейлор Свифт; журналисты The Decoder набрали 175 и 262.

Особый интерес представляет поведение малых моделей. По словам создателей, компактные LLM запоминают меньше людей — порог релевантности у них выше. Поэтому появление в Llama от Meta, обученной на относительно небольшом числе параметров (в публичной версии — от одного миллиарда), считается сигналом высокой значимости персоны: в маленькую модель попадают только те, кто встречался в обучающих данных особенно часто.

Создатели честно обозначают границы инструмента. Языковые модели склонны к галлюцинациям — они могут уверенно сообщать биографические детали, которых никогда не существовало. Опечатка в имени или фамилии способна существенно снизить балл, потому что модели чувствительны к точному написанию. Распространённые имена создают дополнительный шум: модель может смешивать сведения о разных людях с одинаковым именем.

Для отрасли этот инструмент интересен сразу в нескольких измерениях. Во-первых, он делает видимым то, что обычно скрыто внутри «чёрного ящика» — какие знания реально закодированы в параметрах, а не просто извлекаются через поиск. Во-вторых, он поднимает практический вопрос о том, кто и почему попадает в обучающие данные и как это влияет на то, что модели «знают» по умолчанию. Наконец, инструмент наглядно показывает разницу между моделями разного масштаба: чем меньше модель, тем избирательнее её память.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Правительство США вынудило Anthropic отозвать модели Fable 5 и Mythos 5

Продолжить по разделам

Сайт In the Weights проверяет, знают ли языковые модели, кто вы такой

Кратко

Читать дальше

OpenAI научила модели переносить честность и осторожность между доменами

Amazon MGM прекратила работу над фильмом о Сэме Альтмане «Artificial»

Правительство США вынудило Anthropic отозвать модели Fable 5 и Mythos 5