Meta ускоряет внедрение ИИ-модерации, сотрудники предупреждают о рисках

Подготовлено редакцией Malakhov AI

The Decoder·5 часов назад·1 минИсследованияИндустрия

В 2025 году Meta заменила около половины запросов на модерацию контента языковыми моделями, а к концу года планирует довести долю до 90% для некоторых типов контента. Компания утверждает, что модели делают на 13% меньше ошибок, чем люди, но сотрудники сообщают о проблемах с удалением безвредного контента и недостатком контроля.

Кратко

—Meta заменила 50% запросов на модерацию ИИ в 2025 году, планирует 90% к концу года.
—Тесты показывают 13% меньше ошибок и 10% больше нарушений, выявленных моделями.
—Сотрудники предупреждают, что модели удаляют безвредный контент, а развертывание идет слишком быстро.
—Meta меняет Google Gemini на собственную модель Muse Spark для модерации.

Глоссарий · 3 термина▾

LLM (Large Language Model): Большая языковая модель, тип ИИ, обученный на больших объемах текста для генерации и понимания языка.
теневой бан (shadow-ban): Скрытое ограничение видимости контента без уведомления пользователя.
Muse Spark: Новая базовая модель Meta для модерации, заменяющая Google Gemini.

Meta уже в 2025 году перевела около половины задач по модерации контента на крупные языковые модели (LLM). К концу года компания планирует автоматизировать более 90% проверок для некоторых категорий публикаций. По данным Financial Times, это изменение может сэкономить компании миллиарды долларов ежегодно, хотя в Meta опровергают аргумент о стоимости и делают акцент на качестве.

Тестирование, проведенное с марта, показало, что языковые модели Meta допускают на 13% меньше ошибок при применении правил сообщества, чем люди, а также выявляют на 10% больше нарушений. В отличие от традиционных классификаторов машинного обучения, которые плохо справляются с сатирой и эволюционирующим языком, LLM якобы лучше понимают нюансы и поддерживают больше языков. Однако сотрудники рисуют иную картину: модели по-прежнему удаляют или «теневой банят» безвредный контент, а для столь быстрого внедрения не хватает контроля.

Показатель	Люди	Модели ИИ
Доля обработанных запросов (сейчас)	~50%	~50%
Целевая доля к концу года	<10%	>90%
Ошибки при модерации	Исходный уровень	на 13% меньше
Выявленные нарушения	Исходный уровень	на 10% больше

Переход уже приводит к сокращению рабочих мест, особенно среди внешних подрядчиков. Кроме того, как сообщает Financial Times, за кулисами происходит смена моделей: ранее Meta применяла Google Gemini для модерации и поддержки, но недавно поручила сотрудникам перейти на собственную новую базовую модель Muse Spark. Обучаются модели на предыдущих решениях модераторов-людей. Сотрудники предупреждают, что такой быстрый переход может привести к ошибкам и недостатку контроля. Таким образом, Meta стремится снизить затраты и повысить скорость модерации, но сталкивается с рисками, связанными с качеством и социальными последствиями.

Тесты показывают 13% меньше ошибок и 10% больше нарушений, выявленных моделями.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

Meta ускоряет внедрение ИИ-модерации, сотрудники предупреждают о рисках

Кратко

Читать дальше

Qualcomm представил процессор Dragonfly C1000 для ИИ-агентов

OpenAI и Broadcom представили чип Jalapeño для вывода LLM

Google DeepMind встроила компьютерное зрение в Gemini 3.5 Flash