Meta уже в 2025 году перевела около половины задач по модерации контента на крупные языковые модели (LLM). К концу года компания планирует автоматизировать более 90% проверок для некоторых категорий публикаций. По данным Financial Times, это изменение может сэкономить компании миллиарды долларов ежегодно, хотя в Meta опровергают аргумент о стоимости и делают акцент на качестве.
Тестирование, проведенное с марта, показало, что языковые модели Meta допускают на 13% меньше ошибок при применении правил сообщества, чем люди, а также выявляют на 10% больше нарушений. В отличие от традиционных классификаторов машинного обучения, которые плохо справляются с сатирой и эволюционирующим языком, LLM якобы лучше понимают нюансы и поддерживают больше языков. Однако сотрудники рисуют иную картину: модели по-прежнему удаляют или «теневой банят» безвредный контент, а для столь быстрого внедрения не хватает контроля.
| Показатель | Люди | Модели ИИ |
|---|---|---|
| Доля обработанных запросов (сейчас) | ~50% | ~50% |
| Целевая доля к концу года | <10% | >90% |
| Ошибки при модерации | Исходный уровень | на 13% меньше |
| Выявленные нарушения | Исходный уровень | на 10% больше |
Переход уже приводит к сокращению рабочих мест, особенно среди внешних подрядчиков. Кроме того, как сообщает Financial Times, за кулисами происходит смена моделей: ранее Meta применяла Google Gemini для модерации и поддержки, но недавно поручила сотрудникам перейти на собственную новую базовую модель Muse Spark. Обучаются модели на предыдущих решениях модераторов-людей. Сотрудники предупреждают, что такой быстрый переход может привести к ошибкам и недостатку контроля. Таким образом, Meta стремится снизить затраты и повысить скорость модерации, но сталкивается с рисками, связанными с качеством и социальными последствиями.
Тесты показывают 13% меньше ошибок и 10% больше нарушений, выявленных моделями.



