Meta уже в 2025 году перевела около половины задач по модерации контента на крупные языковые модели (LLM). К концу года компания планирует автоматизировать более 90% проверок для некоторых категорий публикаций. По данным Financial Times, это изменение может сэкономить компании миллиарды долларов ежегодно, хотя в Meta опровергают аргумент о стоимости и делают акцент на качестве.

Тестирование, проведенное с марта, показало, что языковые модели Meta допускают на 13% меньше ошибок при применении правил сообщества, чем люди, а также выявляют на 10% больше нарушений. В отличие от традиционных классификаторов машинного обучения, которые плохо справляются с сатирой и эволюционирующим языком, LLM якобы лучше понимают нюансы и поддерживают больше языков. Однако сотрудники рисуют иную картину: модели по-прежнему удаляют или «теневой банят» безвредный контент, а для столь быстрого внедрения не хватает контроля.

ПоказательЛюдиМодели ИИ
Доля обработанных запросов (сейчас)~50%~50%
Целевая доля к концу года<10%>90%
Ошибки при модерацииИсходный уровеньна 13% меньше
Выявленные нарушенияИсходный уровеньна 10% больше

Переход уже приводит к сокращению рабочих мест, особенно среди внешних подрядчиков. Кроме того, как сообщает Financial Times, за кулисами происходит смена моделей: ранее Meta применяла Google Gemini для модерации и поддержки, но недавно поручила сотрудникам перейти на собственную новую базовую модель Muse Spark. Обучаются модели на предыдущих решениях модераторов-людей. Сотрудники предупреждают, что такой быстрый переход может привести к ошибкам и недостатку контроля. Таким образом, Meta стремится снизить затраты и повысить скорость модерации, но сталкивается с рисками, связанными с качеством и социальными последствиями.

Тесты показывают 13% меньше ошибок и 10% больше нарушений, выявленных моделями.