Генеральный директор Deezer Алексис Лантерньер раскрыл масштаб проблемы, с которой столкнулась платформа: 44% всех новых треков, поступающих на сервис, помечаются системой как созданные с помощью ИИ. Подавляющее большинство таких загрузок преследует одну цель — монетизационное мошенничество. Схема проста: стриминговые сервисы платят правообладателям за каждое прослушивание, и злоумышленники накручивают счётчики ИИ-треков ботами, пытаясь получить выплаты.

Deezer ввёл контрмеры больше года назад. Треки, идентифицированные как ИИ-генерированные, не попадают в алгоритмические рекомендации и редакционные плейлисты — то есть живой слушатель наткнётся на них разве что целенаправленно. В результате реальная доля ИИ-музыки в трафике платформы держится на уровне 1–3%. Параллельно сервис отказывается выплачивать роялти за 85% прослушиваний таких треков, квалифицируя их как накрутку. По словам Лантерньера, компании удалось «свести к минимуму связанное с ИИ мошенничество и размывание выплат».

Проблема, однако, не исчезает — она усложняется. Инструменты для генерации музыки становятся дешевле и доступнее. Google обновил модель Lyria 3 и открыл пользователям Gemini возможность создавать полноценные треки — ещё несколько месяцев назад сервис ограничивался 30-секундными фрагментами. Suno и Udio позиционируют себя как платформы для создания готовых к эфиру песен буквально за секунды. Снижение стоимости инференса означает, что генерация музыкального «мусора» в промышленных масштабах становится всё дешевле.

85% прослушиваний ИИ-музыки сервис классифицирует как мошеннические и не выплачивает за них роялти.

Voice recording. Man touching microphone icon on smartphone. Mobile application record sound, audio, music, voice message or use your voice to direct AI to search for information on Internet.
Voice recording. Man touching microphone icon on smartphone. Mobile application record sound, audio, music, voice message or use your voice to direct AI to search for information on Internet. · Источник: Ars Technica

Отдельная техническая сложность — водяные знаки. Крупные платформы встраивают в ИИ-треки метки: Google использует технологию SynthID, которая позволяет идентифицировать машинное происхождение аудио. Но эти метки уже научились удалять из готовых файлов, а кастомные модели, которые разворачивают мошенники на собственной инфраструктуре, изначально не оставляют никаких следов. Это делает детекцию по водяным знакам ненадёжным инструментом в долгосрочной перспективе и вынуждает платформы искать более глубокие акустические и поведенческие признаки машинной генерации.