37% новых релизов на Яндекс Музыке — ИИ-музыка: алгоритм детекции

Подготовлено редакцией Malakhov AI

Habr AI·16 часов назад·1 минРоссияКод

По данным исследования, проведённого в первом полугодии 2026 года, 37% новых треков на Яндекс Музыке содержат признаки генерации искусственным интеллектом, а среди лайкнутых композиций эта доля достигает 50%. Автор разработал алгоритм детекции на основе преобразования Фурье и производной частотного спектра, не требующий GPU.

Кратко

—37% новых релизов на Яндекс Музыке в первом полугодии 2026 года имеют признаки ИИ-генерации.
—Среди треков с лайками доля ИИ-музыки достигает 50%.
—Алгоритм детекции основан на анализе спектральных артефактов через преобразование Фурье и производную.
—Точность определения ИИ-музыки приближается к 100% по заявлению автора.
—Метод не требует GPU и работает на обычном CPU.

Глоссарий · 3 термина▾

преобразование Фурье: Математический метод разложения сложного сигнала на набор синусоидальных составляющих с разными частотами и амплитудами.
производная первого порядка: Скорость изменения сигнала; для дискретных данных вычисляется как разность между соседними значениями.
спектральные артефакты: Аномалии в частотном спектре, возникающие из-за особенностей работы генеративных нейросетей, проявляющиеся как резкие пики на определённых частотах.

Прошло полтора месяца с публикации статьи о том, что Яндекс Музыка на треть состоит из нейрослопа. Автор продолжил исследование и создал алгоритм, определяющий сгенерированные треки с точностью, близкой к 100%. За первое полугодие 2026 года было проанализировано количество новых релизов: 37% из них имеют признаки ИИ-музыки. Если учитывать только треки с лайками, то доля нейромузыки достигает 50%.

Алгоритм детекции основан на спектральных артефактах, возникающих при генерации аудио нейросетями. Эти артефакты, известные как checkerboard artifacts, проявляются в виде повторяющихся резких пиков на определённых частотах. Исследователи Deezer в своей статье "A Fourier Explanation of ИИ-music Artifacts" показали, что такие артефакты можно выявить через преобразование Фурье. Автор адаптировал их подход, используя производную первого порядка для выделения пиков из усреднённого частотного спектра.

Производная первого порядка — это скорость изменения сигнала; для дискретного сигнала она вычисляется как разность соседних отсчётов. Применив её к усреднённому спектру, можно сделать артефакты заметными, особенно в диапазоне 6 кГц – 16 кГц. Затем полученные признаки подаются на классификатор машинного обучения, который обучается отличать живую музыку от сгенерированной. Важно, что для работы алгоритма не требуется GPU — достаточно обычного процессора.

Хотя точность детекции заявлена как близкая к 100%, остаются вопросы: насколько репрезентативна выборка, как алгоритм ведёт себя на разных жанрах и качественных записях. Автор планирует открыть доступ к алгоритму по запросу. Само исследование поднимает проблему маркировки ИИ-контента на стриминговых платформах: пользователи хотят знать, какой трек создан человеком, а какой — нейросетью.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Лучшие практики многократного обучения с подкреплением в Amazon SageMaker ИИ

Продолжить по разделам

37% новых релизов на Яндекс Музыке — ИИ-музыка: алгоритм детекции

Кратко

Читать дальше

GFusion: диффузионная LLM от GigaChat

Сочинский филиал РУДН отменил дипломные работы для студентов-юристов

Лучшие практики многократного обучения с подкреплением в Amazon SageMaker ИИ