Прошло полтора месяца с публикации статьи о том, что Яндекс Музыка на треть состоит из нейрослопа. Автор продолжил исследование и создал алгоритм, определяющий сгенерированные треки с точностью, близкой к 100%. За первое полугодие 2026 года было проанализировано количество новых релизов: 37% из них имеют признаки ИИ-музыки. Если учитывать только треки с лайками, то доля нейромузыки достигает 50%.
Алгоритм детекции основан на спектральных артефактах, возникающих при генерации аудио нейросетями. Эти артефакты, известные как checkerboard artifacts, проявляются в виде повторяющихся резких пиков на определённых частотах. Исследователи Deezer в своей статье "A Fourier Explanation of ИИ-music Artifacts" показали, что такие артефакты можно выявить через преобразование Фурье. Автор адаптировал их подход, используя производную первого порядка для выделения пиков из усреднённого частотного спектра.
Производная первого порядка — это скорость изменения сигнала; для дискретного сигнала она вычисляется как разность соседних отсчётов. Применив её к усреднённому спектру, можно сделать артефакты заметными, особенно в диапазоне 6 кГц – 16 кГц. Затем полученные признаки подаются на классификатор машинного обучения, который обучается отличать живую музыку от сгенерированной. Важно, что для работы алгоритма не требуется GPU — достаточно обычного процессора.
Хотя точность детекции заявлена как близкая к 100%, остаются вопросы: насколько репрезентативна выборка, как алгоритм ведёт себя на разных жанрах и качественных записях. Автор планирует открыть доступ к алгоритму по запросу. Само исследование поднимает проблему маркировки ИИ-контента на стриминговых платформах: пользователи хотят знать, какой трек создан человеком, а какой — нейросетью.

