От моргания до кровотока: как менялись методы обнаружения дипфейков

Подготовлено редакцией Malakhov AI

Habr AI·1 июн.·3 минРоссияКод

В апреле 2025 года 74,2% новых веб-страниц содержали сгенерированный контент — такие данные приводит Ahrefs по выборке из 900 тысяч страниц. На этом фоне индустрия детекции дипфейков прошла путь от подсчёта морганий до анализа микроскопических изменений цвета кожи, связанных с кровотоком.

Кратко

—По данным Regula Deepfake Trends 2024, каждая вторая компания в мире уже сталкивалась с инцидентами, связанными с дипфейками.
—Первые детекторы 2018–2020 годов искали аномалии моргания: ранние генеративные модели почти не воспроизводили его из-за нехватки обучающих данных.
—FaceForensics++ стал стандартным benchmark для детекции: система выделяет область лица и передаёт её в классификатор, а не анализирует кадр целиком.
—Intel FakeCatcher анализирует биосигналы кровотока — изменения цвета кожи, невидимые глазу, но некорректно воспроизводимые генеративными моделями.
—MNW Benchmark от Microsoft, Northwestern и Witness содержит более 50 тысяч артефактов и обновляется дважды в год, чтобы учитывать новые генераторы.

Глоссарий · 6 терминов▾

Дипфейк: Синтетический медиаконтент — видео, аудио или изображение, — в котором внешность или голос человека подменены с помощью нейросетей.
Benchmark: Стандартизированный набор данных и метрик для сравнения производительности разных моделей в одинаковых условиях.
FaceForensics++: Открытый датасет и benchmark для детекции лицевых манипуляций, ставший отраслевым стандартом оценки детекторов дипфейков.
Intel FakeCatcher: Система детекции дипфейков от Intel, анализирующая биосигналы кровотока через микроскопические изменения цвета кожи на видео.
MNW Benchmark: Датасет Microsoft-Northwestern-Witness для оценки детекторов синтетического контента, содержащий более 50 тысяч артефактов из множества генеративных моделей.
Социальная инженерия: Манипулятивные техники, при которых злоумышленник обманывает человека, а не взламывает систему технически — например, выдавая себя за другого с помощью дипфейка.

Согласно исследованию Ahrefs, в апреле 2025 года лишь четверть новых веб-страниц можно было считать написанными человеком. Остальные 74,2% содержали сгенерированный материал — и это только текст. С видео и аудио ситуация не лучше: отчёт Regula Deepfake Trends 2024 фиксирует, что каждая вторая компания в мире уже сталкивалась с инцидентами, где дипфейки использовались для мошенничества, подделки личности или корпоративных атак. Ущерб от таких инцидентов исчисляется сотнями тысяч долларов.

Детекция дипфейков развивалась вместе с их генерацией — и каждый виток этой гонки хорошо иллюстрирует, насколько быстро устаревают методы обнаружения.

Период	Метод детекции	Ключевой проект	Ограничение
2018–2020	Анализ частоты и последовательности морганий	In Ictu Oculi (Eye Blinking)	Работал только против ранних моделей с редкими кадрами закрытых глаз
~2019–2021	Выделение области лица + классификатор на крупном датасете	FaceForensics++	Модели, не представленные в датасете, обходили детектор
2021–2026	Анализ биосигналов кровотока через изменения цвета кожи	Intel FakeCatcher	Новые генераторы учатся корректнее воспроизводить физиологические сигналы

Первые массовые детекторы появились в 2018–2020 годах и эксплуатировали очевидные слабости ранних генеративных моделей. Одна из самых цитируемых работ того периода — In Ictu Oculi: Exposing ИИ Generated Fake Face Videos by Detecting Eye Blinking. Исследователи заметили, что модели почти не воспроизводили естественное моргание: в обучающих датасетах просто не хватало изображений людей с закрытыми глазами. Детектор анализировал частоту и последовательность морганий — если человек на видео не моргал в течение нескольких секунд, запись помечалась как подозрительная.

Первые детекторы 2018–2020 годов искали аномалии моргания: ранние генеративные модели почти не воспроизводили его из-за нехватки обучающих данных.

Следующий этап ознаменовался переходом от поиска единичных артефактов к универсальным моделям на крупных датасетах. Ключевым проектом стал FaceForensics++: авторы предложили стандартный benchmark и доменно-специфичный подход. Система сначала отслеживает и выделяет область лица, затем передаёт её в классификационную сеть. Такой подход позволил обучать детекторы на разнообразных типах манипуляций и сравнивать их результаты в единых условиях. FaceForensics++ фактически стал отраслевым стандартом для оценки детекторов на несколько лет вперёд.

После 2021 года генеративные модели научились синхронизировать движения губ с речью, учитывать освещение и угол камеры и работать в реальном времени. Визуальные артефакты, на которых строились прежние детекторы, исчезли. Индустрия ответила принципиально иными подходами. Показательный пример — Intel FakeCatcher: вместо анализа пикселей система исследует микроскопические изменения цвета кожи, связанные с кровотоком. Для человеческого глаза они незаметны, но генеративные модели долго воспроизводили их некорректно. FakeCatcher выделяет несколько областей лица, извлекает биологические сигналы и анализирует их пространственную и временную согласованность, после чего классификатор оценивает вероятность подделки.

Однако и этот подход не решает фундаментальной проблемы: модели генерации развиваются быстрее, чем способы их обнаружения. Детекторы, обученные на артефактах конкретных моделей, теряют эффективность при появлении новых генераторов. Именно эту проблему пытается адресовать Microsoft-Northwestern-Witness Benchmark (MNW). Датасет содержит более 50 тысяч артефактов — изображения, видео, аудио и мультимодальный контент, — сгенерированных большим набором современных нейросетей, а не одной моделью. Ключевая идея: детектор не должен запоминать особенности конкретного генератора, он должен обобщать признаки синтетического контента как класса. Авторы подчёркивают, что MNW предназначен для оценки детекторов, а не для их обучения или коммерческого использования. Датасет планируется обновлять дважды в год — весной и осенью, — чтобы учитывать новые генераторы и новые способы обхода детекторов.

MNW отражает более широкий сдвиг в отрасли: детекция перестаёт быть разовой проверкой «настоящее или фейк» и превращается в часть инфраструктуры цифрового доверия. В среде, где видео, голос и изображение больше не являются самостоятельным доказательством, задача детектора — не дать окончательный ответ, а обеспечить постоянную верификацию контента в условиях постоянно меняющихся генеративных моделей.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

Продолжить по разделам