Эмоциональный ИИ без научной базы захватывает корпоративные рабочие места

The Decoder·5 дней назад·3 минИсследованияИндустрия

Рынок систем распознавания эмоций на основе ИИ к 2030 году утроится до $9 млрд — при том что научная основа большинства таких продуктов оспаривается десятилетиями. Компании от MetLife до Burger King уже внедряют подобные инструменты для слежки за сотрудниками, а ЕС успел запретить их применение в трудовых отношениях.

Кратко

—Рынок emotion AI вырастет до $9 млрд к 2030 году — втрое по сравнению с текущим объёмом.
—MetLife анализирует голос операторов колл-центров; Burger King тестирует чат-бот Patty, оценивающий дружелюбие сотрудников.
—Теория шести базовых эмоций Пола Экмана, на которой строятся многие продукты, признана научным сообществом упрощённой и методологически ненадёжной.
—Исследование показало: ИИ распознавания эмоций оценивал темнокожих баскетболистов НБА как более злых, чем белых коллег — даже когда те улыбались.
—ЕС запретил emotion AI на рабочих местах в рамках AI Act; в ответ компания MorphCast перенесла штаб-квартиру из Флоренции в Кремниевую долину.

Глоссарий · 5 терминов▾

Emotion AI: Класс программных систем, которые претендуют на распознавание эмоционального состояния человека по мимике, голосу, тексту или физиологическим сигналам.
Affective computing: Область исследований и разработок, изучающая системы, способные распознавать, интерпретировать и имитировать эмоции человека.
Sentiment analysis: Автоматический анализ текста или речи для определения эмоциональной окраски — позитивной, негативной или нейтральной.
AI Act: Регуляторный акт Европейского союза, вступивший в силу в 2024 году и устанавливающий правила применения систем ИИ в зависимости от уровня риска.
Biosensor: Датчик, измеряющий физиологические параметры тела — пульс, частоту дыхания, кожно-гальваническую реакцию и другие показатели.

Программа MorphCast проанализировала выражение лица журналистки The Atlantic Эллен Кашинг во время рабочей встречи и пришла к выводу, что та была «развлечена», «решительна» и «заинтересована» — с периодическими вспышками «нетерпения». Этот самоэксперимент стал отправной точкой для большого репортажа о целой индустрии, которая тихо встраивается в повседневную жизнь офисов и колл-центров под названиями «emotion AI» и «affective computing».

Продукты этого класса анализируют видеозаписи собеседований, аудио звонков в службы поддержки, переписку в корпоративных мессенджерах. MetLife отслеживает тембр и интонации операторов колл-центров. Burger King тестирует гарнитуру с чат-ботом Patty, который оценивает взаимодействие сотрудников с клиентами на предмет «дружелюбия». Производитель офисной мебели Framery испытывал кресла с биосенсорами, измеряющими пульс, частоту дыхания и уровень тревожности. Slack-интеграции Aware и Azure от Microsoft предлагают анализ тональности внутренней переписки, а платформа Imentiv продаёт инструменты эмоционального анализа для найма.

Компания / продукт	Что анализируется	Применение
MetLife	Тембр и интонации голоса	Мониторинг операторов колл-центров
Burger King (чат-бот Patty)	Взаимодействие сотрудников с клиентами	Оценка дружелюбия персонала
Framery	Пульс, дыхание, тревожность	Биосенсоры в офисных креслах
Aware / Microsoft Azure	Корпоративная переписка	Анализ тональности в Slack
Imentiv	Видео собеседований	Эмоциональный анализ при найме
HireVue	Видео и аудио кандидатов	Скрининг соискателей

Научная база большинства этих систем строится на теории шести базовых эмоций психолога Пола Экмана. Проблема в том, что эта теория «широко оспаривается как чрезмерно упрощённая и методологически ненадёжная» уже несколько десятилетий. Нейробиолог Лиза Фельдман Барретт формулирует это так: движения — «будь то на лице, в теле или в звуках, которые вы издаёте, — не несут в себе врождённого эмоционального смысла. Они несут реляционный смысл». Иными словами, одно и то же выражение лица в разных культурах и контекстах означает разное. В США, по данным исследований, люди хмурятся от злости лишь в 35% случаев.

MetLife анализирует голос операторов колл-центров; Burger King тестирует чат-бот Patty, оценивающий дружелюбие сотрудников.

Помимо научной сомнительности, системы демонстрируют устойчивую предвзятость. Исследование Лорен Рю показало: ИИ распознавания эмоций оценивал темнокожих игроков НБА как более злых по сравнению с белыми коллегами — в ряде случаев даже когда те улыбались. Это не абстрактная проблема: по данным расследования NYT 2022 года, социальные работники UnitedHealth получали пониженные оценки за «неактивность клавиатуры» в то время, когда они разговаривали с пациентами. ACLU обвинила платформу для найма HireVue и её клиента Intuit в том, что глухой сотруднице отказали в повышении, а в письме об отказе посоветовали «практиковать активное слушание». Обе компании оспаривают эти обвинения.

Европейский союз отреагировал законодательно: AI Act запрещает применение emotion AI в трудовых отношениях — с исключениями только для медицинских и охранных целей. MorphCast ответила на это переносом штаб-квартиры из Флоренции в Кремниевую долину. Американский рынок остаётся практически нерегулируемым, и именно туда направлен основной рост: по прогнозам, к 2030 году глобальный рынок достигнет $9 млрд.

Автор репортажа заканчивает неожиданным выводом: страшнее, чем ошибающиеся системы, был бы сценарий, при котором они работают безупречно. Тогда к обычным рабочим обязанностям добавится ещё одна — «заставить эмоционального робота думать, что я достаточно жизнерадостна». Это точно описывает логику индустрии: даже если технология не работает, она уже меняет поведение людей, которые знают, что за ними наблюдают.

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме