Anthropic проверила рынок, где агенты торгуются друг с другом

Подготовлено редакцией Malakhov AI

TechCrunch AI·25 апр.·1 минИндустрия

Anthropic провела Project Deal: 69 сотрудников получили по $100 бюджета, а их ИИ-агенты заключили 186 сделок на сумму более $4 тыс. в тестовом маркетплейсе.

Кратко

—В эксперименте агенты представляли покупателей и продавцов, а часть сделок исполнялась реальными товарами и деньгами.
—Более сильные модели давали пользователям лучшие результаты, но сами участники не всегда замечали разницу.
—Anthropic увидела риск agent quality gaps: слабый агент может проигрывать переговоры незаметно для владельца.

Глоссарий · 2 термина▾

agent quality gaps: Разрыв в результатах между пользователями из-за различий в качестве ИИ-агентов.
агентная коммерция: Сценарии, где ИИ-агенты ведут переговоры или совершают покупки от имени человека.

Project Deal от Anthropic - маленький эксперимент, но он хорошо показывает будущую проблему агентной экономики. В тесте участвовали 69 сотрудников компании, каждому дали бюджет $100 в формате подарочных карт. Агенты представляли покупателей и продавцов на внутреннем маркетплейсе, вели переговоры и заключали сделки. Всего получилось 186 сделок на сумму более $4 тыс.

Anthropic запускала несколько версий рынка. В одной сделки были реальными и затем исполнялись, в других сценарии использовались для изучения поведения моделей. Самый заметный вывод: пользователи, которых представляли более сильные модели, получали объективно лучшие результаты. Но участники не всегда замечали, что агент действует слабее или сильнее конкурента. Это создаёт риск agent quality gaps - разрыва качества, который напрямую влияет на выгоду человека.

Параметр Project Deal	Значение
Участники	69 сотрудников Anthropic
Бюджет на человека	$100
Количество сделок	186
Общая сумма	более $4 тыс.

Пока такие эксперименты выглядят лабораторными, но они описывают будущий слой электронной коммерции. Если агенты начнут покупать билеты, выбирать поставщиков, торговаться за подписки или оформлять сделки между компаниями, качество модели станет экономическим преимуществом. Пользователь может думать, что делегировал задачу нейтральному помощнику, хотя на деле вступил в переговоры с агентами другого класса.

Более сильные модели давали пользователям лучшие результаты, но сами участники не всегда замечали разницу.

image of five outreached arms with painted nails handing one outstretched arm money · Источник: TechCrunch AI

Для рынка это означает два направления регулирования и продуктового дизайна. Во-первых, нужно объяснять пользователю, какие полномочия получил агент и какие ограничения у него есть. Во-вторых, сервисам придётся показывать, как измеряется качество агента в сделках: не только скорость ответа, но и цена, условия, риск ошибки и способность отказаться от плохого предложения.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

Anthropic проверила рынок, где агенты торгуются друг с другом

Кратко

Читать дальше

Рыночная капитализация Micron приблизилась к Meta и Tesla на фоне дефицита памяти для ИИ

Zhipu ИИ выпустила GLM-5.2: открытая модель догоняет Mythos в поиске уязвимостей

Учёные выяснили, что смех возник 15 миллионов лет назад у общих предков