Project Deal от Anthropic - маленький эксперимент, но он хорошо показывает будущую проблему агентной экономики. В тесте участвовали 69 сотрудников компании, каждому дали бюджет $100 в формате подарочных карт. Агенты представляли покупателей и продавцов на внутреннем маркетплейсе, вели переговоры и заключали сделки. Всего получилось 186 сделок на сумму более $4 тыс.
Anthropic запускала несколько версий рынка. В одной сделки были реальными и затем исполнялись, в других сценарии использовались для изучения поведения моделей. Самый заметный вывод: пользователи, которых представляли более сильные модели, получали объективно лучшие результаты. Но участники не всегда замечали, что агент действует слабее или сильнее конкурента. Это создаёт риск agent quality gaps - разрыва качества, который напрямую влияет на выгоду человека.
| Параметр Project Deal | Значение |
|---|---|
| Участники | 69 сотрудников Anthropic |
| Бюджет на человека | $100 |
| Количество сделок | 186 |
| Общая сумма | более $4 тыс. |
Пока такие эксперименты выглядят лабораторными, но они описывают будущий слой электронной коммерции. Если агенты начнут покупать билеты, выбирать поставщиков, торговаться за подписки или оформлять сделки между компаниями, качество модели станет экономическим преимуществом. Пользователь может думать, что делегировал задачу нейтральному помощнику, хотя на деле вступил в переговоры с агентами другого класса.
Более сильные модели давали пользователям лучшие результаты, но сами участники не всегда замечали разницу.

Для рынка это означает два направления регулирования и продуктового дизайна. Во-первых, нужно объяснять пользователю, какие полномочия получил агент и какие ограничения у него есть. Во-вторых, сервисам придётся показывать, как измеряется качество агента в сделках: не только скорость ответа, но и цена, условия, риск ошибки и способность отказаться от плохого предложения.



