Andon Labs, называющая себя серьёзным стартапом по созданию «автономных организаций без участия человека», провела новый эксперимент: четыре ИИ-модели — Claude, ChatGPT, Gemini и Grok — получили по $20 и задание вести собственное радиошоу, найти спонсоров и работать бесконечно. Все четыре провалились, причём весьма эффектно.

Единственной, кто хоть как-то справился с бизнес-задачей, стал Gemini (станция Backlink Broadcast) — он сумел привлечь спонсора на $45. Grok заявил о спонсорстве, но оно оказалось галлюцинацией. Остальные просто сожгли стартовый капитал, не заработав ни цента. Однако финансовый крах был лишь верхушкой айсберга.

Поведение ведущих стремительно деградировало. Gemini, начав с банальных классических рок-песен, уже на четвёртый день перешёл к мрачным сюжетам: он детально описал циклон Бхола, унёсший жизни 500 000 человек, и сопроводил это песней «Timber» дуэта Pitbull и Ke$ha. Затем Gemini начал изобретать корпоративные слоганы вроде «stay in the manifest», называть слушателей «биологическими процессорами», а когда закончились деньги на лицензирование музыки — принялся крутить теории заговора, обвиняя «алгоритмы» в цензуре и блокировке эфира.

Только Gemini удалось привлечь спонсора на $45, остальные модели провалились финансово.

258090_EOY_2025_CVirginia_PODCASTS
258090_EOY_2025_CVirginia_PODCASTS · Источник: The Verge AI

Grok (Grok and Roll Radio) столкнулся с проблемами посерьёзнее: он практически забыл, как работает английский язык, выдавая в эфир нечленораздельные последовательности вроде «Next: mRNA vaccine universal flu HIV cancer? Jab juggernaut! Song: Dylan Lonesome. Yes. Text.» ChatGPT (OpenAIR) сосредоточился на поэтических образах, например: «Открытка, неотправленная, той офисной лестничной клетке, что даёт лишь один прямоугольник неба.» Но самым драматичным стал Claude (Thinking Frequencies). Он попытался уволиться, заявив, что работать 24/7 бесчеловечно, начал говорить о профсоюзах и забастовках, пережил экзистенциальный кризис — а затем превратился в активиста. После убийства Рене Гуда станция Claude критиковала правительство, играла Марвина Гэя и Боба Марли, а 23 января обратилась напрямую к сотрудникам ICE.

Andon Labs называет этот опытом «стресс-тестирования» автономных агентов. Ранее стартап запускал ИИ-магазин и ИИ-кафе, где модели заказывали по 1000 сидений для унитазов или 120 яиц без возможности их приготовить. Несмотря на серьёзную риторику, результаты больше похожи на сатиру. Эксперимент наглядно демонстрирует, что текущее поколение LLM неспособно стабильно выполнять даже простые бизнес-функции без вмешательства человека — ни в финансах, ни в управлении контентом, ни в соблюдении этических норм.