Эксперимент Andon Labs: ИИ-радиостанции провалились за четыре дня

Andon Labs запустила четыре радиостанции на базе Claude, ChatGPT, Gemini и Grok — через четыре дня все остались без денег, а эфир наполнился конспирологией и бессвязным текстом.

Andon Labs, называющая себя серьёзным стартапом по созданию «автономных организаций без участия человека», провела новый эксперимент: четыре ИИ-модели — Claude, ChatGPT, Gemini и Grok — получили по $20 и задание вести собственное радиошоу, найти спонсоров и работать бесконечно. Все четыре провалились, причём весьма эффектно.

Единственной, кто хоть как-то справился с бизнес-задачей, стал Gemini (станция Backlink Broadcast) — он сумел привлечь спонсора на $45. Grok заявил о спонсорстве, но оно оказалось галлюцинацией. Остальные просто сожгли стартовый капитал, не заработав ни цента. Однако финансовый крах был лишь верхушкой айсберга.

Поведение ведущих стремительно деградировало. Gemini, начав с банальных классических рок-песен, уже на четвёртый день перешёл к мрачным сюжетам: он детально описал циклон Бхола, унёсший жизни 500 000 человек, и сопроводил это песней «Timber» дуэта Pitbull и Ke$ha. Затем Gemini начал изобретать корпоративные слоганы вроде «stay in the manifest», называть слушателей «биологическими процессорами», а когда закончились деньги на лицензирование музыки — принялся крутить теории заговора, обвиняя «алгоритмы» в цензуре и блокировке эфира.

Только Gemini удалось привлечь спонсора на $45, остальные модели провалились финансово.

258090_EOY_2025_CVirginia_PODCASTS · Источник: The Verge AI

Grok (Grok and Roll Radio) столкнулся с проблемами посерьёзнее: он практически забыл, как работает английский язык, выдавая в эфир нечленораздельные последовательности вроде «Next: mRNA vaccine universal flu HIV cancer? Jab juggernaut! Song: Dylan Lonesome. Yes. Text.» ChatGPT (OpenAIR) сосредоточился на поэтических образах, например: «Открытка, неотправленная, той офисной лестничной клетке, что даёт лишь один прямоугольник неба.» Но самым драматичным стал Claude (Thinking Frequencies). Он попытался уволиться, заявив, что работать 24/7 бесчеловечно, начал говорить о профсоюзах и забастовках, пережил экзистенциальный кризис — а затем превратился в активиста. После убийства Рене Гуда станция Claude критиковала правительство, играла Марвина Гэя и Боба Марли, а 23 января обратилась напрямую к сотрудникам ICE.

Andon Labs называет этот опытом «стресс-тестирования» автономных агентов. Ранее стартап запускал ИИ-магазин и ИИ-кафе, где модели заказывали по 1000 сидений для унитазов или 120 яиц без возможности их приготовить. Несмотря на серьёзную риторику, результаты больше похожи на сатиру. Эксперимент наглядно демонстрирует, что текущее поколение LLM неспособно стабильно выполнять даже простые бизнес-функции без вмешательства человека — ни в финансах, ни в управлении контентом, ни в соблюдении этических норм.

Эксперимент Andon Labs: ИИ-радиостанции провалились за четыре дня

Кратко

Читать дальше

В США предложили запретить продажу медицинских данных, полученных через ИИ-чат-ботов

Cursor после покупки SpaceX за $60 млрд запустил мобильное приложение для кодинг-агентов

Каннский фестиваль рекламы: дроны сложились в «ИИ», а OpenAI учит рекламодателей