В начале апреля разработчик Юлиус Брюссе создал плагин Caveman для ИИ-инструментов, который заставляет модели вроде Claude Code и Codex отвечать максимально кратко — как «пещерный человек». Вместо развёрнутых объяснений с извинениями и переходами модель выдаёт короткие команды: «Что нужно?», «Готово.», «Исправлено». По замыслу автора, такой подход сокращает число выходных токенов, за которые компании платят поставщикам ИИ-услуг.
Проблема затрат на ИИ стала острой. GitHub объявил о переходе на токенную модель оплаты для своих сервисов Codex. Uber, по данным внутренних источников, исчерпал весь бюджет на ИИ за четыре месяца и ввёл лимиты для сотрудников. Walmart также ограничил использование корпоративных ИИ-инструментов. Консалтинговая компания Accenture, ранее активно продвигавшая внедрение ИИ, теперь предлагает клиентам «токенную экономику» — оптимизацию расходов на каждом запросе.
Caveman — это не шутка, а инструмент с измеримым эффектом. В тестах 404 Media плагин показал экономию около 65% токенов. Сам Брюссе утверждает, что в его оценках сокращение достигает 65–75% по сравнению со стандартным выводом и даже превосходит обычную инструкцию «будь краток». Пользователь может выбрать степень «грубости»: lite, full, ultra или даже Wenyan (перевод на классический китайский).
Среди пользователей — сотрудники OpenAI, Nvidia и GitHub; один из инженеров OpenAI внёс код в проект.

Среди пользователей Caveman — сотрудники OpenAI, Nvidia и GitHub. Шейн Суини, директор по инженерии в OpenAI, внёс код для поддержки Codex. Крупный клиент — французский производитель электрооборудования Legrand. Внутренний меморандум Legrand рекомендует сотрудникам использовать Caveman как один из способов снизить расходы, наряду с выбором менее мощных моделей и отказом от высоких настроек рассуждений.



