Компании заставляют ИИ-модели «говорить по-пещерному» ради экономии токенов

Подготовлено редакцией Malakhov AI

404 Media·2 часа назад·1 минИндустрия

Плагин Caveman, разработанный Юлиусом Брюссе в начале апреля, сокращает объём выходных токенов ИИ-моделей на 65–75%, заставляя их отвечать в стиле «пещерного человека». Использование плагина растёт на фоне резкого увеличения затрат компаний на ИИ: GitHub перешёл на токенную модель оплаты, Uber исчерпал бюджет за четыре месяца.

Кратко

—Плагин Caveman сокращает выходные токены LLM на 65–75% за счёт отказа от вежливости и форматирования.
—Среди пользователей — сотрудники OpenAI, Nvidia и GitHub; один из инженеров OpenAI внёс код в проект.
—Компании вроде Legrand внедряют Caveman после введения квот и изменения биллинга.
—Консалтинговая фирма Accenture предлагает клиентам «токенную экономику» как новую услугу.

Глоссарий · 4 термина▾

токены: Базовые единицы текста, обрабатываемые языковыми моделями; оплата обычно идёт за количество токенов на входе и выходе.
LLM: Большая языковая модель, тип ИИ, способный генерировать и понимать текст.
агентный цикл: Автоматический процесс, в котором ИИ многократно выполняет запросы без участия человека.
выходные токены: Токены, сгенерированные моделью в ответ на запрос.

В начале апреля разработчик Юлиус Брюссе создал плагин Caveman для ИИ-инструментов, который заставляет модели вроде Claude Code и Codex отвечать максимально кратко — как «пещерный человек». Вместо развёрнутых объяснений с извинениями и переходами модель выдаёт короткие команды: «Что нужно?», «Готово.», «Исправлено». По замыслу автора, такой подход сокращает число выходных токенов, за которые компании платят поставщикам ИИ-услуг.

Проблема затрат на ИИ стала острой. GitHub объявил о переходе на токенную модель оплаты для своих сервисов Codex. Uber, по данным внутренних источников, исчерпал весь бюджет на ИИ за четыре месяца и ввёл лимиты для сотрудников. Walmart также ограничил использование корпоративных ИИ-инструментов. Консалтинговая компания Accenture, ранее активно продвигавшая внедрение ИИ, теперь предлагает клиентам «токенную экономику» — оптимизацию расходов на каждом запросе.

Caveman — это не шутка, а инструмент с измеримым эффектом. В тестах 404 Media плагин показал экономию около 65% токенов. Сам Брюссе утверждает, что в его оценках сокращение достигает 65–75% по сравнению со стандартным выводом и даже превосходит обычную инструкцию «будь краток». Пользователь может выбрать степень «грубости»: lite, full, ultra или даже Wenyan (перевод на классический китайский).

Среди пользователей — сотрудники OpenAI, Nvidia и GitHub; один из инженеров OpenAI внёс код в проект.

Image: Getty Images for Unsplash+, and company logos. · Источник: 404 Media

Среди пользователей Caveman — сотрудники OpenAI, Nvidia и GitHub. Шейн Суини, директор по инженерии в OpenAI, внёс код для поддержки Codex. Крупный клиент — французский производитель электрооборудования Legrand. Внутренний меморандум Legrand рекомендует сотрудникам использовать Caveman как один из способов снизить расходы, наряду с выбором менее мощных моделей и отказом от высоких настроек рассуждений.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ