LLM как коммунальная услуга: почему токен становится единицей оплаты за мышление

Habr AI·29 апр.·3 минРоссияКод

Дмитрий Фырнин, технический директор компании SENSE, описывает трансформацию рынка LLM: модели перестают быть SaaS-сервисами и превращаются в инфраструктуру — с токенами как расчётной единицей, геополитическим ценообразованием и логикой коммунальных тарифов.

Кратко

—LLM-рынок структурно напоминает энергетику: компании продают инференс — токены вычислительной мощности, а не программный продукт.
—Цену токена зажимают с двух сторон: снизу — себестоимость GPU и электричества, сверху — государственные субсидии (DeepSeek, Mistral, CHIPS Act).
—Рынок движется к «достаточно хорошему мышлению с предсказуемой экономикой», а не к лучшим benchmark-результатам.
—Агентные сценарии упираются в безопасность: prompt injection позволяет вредоносному контенту интерпретироваться как команда и влиять на реальные действия системы.
—Улучшения моделей постепенно перестают быть заметны массовому пользователю — рынок взрослеет по сценарию потребительской электроники.

Глоссарий · 6 терминов▾

Инференс: Процесс применения обученной модели для получения ответа на запрос пользователя — то, за что фактически платят при использовании LLM через API.
Токен: Минимальная единица текста, которую обрабатывает языковая модель; примерно соответствует слогу или короткому слову, используется как расчётная единица при тарификации.
Prompt injection: Атака на языковую модель, при которой вредоносные инструкции встраиваются в обрабатываемые данные и воспринимаются моделью как команды.
SLA: Соглашение об уровне сервиса — договорённость между провайдером и клиентом о гарантированных параметрах доступности и качества услуги.
Агентный сценарий: Режим работы LLM, при котором модель не просто отвечает на вопросы, но самостоятельно выполняет последовательность действий — вызывает инструменты, читает файлы, отправляет запросы.
CHIPS Act: Американский закон 2022 года о субсидировании производства полупроводников на территории США, косвенно финансирующий инфраструктуру крупных технологических компаний.

Технический директор SENSE Дмитрий Фырнин опубликовал на Habr первую часть серии материалов о том, как LLM меняют среду принятия решений. Центральный тезис: языковые модели уже не укладываются в категорию SaaS и ведут себя как коммунальная услуга — с тарифами, уровнями доступа и чувствительностью к цене.

Аналогия с энергосистемой здесь не декоративная. Электричество распределяется, тарифицируется и регулируется — и его отсутствие ощущается острее, чем присутствие. По мере того как на языковые модели завязываются бизнес-процессы, они приобретают ту же логику: SLA, приоритеты доступа, ценовые уровни. Продуктовые оболочки — корпоративные тарифы, API, агентные сценарии — в конечном счёте сводятся к одному вопросу: сколько токенов, какого качества и при каких ограничениях доступно пользователю.

Страна / блок	Инструмент поддержки	Бенефициар
Китай	Субсидии дата-центров, энергетики, производителей GPU	DeepSeek и другие
США	CHIPS Act, военные контракты	Microsoft, Google, Amazon
ЕС	Государственные фонды	Mistral

Экономика токенов устроена жёстко. Снизу стоимость единицы вычисления ограничивает себестоимость GPU и электричества: если мощность выгоднее использовать иначе, цена на токены не будет падать бесконечно. Сверху давит конкуренция и — что принципиально — государственные субсидии. Китай субсидирует дата-центры, энергетику и производителей GPU, что позволило DeepSeek выйти на рынок с агрессивно низкой ценой. США через CHIPS Act и военные контракты косвенно финансируют инфраструктуру Microsoft, Google и Amazon. ЕС поддерживает Mistral через государственные фонды, рассматривая его как стратегический актив. В итоге стоимость токена оказывается зажатой не только между инфраструктурой и рынком, но и между геополитическими интересами — и эта зона конфликта, по оценке автора, будет только расширяться.

Цену токена зажимают с двух сторон: снизу — себестоимость GPU и электричества, сверху — государственные субсидии (DeepSeek, Mistral, CHIPS Act).

Рынок движется не к «лучшему мышлению», а к «достаточно хорошему мышлению с предсказуемой экономикой». Инвесторы крупнейших LLM-компаний рано или поздно начнут требовать прибыльности, и тогда главным конкурентным преимуществом станет не впечатляющий benchmark, а способность давать приемлемый результат при низкой себестоимости. Это объясняет, почему разговоры про «цифровых сотрудников» набирают вес: рынку нужна понятная единица потребления. На практике, впрочем, это пока не автономный субъект, а сборка из модели, инструментов, памяти и ограничений. Ближайшее будущее — коммерциализация узких сценариев: поддержка, суммаризация, генерация, аналитика, кодогенерация, работа с внутренними данными.

Отдельный сдвиг — появление пооперационной цены на мышление. Умственный труд всегда стоил денег, но его цена учитывалась через часы специалистов. LLM впервые позволяют грубо, но практически оценить, сколько стоит анализ, генерация или перебор вариантов. Компании начинают оптимизировать не просто процессы, а глубину и стоимость размышления: где хватит дешёвой модели, где нужна большая глубина, где допустим черновик, а где требуется человеческая верификация из-за цены ошибки или репутационных рисков.

Агентные сценарии — следующий рубеж, и именно здесь безопасность становится главным тормозом. Пока модель помогает писать или искать, цена ошибки невысока. Но когда LLM получает доступ к почте, документам, CRM или платежам, она становится точкой потенциальной атаки. Исследования prompt injection показывают: агентные системы уязвимы к атакам, при которых вредоносный контент интерпретируется как команда — и влияет не только на ответ, но и на поведение всей системы, вплоть до вызова инструментов и изменения логики выполнения. Модель не на 100% различает данные и инструкции, и это структурная проблема, а не баг конкретной реализации.

Наконец, траектория улучшений моделей всё больше напоминает рынок потребительской электроники: сначала ощутимый скачок, затем серия улучшений, которые инженерно реальны, но субъективно воспринимаются как второстепенные. Каждый новый скачок обходится дороже и меньше ощущается массовым пользователем. Наиболее реалистичный сценарий: часть улучшений станет критичной для профессионалов, часть будет работать на поддержание лидерства. Массовому пользователю окажется важнее не то, что модель стала чуть умнее, а то, что она стала надёжнее, дешевле и лучше встроилась в реальные процессы.

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме