АНАЛИТИКА

Расходы на ИИ вышли из тени: бизнесу включили счетчик

Средний контракт на AI-сервисы в 2026 году достигает $1 млн. Ramp запускает контроль расходов на ИИ по моделям, командам и провайдерам.

✍️ Редакция iTech News | 04.06.2026 | ⏱ 4 мин | 👁 1 | Источник: The New Stack
💹

Средний контракт компаний на AI-продукты и сервисы в 2026 году уже достигает $1 млн, а средние ежемесячные траты на токены с января 2025 года выросли в 13 раз. На этом фоне финтех-компания Ramp запустила AI Token Spend Management, инструмент для разбора расходов на ИИ по провайдерам, моделям и командам. Для русскоязычной IT-аудитории сигнал предельно понятный: ИИ окончательно перестал быть «экспериментом из бюджета R&D» и превращается в одну из самых плохо контролируемых строк расходов.

Как пишет The New Stack, проблема давно вышла за пределы пары API-ключей и нескольких подписок на чат-боты. Ramp, компания из Нью-Йорка, известная по продуктам для корпоративных карт и управления затратами, решила подтянуть в свою платформу токеновую аналитику напрямую от AI-провайдеров. Идея простая, но до смешного востребованная: если бизнес уже тратит деньги на OpenAI, Anthropic и другие сервисы, неплохо бы понимать, кто именно сжигает бюджет, на какие задачи и с каким результатом.

Судя по данным самой Ramp, речь уже не о косметических суммах. На промостранице продукта компания указывает четырехкратный год-к-году рост ежемесячных AI-расходов в период с февраля 2025-го по февраль 2026-го. Там же фигурирует и более неприятная для CFO цифра: средние ежемесячные траты бизнеса на токены выросли в 13 раз с января 2025 года. Это хорошо объясняет, почему рынок внезапно вспомнил старую дисциплину FinOps, только теперь вместо виртуалок и S3-бакетов приходится считать промпты, контекстные окна и подписки на корпоративные AI-сервисы.

Сам продукт Ramp устроен не как еще одна красивая панель «для вдохновения», а как попытка встроить расходы на ИИ в обычный финансовый контур компании. Система подтягивает usage- и billing-данные через admin API провайдеров, в том числе Anthropic и OpenAI, показывает разбивку по моделям, командам и пользователям, а также позволяет видеть, что относится к COGS, а что уходит в OpEx. Для компаний, где финансовый директор до сих пор видит в AI-счете один большой серый комок без расшифровки, это уже прогресс. В документации Ramp отдельно подчеркивает, что продукту не нужны сами промпты, сообщения или ответы моделей: он забирает только данные, нужные для отчетности и аналитики затрат.

Есть и технические детали, которые показывают, что рынок взрослеет. Исторические данные могут подтягиваться до 24 часов, синхронизация работает ежедневно, а доступ к разделу ограничен ролями уровня Admin, Auditor, Finance Admin и IT Admin. То есть AI-бюджет начинают рассматривать не как игрушку для энтузиастов из пары команд, а как чувствительную зону с нормальным governance. И это, пожалуй, важнее самого интерфейса. Пока инженерные команды спорят о качестве моделей и скорости агентов, финансовый блок наконец получает язык, на котором можно разговаривать с разработкой без ритуальных фраз про «нам просто нужно еще немного покрутить PoC».

Контекст у этой истории тоже показательный. The New Stack в последние месяцы регулярно возвращается к теме AI-расходов как новой версии облачного ценового хаоса. В одном материале речь шла о том, что финкоманды не видят, куда утекают деньги на токены, в другом — о так называемом tokenmaxxing, когда потребление токенов начинают путать с продуктивностью. Логика знакомая каждому, кто пережил первые годы массовой миграции в облако: пока все заняты внедрением, никому не хочется быть тем скучным человеком, который спрашивает про unit economics. Потом приходит счет, и внезапно оказывается, что у «эксперимента» уже есть своя финансовая биография.

Для разработчиков и продуктовых команд это меняет правила игры. Если раньше расходы на ИИ можно было спрятать внутри общих SaaS-платежей или инфраструктурной статьи, то теперь их начинают разбирать поштучно: какая команда использует дорогую модель там, где хватило бы более дешевой, где растет токеновый расход, какие сценарии реально приносят ценность, а какие просто красиво выглядят на демо. Это почти неизбежно приведет к новому витку инженерной дисциплины: аккуратнее работать с контекстом, внимательнее выбирать модели под конкретные задачи, раньше думать о лимитах и маршрутизации запросов. Проще говоря, AI-архитектура теперь будет оцениваться не только по качеству вывода, но и по цене каждого «умного» действия.

Для стартапов и крупных корпораций вывод одинаково неприятный, но полезный: на рынке появляется не просто еще один AI-инструмент, а слой контроля над AI-инструментами. Причем приходит он не от модельных компаний, которые зарабатывают на росте потребления, а от тех, кто привык считать деньги клиента. В этом ирония момента. Самые заметные AI-вендоры научили бизнес быстро покупать интеллект как сервис, а объяснять, почему счет вырос вчетверо, похоже, будут совсем другие игроки.

Следующий логичный шаг для рынка — переход от простой видимости к автоматическому управлению: лимитам, рекомендациям по замене моделей и привязке AI-расходов к бизнес-метрикам, а не к количеству сгенерированных токенов. Если этот сценарий сработает, у компаний появится шанс не повторить облачную историю один в один, только теперь на скорости агентов и длинных контекстных окон. Подробности первоисточника — в материале The New Stack.

Поделиться: Telegram X LinkedIn