Русский ИИ — бессмысленно и беспощадно дорогой.

Сколько российский бизнес переплачивает за отечественные ИИ?

Под российскими LLM чаще всего подразумеваются не модели, созданные с нуля, а дообученные версии открытых моделей мировых вендоров: LLaMA, Qwen, Mistral и др. Российские разработчики подмешивают локальные корпуса, настраивают на задачи, ставят фирменный логотип — и переносят это на собственные серверы. Вот здесь и прячется главная наценка. Современные GPU в страну идут окольными путями, с посредниками и маржой. Облака за рубежом для персональных данных — закрыты 152-ФЗ. Значит, строй свой ЦОД, неси капексы и платёжки за электричество. Сервер, способный обслуживать тысячу активных пользователей — стоит около 55 млн рублей, не считая расходов на электричество.
Но даже при наличии необходимых GPU, из-за слабой нагрузки, себестоимость токена все равно высока. Чтобы цена была адекватной, мощности должны работать на 80–90%. Однако пока корпоративные LLM внутри компаний не востребованы так сильно, и генерация текстов выходит дороже.

Итог — цена токена отражает не интеллект модели, а кривую стоимость инфраструктуры. На витрине это выглядит благопристойно: «своё, локальное, надёжное». В счёте — иначе.

Посмотрим на цифры. Например, сервис-агрегатор иностранных LLM AI-MEDIATOR, который даёт российскому бизнесу доступ к API иностранных ИИ-моделей, дает такой прайс на gpt‑5: 25 рублей за 1 млн токенов во входе при кешировании, 250 рублей — если кеш не сработал, и 2 000 рублей — за 1 млн выходных токенов. Для сравнения, у «своих»: Яндекс GPT Pro5 — 1 200 рублей за 1 млн токенов, GigaChat — 1 500 рублей за 1 млн.

Дьявол — в пропорциях. В реальных корпоративных сценариях входных токенов больше: длинный контекст, RAG, регламенты, юридические корпуса, проверка фактов. Если исходить из привычных 80% входа и 20% выхода и считать, что кеш работает, то «иностранный» миллион токенов через агрегатор обойдётся примерно в 420 рублей. Без кеша — в 600 рублей. При ещё более «входо‑тяжёлом» профиле (85/15) — порядка 321 рубля. Даже при 50/50 — около 1 013 рублей.

На этом фоне «свои» оказываются дороже в два–четыре раза: при профиле 80/20 с кешем Яндекс GPT Pro5 — примерно в 2,9 раза, GigaChat — в 3,6 раза; при 85/15 — в 3,7 и 4,7 раза соответственно. Штамп «доступнее и безопаснее» рушится о сухую математику.

Теперь — к итоговой цене вопроса для экономики. По данным Центра ИИ МТС (MTS AI), объём российского рынка LLM‑продуктов для бизнеса в 2024 году — 35 млрд рублей. С прогнозным ростом 25% в 2025‑м рынок достигнет примерно 43,75 млрд. Если переложить на этот объём текущий ценовой разрыв (типичная экономия при переходе с «отечественных» тарифов на агрегатор — 50–72% токено‑чека, то есть разница в 600–1 080 рублей на каждый миллион токенов), получаем три сценария «сожжённых» денег:

  • Консервативный: около 6,5 млрд рублей переплаты.
  • Базовый: порядка 14–15 млрд рублей.
  • Верхняя оценка: до 28–30 млрд рублей.

Это не инвестиции в качество ответов модели. Это цена инфраструктурных ограничений, дефицита железа и регуляторики, переложенная на бизнес.

Мы привыкли, что технологии удешевляют процессы. ИИ должен становиться доступнее, как облако или минуты связи. Но пока «русский ИИ» выходит бессмысленно и беспощадно дорогим — и счёт за эту роскошь в 2025 году составит для компаний миллиарды рублей.

2
5 комментариев