Юнит-экономика текстовой AI-игры: как запустить нейросетевую RPG в соло и свести себестоимость к 2 копейкам за ход
Кейс о том, почему обычные «чат-боты» мертвы для бизнеса, как геймдизайн спасает удержание пользователей и сколько стоит запуск проекта на домашнем сервере.
Привет, DTF!
Пока крупные студии инвестируют миллионы долларов в генеративный ИИ, инди-разработчики пытаются нащупать жизнеспособные бизнес-модели на базе больших языковых моделей (LLM). Большинство таких попыток заканчивается одинаково: разработчик создаёт обертку над ChatGPT, ловит «вау-эффект» от первых пользователей, а через неделю обнаруживает, что удержание стремится к нулю, а счета за API съедают весь бюджет.
Я хочу поделиться своим опытом создания текстовой RPG «Стирая Грань» (Beyond The Verge) — полностью русскоязычного проекта, который прошёл через жёсткий продуктовый пивот, чтобы превратиться из банального чат-бота в прибыльную микро-SaaS систему со стабильной математикой.
1. Продуктовый пивот: Почему «просто чаты» не удерживают аудиторию
Изначально концепт выглядел стандартно: пользователь пишет стартовый промпт (например: «Я эльф в мрачном мире»), а ИИ генерирует ему бесконечную историю. Первые 15–20 ходов человек в восторге. Но как только новизна проходит, продукт моментально теряет пользователя.
Причины две:
- Отсутствие драматического напряжения. В бесконечном повествовании ИИ всегда поддакивает игроку. Там нельзя по-настоящему проиграть. Нет риска — нет азарта.
- Модельная амнезия. Через пару десятков сообщений ИИ банально теряет нить сюжета, забывает инвентарь, путает локации и превращает историю в кашу.
Что было сделано: Я полностью перестроил продукт, сместив акцент с «генерации романов» на жёсткий классический геймдизайн. ИИ был лишён права самостоятельно менять мир. Вместо этого бэкенд на FastAPI запер его в рамки 11 игровых модулей (инвентарь, квесты, репутация фракций, честные кубики D20).
Появилась перманентная смерть персонажа и лимиты на воскрешение. Если здоровье или энергия падают до нуля — кампания закрывается, и ИИ генерирует финальный красивый Эпилог. Как только появились реальные ставки и риск проиграть, вовлечённость пользователей выросла в разы.
2. Юнит-экономика: Как не разориться на API провайдеров
Главный страх любого ИИ-стартапа — лавинообразный рост стоимости контекста. Чтобы ИИ не страдал склерозом, бэкенд на каждом ходу должен передавать ему карту, текущий квест, содержимое рюкзака и логи памяти. Вес одного запроса быстро раздувается до 4 000 токенов.
Если слать такие объёмы в лоб через условный OpenAI, проект станет глубоко убыточным. Вот как я заставил экономику работать в плюс:
А) Экономия на тексте: Prompt Caching в DeepSeek
В качестве основного текстового ядра я взял DeepSeek API. Архитектура промптов спроектирована таким образом, что статичные данные (правила движка, история мира) идут в самом начале запроса. Это позволяет использовать автоматический кэш контекста (Prompt Caching).
В итоге до 90% входного текста попадает в Cache Hit и обходится в копейки. Вот как раскладывается себестоимость одного среднего хода (4000 токенов на вход + ~600 токенов на ответ модели):
- Попадание в кэш (Cache Hit): 3600 токенов (тариф $0.0028 за 1 млн) = $0.00001008
- Промах мимо кэша (Cache Miss): 400 токенов (тариф $0.14 за 1 млн) = $0.00005600
- Ответ модели (Выходные токены): 600 токенов (тариф $0.28 за 1 млн) = $0.00016800
🔥 Итоговая себестоимость 1 хода: 4600 токенов обходятся всего в $0.00023408, что по курсу составляет примерно 2.2 копейки.
Б) Локальный RAG за 0 рублей
Долгосрочная память реализована через векторный поиск в связке с pgvector в PostgreSQL. Чтобы не платить сторонним сервисам за генерацию эмбеддингов, я взял опенсорсную модель multilingual-e5-base, конвертировал её в формат ONNX (файл весит ~1.06 ГБ) и запустил её локально на своём сервере. Затраты на векторный поиск — 0 рублей.
3. Монетизация и маржинальность
Для пользователей была выбрана модель Freemium с пакетами токенов и ежемесячной подпиской:
- Гостевой режим: 5 ходов без регистрации для моментального знакомства с продуктом.
- Приветственный грант: 1 000 000 токенов бесплатно при создании профиля (этого честно хватает на ~250 глубоких ходов, то есть на одну большую законченную кампанию).
- Пакеты в магазине: 10 млн токенов за 99 рублей или 100 млн токенов за 999 рублей.
При розничном тарифе (10M за 99₽) один средний ход обходится игроку примерно в 4 копейки. При себестоимости API в 2.2 копейки чистая валовая маржинальность бизнеса составляет стабильные 45–50%. Это создаёт надёжную подушку безопасности от колебаний курсов валют.
Как монетизировать графику?
В игре есть генерация уникальных аватаров персонажей через API YandexArt. Себестоимость одной картинки от Яндекса — 2.3 рубля.
Внутри игры эта фича стоит fixed-сумму в токенах — 280 000. По нашему розничному курсу это эквивалентно примерно 2.8 рублям. Таким образом, даже на генерации картинок заложена чистая прибыль в районе 21.7% сверх себестоимости API.
4. Инфраструктура: Сервер под столом
Для минимизации постоянных издержек (OPEX) на этапе запуска я отказался от дорогих облаков и развернул всю инфраструктуру на домашнем мини-сервере (Ubuntu 24.04, Docker). Внешний трафик маршрутизируется по цепочке: VPS с Nginx/Caddy → FRP-туннель → Домашний сервер.
При деплое Flutter Web столкнулся с забавным факапом: монолитный JS-файл фронтенда весил 3.6 МБ. FRP-туннель без включенного сжатия намертво рвал соединение на середине загрузки, выдавая ошибку unexpected EOF. Включение обычного gzip on; в конфигурации Nginx решило проблему и снизило объём передаваемых данных в разы.
Итоги и планы
На коленке и без бюджетов на маркетинг (чисто на вайб-кодинге) удалось собрать сложный игровой продукт с работающей экономикой, который не уходит в минус от наплыва пользователей.
Посмотреть на интерфейс и потестировать баланс ИИ-мастера можно на живом домене: beyondtheverge.online. Гостевой режим пускает в игру за пару секунд без ввода почты.
Буду рад обсудить в комментариях юнит-экономику ИИ-проектов, продуктовую ценность LLM и геймдизайн текстовых игр!