Как оптимизировать свои расходы: оптимальный выбор моделей в Cursor IDE, v3.0
Мой текущий стэк:
Opus 4.5 $> GPT-5.1 High >= GPT-5.1 Codex Max XHigh >?$ Gemini 3 Pro Preview $>> GPT-5 Mini gt;= Grok Code Fast
Вкратце о каждой основной модели
Opus 4.5
- Работает с предоставленным контекстом глубже всех остальных, что особенно заметно при работе с документацией;
- Мне нравится стиль общения семейства Claude;
- В разы дороже остальных моделей. Рекомендую командам с огромными бюджетами.
Экстраполируя моё использование, может уходить до 400'000 руб/мес. на однопоточный agent coding. - Для остальных - только разовое привлечение при важных правках документации или при планировании рефакторингов.
- На крупных файлах/проектах можете столкнуться с тем, что она очень жадно наполняет своё контекстное окно и оно может довольно быстро и часто переполняться, что приводит к его сжатию, что может ухудшать результат работы.
Gemini 3 Pro Preview
- по всем бенчмаркам уделывает всех, кроме Opus 4.5;
по некоторым Opus 4.5 немного лучше. - Дешевле чем Opus 4.5.
- Хаотична, из-за чего сложно на неё полагаться как на основную модель.
- На старте имела проблемы с корректным взаимодействием с файлами: стирала файлы так, что их можно было восстановить только через git revert (отмена действий в чате не отменяла стирание файла).
GPT-5.1 High
- остальные субверсии можете игнорировать - вы не выиграете от обрезания модели мозга
- отличная стабильная дешёвая умная модель
- GPT-5.1 стала немного теплее относительно GPT-5, из-за чего стало приятнее с ней общаться и читать её отчёты.
- Ходят слухи о скором выходе GPT-5.2: вряд ли рост будет сильным - главное, чтобы не испортили.
GPT-5.1 Codex Max Extra High (Codex Max XHigh)
- Мне абсолютно не нравятся GPT-5 Codex и GPT-5.1 Codex.
Говорят, что в Codex CLI они заметно лучше, чем в Cursor. В Cursor они слишком хаотичны и я даже не стал пытаться их обуздать.
Пробовал GPT-5.1 Codex Mini High как потенциальную замену GPT-5 Mini, но не получилось - Codex Max XHigh оказалась довольно приятной и стабильной моделью
- Очень экономно заполняет свой контекст.
- На кучу субверсий разного уровня thinking'а можете забить - вы берёте эту модель для сложных задач и хотите, чтобы она их решила
- Благодаря экономичности, мощности и скорости можно рассматривать как идеальную модель для простых задач.
- До 11 декабря бесплатна; затем примерно равна GPT-5.1 High
- Я не уверен, оставлю ли я её основной моделью после промо-недели, но Вы можете сравнить работу 5.1 Codex Max и обычной GPT-5.1 на своих задачах и стиле промптинга.
- Gemini 3 Pro Preview оценивает её работу с документацией в чате как малословного техлида - в целом, соглашусь.
- Из-за экономности, думает очень мало - хороший вариант быстро получить ответ от достаточно умной модели, но стиль и краткость вам могут не понравится.
GPT-5 Mini / Grok Code Fast
- Две дешёвые модели для простых задач: поиск по репозиторию (разговор с репозиторием), мелкие правки.
- Mini чуть умнее, GCF чуть быстрее
- GCF бесплатен, за что Илону Маску большой спасибо
- Ниже ответ, почему их не стоит использовать для всех задач:
Попытка выполнить список задач через GCF; откат; удачная попытка выполнить через GPT-5. При этом видно, что GCF успел сгенерировать гораздо больше токенов, чем GPT-5, но не смог справиться с поставленной задачей, при том, что получил больше времени и дополнительных подсказок от разработчика.
Остальные модели
Claude Sonnet 4.5
- Он не настолько умнее GPT-5.1 насколько он её дороже. Gemini 3 Pro сравним или тоже немного дешевле.
- Можно использовать как бюджетную альтернативу Opus 4.5
- Шикарен в QA
Claude Haiku 4.5
Дороже и глупее GPT-5.1. Если нужен Claude, то используйте Sonnet или Opus.
GPT-5 Pro
Мозги на уровне GPT-5.1 с x10 наценкой.
Grok
- Grok 4: С релиза плохо работает в Cursor IDE
- Grok 4 Fast: Очень ленивая модель. Опять же, возможно, из-за Cursor, а не потому что модель плохая.
- Grok 4.1: Не представлен в Cursor. Надеюсь, Grok 4.2 добавят на релизе и он будет работать лучше, чем Grok 4.
Китайцы
- Kimi K2: с релиза сломано отображение её ответов в чате; из коробки дают устаревшую версию модели.
- DeepSeek: из коробки нет DeepSeek-V3.2, который можно было бы рассматривать как модель для простых задач; остальные уже устарели.
Composer 1
Собственная модель от разработчиков Cursor IDE. Пробовал её только на открытом тестировании. По ощущениям, глупее чем GPT-5 при немного большей стоимости.
Дополнительные материалы
Рекомендую работать в Cursor IDE имея в User Rules мой Agent Compass - набор правил взаимодействия пользователя и ИИ, выдающий роли обеим сторонам. Скоро буду его обновлять и добавлю в репозиторий свои рекомендации по промптингу. Когда наступит это "скоро" пока сказать не могу 👀