Как оптимизировать свои расходы: оптимальный выбор моделей в Cursor IDE, v3.0

Как оптимизировать свои расходы: оптимальный выбор моделей в Cursor IDE, v3.0

Мой текущий стэк:
Opus 4.5 $> GPT-5.1 High >= GPT-5.1 Codex Max XHigh >?$ Gemini 3 Pro Preview $>> GPT-5 Mini gt;= Grok Code Fast

Вкратце о каждой основной модели

Opus 4.5

  • Работает с предоставленным контекстом глубже всех остальных, что особенно заметно при работе с документацией;
  • Мне нравится стиль общения семейства Claude;
  • В разы дороже остальных моделей. Рекомендую командам с огромными бюджетами.
    Экстраполируя моё использование, может уходить до 400'000 руб/мес. на однопоточный agent coding.
  • Для остальных - только разовое привлечение при важных правках документации или при планировании рефакторингов.
  • На крупных файлах/проектах можете столкнуться с тем, что она очень жадно наполняет своё контекстное окно и оно может довольно быстро и часто переполняться, что приводит к его сжатию, что может ухудшать результат работы.

Gemini 3 Pro Preview

  • по всем бенчмаркам уделывает всех, кроме Opus 4.5;
    по некоторым Opus 4.5 немного лучше.
  • Дешевле чем Opus 4.5.
  • Хаотична, из-за чего сложно на неё полагаться как на основную модель.
  • На старте имела проблемы с корректным взаимодействием с файлами: стирала файлы так, что их можно было восстановить только через git revert (отмена действий в чате не отменяла стирание файла).
Моё использование за 30д by <a href="https://api.dtf.ru/v2.8/redirect?to=https%3A%2F%2Fcursortokens.vercel.app%2F&postId=4519997" rel="nofollow noreferrer noopener" target="_blank">cursortokens.vercel.app</a>
Моё использование за 30д by cursortokens.vercel.app

GPT-5.1 High

  • остальные субверсии можете игнорировать - вы не выиграете от обрезания модели мозга
  • отличная стабильная дешёвая умная модель
  • GPT-5.1 стала немного теплее относительно GPT-5, из-за чего стало приятнее с ней общаться и читать её отчёты.
  • Ходят слухи о скором выходе GPT-5.2: вряд ли рост будет сильным - главное, чтобы не испортили.

GPT-5.1 Codex Max Extra High (Codex Max XHigh)

  • Мне абсолютно не нравятся GPT-5 Codex и GPT-5.1 Codex.
    Говорят, что в Codex CLI они заметно лучше, чем в Cursor. В Cursor они слишком хаотичны и я даже не стал пытаться их обуздать.
    Пробовал GPT-5.1 Codex Mini High как потенциальную замену GPT-5 Mini, но не получилось
  • Codex Max XHigh оказалась довольно приятной и стабильной моделью
  • Очень экономно заполняет свой контекст.
  • На кучу субверсий разного уровня thinking'а можете забить - вы берёте эту модель для сложных задач и хотите, чтобы она их решила
  • Благодаря экономичности, мощности и скорости можно рассматривать как идеальную модель для простых задач.
  • До 11 декабря бесплатна; затем примерно равна GPT-5.1 High
  • Я не уверен, оставлю ли я её основной моделью после промо-недели, но Вы можете сравнить работу 5.1 Codex Max и обычной GPT-5.1 на своих задачах и стиле промптинга.
  • Gemini 3 Pro Preview оценивает её работу с документацией в чате как малословного техлида - в целом, соглашусь.
  • Из-за экономности, думает очень мало - хороший вариант быстро получить ответ от достаточно умной модели, но стиль и краткость вам могут не понравится.

GPT-5 Mini / Grok Code Fast

  • Две дешёвые модели для простых задач: поиск по репозиторию (разговор с репозиторием), мелкие правки.
  • Mini чуть умнее, GCF чуть быстрее
  • GCF бесплатен, за что Илону Маску большой спасибо
  • Ниже ответ, почему их не стоит использовать для всех задач:
ЕМНИП тест был на RUST+TypeScript репозитории.
ЕМНИП тест был на RUST+TypeScript репозитории.

Попытка выполнить список задач через GCF; откат; удачная попытка выполнить через GPT-5. При этом видно, что GCF успел сгенерировать гораздо больше токенов, чем GPT-5, но не смог справиться с поставленной задачей, при том, что получил больше времени и дополнительных подсказок от разработчика.

Остальные модели

Claude Sonnet 4.5

  • Он не настолько умнее GPT-5.1 насколько он её дороже. Gemini 3 Pro сравним или тоже немного дешевле.
  • Можно использовать как бюджетную альтернативу Opus 4.5
  • Шикарен в QA

Claude Haiku 4.5

Дороже и глупее GPT-5.1. Если нужен Claude, то используйте Sonnet или Opus.

GPT-5 Pro

Мозги на уровне GPT-5.1 с x10 наценкой.

Grok

  • Grok 4: С релиза плохо работает в Cursor IDE
  • Grok 4 Fast: Очень ленивая модель. Опять же, возможно, из-за Cursor, а не потому что модель плохая.
  • Grok 4.1: Не представлен в Cursor. Надеюсь, Grok 4.2 добавят на релизе и он будет работать лучше, чем Grok 4.

Китайцы

  • Kimi K2: с релиза сломано отображение её ответов в чате; из коробки дают устаревшую версию модели.
  • DeepSeek: из коробки нет DeepSeek-V3.2, который можно было бы рассматривать как модель для простых задач; остальные уже устарели.

Composer 1

Собственная модель от разработчиков Cursor IDE. Пробовал её только на открытом тестировании. По ощущениям, глупее чем GPT-5 при немного большей стоимости.

Дополнительные материалы

Рекомендую работать в Cursor IDE имея в User Rules мой Agent Compass - набор правил взаимодействия пользователя и ИИ, выдающий роли обеим сторонам. Скоро буду его обновлять и добавлю в репозиторий свои рекомендации по промптингу. Когда наступит это "скоро" пока сказать не могу 👀

Начать дискуссию