Как оптимизировать свои расходы: оптимальный выбор моделей в Cursor IDE, v3.0

Прошлая версия и дополнения к ней доступны на форуме Cursor

Мой текущий стэк:
Opus 4.5 $> GPT-5.1 High >= GPT-5.1 Codex Max XHigh >?$ Gemini 3 Pro Preview $>> GPT-5 Mini gt;= Grok Code Fast

Работает с предоставленным контекстом глубже всех остальных, что особенно заметно при работе с документацией;
Мне нравится стиль общения семейства Claude;
В разы дороже остальных моделей. Рекомендую командам с огромными бюджетами.
Экстраполируя моё использование, может уходить до 400'000 руб/мес. на однопоточный agent coding.
Для остальных - только разовое привлечение при важных правках документации или при планировании рефакторингов.
На крупных файлах/проектах можете столкнуться с тем, что она очень жадно наполняет своё контекстное окно и оно может довольно быстро и часто переполняться, что приводит к его сжатию, что может ухудшать результат работы.

по всем бенчмаркам уделывает всех, кроме Opus 4.5;
по некоторым Opus 4.5 немного лучше.
Дешевле чем Opus 4.5.
Хаотична, из-за чего сложно на неё полагаться как на основную модель.
На старте имела проблемы с корректным взаимодействием с файлами: стирала файлы так, что их можно было восстановить только через git revert (отмена действий в чате не отменяла стирание файла).

Моё использование за 30д by <a href="https://api.dtf.ru/v2.8/redirect?to=https%3A%2F%2Fcursortokens.vercel.app%2F&postId=4519997" rel="nofollow noreferrer noopener" target="_blank">cursortokens.vercel.app</a>

остальные субверсии можете игнорировать - вы не выиграете от обрезания модели мозга
отличная стабильная дешёвая умная модель
GPT-5.1 стала немного теплее относительно GPT-5, из-за чего стало приятнее с ней общаться и читать её отчёты.
Ходят слухи о скором выходе GPT-5.2: вряд ли рост будет сильным - главное, чтобы не испортили.

Мне абсолютно не нравятся GPT-5 Codex и GPT-5.1 Codex.
Говорят, что в Codex CLI они заметно лучше, чем в Cursor. В Cursor они слишком хаотичны и я даже не стал пытаться их обуздать.
Пробовал GPT-5.1 Codex Mini High как потенциальную замену GPT-5 Mini, но не получилось
Codex Max XHigh оказалась довольно приятной и стабильной моделью
Очень экономно заполняет свой контекст.
На кучу субверсий разного уровня thinking'а можете забить - вы берёте эту модель для сложных задач и хотите, чтобы она их решила
Благодаря экономичности, мощности и скорости можно рассматривать как идеальную модель для простых задач.
До 11 декабря бесплатна; затем примерно равна GPT-5.1 High
Я не уверен, оставлю ли я её основной моделью после промо-недели, но Вы можете сравнить работу 5.1 Codex Max и обычной GPT-5.1 на своих задачах и стиле промптинга.
Gemini 3 Pro Preview оценивает её работу с документацией в чате как малословного техлида - в целом, соглашусь.
Из-за экономности, думает очень мало - хороший вариант быстро получить ответ от достаточно умной модели, но стиль и краткость вам могут не понравится.

Две дешёвые модели для простых задач: поиск по репозиторию (разговор с репозиторием), мелкие правки.
Mini чуть умнее, GCF чуть быстрее
GCF бесплатен, за что Илону Маску большой спасибо
Ниже ответ, почему их не стоит использовать для всех задач:

ЕМНИП тест был на RUST+TypeScript репозитории.

Попытка выполнить список задач через GCF; откат; удачная попытка выполнить через GPT-5. При этом видно, что GCF успел сгенерировать гораздо больше токенов, чем GPT-5, но не смог справиться с поставленной задачей, при том, что получил больше времени и дополнительных подсказок от разработчика.

Он не настолько умнее GPT-5.1 насколько он её дороже. Gemini 3 Pro сравним или тоже немного дешевле.
Можно использовать как бюджетную альтернативу Opus 4.5
Шикарен в QA

Дороже и глупее GPT-5.1. Если нужен Claude, то используйте Sonnet или Opus.

Мозги на уровне GPT-5.1 с x10 наценкой.

Grok 4: С релиза плохо работает в Cursor IDE
Grok 4 Fast: Очень ленивая модель. Опять же, возможно, из-за Cursor, а не потому что модель плохая.
Grok 4.1: Не представлен в Cursor. Надеюсь, Grok 4.2 добавят на релизе и он будет работать лучше, чем Grok 4.

Kimi K2: с релиза сломано отображение её ответов в чате; из коробки дают устаревшую версию модели.
DeepSeek: из коробки нет DeepSeek-V3.2, который можно было бы рассматривать как модель для простых задач; остальные уже устарели.

Собственная модель от разработчиков Cursor IDE. Пробовал её только на открытом тестировании. По ощущениям, глупее чем GPT-5 при немного большей стоимости.

Рекомендую работать в Cursor IDE имея в User Rules мой Agent Compass - набор правил взаимодействия пользователя и ИИ, выдающий роли обеим сторонам. Скоро буду его обновлять и добавлю в репозиторий свои рекомендации по промптингу. Когда наступит это "скоро" пока сказать не могу 👀

#cursor #claude #chatgpt #gemini3pro #agentcoding

Как оптимизировать свои расходы: оптимальный выбор моделей в Cursor IDE, v3.0

Вкратце о каждой основной модели

Opus 4.5

Gemini 3 Pro Preview

GPT-5.1 High

GPT-5.1 Codex Max Extra High (Codex Max XHigh)

GPT-5 Mini / Grok Code Fast

Остальные модели

Claude Sonnet 4.5

Claude Haiku 4.5

GPT-5 Pro

Grok

Китайцы

Composer 1

Дополнительные материалы