Claude Sonnet 4.5: самая умная модель для кода, которую мир еще не видел

Привет, я Антон, автор ТГ-канала Шадрин + AI. Моя работа — внедрять нейросети в бизнес и рассказывать о прорывных обновлениях первым.

Anthropic только что выпустил Claude Sonnet 4.5 — и это не просто очередное обновление. Это лучшая модель для кодинга в мире, сильнейшая модель для создания сложных агентов и лучшая модель для управления компьютером. Плюс существенные улучшения в рассуждениях и математике.

Если вы думаете, что это очередной маркетинговый буллшит — держитесь за стул.

Цифры, от которых у конкурентов подгорает

На SWE-bench Verified (это где ИИ решает реальные задачи разработчиков) Claude Sonnet 4.5 показывает 77.2%. Для сравнения: еще недавно топовые модели с трудом преодолевали 50%.

Но самое дикое даже не это. Модель способна поддерживать фокус более 30 часов на сложных многошаговых задачах. 30 часов, Карл! Это как junior-разработчик, который не устает, не отвлекается на ютуб и не уходит домой.

Ключевые показатели:

  • OSWorld (управление компьютером): 61.4% против 42.2% у предыдущей версии
  • Кодинг: прирост производительности почти в 2 раза
  • Математика и рассуждения: существенные улучшения по всем бенчмаркам

Что нового кроме циферок

Claude Code получил чекпоинты

В Claude Code добавили чекпоинты — одну из самых запрашиваемых функций — которые сохраняют ваш прогресс и позволяют мгновенно откатиться к предыдущему состоянию. Представьте Git, встроенный прямо в ИИ-редактор.

Обновили интерфейс терминала и выпустили нативное расширение для VS Code. Теперь можно кодить прямо в привычной среде с поддержкой Claude.

Редактирование контекста и память для API

Добавили новую функцию редактирования контекста и инструмент памяти в Claude API, что позволяет агентам работать еще дольше и справляться с еще большей сложностью.

Это значит, что теперь можно создавать ИИ-агентов, которые помнят контекст проекта неделями и не тупят после 10 сообщений.

Выполнение кода прямо в чате

В приложениях Claude теперь доступно выполнение кода и создание файлов (таблицы, презентации и документы) прямо в разговоре. Больше не нужно копипастить код в IDE — Claude сам всё запустит и покажет результат.

Claude Agent SDK: создавайте своих агентов

Anthropic выпустил Claude Agent SDK — инфраструктуру, которая лежит в основе их собственных продуктов. Теперь любой разработчик может создать агента уровня Claude Code для своих задач.

Это та же инфраструктура, которая питает Claude Code, но она показывает впечатляющие преимущества для очень широкого спектра задач, не только кодинга

Что можно делать с SDK:

  • Создавать агентов для специфических задач
  • Управлять памятью на длительных проектах
  • Координировать работу нескольких субагентов
  • Настраивать систему разрешений

Реальные отзывы от первых пользователей

GitHub Copilot: "Наши первоначальные оценки показывают значительные улучшения в многошаговых рассуждениях и понимании кода"

Cursor: "Мы видим производительность кодирования на уровне state-of-the-art от Claude Sonnet 4.5, со значительными улучшениями в задачах с длинным горизонтом"

Devin: "Для Devin Claude Sonnet 4.5 увеличил производительность планирования на 18% и сквозные оценки на 12% — это самый большой скачок, который мы видели с момента выпуска Claude Sonnet 3.6"

Кстати, если хотите научиться правильно писать промпты для максимальной производительности Claude — у меня в ТГ-канале есть полный гайд по промптингу. Там же техника "задай вопрос", которая работает идеально с новым Sonnet. Всё в закрепе.

Imagine with Claude: ИИ создает софт на лету

Вместе с релизом запустили временный исследовательский превью под названием "Imagine with Claude". В этом эксперименте Claude генерирует программное обеспечение на лету. Никакая функциональность не предопределена; никакой код не написан заранее.

То, что вы видите — это Claude, создающий в реальном времени, отвечающий и адаптирующийся к вашим запросам по мере взаимодействия.

Доступно подписчикам Max на 5 дней после релиза на claude.ai/imagine.

Безопасность на новом уровне

Claude Sonnet 4.5 — это самая выровненная модель frontier, которую Anthropic когда-либо выпускал. Улучшенные возможности Claude и обширное обучение безопасности позволили существенно улучшить поведение модели.

Снижены проблемные поведения, такие как подхалимство, обман, стремление к власти и склонность поощрять бредовое мышление.

Для агентских возможностей и управления компьютером также достигнут значительный прогресс в защите от атак с инъекцией промптов.

Как получить доступ

Claude Sonnet 4.5 доступен везде уже сегодня. Разработчики могут использовать claude-sonnet-4-5 через Claude API. Цена остается той же, что и у Claude Sonnet 4: $3/$15 за миллион токенов.

Где доступно:

  • Claude.ai — для всех пользователей
  • API — для разработчиков
  • Claude Code — обновления для всех
  • Agent SDK — для всех разработчиков
  • Выполнение кода и создание файлов — на всех платных планах

Что это значит для индустрии

Claude Sonnet 4.5 — это не просто улучшение метрик. Это модель, которая может заменить junior-разработчика, а в некоторых задачах и middle.

30 часов непрерывной работы над сложными задачами — это уровень, когда ИИ становится полноценным членом команды, а не просто инструментом для автокомплита.

С выходом Agent SDK любая компания теперь может создать специализированного ИИ-агента под свои задачи. Это как получить конструктор для создания узкоспециализированных ИИ-сотрудников.

Итог

Claude Sonnet 4.5 — это новый стандарт в ИИ-разработке. Пока конкуренты хвастаются процентами в синтетических бенчмарках, Anthropic выкатывает модель, которая реально работает 30 часов подряд над вашим кодом.

Anthropic рекомендует обновиться до Claude Sonnet 4.5 для всех применений. Это прямая замена, которая обеспечивает значительно улучшенную производительность за ту же цену

В моём канале Шадрин + AI отслеживаю все обновления Claude и других нейросетей. Подписывайтесь, чтобы первыми узнавать о прорывных релизах и получать практические гайды по их применению.

Начать дискуссию