DeepSeek выпустила гибридную модель V3.1 с «базовым» и «рассуждающим» режимами

Её также оптимизировали для китайских чипов, пишет Reuters.

Это обновлённая версия флагманской модели V3, её добавили в бесплатный чат-бот DeepSeek. По словам компании, V3.1-Think отвечает быстрее «рассуждающей» R1, тратя меньше токенов на поиск решения.

По данным внутренних тестов, наиболее заметные улучшения — в навыках ИИ-агента: поиске информации, использовании браузера, выполнении многоэтапных задач.

V3.1 в режиме «рассуждений» обошла Claude 4 Sonnet в тестах независимых исследователей Artificial Analysis на научные знания, математику и написание кода.

Веса модели выложили на HuggingFace. Она также доступна в API. С 5 сентября 2025 года работа с моделью там будет стоить 56 центов за один миллион входных токенов и 1,68 доллара за один миллион выходных — без разделения на «базовый» и «рассуждающий» режим. Длину контекста в API увеличили до 128 тысяч токенов. DeepSeek также добавила совместимость с API от Anthropic.
Financial Times 14 августа сообщило, что DeepSeeek столкнулась с трудностями из-за китайских чипов. Качество ответов новой модели R2 не устраивало гендиректора Лян Вэньфэна, и DeepSeek откладывала выпуск, запланированный на май 2025 года. Huawei Central сообщало, что R2 могут выпустить с 15 по 30 августа 2025 года.