DeepSeek выпустила гибридную модель V3.1 с «базовым» и «рассуждающим» режимами
Её также оптимизировали для китайских чипов, пишет Reuters.
- Это обновлённая версия флагманской модели V3, её добавили в бесплатный чат-бот DeepSeek. По словам компании, V3.1-Think отвечает быстрее «рассуждающей» R1, тратя меньше токенов на поиск решения.
Количество токенов, которые тратят на поиск ответа R1 и V3.1. Источник: DeepSeek
- По данным внутренних тестов, наиболее заметные улучшения — в навыках ИИ-агента: поиске информации, использовании браузера, выполнении многоэтапных задач.
Модель научилась использовать инструменты лучше R1. Источник: DeepSeek
- V3.1 в режиме «рассуждений» обошла Claude 4 Sonnet в тестах независимых исследователей Artificial Analysis на научные знания, математику и написание кода.
- Веса модели выложили на HuggingFace. Она также доступна в API. С 5 сентября 2025 года работа с моделью там будет стоить 56 центов за один миллион входных токенов и 1,68 доллара за один миллион выходных — без разделения на «базовый» и «рассуждающий» режим. Длину контекста в API увеличили до 128 тысяч токенов. DeepSeek также добавила совместимость с API от Anthropic.
- Financial Times 14 августа сообщило, что DeepSeeek столкнулась с трудностями из-за китайских чипов. Качество ответов новой модели R2 не устраивало гендиректора Лян Вэньфэна, и DeepSeek откладывала выпуск, запланированный на май 2025 года. Huawei Central сообщало, что R2 могут выпустить с 15 по 30 августа 2025 года.
143 комментария