DeepSeek отложила выпуск модели из-за чипов Huawei
Китайская компания DeepSeek успешно выпустила в январе языковую модель R1, которая привлекла внимание эффективным обучением при ограниченных вычислительных ресурсах. Однако американские санкции заставили компанию искать альтернативы чипам Nvidia.
Китайские власти настоятельно рекомендовали местным разработчикам искусственного интеллекта перейти на использование ускорителей Huawei Ascend. Теперь многие компании должны предоставить убедительные причины, чтобы продолжать закупать оборудование Nvidia.
При попытке использовать чипы Huawei для обучения языковых моделей DeepSeek столкнулась с серьезными техническими сложностями. Компания была вынуждена переориентировать ускорители Huawei на задачи инференса, а обучение продолжить на чипах Nvidia.
Изначально выпуск DeepSeek R2 был запланирован на май этого года. Однако в июне генеральный директор компании Лян Вэньфэн заявил, что все еще недоволен производительностью новой модели и отложил ее выход на неопределенный срок.
Huawei направила команду специалистов для помощи в решении технических проблем, но добиться успешного обучения модели R2 на чипах китайской компании так и не удалось. Даже адаптация ускорителей Ascend для задач инференса до сих пор не завершена.
Руководство DeepSeek оценивает текущий прогресс в разработке R2 как недостаточный. Они планируют потратить больше времени, чтобы довести модель до требуемого уровня. Тем не менее, некоторые источники предполагают, что обновлённая версия языковой модели выйдет в ближайшее время.
Ситуация с DeepSeek показывает, с какими трудностями сталкиваются китайские технологические компании в условиях американских санкций и попыток заменить импортные компоненты отечественными аналогами. Проблемы с производительностью локальных ускорителей могут замедлить развитие китайской индустрии искусственного интеллекта.