Популярное
Свежее
Моя лента
Сообщения
Рейтинг
Пополнить Steam
Низкая комиссия
Темы
Игры
Гайды
Офтоп
Ночной музпостинг
Вопросы
Творчество
Кино и сериалы
Музыка
Hollow Knight
Видео
Показать все
DTF
О проекте
Правила
Реклама
Приложения
Аккаунт заморожен
Жизнь
16 авг

Статья удалена

DeepSeek отложила выпуск новой языковой модели R2 из-за технических проблем с ускорителями Huawei Ascend.

Статья удалена
  • Китайская компания DeepSeek успешно выпустила в январе языковую модель R1, которая привлекла внимание эффективным обучением при ограниченных вычислительных ресурсах. Однако американские санкции заставили компанию искать альтернативы чипам Nvidia.

  • Китайские власти настоятельно рекомендовали местным разработчикам искусственного интеллекта перейти на использование ускорителей Huawei Ascend. Теперь многие компании должны предоставить убедительные причины, чтобы продолжать закупать оборудование Nvidia.

  • При попытке использовать чипы Huawei для обучения языковых моделей DeepSeek столкнулась с серьезными техническими сложностями. Компания была вынуждена переориентировать ускорители Huawei на задачи инференса, а обучение продолжить на чипах Nvidia.

  • Изначально выпуск DeepSeek R2 был запланирован на май этого года. Однако в июне генеральный директор компании Лян Вэньфэн заявил, что все еще недоволен производительностью новой модели и отложил ее выход на неопределенный срок.

  • Huawei направила команду специалистов для помощи в решении технических проблем, но добиться успешного обучения модели R2 на чипах китайской компании так и не удалось. Даже адаптация ускорителей Ascend для задач инференса до сих пор не завершена.

  • Руководство DeepSeek оценивает текущий прогресс в разработке R2 как недостаточный. Они планируют потратить больше времени, чтобы довести модель до требуемого уровня. Тем не менее, некоторые источники предполагают, что обновлённая версия языковой модели выйдет в ближайшее время.

  • Ситуация с DeepSeek показывает, с какими трудностями сталкиваются китайские технологические компании в условиях американских санкций и попыток заменить импортные компоненты отечественными аналогами. Проблемы с производительностью локальных ускорителей могут замедлить развитие китайской индустрии искусственного интеллекта.

Виктор Буторин
Офтоп
16 мая
Ой, нейросеть?

Опробовал DeepSeek на мелких задачах с текстом. И это неплохо. Но мое старое ворчание на тему нейронок, в целом-то, подтвердилось. Если вы желаете использовать нейросеть, вы должны понимать в вопросе хоть что-то (как минимум!).

Ой, нейросеть?

#deepseek #ии