Что такое DeepSeek и почему Nvidia больно + UDP 30.01

OpelAI, Anthropic и другие тратят 100$ млн долларов только на вычислительные ресурсы (а ведь еще есть зарплаты и прочие расходы). Им нужны огромные дата-центры с тысячами GPU стоимостью 40к$ каждый.

Но откуда ни возьмись пришли DeepSeek (Китай) и сказали: «Мы сделаем за 5млн$».

Но, как говорится, говорить — это не мешки таскать. Поэтому они взяли и сделали.

Как? Они просто поселились в офисе, работали по 27 часов в сутки (трудолюбивые, что сказать), кодили, кодили и наконец накодили. Представим, что традиционный ИИ — это писать каждое число с 32 знаками после запятой. DeepSeek решили, что и 8 знаков достаточно. Представили уровень оптимизации токенов?

В итоге они используют на 75% меньше памяти.

Обычный ИИ читает как первоклассник: «Кошка... сидит... на...». DeepSeek читает целыми фразами сразу. В 2 раза быстрее с точностью 90%. Когда вы обрабатываете миллиарды слов, это важно.

Вместо огромного ИИ, который пытается знать всё (как если бы один человек был врачом, юристом и инженером), у них есть специализированные эксперты, которые активируются только тогда, когда это нужно.

В традиционной модели все 1,8 триллиона параметров активны всегда.

В DeepSeek 671 млрд параметров всего, но только 37 млрд активно одновременно. На каждой задаче у тебя работает базовая «команда», а когда нужен узкий эксперт в области, он подключается, решает вопрос и уходит.

Результаты:

- Стоимость обучения: 100 млн$ -> 5 млн$

- Необходимые GPU: 100 000 -> 2000

- Стоимость API: на 95% дешевле

- Может работать на игровых GPU

Причем это открытый исходный код, которым может пользоваться любой. Любой может проверить их работу и убедиться, что это не магия, а просто гениальная инженерия.

Это переломный момент, как команда из 200 человек и бюджетом одного топового инженера нагнула все «большие» компании по разработке ИИ и напрямую угрожает капитализации Nvidia.

Прикольная статья на хабре на эту тему

Ну и ссылка на саму нейросеть

На фоне выхода DeepSeek, Nvidia потеряла около 600млрд$ капитализации.

Там еще и насдак просел.

Удивительно смотреть как то, как сыпется капитал из-за относительно небольшого стартапа. (По крайней мере по офф версии. Я убежден, что Китай влил гораздо больше денег.)

Пузырь ИИ давно должен был лопнуть т.к. они собирали в себя огромные капиталы которые, я убежден, размывались по кошелькам больше, чем инвестировались в технологии. Иначе возникает вопрос, почему OpenAI и другие не думали о подобной оптимизации?

Секретные ключи, незашифрованные чаты, логи и даже бэкенд китайского творения стали достоянием общественности.
Исследователи из Wiz Research проводили стандартную проверку инфраструктуры и случайно наткнулись на базу данных — у неё нет НИКАКОЙ защиты, то есть воспользоваться может любой.
Пока что комментариев от Xi Jinping не поступало.

Что такое DeepSeek и почему Nvidia больно + UDP 30.01

Инновации DeepSeek в области ИИ поражают людей и, возможно, угрожают рыночной капитализации Nvidia в $2 трлн.

Система мульти-токенов

UPD 30.01

Убытки составили триллионы долларов в день

Ну и на вкусное: DeepSeek взломали — в открытом доступе оказались абсолютно все данные нейронки