Что такое DeepSeek и почему Nvidia больно + UDP 30.01
Инновации DeepSeek в области ИИ поражают людей и, возможно, угрожают рыночной капитализации Nvidia в $2 трлн.
OpelAI, Anthropic и другие тратят 100$ млн долларов только на вычислительные ресурсы (а ведь еще есть зарплаты и прочие расходы). Им нужны огромные дата-центры с тысячами GPU стоимостью 40к$ каждый.
Но откуда ни возьмись пришли DeepSeek (Китай) и сказали: «Мы сделаем за 5млн$».
Но, как говорится, говорить — это не мешки таскать. Поэтому они взяли и сделали.
Как? Они просто поселились в офисе, работали по 27 часов в сутки (трудолюбивые, что сказать), кодили, кодили и наконец накодили. Представим, что традиционный ИИ — это писать каждое число с 32 знаками после запятой. DeepSeek решили, что и 8 знаков достаточно. Представили уровень оптимизации токенов?
В итоге они используют на 75% меньше памяти.
Система мульти-токенов
Обычный ИИ читает как первоклассник: «Кошка... сидит... на...». DeepSeek читает целыми фразами сразу. В 2 раза быстрее с точностью 90%. Когда вы обрабатываете миллиарды слов, это важно.
Вместо огромного ИИ, который пытается знать всё (как если бы один человек был врачом, юристом и инженером), у них есть специализированные эксперты, которые активируются только тогда, когда это нужно.
В традиционной модели все 1,8 триллиона параметров активны всегда.
В DeepSeek 671 млрд параметров всего, но только 37 млрд активно одновременно. На каждой задаче у тебя работает базовая «команда», а когда нужен узкий эксперт в области, он подключается, решает вопрос и уходит.
Результаты:
- Стоимость обучения: 100 млн$ -> 5 млн$
- Необходимые GPU: 100 000 -> 2000
- Стоимость API: на 95% дешевле
- Может работать на игровых GPU
Причем это открытый исходный код, которым может пользоваться любой. Любой может проверить их работу и убедиться, что это не магия, а просто гениальная инженерия.
Это переломный момент, как команда из 200 человек и бюджетом одного топового инженера нагнула все «большие» компании по разработке ИИ и напрямую угрожает капитализации Nvidia.
Прикольная статья на хабре на эту тему
Ну и ссылка на саму нейросеть
UPD 30.01
На фоне выхода DeepSeek, Nvidia потеряла около 600млрд$ капитализации.
Там еще и насдак просел.
Убытки составили триллионы долларов в день
Удивительно смотреть как то, как сыпется капитал из-за относительно небольшого стартапа. (По крайней мере по офф версии. Я убежден, что Китай влил гораздо больше денег.)
Пузырь ИИ давно должен был лопнуть т.к. они собирали в себя огромные капиталы которые, я убежден, размывались по кошелькам больше, чем инвестировались в технологии. Иначе возникает вопрос, почему OpenAI и другие не думали о подобной оптимизации?
Ну и на вкусное: DeepSeek взломали — в открытом доступе оказались абсолютно все данные нейронки
Секретные ключи, незашифрованные чаты, логи и даже бэкенд китайского творения стали достоянием общественности.
Исследователи из Wiz Research проводили стандартную проверку инфраструктуры и случайно наткнулись на базу данных — у неё нет НИКАКОЙ защиты, то есть воспользоваться может любой.
Пока что комментариев от Xi Jinping не поступало.
Компания больше не самая дорогая в мире.
Недавно я наткнулся на новость, которая заставила меня задуматься о будущем искусственного интеллекта. Китайский стартап DeepSeek выпустил чат-бота, который неожиданно взлетел на первое место в американском App Store, обогнав даже ChatGPT от OpenAI. Что такое DeepSeek? DeepSeek — китайский стартап, основанный в 2023 году Лян Вэньфэном, руководи…
Вы там все у китайцев на зп сидите что-ли? Куча однотипных постов плодите на тему синего кита (запрещён в РФ). :)
Так блядь по факту же, нейронка, с мощностью 4о и о1 со своим р1 стоит дешевле оных многократно. Об этом пишут все дрочеры нейронок, кому не лень. Если конкретно ты сидишь лишь на дтф и из нейронок знаком только чатом гпт и чем то ещё для картинок, то это не значит что в мире нейросетей происходит тотальный пиздец, с одной стороны одни обещают мега ии с дата центрами в пол триллиона, другие вкладывают сотни миллиардов и обещают столетие научных открытии за несколько десятилетии и аги к 30 годам, третьи, как китайцы, из-за ограничения в железе пытаются вывозить за счёт алгоритмов и кода. Это же ахуенно, максимальная конкуренция, при котором в итоге выиграет наиболее эффективные, так в конце ещё и объеденит в себе все лучшие решения
Запрещён в РФ, а где сотрудничество с Китаем и тёплые отношения? Опять Путин писдит?