СМИ: Microsoft и OpenAI подозревают китайскую DeepSeek в краже данных

Компании изучают ситуацию, а акции технологических гигантов вновь дорожают.

СМИ: Microsoft и OpenAI подозревают китайскую DeepSeek в краже данных
579579
5151
1313
55
44
33
11
11
11
11
11

Удобно, как только появился реальный конкурент то для него внезапно и дело сшили за пару дней. Через неделю дипсик запретят на территории ЕС и США?

104
2

Объявят, что сервера deepseek устарели

103

Особо смешно, что бидон и чипы невидии последние запрещал китайцам отправлять. А те в итоге все равно запилили свой ии на старых, который еще и работает без подписок и всей этой срани. Я прям жду не дождусь когда заблочат и серваки разгрузятся от просветленных западных товарищей

48
3

Дело? Какое еще дело? Никто ничего не шил.

OpenAI как бы говорит, что такую нейронку как Deepseek нельзя сделать с нуля. Они украли данные и за счет этого, она выходит дешевле. Чтобы в будущем делать более мощные нейронки все равно потребуются большие инвестиции. Все падение рынка было вызвано именно этим. Мол затраты слишком высокие.

OpenAI это говорят инвесторам прежде всего.

7
3
1

"Украли данные"
Ого, из интернета взяли данные для тренировки нейросети.
Алгоритмы работы нейросети они никаким образом украсть не могли, а фактически всё строится именно на алгоритмах.

Или может openai где то датасеты свои хранила в открытом виде?

7

В данном случае подразумевается техника дистилляции. См Distillation techniques.

Есть нейронка учитель и нейронка ученик. То, что это техника использовалась в DeepSeek они даже не скрывают: https://arxiv.org/html/2412.19437v1
Что они, возможно, скрывают так это, что часть работы учителя брали Claude и ChatGPT.

Сделать учителя очень трудозатратно, сделать ученика гораздо дешевле. DeepSeek, видимо, когда говорили про свои затраты имели в виду только затраты на создание "ученика".

Но фишка в том, что без учителя не будет и учеников.
На самом деле это большая проблема для AI. Первым быть невыгодно.

10

Интересно, надо почитать. Но в таком случае получается что ученик превзошел учителя)

Как минимум в плане данных он гораздо лучше ориентируется, меньше придумывает.

Когда я пытался изучать шейдеры при помощи ChatGPT я сталкивался с тем, что он берёт кусками из разных языков/апи/рендеров и максимум что от него можно было получить адекватное, это расшифровку каких нибудь формул. Сколько я не пытался, gpt так и не смог написать адекватный, рабочий, шейдер. Причем на любых моделях, включая самые новые.

Решил прогнать схожие вещи через DeepSeek и он моментально сориентировался в том, о чем я его спрашиваю, в каком движке я работаю и какие есть особенности рендера в конкретном месте.

3
1

Причем на любых моделях, включая самые новые.Ты имеешь в виду подписочные o1-mini и o1, или бесплатные?

А Gemini 2.0 не тестировал? Я сейчас в основном использую сочетание ChatGPT и мыслящей модели Gemini

Комментарий недоступен

Да, да, поэтому он выдавал одинаковые ответы с чатгпт на одни и те же запросы. Наивный защитник.

2

Комментарий удалён модератором

Кому ещё думать надо...

Затраты на создание первоначальной нейронки некуда не делись.

1
1

Этих конкурентов тьма. Это у русских какое-то особое преклонение перед китайцами и делаете акцент на очередной ИИ, которая выросла из плохого торгового бота.

4
3

Ну что вы в самом деле. Запрещают только тоталитарные диктатуры. Деловые люди предложат сначала продать компанию американским инвесторам, а уже потом в случае отказа запретят

1

Вроде в Италии уже нельзя скачать из appstore и goggle play

[]