Каждый лоток в стойке содержит либо два чипа GB200, либо два коммутатора NVLink, по 18 первых и девять вторых на стойку. В общей сложности, по словам Nvidia, одна из этих стоек может поддерживать модель с 27 триллионами параметров. По слухам, GPT-4 имеет модель с 1,7 триллионами параметров.
Компания заявляет, что Amazon, Google, Microsoft и Oracle уже планируют включить стойки NVL72 в свои предложения облачных сервисов, хотя неясно, сколько они покупают.
И, конечно, Nvidia рада предложить компаниям и остальные решения. Вот DGX Superpod для DGX GB200, который объединяет восемь систем в одной, в общей сложности 288 процессоров, 576 графических процессоров, 240 ТБ памяти и 11,5 эксафлопс вычислений FP4.
Начало конца человечества в руках корейца.
Сделайте ему кто-то узкие глазки
Nvlink в графических картах для потребительского сегмента ушел вместе с 3090, а тут и обьединение целых стоек через линк.Какая же жадная узкоглазая жаба этот хуанг, дал бы пацанам две 4070 в мост соединить и 50 серия курила бы в углу, в растере то конечно уже ничего не придумаешь кроме тупого наращивания кэша и частот, а вот моднявые нейросети с fp4 и fp8 вот поле непаханное для оптимизаций. Все для серверного сегмента по диким ценам. Ну ничего, одна синяя конторка уже пробовала тупо закинуть в серверный сегмент свои поделия за оверпрайс. Китайцы задвинут хуанга не зря он начал огораживать cuda
Интересно этот новый интерфейс nvlink будет и в потребительском сегменте? Я к тому что можно ли будет подключить две 5090?