Подумал я. А потом прочитал, что для 5090 для графика они использовали сжатую fp4 модель Flux.dev, тогда как на 4090 использовалась fp8 вариант.
На фоне выхода RTX 5090 с пиковым потреблением до 900 Вт вспоминаются подобные разработки из прошлого десятилетия
Разбор новой, необычной системы охлаждения. С инженером Nvidia. Возможно, это уже было на сайте, но пост создать побудила соседняя тема про 5090, где у комментирующих было явное непонимание как такое вообще может быть возможно. Всё дело в том, что такого еще никогда не делали. Посмотрите видео, там интересно.
На презентации nvidia показали разницу в между 4000 и 5000 серией в генеративной нейросети flux. И совершенно беспардонно прямым текстом написали, что на 5000 серии использовалась модель (fp4 против fp8), которая в два раза меньше и, соответственно, быстрее.
Если 5070 со всеми включёнными DLSS4, фреймгенами и прочим сравнится с нативом 4090, то получается 4090 с апгрейдом DLSS и фреймгеном сравнится с 5090, но об этом по понятным причинам на презентации не сказали. Поэтому смысла с 4090 обновляться на что-то из 5x серии примерно ноль с учетом курса.
И хотя понятно что даже от 4090 будет смысл, мне интересно какая карта оптимальная для такого разрешения? На данный момент целюсь в 4070 Ti SUPER, но думаю не добавить ли на 4080 SUPER?
Я распаковываю RTX 5090, а затем подвергаю ее многочисленным позорным испытаниям и оценкам, сравнивая ее со старшим, еще более массивным братом RTX 4090. Отказ от ответственности: я получил этот продукт от Nvidia, мне за него не заплатили, и они не имели никакого отношения к тому, что показано в этом видео, кроме предоставления мне продукта и устан…
можно раскрыть в чем разница этих fp моделей для людей вне контекста?
1 игрок [fp 8] = тебе надо занести на 5 этаж 1000 кирпичей
2 игрок [fp 4 ]= тебе надо занести на 5 этаж 5000 кирпичей
Победил 2 игрок.
fp8 - это значит, что параметры представляются в виде 8битных чисел с плавающей запятой, а fp4 - в виде 4х битных
Если не вдаваться в подробности - это квантизация. Фп8 - меньше потерь данных при квантовании и она в 2 раза тяжелее чем фп4, у которой будет больше смазов и потерь данных. В общем фп4 в 2 раза легче для видюх чем фп8
Грубо говоря это вес модели, fp16-fp8-fp4 это сжатие от базового размера.
https://dennisforbes.ca/articles/understanding-floating-point-numbers.html
неплохо описана тема. Если просто, то вместо прицельной стрельбы пошла стрельба от бедра, на точность чуток подзабит болт