Нифига себе, производительность в нейронках выросла

Подумал я. А потом прочитал, что для 5090 для графика они использовали сжатую fp4 модель Flux.dev, тогда как на 4090 использовалась fp8 вариант.

Нифига себе, производительность в нейронках выросла
3838
1717
22

можно раскрыть в чем разница этих fp моделей для людей вне контекста?

13

1 игрок [fp 8] = тебе надо занести на 5 этаж 1000 кирпичей
2 игрок [fp 4 ]= тебе надо занести на 5 этаж 5000 кирпичей

Победил 2 игрок.

8
1

fp8 - это значит, что параметры представляются в виде 8битных чисел с плавающей запятой, а fp4 - в виде 4х битных

5

Грубо говоря это вес модели, fp16-fp8-fp4 это сжатие от базового размера.

1

https://dennisforbes.ca/articles/understanding-floating-point-numbers.html

неплохо описана тема. Если просто, то вместо прицельной стрельбы пошла стрельба от бедра, на точность чуток подзабит болт