Подумал я. А потом прочитал, что для 5090 для графика они использовали сжатую fp4 модель Flux.dev, тогда как на 4090 использовалась fp8 вариант.
можно раскрыть в чем разница этих fp моделей для людей вне контекста?
1 игрок [fp 8] = тебе надо занести на 5 этаж 1000 кирпичей
2 игрок [fp 4 ]= тебе надо занести на 5 этаж 5000 кирпичей
Победил 2 игрок.
fp8 - это значит, что параметры представляются в виде 8битных чисел с плавающей запятой, а fp4 - в виде 4х битных
Грубо говоря это вес модели, fp16-fp8-fp4 это сжатие от базового размера.
https://dennisforbes.ca/articles/understanding-floating-point-numbers.html
неплохо описана тема. Если просто, то вместо прицельной стрельбы пошла стрельба от бедра, на точность чуток подзабит болт