Статья удалена
Поддержка INT4/FP4 является ключевым технологическим прорывом в серии RTX 50XX. Это нововведение в комбинации с новыми методами квантизации моделей позволяет достичь значительного увеличения производительности и позволяет упаковать большие модели в отностительно небольшой размер VRAM пользовательских видеокарт. А именно:
- FP4 уменьшает размер моделей ИИ более чем в два раза по сравнению с FP16 (в 4090 нет нормальной поддержки fp8), позволяя запускать более сложные модели на видеокартах с меньшим объемом памяти.
- На примере модели FLUX.1, использование FP4 снижает требования к видеопамяти с 23 ГБ до менее чем 10 ГБ, при этом время генерации изображения сокращается с 15 до 5 секунд на RTX 5090.
Заявленное двукратное увеличение производительности RTX 50XX во многом достигается именно благодаря переходу на более эффективные вычисления с меньшей точностью, а не увеличением производительности в формате предыдущих поколений. В играх это особенно заметно при использовании трассировки лучей, где INT4 вычисления значительно упрощают расчеты.
Дальше видимо будет только так – производительность рендеринга будет расти незначительно и улучшение картинки будет происходить в большей степени за счет инноваций в AI. По крайней мере в ближайшее время.