Подробно о 30-й серии GeForce RTX от NVIDIA — стоит ли обновляться прямо сейчас или лучше подождать

Мы посетили закрытую презентацию компании и рассказываем о возможных подводных камнях.

1 сентября NVIDIA провела презентацию, на которой представила три видеокарты из семейства GeForce RTX. Согласно слайдам с презентации, даже «младшая» RTX 3070 опережает по производительности прошлый флагман RTX 2080 Ti при двукратной разнице в цене — в России RTX 2080 Ti Founders Edition стоит 96 тысяч рублей, а официальная цена референса RTX 3070 в октябре составит 45,5 тысяч рублей.

Начать стоит с того, что NVIDIA не раскрывает конкретные значения производительности — на презентации и в «первом взгляде» от Digital Foundry очень мало конкретики, все оперируют «процентами разницы», а не сопоставлением конкретных показателей.

Мы предполагаем, что, говоря о «двукратном» приросте производительности, Nvidia имела в виду средний fps на определённом контрольном участке игры, но на деле эти графики могли собрать из пиковых значений максимального фреймрейта — одной из самых нерепрезентативных характеристик в принципе.

Разница между двумя видеокартами по среднему и пиковому fps может быть разной

Кроме того, все измерения производились в 4К и с Intel Core i9 — при более низких разрешениях разница между видеокартами разного уровня (или поколений) может отличаться. Так, разница между RTX 2060 и RTX 2080 в 4K превышает 50%, но в Full HD не дотягивает и до 30%.

И здесь важно видеть конкретные результаты тестов — например, между RTX 2080 и RTX 2060 пролегает очень важная граница, одна из них выдаёт «играбельные» 40 fps, тогда как вторая вытягивает «полноценные» 60 кадров в секунду.

Позже на закрытой сессии вопросов и ответов NVIDIA поделилась более точными графиками — но тоже в основном в 4K. Редким исключением стал график ниже, на котором RTX 3070 сравнивают с двумя предыдущими поколениями видеокарт этого класса в разрешении 1440р.

Наибольший прирост заметен в Minecraft RTX — игре с полной трассировкой глобального освещения (path tracing), это говорит о приросте производительности RT-ядер. На втором месте Control с DLSS 2.0 и обычной трассировкой теней отражений.

Но интереснее всего здесь пример Borderlands 3, игры, которая создавалась преимущественно под крылом AMD и не поддерживает технологии NVIDIA. В ней прирост на максимальных настройках и при вполне «нормальном» разрешении составил больше 65%, а в абсолютных значениях производительность подскочила с 50 fps до 80+ fps, это более чем значительное превосходство. А вот GTX 1070, которая могла «честно» соревноваться с более новыми моделями в этом тесте, смотрится совсем невыразительно — в современных играх эта видеокарта годится преимущественно для Full HD.

В «низком» разрешении RTX 3080 даже не тестировали. На примере DOOM Eternal видно, что в этом случае речь идёт о фреймрейте выше 120 fps на максимальных настройках даже в 4K, так что вопросы о более низких разрешениях отпадают сами собой — очевидно, что для «обычных» игровых мониторов с разрешением 1440р и 1080p её производительность скорее всего будет избыточной.

В разборе Digital Foundry эксперты зафиксировали среднюю разницу от 70% до 92,3% в зависимости от игры. В играх с DLSS 2.0 и трассировкой лучей прирост производительности по большей части выше — значит, NVIDIA не только нарастила производительность основных CUDA-ядер, но и улучшила дополнительный блок с RT и тензорными ядрами.

Если сравнивать по характеристикам с официального сайта, можно увидеть, что количество ядер CUDA увеличилось более чем вдвое. У RTX 2080 Super 3072 ядра, работающих на частоте до 1,815 ГГц, тогда как у RTX 3080 в распоряжении 8704 ядра (+162%) но частота ниже, до 1,71 ГГц.

И это единственные существенные характеристики графического чипа, которые можно сравнить напрямую. Там, где у видеокарт Turing указано число лучей, которые RT-блок может просчитывать в секунду, у Ampere указано лишь, что используются RT-ядра второго поколения и тензорные ядра третьего поколения, без подробностей.

Неясное распределение прироста производительности в обычных и специализированных ядрах создаёт неопределённость в том, как хорошо новые видеокарты будут справляться с неоптимизированными играми. Однако появившийся в сети слайд со сравнением производительности в играх без DLSS и RTX (таких как DOOM Eternal и Borderlands 3) вносит некоторую ясность — даже без применения дополнительных ядер и фирменных технологий оптимизации новые видеокарты показывают внушительные результаты.

<a href="https://api.dtf.ru/v2.8/redirect?to=https%3A%2F%2Ftwitter.com%2Fdavideneco25320%2Fstatus%2F1300844073960562689&postId=202833" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

На закрытом брифинге NVIDIA рассказала о том, как изменилась архитектура графических чипов Ampere по сравнению c Turing и какие нововведения коснулись аппаратной трассировки лучей. Так, например, в чипах Ampere стало вдвое меньше тензорных ядер, но их производительность многократно возросла. Кроме того, они «научились» проводить апскейлинг для DLSS 2.0 (и 2.1) параллельно рендерингу, а не после него.

Второе поколение RT-ядер для трассировки лучей в реальном времени стало быстрее, а самих ядер в новых картах — больше.

Для того, чтобы полностью подготовить к выводу один кадр Wolfenstein Youngblood с трассировкой отражений и DLSS 2.0, RTX 2080 Super требуется 13 мс: сначала кадр рендерится в пониженном разрешении и обсчитывается трассировка освещения, а потом полученное изображение увеличивается до целевого разрешения.

Ровно тот же процесс на RTX 3080 занимает 7,5 миллисекунд (прирост скорости 42%), а если выполнять задачи параллельно (апскейлинг производится предиктивно на основе информации из предыдущих кадров), то новая видеокарта справляется за 6,7 мс (ещё на 12% быстрее).

Жёлтое — нагрузка на шейдеры, зелёное — на RT-ядра, фиолетовое — на тензорные ядра

При этом сами принципы трассировки не изменились — просто RTX 30-й серии справляется с этими задачами быстрее, и сам процесс меньше сказывается на производительности. В целом, владельцам GeForce RTX 20-й серии можно не беспокоиться о том, что их видеокарты не справятся с эффектами трассировки в новых играх — возможно, придётся снизить дальность прорисовки и качество текстур, но менее реалистичными освещение и отражения не станут.

К тому же, Microsoft уже подтвердила, что RTX 20 и RTX 30 находятся на одном уровне поддержки функций DirectX 12 Ultimate — а значит, производительность RTX 20 в будущем может даже вырасти, так как больше разработчиков будут брать на вооружение технологии вроде DLSS 2.0, VRS и Mesh Shading, направленные на увеличение частоты кадров без ухудшения качества графики.

На презентации NVIDIA много времени посвятила новым технологиям. Большинство из них будут работать на RTX 20-й серии, а некоторые даже на GTX 900. Давайте разберём по порядку.

RTX Broadcast

Приложение задействует тензорные ядра для работы нейросетей, которые помогают создавать «чистые» трансляций без дополнительных вложений.

RTX Voice устраняет фоновые шумы, которые захватывает микрофон, причём он может справиться даже с рёвом строительного фена.

RTX GreenScreen эффективно обрезает фон — аналогичный инструмент от, например, XSplit распространяется по платной подписке, но (если судить по демонстрации) ни в чём не превосходит бесплатную утилиту от NVIDIA. Разумеется условно-бесплатную, видеокарту-то купить всё равно надо.

Пример XSplit — утилита обрезала часть руки, а по краям заметно много артефактов.

У нас не было шанса протестировать RTX Broadcast целиком — но появившийся в раннем доступе RTX Voice умельцы смогли «завести» на видеокартах GTX 10 и GTX 16, у которых никаких тензорных ядер нет. Впрочем, в случае со старыми картами утилита сильнее сказывается на производительности.

dtf.ru

Пользователь нашёл способ запустить RTX Voice на старых видеокартах GeForce — Железо на DTF

NVIDIA Reflex

Пакет технологий, направленный на снижение системной задержки в играх. Reflex работает на любых видеокартах вплоть до GeForce GTX 900, но для полной функциональности требует монитора с расширенным модулем G-Sync Ultimate.

NVIDIA Reflex оптимизирует очередь вычислений и снижает нагрузку на процессор, немного увеличивая fps и выравнивая время кадра. Благодаря этому новые кадры поступают равномерно, и отображение событий, которые уже произошли в игре (и зарегистрированы сервером) происходит более своевременно.

Для киберспортсменов NVIDIA обновила модуль G-Sync Ultimate, добавив поддержку Reflex. Если монитор оснащён этой технологией, то мышь и клавиатурe нужно подключать к нему, а не к материнской плате. Специальный чип будет регистрировать скорость отклика системы на нажатия — эти данные помогут понять, есть ли на компьютере нежелательные задержки и как их устранить.

Один недостаток — Reflex поддерживают всего четыре «киберспортивных» монитора с частотой 360 Гц и диагональю 24 дюйма, которые при этом стоят от 800 долларов (да, дороже, чем RTX 3080).

dtf.ru

ASUS, Acer, MSI и Alienware первыми представили мониторы с частотой 360 Гц и NVIDIA Reflex — Железо на DTF

Возможно, самый недооценённый из анонсов презентации. Это, по сути, ответ новому поколению консолей — там, где Microsoft и Sony используют выделенный со-процессор для сжатия и декодирования текстур при стриминге ассетов с SSD, NVIDIA задействует для этого видеокарту.

Максимальная скорость чтения с современных PCIe 4.0 SSD — около 7 ГБ/с, но этого недостаточно для того, чтобы подгружать необходимые объекты и текстуры с накопителя в видеопамять в реальном времени. RTX IO позволяет эффективно сжимать и декодировать информацию, чтобы передавать до 14 ГБ данных в секунду, удваивая пропускную способность канала.

NVIDIA утверждает, что, чтобы проводить подобные операции в реальном времени, потребуется загрузить 24 ядра процессора. Но для видеокарты, по словам инженеров NVIDIA, эта нагрузка «практически ничего не стоит».

Первый столбец — загрузка с HDD без компрессии, второй — декомпрессия на «обычном» процессоре, третий — декомпрессия на 24-ядерном Threadripper, четвёртый — на видеокарте с RTX IO

RTX IO задействует технологию прямого чтения Microsoft DirectStorage, которую разработчики игр для ПК должны интегрировать в свои проекты.

За неимением подходящих игр, NVIDIA показала разницу в скорости загрузки уровня на примере демо Marbles at Night.

Игры с Microsoft DirectStorage API начнут появляться не раньше 2021 года, технология скорее всего будет развиваться одновременно с технологиями компрессии данных на консолях.

NVIDIA уже подтвердила, что RTX IO будет доступна владельцам RTX 20 и 30 в равной степени.

Исходя из открытых данных можно заключить, что RTX 30-й серии предназначены прежде всего для популяризации разрешения 4К и развития технологий оптимизации производительности игр при помощи нейросетей и особенностей чипов GPU. В высоком разрешении прирост производительности от увеличения числа CUDA-ядер, скорости памяти и технологий вроде DLSS будет заметен намного лучше.

Для владельцев видеокарт RTX 20-й серии апгрейд будет оправдан только в случае, если уже имеющейся видеокарты не хватает для комфортной игры в интересующем вас разрешении. RTX 2060, 2060 Super и 2070 остаются актуальными на Full HD и 1440p в нетребовательных играх, а RTX 2070 Super, 2080 и 2080 Super вполне релевантны для 1440p и, в меньшей степени, 4К.

Системные требования игр едва ли будут значительно расти в ближайшее время — напротив, большинство новых технологий сейчас ориентированы на оптимизацию процессов и увеличение производительности на существующем железе.

Для владельцев GeForce GTX 16, Radeon RX 5000 и моделей прошлых поколений апгрейд более чем оправдан, но торопиться не стоит.

Индустрия стоит на пороге по-настоящему нового поколения: трассировка лучей прижилась, «умных» технологий оптимизации вроде DLSS становится всё больше, а производители консолей активно продвигают стриминг текстур с SSD с применением компрессии. И все эти технологии — не эксклюзив NVIDIA, уже в ближайшие месяцы AMD и Intel покажут собственные решения того же порядка.

Аппаратная трассировка лучей, апскейлинг нейросетями (DLSS) и технологии оптимизации производительности из пакета DirectX 12 Ultimate (VRS, Mesh Shading, Sampler Feedback) недоступны для старых видеокарт, но есть у RTX 20 и RTX 30.

AMD Radeon (RDNA 2) должны анонсировать в октябре и выпустить до конца года, а Intel Xe HPG — в начале 2021-го. Поэтому, если есть возможность, стоит подождать выхода всех видеокарт нового поколения (к весне 2021) и принять взвешенное решение на основе всех тестов. Впрочем, справедливо и то, что у NVIDIA сейчас фора в целое поколение, и конкурентам будет тяжело сократить дистанцию.

Видеокарты GeForce RTX 3080 и RTX 3090 появятся в продаже в США до конца сентября, а RTX 3070 — в октябре. В российских магазинах новинки могут появиться с некоторым опозданием в связи с логистическими трудностями из-за пандемии.

#лонг #мнение #nvidia #geforce

Подробно о 30-й серии GeForce RTX от NVIDIA — стоит ли обновляться прямо сейчас или лучше подождать

О сравнениях производительности

О трассировке лучей

О новых технологиях

NVIDIA RTX IO