Железо

Новая статья: Обзор видеокарты NVIDIA GeForce RTX 3080, часть 2: долгожданные тесты

Новейшие видеокарты серии GeForce RTX 30 изрядно задержались на пути в редакцию 3DNews — настолько, как мы даже не предполагали, пока работали над первой частью обзора, посвященной архитектуре чипов Ampere и всем характеристикам потребительских устройств на их основе. Но теперь первые партии GeForce RTX 3080 наконец-то потекли в Россию тонким ручейком, и мы получили возможность испытать RTX 3080 на практике, ответив на все волнующие читателей вопросы, кроме одного: сколько в действительности будут стоить передовые ускорители. Планы IT-изданий на публикацию обзоров — не единственное, на что повлияла пандемия. Говорят, что свою лепту в дефицит RTX 3080 внесло осложнение отношений между США и Китаем, но главный виновник — невероятный ажиотаж вокруг новинок. Просто так взять и купить GeForce RTX 3080 сейчас практически невозможно. Геймерам, которые поспешили сбыть с рук GeForce RTX 2080 Ti, в лучшем случае придется отстоять очередь на предзаказ в каком-либо из зарубежных интернет-магазинов — складские запасы там иссякли в течение нескольких часов, если не минут, после того, как NVIDIA дала отмашку на старт продаж, а цены закономерно (и намного) превышают рекомендованные Санта-Кларой $699. Нечего и говорить о том, что RTX 3080 в России — по крайней мере, на первых порах — будет стоить дорого. Но ведь не зря же покупатели так набросились на свежие ускорители NVIDIA? Это мы и собираемся выяснить сегодня.

Однако сразу предупредим, что если вас интересует не только разбор производительности GeForce RTX 3080, но и знакомство с видеокартами Founders Edition, с этим придется еще немного повременить. Фирменные устройства попадут в редакцию позже партнерских вариантов RTX 3080, хотя это по-своему справедливо. В этот раз Founders Edition предельно далек от того, что раньше называли рефененсными платами и представляет собой лимитированный продукт для ценителей прекрасного, который никогда не стоил бы в рознице $699, если бы вместо NVIDIA его конструировал и продавал кто-нибудь из партнеров компании.

Мы рады, что GeForce RTX 3080 в первых бенчмарках на 3DNews представляет устройство Palit. Под этой маркой уже не раз появлялись самые доступные модификации той или иной видеокарты на российском рынке. И хотя RTX 3080 принципиально не может быть дешевым, Palit GeForce RTX 3080 GamingPro OC продемонстрирует, на что может рассчитывать покупатель, который в сложившихся условиях по-прежнему намерен сэкономить

⇡#Технические характеристики GeForce RTX 3080

Хотя официальным спецификациям видеокарт GeForce 30-й серии мы уделили повышенное внимание в архитектурной части обзора, не помешает напомнить читателям, с каким монстром мы имеем дело в лице GeForcе RTX 3080 и графического процессора GA102.

Логика полностью функционального кристалла GA102 представлена семью блоками GPC (Graphics Processing Cluster, крупнейшими масштабируемыми компонентами массива) — против шести в составе TU102. Каждый из них по-прежнему содержит 12 потоковых мультипроцессоров (Streaming Multiprocessor), только набор 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри SM был удвоен. В результате формула главных исполнительных блоков GA102 включает 10 496 FP32-совместимых CUDA-ядра и 336 блоков наложения текстур.

Однако GeForce RTX 3080 досталась существенно урезанная разновидность GA102, в которой осталось только шесть действующих модулей GPC. Кроме того, два из них не полностью укомплектованы SM’ами. В итоге GeForce RTX 3080 располагает 8 704 шейдерными ALU для операций FP32 и 272 блоками наложения текстур. Тем не менее, это по-прежнему громадный запас сырой вычислительной мощности по сравнению с топ-моделями 20-й серии: у GeForce RTX 2080 SUPER и RTX 2080 Ti соответственно есть лишь 3072 и 4352 CUDA-ядра FP32. Рекомендуем обратиться к первой части обзора, чтобы узнать, каким образом NVIDIA удалось втиснуть на кристалл столько шейдерных ALU, не выходя за пределы и без того колоссального компонентного бюджета в 28 млрд транзисторов.

Для того, чтобы насытить потребность GA102 в быстром доступе к данным, видеокарты GeForce RTX 3080 и RTX 3090 комплектуются оперативной памятью нового типа GDDR6X, которая в случае RTX 3080 обеспечивает пропускную способность в 19 Гбит/с на контакт шины против 14- или 16-гигабитной GDDR6, преобладающей в ускорителях прошлого поколения. При этом совокупная ПСП RTX 3080 несмотря на урезанную до 320 бит шину достигает 760 Гбайт/с. Больше — только у GeForce RTX 3090 (960 Гбайт/с) и Radeon VII (1 Тбайт/с). Легкие опасения может вызвать только объем оперативной памяти в 10 Гбайт, хотя формально и фактически более слабый GeForce RTX 2080 Ti располагает 12 Гбайт VRAM.

Производитель

NVIDIA

Модель

GeForce RTX 2080

GeForce RTX 2080 SUPER

GeForce RTX 2080 Ti

TITAN RTX

GeForce RTX 3080

GeForce RTX 3090

Графический процессор

Название

TU104

TU104

TU102

TU102

GA102

GA102

Микроархитектура

Turing

Turing

Turing

Turing

Ampere

Ampere

Техпроцесс

12 нм FFN

12 нм FFN

12 нм FFN

12 нм FFN

8 нм (8N)

8 нм (8N)

Число транзисторов, млн

13 600

13 600

18 600

18 600

28 300

28 300

Тактовая частота, МГц: Base Clock / Boost Clock

1 515/1 710 (Founders Edition: 1 515/1 800)

1 650/1 815

1 350/1 545 (Founders Edition: 1 350/1 635)

1 350/1 770

НД /1 710

НД /1 695

Шейдерные ALU

2 944

3 072

4 352

4 608

8 704

10 496

Блоки наложения текстур (TMU)

184

192

272

288

272

328

Блоки операций растеризации (ROP)

64

64

88

96

96

112

Тензорные ядра

368

384

544

576

272

328

RT-ядра

46

48

68

72

68

82

Оперативная память

Разрядность шины, бит

256

256

352

384

320

384

Тип микросхем

GDDR6 SGRAM

GDDR6 SGRAM

GDDR6 SGRAM

GDDR6 SGRAM

GDDR6X SGRAM

GDDR6X SGRAM

Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)

1 750 (14 000)

1 937,5 (15 500)

1 750 (14 000)

1 750 (14 000)

1 188 (19 000)

1 219 (19 500)

Объем, Мбайт

8 192

8 192

11 264

24 576

10 240

24 576

Шина ввода/вывода

PCI Express 3.0 x16

PCI Express 3.0 x16

PCI Express 3.0 x16

PCI Express 3.0 x16

PCI Express 4.0 x16

PCI Express 4.0 x16

Производительность

Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)

10 069/10 598 (Founders Edition)

11 151

13 448/14 231 (Founders Edition)

16 312

29 768

35 581

Производительность FP64/FP32

1/32

1/32

1/32

1/32

1/32

1/32

Производительность FP16/FP32

2/1

2/1

2/1

2/1

1/1

1/1

Пропускная способность оперативной памяти, Гбайт/с

448

496

616

672

760

936

Вывод изображения

Интерфейсы вывода изображения

DisplayPort 1.4a, HDMI 2.0b

DL DVI-D, DisplayPort 1.4a, HDMI 2.0b

DisplayPort 1.4a, HDMI 2.0b

DisplayPort 1.4a, HDMI 2.0b

DisplayPort 1.4a, HDMI 2.1

DisplayPort 1.4a, HDMI 2.1

TBP/TDP, Вт

215/225 (Founders Edition)

250

250/260 (Founders Edition)

280

320

350

Розничная цена (США, без налога), $

699 (рекоменд.)/ 799 (Founders Edition) — в момент выхода

699 (рекоменд. в момент выхода)

999 (рекоменд.)/ 1 199 (Founders Edition) — в момент выхода

2 499

699 (рекоменд. в момент выхода)

1499 (рекоменд. в момент выхода)

Розничная цена (Россия), руб.

63 990 (Founders Edition в момент выхода)

56 990 (рекоменд. в момент выхода)

95 990 (Founders Edition в момент выхода)

221 990 (в момент выхода)

63 490 (nvidia.ru)

136 990 (nvidia.ru)

Впрочем, действительное потребление набортной памяти видеокарты современными играми — тонкая тема, которую не раскрывают оценки занятых гигабайтов в мониторинге GPU-Z или MSI Afterburner. Пока 10 Гбайт оперативки GeForce RTX 3080 должно хватить для любых задач обычного пользователя, включая игры на 4К-экране с максимальными настройками детализации. Однако практика последних лет говорит о том, что для долгой службы без апгрейда лучше набирать VRAM с запасом. Неспроста на горизонте уже маячат версии GeForce RTX 3080 с 20 Гбайт GDDR6X, которые, очевидно, внесут дополнительные коррективы в ценовую картину 30-й серии. Также оставим за рамками обзора такой вопрос, как влияние на работу новых топов NVIDIA двух различных поколений интерфейса PCI Express. Консенсус состоит в том, что PCIe 4. 0 не приносит в играх никакого практически значимого преимущества, хотя дает AMD лишнюю возможность подчеркнуть достоинства платформы AM4. Другое дело — профессиональные приложения, особенно те, что могут использовать несколько GPU одновременно, но это мы оставим на усмотрение специалистов в таких задачах, как глубинное обучение.

Как бы то ни было, официальные данные о производительности GeForce RTX 3080 таковы, что новинка обеспечивает вдвое более высокую частоту смены кадров по сравнению с базовой версией GeForce RTX 2080 — в условиях, идеальных для архитектуры Ampere, то есть при разрешении 4К и с трассировкой лучей, но тем не менее. Мы намерены выяснить, отработает ли RTX 3080 такую заявку, а заодно проверить, каково действительное энергопотребление ускорителя. Как ни крути, одночиповые игровые платы NVIDIA впервые перевалили за отметку 300 Вт, а ведь RTX 3080 — это даже не флагман серии. Но сперва внимательно изучим видеокарту, которая удостоилась чести представлять новую архитектуру в первых тестах — Palit GeForce RTX 3080 GamingPro OC.

⇡#Palit GeForce RTX 3080 GamingPro OC: конструкция, комплект поставки

Партнеры NVIDIA и AMD не любят выпускать видеокарты, лишенные хотя бы номинального разгона. Вот и Pait GamingPro потому несет в названии индекс OC, что графический процессор в ней пускай совсем чуть-чуть, но все-таки разогнан. Оверклокинг сводится к добавочным 30 МГц проектной тактовой частоты под игровой нагрузкой (Boost Clock), поэтому спецификации ускорителя вполне можно приравнять к референсным с практической точки зрения.

Тем более сильное впечатление производит система охлаждения, которую Palit водрузила на чип GA102. Видеокарта занимает в корпусе ПК три полных слота расширения, что могли себе позволить далеко не все разновидности GeForce RTX 2080, включая те, которые разогнаны поболее Pait GamingPro. Не зря компания приложила к своему продукту акриловую подпорку, которая удерживает свободный край платы в горизонтальном положении.

Однако кулер палитовской версии GeForce RTX 3080 интересен не только своими габаритами. Когда все взгляды прикованы к видеокартам Founders Edition, задающим стандарты если не в эффективности охлаждения (это мы еще выясним в свое время), то уж точно в эстетике, партнеры NVIDIA, которые не могут себе позволить расходовать на один только кулер свыше $150 (по слухам, именно в такую сумму обходится производство СО для одной платы Founders Edition), стремятся так или иначе выделиться из общей массы.

При взгляде спереди Palit GeForce RTX 3080 GamingPro OC не представляет собой ничего экстраординарного: кажется, что перед нами обычный кулер с тремя вентиляторами диаметром 95 мм, только очень толстый. Есть и практически обязательная для современных высокопроизводительных видеокарт RGB-подсветка.

Но если перевернуть видеокарту, можно убедиться в том, что поток воздуха от правого вентилятора проходит насквозь через массив радиаторных ребер и пластину на оборотной стороне PCB — прямо как в Founders Edition. Не удивимся, если и другие производители последуют в этой детали примеру NVIDIA не столько из стремления подражать законодателю мод, сколько потому, что схемотехника ускорителей с памятью GDDR6X требует размещать чипы RAM как можно ближе к GPU и таким образом располагает к коротким печатным платам. Такой поход к устройству системы охлаждения мы уже видели когда-то в исполнении SAPPHIRE — тоже на базе короткой PCB ускорителей Radeon R9 Fury.

Кстати, нельзя не похвалить Palit за то, что пластина поверх печатной платы сделана не из бесполезного и даже вредного для охлаждения пластика, а из алюминия и прижата к текстолиту через несколько термопрокладок.

Под кожухом системы охлаждения скрывается вполне типичный, разве что с поправкой на размеры, двухсекционный радиатор, пронизанный несколькими толстыми теплотрубками. Тепло с кристалла GPU снимает никелированная медная подошва, а микросхемы памяти и силовые каскады VRM контактируют с массивной металлической рамой.

Кулер GeForce RTX 3080 GamingPro OC выглядит подобающе мощным для видеокарты со штатным энергопотреблением в 320 Вт и, как мы успеем убедиться, отличается одновременно высокой эффективностью и низким уровнем шума. Когда температура GPU меньше 60 °C, активное охлаждение ему вообще не требуется, а вращение вентиляторов прекращается. Единственная претензия, которую можно предъявить к конструкции этой видеокарты (да и многих других тоже), состоит в том, что весь отработанный горячий воздух система охлаждения оставляет внутри корпуса ПК. При таком устройстве, когда ребра радиатора идут параллельно решетке в торце кожуха, ее вполне можно было заменить глухой пластиной с вырезами только под разъемы видеовыходов — от этого бы ничего не изменилось.

К слову о видеовыходах GeForce RTX 3080, отсутствие характерного для ускорителей 20-й серии разъема USB Type-C с поддержкой DisplayLink не является мерой экономии со стороны Palit. Этот стандарт, предназначенный для подключения шлемов VR одним проводом, как говорится, не взлетел и в итоге был отвергнут NVIDIA.

⇡#Palit GeForce RTX 3080 GamingPro OC: печатная плата

Как мы уже отметили в самом начале, разновидности GeForce 30-й серии под маркой Founders Edition некорректно называть референсными устройствами. Тем не менее NVIDIA предоставляет партнерам настоящий референсный дизайн PCB, чтобы помочь наладить выпуск видеокарт первой волны с фирменными системами охлаждения, а под кулером бюджетного ускорителя иногда можно обнаружить и саму эталонную плату с маркировкой NVIDIA. Печатная плата Palit GeForce RTX 3080 GamingPro OC представляет собой примерно то же самое: фотографии еще нескольких PCB для чипов GA102, которые всплыли в интернете, похожи на то, что вы видите на фотографиях, и очевидно являются вариациями на одну и ту же тему.

Как бы то ни было, у рядового покупателя, не заинтересованного в соревновательном оверклокинге, вряд ли найдется повод придраться к плате RTX 3080 GamingPro OC. Референсный дизайн позволяет организовать 16-фазное питание графического процессора при помощи двух восьмифазных контроллеров On Semiconductor NCP81610, хотя в данном случае на плате распаяно только пять силовых каскадов одного VRM. Памяти GDDR6X выделено вплоть до четырех фаз, но компоненты двух из них, опять-таки отсутствуют. В фазах питания графического процессора применяются силовые каскады AOZ5311NQI от Alpha & Omega с номинальным током 50 А.

Печатная плата Palit GeForce RTX 3080 GamingPro OC не нуждается в более подробных комментариях. Ускорители Founders Edition обслуживают VRM, состоящий в общей сложности из 18 фаз, в них применяются исключительно твердотельные конденсаторы, но среди партнерских разновидностей RTX 3080 и RTX 3090 мы еще не раз увидим именно такой — удешевленный, но вполне достойно укомплектованный — дизайн.

⇡#Тестовый стенд, методика тестирования

Тестовый стенд

CPU

Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)

Материнская плата

ASUS MAXIMUS XI APEX

Оперативная память

G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 Гбайт (3200 МГц, CL14)

ПЗУ

Intel SSD 760p, 1024 Гбайт

Блок питания

Corsair AX1200i, 1200 Вт

Система охлаждения CPU

Corsair Hydro Series H115i

Корпус

CoolerMaster Test Bench V1.0

Монитор

NEC EA244UHD

Операционная система

Windows 10 Pro x64

ПО для GPU AMD

Все видеокарты

AMD Radeon Software Adrenalin 2019 Edition 20.8.3

ПО для GPU NVIDIA

Все видеокарты

NVIDIA GeForce Game Ready Driver 456.16

Игры

Игра (в порядке даты выхода)

API

Метод тестирования

Настройки графики

Полноэкранное сглаживание

Strange Brigade

Vulkan

Встроенный бенчмарк

Макс. качество графики

AA Ultra

Shadow of the Tomb Raider

DirectX 12

Встроенный бенчмарк

Макс. качество графики. DXR выкл., DLSS выкл.

TAA

Assassin's Creed Odyssey

DirectX 11

Встроенный бенчмарк

Макс. качество графики

AA High (TAA)

Battlefield V

DirectX 12

Миссия Liberte + OCAT

Макс. качество графики. DXR выкл., DLSS выкл.

TAA High

Metro Exodus

DirectX 12

Встроенный бенчмарк

Макс. качество графики. DXR выкл., DLSS выкл, Shading Rate 100%

TAA

Total War: THREE KINGDOMS

DirectX 12

Встроенный бенчмарк (Battle Benchmark)

Макс. качество графики

TAA

Control

DirectX 12

OCAT

Макс. качество графики

TAA

Borderlands 3

DirectX 12

Встроенный бенчмарк

Макс. качество графики

TAA

Red Dead Redemption 2

Vulkan

Встроенный бенчмарк

Макс. качество графики

TAA High

DOOM Eternal

Vulkan

Начало миссии Mars Core + OCAT

Макс. качество графики

TAA

Игры (с трассировкой лучей)

Игра (в порядке даты выхода)

API

Метод тестирования

Полноэкранное сглаживание

Battlefield V

DirectX 12

Миссия Liberté + OCAT

Макс. качество графики. DXR Raytrace Reflection Quality: Ultra

TAA/DLSS

Shadow of the Tomb Raider

DirectX 12

Встроенный бенчмарк

Макс. качество графики. Ray Traced Shadows Quality: Ultra

TAA/DLSS

Metro Exodus

DirectX 12

Встроенный бенчмарк

Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra

TAA/DLSS

Quake II RTX

Vulkan

Timedemo, запись demo1.dm2

Макс. качество графики

TAA

Control

DirectX 12

OCAT

Ray Tracing Preset: High

TAA/DLSS 2.0

Minecraft with RTX Beta

DirectX 12

Бенчмарк в мире Portal Pioneers + OCAT

Макс. дальность рендеринга геометрии и частиц

Нет/DLSS 2.0

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.

Вычисления общего назначения, кодирование/декодирование видео

Приложение

Настройки

API

AMD

NVIDIA

AMD

NVIDIA

Adobe Premiere Pro CC 2020

PugetBench for Premiere Pro 0.88

GPU Effects: живое воспроизведение (ProRes 422, 4K@59,94 FPS)

OpenCL

CUDA

GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS)

Blender 2.9

Демо Class Room с сайта Blender Foundation

Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256

OpenCL

CUDA/OptX

Демо Nissan GTR от AMD

Рендерер AMD Radeon ProRender

OpenCL

DXVA Checker 4.1.2, Decode Benchmark

H.264 (Microsoft H264 Video Decoder)

1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1)

D3D11VA

H.265 (Microsoft HEVC Video Extensions)

1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)

VP9 (Microsoft VP9 Video Extensions)

1920 × 1080; 3840 × 2160; 7680 × 4320

FFmpeg 4.2.1, кодирование H.264

1920 × 1080

-c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M

-c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3M

AMF

NVENC

3840 × 2160

-c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M

-c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M

FFmpeg 4.2.1, кодирование H.265

1920 × 1080

-c:v hevc_amf -quality speed -level 4 -b:v 3M

-c:v hevc_nvenc -preset fast -level 4 -b:v 3M

3840 × 2160

-c:v hevc_amf -quality speed -level 5 -b:v 7.5M

-c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M

7680 × 4320

Н/Д

-c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M

REDCINE-X PRO

Декодирование файлов RED R3D с разрешением 4К, 6К и 8К

OpenCL

CUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью амперметра JUNTEK VAT-1050 и устройства NVIDIA PCAT. Чтобы одновременно измерить ток, проходящий по разъемам дополнительного питания и слоту материнской платы, видеокарта подключается через жесткий райзер PCI Express x16, в котором линии питания разорваны и выведены на отдельный кабель.

В качестве нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и при максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

⇡#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

  • Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт);
  • NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) ;
  • NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) ;
  • NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11 Гбит/с, 11 Гбайт) ;
  • NVIDIA GeForce GTX 1080 FE (1607/1733 МГц, 10 Гбит/с, 8 Гбайт) ;
  • AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) ;
  • AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт) .

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты нереференсного дизайна приведены в соответствие с референсными параметрам (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

⇡#Тактовые частоты, энергопотребление, температура, уровень шума и разгон

Прежде чем приступить к бенчмаркам Palit RTX 3080 GamingPro OC, хотим рассказать о пополнении в нашем тестовом инструментарии. Вместе с комплектом LDAT, который позволяет регистрировать время задержки между вводом и реакцией изображения в играх, мы получили от NVIDIA новое средство измерения потребляемой мощности для плат расширения PCI Express под названием PCAT (Power Capture Analysis Tool).

В большинстве обзоров графических ускорителей используются косвенные методы оценки энергопотребления — при помощи программных инструментов драйвера видеокарты или чаще всего по совокупной мощности компьютера, — которые не позволяют проводить точное сравнение устройств различных производителей и рассчитывать такой показатель, как быстродействие на ватт мощности, характеризующий новые достижения в проектировании GPU. Так, современные видеокарты на чипах NVIDIA способны отдавать через API данные о своем общем энергопотреблении (включая оперативную память, вентиляторы охлаждения и потери КПД на преобразование напряжения) благодаря тому, что для контроля мощности в них применяются шунты на всех линиях 12 В. В то же время система питания ускорителей AMD устроена проще и позволяет отслеживать лишь мощность самого графического процессора на выходе силовых каскадов VRM без учета остальных компонентов. Ну а замеры полной мощности системы бытовым ваттметром, очевидно, не дают возможности исключить из уравнения неодинаковую загрузку центрального процессора при использовании GPU различных классов производительности.

Единственный способ раз и навсегда устранить перечисленные ограничения состоит в том, чтобы изолировать питание видеокарты от материнской платы тестового стенда и контролировать ток непосредственно между подопытным устройством и БП. В обзорах новых GPU мы уже не первый год следуем именно такой методике, когда видеокарта подключается к материнской плате жестким райзером, в котором разорваны линии питания, а весь ток и, следовательно, потребляемая мощность измеряется универсальным цифровым ваттметром при помощи шунта, рассчитанного на несколько сотен ватт.

Инструмент PCAT работает точно таким же образом. Он состоит из платы микроконтроллера с восьмиконтактными разъемами питания PCI Express и переходника, изолирующего видеокарту от материнской платы. Таким образом все питание поступает на ускоритель через PCAT, а микроконтроллер регистрирует ток, проходящий через кабели и слот PCI Express. Для оценки энергопотребления на глазок у PCAT есть миниатюрный OLED-экран, но в отличие от нашего ваттметра устройство NVIDIA можно подключить к компьютеру по USB и записывать лог потребляемой мощности — совокупной или, если требуется, мощности слота PCI Express и разъемов дополнительного питания в отдельности.

Заметим, что программное обеспечение PCAT, как и LDAT, не обязательно запускать на тестовом компьютере, а в том случае, когда оно работает на отдельной машине, у PCAT нет никакой возможности узнать, какое именно железо мы тестируем. Соответственно, не стоит волноваться о том, получат ли ускорители AMD справедливые оценки мощности в сравнении с новинками NVIDIA. Что касается точности измерения, то замеры энергопотребления видеокарт под нагрузкой с помощью PCAT не разошлись с показателями наших собственных инструментов, откалиброванных по падению напряжения на шунте, более чем на 2 %. Так что на первых порах мы смело можем оперировать старыми и новыми данными вперемешку, но в обзорах всех будущих GPU целиком перейдем на PCAT. В конце концов, инструмент NVIDIA намного удобнее в работе, не говоря о том, что выглядит куда симпатичнее наших самоделок.

Однако вернемся к Palit RTX 3080 GamingPro OC. Как мы уже заметили, перед нами разогнанный вариант GeForce RTX 3080, но оверклокинг в данном случае сводится к чисто символической величине 30 МГц по частоте Boost Clock, а резерв мощности видеокарты соответствует референсным 320 Вт. Как следствие, заводской разгон видеокарты не должен исказить общую картину сравнения GeForce RTX 3080 с другими ускорителями, все из которых представлены в бенчмарках референсными моделями.

NVIDIA оценивает диапазон тактовых частот GeForce RTX 3080 более консервативно, чем у его формальных предшественников — RTX 2080 и RTX 2080 SUPER. В действительности так оно и есть, хотя дистанция между устойчивой тактовой частотой ядра Palit RTX 3080 GamingPro OC и GeForce RTX 2080 SUPER Founders Edition оказалась немногим больше 50 МГц (1854 и 1907 МГц соответственно) под мощной нагрузкой в Crysis 3. Да, мы по-прежнему используем эту игру в качестве стресс-теста: достаточно сказать, что RTX 3080 стал первым ускорителем на нашей практике, который добился в Crysis 3 фреймрейта 60 FPS при разрешении 4К (даже без полноэкранного сглаживания MSAA!). А вот по сравнению с чипом TU102 на плате GeForce RTX 2080 Ti новый GPU тактуется на 131 МГц выше невзирая на полуторакратную разницу в транзисторных бюджетах. Жаль только, что универсальные программные инструменты для мониторинга и разгона видеокарт еще не получили доступ к датчикам питающего напряжения GPU, чтобы мы узнали, как смена техпроцесса подействовала на этот параметр.

Парадоксально, что NVIDIA раздала (избранным IT-изданиям, но тем не менее) комплекты для измерения мощности ускорителей именно в то время, когда ее потребительские устройства достигли беспрецедентно высоких TDP. Но может быть, в том-то и дело, что мы проверим мощность Ampere на практике и убедимся, что она не так страшна, как следует из его официальных ТТХ. Увы, по крайней мере Palit RTX 3080 GamingPro OC действительно расходует не меньше 314 из положенных по паспорту 320 Вт мощности. Единственная видеокарта, не считая «двухголовых» устройств, в нашей базе данных, которая превосходит по мощности RTX 3080, это Radeon RX Vega 64 с штатной СЖО, а все предыдущие топ-модели NVIDIA (включая 250-ваттные RTX 2080 SUPER и RTX 2080 Ti) новинка оставила далеко позади.

При таком внушительном энергопотреблении и, следовательно, тепловыделении GPU, нужно отдать должное системе охлаждения Palit. Температура в пределах 70 °C под нагрузкой еще не является признаком качества — просто именно так настроена автоматика кулера, а вот удержать уровень шума на уровне 38 дБА (ниже, чем у старших моделей Founders Edition прошлого поколения) куда сложнее.

Рабочие параметры под нагрузкой (Crysis 3)

Видеокарта

Настройки

Тактовая частота GPU, МГц

Напряжение питания GPU, В

Частота вращения вентиляторов, об/мин (% от макс.)

Частота вращения вентиляторов 2, об/мин (% от макс.)

Средн.

Макс.

Средн.

Макс.

Средн.

Средн.

Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт)

1854

1950

Н/Д

Н/Д

1823 (46%)

1823 (46%)

Palit GeForce RTX 3080 GamingPro OC (+50 МГц, 21,2 Гбит/с, 10 Гбайт)

+9% мощности

1940

2010

Н/Д

Н/Д

1894 (48%)

1894 (48%)

NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт)

1735

1810

0,96

1,01

2377 (50%)

Н/Д

NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт)

1907

1920

1,03

1,04

1969 (53%)

1969 (53%)

NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт)

1723

1860

0,91

1,03

2082 (56%)

2082 (56%)

AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт)

1756

1786

Н/Д

Н/Д

2617 (Н/Д)

Н/Д

AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)

Термопаста ARCTIC MX-2

1795

1819

1,07

1,18

2102 (43%)

Н/Д

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

Мы не питали больших надежд на оверклокинг GeForce RTX 3080 и, как показал опыт, видеокарта действительно не поддается разгону, который выражается в сколько-нибудь значимом приросте игрового быстродействия. Начнем с того, что прошивка Palit GamingPro OC позволяет лишь на 9 % увеличить резерв мощности платы, который является главным препятствием для наращивания тактовых частот графического процессора. А в рамках установленного TDP автоматика GPU Boost уже практически исчерпывает частотный потенциал. Нам удалось добавить 50 МГц к проектной частоте Boost Clock, что выражается в 85 МГц реальной тактовой частоты под игровой нагрузкой (5 % от исходных 1854 МГц). Надо ли говорить, что это капля в море, которая едва ли повлияет даже на самые чувствительные бенчмарки. К тому же, оверклокинг графического ядра влечет за собой рост и без того чрезвычайно высокой потребляемой мощности на 19 Вт — к счастью, хотя бы без последствий для температуры и шума системы охлаждения.

Быть может, в GeForce RTX 3080 выгоднее разгонять оперативную память? Задел для оверклокинга чипов GDDR6X со штатной пропускной способностью 19 Гбит/с, которые применяются в GeForce RTX 3080, существует, но раскрыть его не так-то просто. Для того, чтобы найти предел стандартных чипов GDDR6 при неизменных таймингах, достаточно постепенно увеличивать тактовую частоту, пока видеокарта не потеряет стабильность или не появятся графические артефакты на экране. GDDR6X ведет себя коварно: поначалу мы смогли довести пропускную способность чипов до 21,8 Гбит/с на контакт, но скоро обнаружили, что чем дальше она уходит за пределы 21,2 Гбит/с, тем сильнее не возрастает, а наоборот, падает производительность. Возможно, к делу подключились те самые алгоритмы настройки сигнала в шине GDDR6X, о которых говорила NVIDIA, поддерживающие стабильность даже в условиях сильной деградации соотношения сигнал-шум.

Кстати, GPU-Z и подобные программы некорректно определяют командную частоту GDDR6X на уровне 1 188 МГц, хотя на самом деле она вдвое выше. Если в будущем не исправят эту ошибку, привыкайте умножать число на 16, а не на 8, как с GDDR6, чтобы получить итоговую пропускную способность чипов.

⇡#Игровые тесты ( 1920 × 1080)

Постоянные читатели железного раздела 3DNews наверняка заметили, что состав тестовой методики для новых GPU сильно изменился. Мы исключили из программы синтетическую нагрузку — как 3DMark в разделе игрового 3D-рендеринга, так и аналогичные тесты вычислений общего назначения. Да, 3DMark неплохо подходит для того, чтобы быстро оценить разницу между близкими по характеристикам видеокартами. Но когда речь идет о новом поколении графических процессоров, которое претендует на качественно иной уровень производительности, изучать «попугаи» в 3DMark не имеет никакого смысла. Он давно перестал быть альтернативой играм, основанных на разных графических движках и работающих с разными API, и порой изрядно расходится с действительностью в оценках GPU той или иной архитектуры. Бенчмарки с трассировкой лучей и масштабированием DLSS в 3DMark неплохо иллюстрировали возможности ускорителей GeForce RTX 20-й серии в их первые месяцы, но теперь вдобавок к играм, использующим богатые функции «гибридного» рендеринга, появились полностью трассированные модификации Quake II и Minecraft. В итоге мы решили упразднить тесты в 3DMark и вместо них расширить арсенал настоящих игр, который теперь наполовину состоит из проектов, поддерживающих трассировку лучей в том или ином объеме.

С другой стороны, нужно пояснить, почему в списке тестов отсутствуют некоторые игровые новинки 2020 года, отличившиеся высокими запросами к железу и на первый взгляд идеально подходящие для проверки таких устройств, как GeForce RTX 3080. Речь идет о Horizon Zero Dawn и Microsoft Flight Simulator, которым на 3DNews посвящены масштабные сравнительные тесты. Дело в том, что обе игры вышли на PC относительно недавно, и пока не отличаются высокой стабильностью вообще и быстродействия в частности. Рисковать повторяемостью результатов бенчмарков ради того, чтобы тестовая методика состояла из самых свежих игр, мы не готовы, так что Horizon Zero Dawn и MSFS придется постоять в очереди, пока не закончится первая волна патчей, исправляющих ошибки.

Итак, приступим к анализу тестовых результатов в стартовом разрешении 1080p, которое, честно говоря, совершенно не подходит для того, чтобы раскрыть потенциал ускорителей класса GeForce RTX 3080. А жаль, ведь именно в таком режиме современное железо может развивать кадровую частоту свыше 100 FPS не только в легких киберспортивных играх, но и в требовательных ААА-проектах, что положительно сказывается на времени реакции — особенно на экране с высокой частотой. Недавно мы отдельно разбирали этот вопрос в ходе аппаратного тестирования задержек с помощью LDAT и пришли к выводу, что FPS полезно наращивать за пределы частоты обновления монитора, будь у вас даже сверхскоростная матрица 240 Гц. Увы, среди тестовых игр только DOOM Eternal и Strange Brigade являются таким счастливым исключением.

Тем не менее, даже в таких условиях GeForce RTX 3080 обеспечивает существенную прибавку в 23 % усредненной кадровой частоты по сравнению с бывшим флагманом потребительских видеокарт NVIDIA, GeForce RTX 2080 Ti, а если сравнивать с RTX 2080 SUPER, речь идет от дополнительных 38 % FPS. Наконец, старшие модели позапрошлого поколения — GTX 1080 и GTX 1080 Ti — новинка превосходит на целых 110 и 67 % соответственно. Нечего и говорить о «красных» топах до предстоящего релиза чипов Navi второй волны: GeForce RTX 2080 одержал победу над Radeon VII и Radeon RX 5700 XT с преимуществом в 64 и 69 %.

⇡#Игровые тесты (2560 × 1440)

Переход к разрешению 1440p позволил мощным видеокартам вздохнуть свободнее, но соотношение между GeForce RTX 3080 и старшими моделями серии RTX 20 от этого принципиально не изменилось. Ускоритель на чипе Ampere превосходит GeForce RTX 2080 SUPER и RTX 2080 Ti по среднему FPS на 46 и 29 % соответственно. Другое дело, если сравнить RTX 3080 с прошлым поколением видеокарт NVIDIA: отрыв от GeForce GTX 1080 и GTX 1080 Ti увеличился до впечатляющих 134 и 79 %. То же касается «красных» ускорителей средне-высокой ценовой категории на базе современной архитектуры RDNA, представленных Radeon RX 5700 XT: RTX 3080 превосходит последний уже на 80 % FPS.

⇡#Игровые тесты (3840 × 2160)

Тесты на 4К-экране должны поставить точку в сравнении ускорителей 30-й серии с их ближайшими предшественниками. В таких условиях бутылочным горлышком системы становится именно графический, а не центральный процессор. К тому же, коль скоро старшие модели поколения Turing считаются видеокартами, подходящими для разрешения 2160p, их эстафету должны перенять все три новинки от GeForce RTX 3070 до RTX 3090.

Тем не менее, игровая графика тоже не стоит на месте. Хотя мы больше не используем в бенчмарках ресурсоемкое полноэкранное сглаживание MSAA и подобного типа, которое повсеместно вытеснили легковесные разновидности TAA, только в шести из десяти тестовых проектов средняя частота смены кадров на GeForce RTX 3080 перевалила за 60 FPS. Прошло уже семь лет с тех пор, как NVIDIA и AMD официально открыли эпоху гейминга в 4К, а избавить передовые игры на максималках от костылей в виде масштабирования кадра с помощью DLSS или FidelityFX CAS по-прежнему невозможно. Хотя, справедливости ради, среди всех игр только в Total War: THREE KINGDOMS — очередной серии вечно тормозящей стратегии — новый ускоритель не удержал фреймрейт как минимум на уровне 50 FPS.

Как ни крути, RTX 3080 все-таки сделал большой шаг к цели сделать 4К безоговорочно играбельным режимом, достигнув 55-процентного преимущества перед GeForce RTX 2080 SUPER. Конечно, это еще не такие рекордные показатели роста быстродействия между поколениями GPU, какими отличились ускорители семейства Pascal: к примеру, GeForce GTX 1080 в таких же условиях оказался на 72 % быстрее GeForce GTX 980. Однако нужно сделать поправку на то, что в то время чипмейкеры совершили гигантский прорыв в технологии производства GPU с нормы 28 нм к 14/16-нанометровой фотолитографии. Свидетелями такого прироста быстродействия мы вряд ли станем в обозримом будущем, если только TSMC и Samsung не столкнутся с очередным кризисом масштабирования транзисторов. С другой стороны, стоит учесть, что в отличие от GeForce RTX 2080 и RTX 2080 SUPER новый GeForce RTX 3080 основан на чипе первого эшелона, пусть и сильно урезанном по числу активных исполнительных блоков, так что и спрос с него выше, чем с того же RTX 2080, который сумел предложить лишь на 37 % больше FPS по сравнению со своим прямым предшественником GeForce GTX 1080.

Любопытно, что именно в 37 % средней кадровой частоты оценивается разница между GeForce RTX 3080 и GeForce RTX 2080 Ti. Вряд ли даже такие числа убедят пользователей бывшей топ-модели в необходимости срочного апгрейда (предприимчивые читатели добавят, что от RTX 2080 Ti нужно было избавиться заранее, пока еще не рухнули цены), а вот перспектива замены GeForce GTX 1080 или даже GeForce GTX 1080 Ti на RTX 3080 для игры в 4К выглядит чрезвычайно привлекательно. Как ни крути, ему рукой подать до отметки 60 FPS в таких невероятно тяжелых играх, как Red Dead Redemption 2, при максимальном качестве графики, но и во всех остальных случаях RTX 3080 превосходит старшие модели семейства Pascal по среднему фреймрейту в 2–2,5 раза.

⇡#Игровые тесты в разгоне

От жалких 5 % кадровой частоты GPU, которые мы смогли выжать из Palit RTX 3080 GamingPro OC в попытках оверклокинга, не приходится ожидать сколько-нибудь значительного влияния на игровую производительность. Оперативная память GDDR6X в RTX 3080 оказалась более перспективной целью для разгона: в конце концов, нам удалось увеличить ее пропускную способность с 19 до 21,2 Гбит/с на контакт шины, а это составляет целых 16 % от ее штатных характеристик. Как следствие, если мы сможем найти в бенчмарках разогнанного RTX 3080 какую-то полезную информацию, она будет ответом на вопрос, хватает ли урезанному чипу GA102 общей ПСП в 760 Гбайт/с, которой его наделила NVIDIA.

Как выяснилось, хватает, и наверняка с большим запасом. Почти во всех тестах при разрешении 4К дополнительная ПСП и символически разогнанный графический процессор принесли GeForce RTX 3080 ровно 1 % фреймрейта (что, кстати, говорит о надежности тестовой методики, в которую мы включили игры с наиболее стабильным быстродействием). Нечего и говорить, что при более низком разрешении разгон целиком будет перекрыт процессорозависимостью игр и погрешностью измерения. Не исключаем, что в будущем нам еще попадутся варианты GeForce RTX 3080, благосклонные к разгону, но уже сейчас можно предсказать, что за рамками самых экстремальных случаев это бессмысленная затея.

⇡#Игровые тесты с трассировкой лучей

GeForce RTX 3080 уже продемонстрировал нешуточный рост быстродействия в бенчмарках с традиционным растеризационным 3D-рендерингом, но мы ожидали получить самые яркие результаты в тестах игрового рейтрейсинга. В конце концов, именно рывок скорости трассировки лучей должен стать кульминацией всех изменений, которые NVIDIA заложила в архитектуру Ampere.

Так и получилось. Если не брать в расчет масштабирование кадра при помощи DLSS, RTX 3080 гораздо лучше выдерживает лавинообразный рост вычислительной нагрузки, который вызывает трассировка лучей. Как следствие, между новинкой и топовыми ускорителями 20-й серии возникает значительная дистанция даже при условно низком разрешении 1080p: согласно результатам шести бенчмарков RTX 3080 на 48 % превосходит GeForce RTX 2080 SUPER и на 27 % — RTX 2080 Ti. Если двигаться дальше к режиму 1440p, разрыв увеличивается до 55 и 34 % соответственно, и достигает пика в 4К с показателями 69 и 39 %. Вот теперь мы наконец-то имеем дело с ростом быстродействия по золотым стандартам архитектуры Pascal!

Впрочем, сила Ampere не столько в относительных, сколько в абсолютных числах. При разрешении 1440p трассировка лучей помешала GeForce RTX 3080 закрепиться на отметке 60 FPS только в бенчмарке Metro Exodus, и даже полностью трассированые модификации Quake II RTX и Minecraft ускоритель переварил без всяких проблем. Конечно, говорить о возможности игры с трассировкой лучей и без тормозов в честном 4К все еще преждевременно, но благодаря GeForce RTX 3080 это стало возможным по крайней мере в Battlefield V и, с некоторой натяжкой, в Shadow of the Tomb Raider.

Благо, почти все игры, поддерживающие DXR (или библиотеки рейтрейсинга в API Vulkan), одновременно позволяют использовать DLSS. Технология масштабирования кадров при помощи нейросети прошла огромный путь от первых, откровенно неудачных реализаций в Battlefield V и Metro Exodus и научилась выдавать картинку, которую с трудом удается отличить невооруженным глазом от честного полнокадрового рендеринга. А вот в таких условиях достижения GeForce RTX 3080 уже не настолько впечатляют, как то, что мы увидели до этого. Не все игры позволяют включить DLSS на мощных ускорителях при разрешении экрана ниже 1440p или 2160p (отсюда нули в итоговых таблицах), но всегда действует одно правило: GeForce RTX 2080 и RTX 2080 Ti благодаря DLSS подтягиваются к GeForce RTX 3080 так, что в 4К преимущество новинки перед ее предшественниками сжимается до 52 и 30 % соответственно. Это по-прежнему сильный результат, но о достойных пресловутого «Паскаля» 69 и 39 % речь уже не идет.

⇡#Вычисления общего назначения

Видеокарты на чипах Turing отлично чувствовали себя в задачах, связанных с расчетами общего назначения. Несмотря на игровую ориентацию GeForce 20-й серии, именно в сфере GP-GPU, где до того явным фаворитом была логика GCN от AMD, эта архитектура принесла наибольшие дивиденды. В этот раз NVIDIA обязана как минимум закрепить, а в лучшем случае повторить прошлый успех, ведь сырая вычислительная мощность Ampere благодаря громадному количеству шейдерных ALU и переработанным блокам трассировки лучей вышла на совершенно иной уровень.

Не все приложения одинаково эффективно распоряжаются ресурсами GPU, но уже в Adobe Premiere Pro новый ускоритель способен существенно уменьшить время рендеринга 4К-видео со сложными графическими эффектами по сравнению с рабочими станциями на GeForce RTX 2080 SUPER, а разница между Ampere и Pascal так и вовсе просто колоссальная («красные» видеокарты, как и следовало ожидать, держатся лучше). Заметим, что в этом тесте не используется возможность кодирования H. 264 и H. 265 силами аппаратного медиадвижка NVENC — нас интересует только производительность самого GPU.

Лучше всего мощь архитектуры Ampere раскрывают задачи оффлайнового рейтрейсинга — такие как рендеринг в Blender на движке Cycles. Здесь GeForce RTX 3080 продемонстрировал более чем двукратное преимущество в скорости отрисовки сцены перед «Тьюрингами» и Radeon VII, неважно проводится ли рендеринг с использованием RT-ядер или исключительно софтверным методом. Впрочем, движок Radeon ProRender, который мы используем в качестве альтернативы строго тайловым рендеререам наподобие Cycles, не был настолько же впечатлен достижениями Ampere.

Прим. Для тестов новых видеокарт мы перешли на актуальную релизную версию Blender — 2. 9 — и обнаружили, что Radeon RX 5700 XT снова потерял возможность работать с движком Cycles.

Напоследок прокомментируем результаты бенчмарка, использующего не только шейдерные ALU графического процессора, но и тензорные ядра — в данном случае для дебайеринга видеозаписей, снятых на профессиональную камеру RED. Здесь мы не ожидали от Ampere каких-либо чудес, ведь сильнейший рост пропускной способности на одно тензорное ядро новая архитектура сулит только в работе со структурно-разреженными сетями. Действительно, замена одного из старших «Тьюрингов» на GeForce RTX 3080 не повлияет на скорость декодирования R3D при разрешении 8К, но вот полоска 6К и, в особенности, 4К на графике просто выстреливает вперед.

Ускорители на чипах Ampere, вне всяких сомнений, должны вызвать большой интерес не только у геймеров, но и у профессионалов, занимающихся обработкой аудиовизуального контента. Однако более подробные тесты новых видеокарт мы приберегли для GeForce RTX 3090, который представляет собой скорее профессиональную, нежели игровую видеокарту.

⇡#Кодирование/декодирование видео

Еще одним нововведением среди вычислительных функций кремния Ampere является декодирование видео стандарта AV1 силами специализированного ASIC NVDEC. Пожалуй, это первый кодек, настолько требовательный к вычислительным ресурсам, что распаковка потока AV1 при высоком разрешении, для которого он и предназначен, с плавной частотой смены кадров выходит за пределы возможностей мощного восьмиядерного CPU, не говоря уже о ноутбучных процессорах. Чипы Ampere решают проблему за счет быстрого аппаратного декодирования, но проверить эту функцию самостоятельно мы пока не можем: в большинстве программных кодировщиков поддержка AV1 еще не вышла из экспериментальной стадии и либо вовсе не позволяет создавать ролики с разрешением 8К, либо это происходит чрезвычайно медленно и занимает вплоть до нескольких суток на один файл.

Ну а пока мы обнаружили, что обновленный NVDEC существенно прибавил в скорости декодирования «старых» форматов HEVC и VP9, пусть она и без того была избыточно высокой для просмотра фильмов. Резерв нужен GPU для декодирования нескольких потоков в профессиональных задачах, а также быстрого перекодирования видео в другой формат с привлечением CPU или на связке NVDEC + NVENC. Кстати, NVENC не претерпел абсолютно никаких изменений в Ampere — это по-прежнему самый быстрый аппаратный кодировщик H. 264 и HEVC, который можно найти в графических и центральных процессорах.

⇡#Производительность на ватт и площадь GPU

О том, какие численные преимущества дал NVIDIA переход на техпроцесс 8 нм, преждевременно говорить, пока мы не провели тесты GeForce RTX 3090. Как ни крути, чип GA102 в составе RTX 3080 значительно урезали, а это не лучшим образом сказывается на его энергоэффективности. Тем не менее, если сфокусироваться не на процессорах, а на конкретных устройствах, можно сделать определенные предварительные выкладки. Во-первых, производительность на ватт у GeForce RTX 3080 все-таки увеличилась по сравнению с RTX 2080 SUPER, основанным на полностью функциональном чипе TU104, причем изрядно — на 21 %. А вот по сравнению с RTX 2080 Ti — всего лишь на 9 %, хотя, повторимся, здесь нужно отталкиваться от результатов RTX 3090.

Ну а самое главное, по удельному быстродействию на фоне RTX 3080 очень бледно смотрится не только Radeon VII, но и Radeon RX 5700 XT. Новинка обеспечивает на 40 % больше FPS в пересчете на ватт потребляемой мощности, хотя оба чипа — и GA102, и Navi 10 — производятся по технологическим нормам одного класса. Конечно, сравнивать по энергоэффективности GPU настолько разного масштаба не вполне корректно. Тем более, мы знаем, что Radeon RX 5700 XT подвело сильно завышенное напряжение питания GPU. Но во всяком случае ясно, что AMD уже нельзя повторять подобных ошибок, если она намерена преодолеть технологическое отставание в одно поколение GPU и сделать из чипов Navi второго поколения конкурентов для NVIDIA Ampere.

Производитель

NVIDIA

AMD

Модель

GeForce RTX 3080

GeForce GTX 1080 Ti

GeForce RTX 2080 SUPER

GeForce RTX 2080 Ti FE

Radeon VII

Radeon RX 5700 XT

Графический процессор

GA102

GP102

TU104

TU102

Vega 20 XL

Navi 10 XT

Микроархитектура

Ampere

Pascal

Turing

Turing

GCN 5 поколения

RDNA

Техпроцесс, нм

8 нм (8N)

16 нм FFN

12 нм FFN

12 нм FFN

7 нм FinFET

7 нм FinFET

Число транзисторов, млн

28 300

12 000

13 600

18 600

13 200

10 300

Площадь чипа, кв. мм

628

471

545

754

331

251

Средняя потребляемая мощность (Crysis 3), Вт

314

216

244

250

286

219

Производительность/Вт

100%

−44%

−17%

−8%

−38%

−28%

Производительность/млн транзисторов

100%

−9%

+34%

+11%

+21%

+37%

Производительность/кв. мм

100%

−49%

−26%

−39%

+7%

+25%

Производительность/Вт (обратное сравнение)

100%

+79%

+21%

+9%

+61%

+40%

Производительность/млн транзисторов (обратное сравнение)

100%

+10%

−25%

−10%

−17%

−27%

Производительность/кв. мм (обратное сравнение)

100%

+95%

+35%

+64%

−7%

−20%

⇡#Результаты игровых тестов и рекомендованные цены

1920 × 1080

Полноэкранное сглаживание

Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт)

NVIDIA GeForce GTX 1080 (1607/1733 МГц, 10 Гбит/с, 8 Гбайт)

NVIDIA GeForce GTX 1080 Ti (1480/1582 МГц, 11 Гбит/с, 11 Гбайт)

NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт)

NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт)

AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт)

AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)

Assassin's Creed Odyssey

TAA High

78 / 100

55 / 62

67 / 76

70 / 81

74 / 90

56 / 68

51 / 67

Battlefield V

TAA High

153 / 177

107 / 127

124 / 140

147 / 159

154 / 168

133 / 154

125 / 151

Borderlands 3

TAA

124 / 142

55 / 63

72 / 83

83 / 94

96 / 109

80 / 89

81 / 89

Control

TAA

137 / 152

59 / 63

78 / 83

96 / 105

110 / 121

87 / 95

78 / 87

DOOM Eternal

TAA

189 / 295

71 / 122

87 / 156

141 / 221

153 / 233

102 / 167

106 / 171

Metro Exodus

TAA

56 / 96

25 / 45

32 / 58

39 / 69

46 / 79

30 / 54

30 / 54

Red Dead Redemption 2

TAA High

77 / 84

29 / 31

38 / 41

49 / 54

56 / 62

40 / 44

38 / 42

Shadow of the Tomb Raider

TAA

111 / 162

65 / 84

89 / 117

107 / 140

114 / 149

84 / 115

89 / 114

Strange Brigade

AA Ultra

264 / 346

106 / 137

136 / 178

176 / 228

201 / 261

123 / 186

119 / 168

Total War: THREE KINGDOMS

TAA

86 / 102

38 / 46

47 / 57

60 / 71

69 / 83

44 / 52

39 / 47

Макс.

−28%

−21%

−10%

−5%

−13%

−15%

Средн.

−52%

−40%

−27%

−19%

−39%

−41%

Мин.

−63%

−51%

−36%

−26%

−49%

−54%

2560 × 1440

Полноэкранное сглаживание

Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт)

NVIDIA GeForce GTX 1080 (1607/1733 МГц, 10 Гбит/с, 8 Гбайт)

NVIDIA GeForce GTX 1080 Ti (1480/1582 МГц, 11 Гбит/с, 11 Гбайт)

NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт)

NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт)

AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт)

AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)

Assassin's Creed Odyssey

TAA High

77 / 92

44 / 49

56 / 62

54 / 64

65 / 75

43 / 53

47 / 56

Battlefield V

TAA High

143 / 160

80 / 99

98 / 115

113 / 130

126 / 145

111 / 129

100 / 124

Borderlands 3

TAA

92 / 105

37 / 42

50 / 57

58 / 65

67 / 76

57 / 62

57 / 62

Control

TAA

99 / 103

36 / 39

51 / 55

64 / 71

70 / 79

60 / 64

51 / 57

DOOM Eternal

TAA

168 / 251

59 / 92

74 / 123

116 / 175

128 / 187

90 / 138

90 / 135

Metro Exodus

TAA

49 / 81

21 / 36

27 / 47

33 / 56

39 / 64

27 / 45

26 / 44

Red Dead Redemption 2

TAA High

68 / 74

24 / 27

33 / 35

43 / 47

49 / 53

35 / 38

34 / 36

Shadow of the Tomb Raider

TAA

110 / 139

44 / 55

62 / 78

77 / 96

84 / 107

61 / 81

61 / 76

Strange Brigade

AA Ultra

210 / 262

77 / 94

102 / 127

135 / 164

153 / 189

99 / 138

93 / 121

Total War: THREE KINGDOMS

TAA

60 / 70

25 / 29

32 / 38

40 / 47

47 / 55

30 / 34

26 / 31

Макс.

−38%

−28%

−19%

−9%

−19%

−23%

Средн.

−57%

−44%

−32%

−23%

−42%

−45%

Мин.

−64%

−53%

−38%

−28%

−51%

−56%

3840 × 2160

Полноэкранное сглаживание

Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт)

NVIDIA GeForce GTX 1080 (1607/1733 МГц, 10 Гбит/с, 8 Гбайт)

NVIDIA GeForce GTX 1080 Ti (1480/1582 МГц, 11 Гбит/с, 11 Гбайт)

NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт)

NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт)

AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт)

AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)

Assassin's Creed Odyssey

TAA High

58 / 65

26 / 30

36 / 40

40 / 46

39 / 46

35 / 41

33 / 37

Battlefield V

TAA High

100 / 114

44 / 55

55 / 68

67 / 80

75 / 90

64 / 76

55 / 68

Borderlands 3

TAA

53 / 60

20 / 22

27 / 31

32 / 35

37 / 41

29 / 32

29 / 34

Control

TAA

53 / 55

17 / 19

25 / 27

32 / 36

36 / 41

31 / 33

25 / 28

DOOM Eternal

TAA

118 / 159

38 / 52

49 / 69

73 / 98

83 / 108

62 / 85

47 / 62

Metro Exodus

TAA

36 / 55

14 / 23

20 / 31

24 / 37

28 / 43

20 / 31

19 / 29

Red Dead Redemption 2

TAA High

51 / 54

18 / 19

24 / 25

31 / 34

36 / 39

26 / 28

24 / 26

Shadow of the Tomb Raider

TAA

66 / 79

23 / 28

33 / 41

42 / 51

48 / 58

34 / 44

30 / 39

Strange Brigade

AA Ultra

134 / 155

44 / 52

60 / 71

83 / 93

95 / 109

70 / 88

61 / 72

Total War: THREE KINGDOMS

TAA

33 / 38

13 / 15

16 / 19

21 / 24

25 / 29

15 / 18

12 / 15

Макс.

−52%

−38%

−29%

−21%

−33%

−40%

Средн.

−62%

−48%

−36%

−27%

−44%

−50%

Мин.

−67%

−57%

−42%

−32%

−53%

−61%

⇡#Результаты игровых тестов с трассировкой лучей

1920 × 1080

Полноэкранное сглаживание

Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт), RT вкл.

NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт), RT вкл.

NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт), RT вкл.

Battlefield V

TAA High

95 / 117

67 / 87

77 / 97

Control

TAA

85 / 91

54 / 58

66 / 70

Metro Exodus

TAA

47 / 75

34 / 54

39 / 63

Minecraft with RTX Beta

Нет

103 / 115

61 / 70

69 / 79

Quake II RTX

TAA

Н/Д / 119

Н/Д / 72

Н/Д / 88

Shadow of the Tomb Raider

TAA

90 / 121

62 / 89

73 / 102

Макс.

−26%

−16%

Средн.

−32%

−22%

Мин.

−39%

−31%

2560 × 1440

Полноэкранное сглаживание

Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт), RT вкл.

NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт), RT вкл.

NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт), RT вкл.

Battlefield V

TAA High

72 / 95

49 / 66

56 / 75

Control

TAA

59 / 64

36 / 38

43 / 46

Metro Exodus

TAA

38 / 57

26 / 39

30 / 46

Minecraft with RTX Beta

Нет

66 / 72

37 / 42

43 / 49

Quake II RTX

TAA

Н/Д / 71

Н/Д / 42

Н/Д / 51

Shadow of the Tomb Raider

TAA

67 / 90

42 / 60

49 / 69

Макс.

−31%

−19%

Средн.

−36%

−25%

Мин.

−42%

−32%

3840 × 2160

Полноэкранное сглаживание

Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт), RT вкл.

NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт), RT вкл.

NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт), RT вкл.

Battlefield V

TAA High

43 / 61

27 / 39

32 / 45

Control

TAA

31 / 34

18 / 20

22 / 24

Metro Exodus

TAA

23 / 34

14 / 21

17 / 26

Minecraft with RTX Beta

Нет

30 / 34

17 / 18

21 / 23

Quake II RTX

TAA

Н/Д / 33

Н/Д / 19

Н/Д / 23

Shadow of the Tomb Raider

TAA

38 / 50

21 / 30

26 / 37

Макс.

−36%

−24%

Средн.

−41%

−28%

Мин.

−47%

−32%

3840 × 2160

Полноэкранное сглаживание (без DLSS)

Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт), RT + DLSS

NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт), RT + DLSS

NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт), RT + DLSS

Battlefield V

TAA High

59 / 72

41 / 51

46 / 58

Control

TAA

53 / 56

33 / 35

39 / 41

Metro Exodus

TAA

34 / 48

23 / 33

28 / 40

Minecraft with RTX Beta

Нет

87 / 95

49 / 56

57 / 65

Shadow of the Tomb Raider

TAA

55 / 69

36 / 47

42 / 55

Макс.

−29%

−17%

Средн.

−34%

−23%

Мин.

−41%

−32%

⇡#Выводы

В ближайшее время GeForce RTX 3080 предстоит выдержать сравнение не только с ускорителями NVIDIA прошлого поколения, но и с грядущими высокопроизводительными продуктами AMD. Однако неважно, чем закончится это противостояние, уже сейчас очевидно, что 30-я серия GeForce на чипах Ampere скорее вызовет согласие во мнениях, нежели ожесточенные споры, которые спровоцировала линейка RTX 20.

Теперь, когда все трудности с доставкой тестовых образцов остались позади и можно оперировать данным независимых измерений производительности, болельщикам зеленой команды, которые без колебаний поверили в заявления о двукратном превосходстве новинки над RTX 2080, и скептикам, твердившим о «фальшивых шейдерах» придется выработать компромиссный взгляд на быстродействие RTX 3080. Конечно, NVIDIA подобрала для рекламных материалов тесты, представляющие новое поколение в самом выгодном свете, а на практике среднее преимущество RTX 3080 перед GeForce RTX 2080 SUPER оценивается более скромными 55 % FPS, если взять игры в режиме 4К без трассировки лучей, и 52–69 % с трассировкой (в зависимости от того, используется ли DLSS). Можно возразить, что мы взяли GeForce RTX 2080 SUPER, а не оригинальный RTX 2080, отталкиваться от которого, разумеется, удобнее NVIDIA, но разница в быстродействии между последними не превышает 5 % и, следовательно, не меняет общую картину.

Как ни крути, в реальных играх RTX 3080 не настолько силен, как на бумаге, но повода для расстройства или злорадства мы в этом тоже не нашли. После серии чипов Turing — революционной в функциональном плане, но разочаровывающей с точки зрения прироста быстродействия — хочется вернуть назад цифры межпоколенческой разницы свыше 70 % FPS, но стоит напомнить, что Pascal был уникальным явлением, которое стало возможным благодаря рывку фотолитографии с норм 28 на 16 нм. Не факт, что технологии производства чипов в современном виде когда-либо позволяет его повторить. Ampere усилил видеокарты NVIDIA больше, чем весьма успешная для своего времени архитектура Maxwell, а в тестах с трассировкой лучей и вправду можно отыскать результаты, близкие к достижениям Pascal.

Но главное в Ampere — это не столько количественный, сколько качественный характер, который приобретает рост производительности. GeForce RTX 3080 по силам любые игры (кроме самых сложных или скверно оптимизированных) в 4К на максималках, а при разрешении 1440p он в большинстве случаев не нуждается в DLSS даже для трассировки лучей. Впрочем, рейтрейсинг по-прежнему так сильно нагружает GPU, что без технологий масштабирования кадров резерва для будущих, еще более требовательных игр, осталось немного даже у RTX 3080 (благо сама DLSS с каждой итерацией работает все лучше и стремиться отбросить ее любой ценой бессмыслеyно). Как бы то ни было, теперь можно поставить точку в затянувшейся истории GeForce GTX 1080 Ti — владельцы этого ускорителя могут смело рассчитывать на двойную норму прежнего фреймрейта. Единственное противопоказание к апгрейду на RTX 3080 — если вы сидите за монитором с разрешением 1920 × 1080. Даже самый современный CPU не выжмет из старших Ampere быстродействия, на которое они рассчитаны, в таком графическом режиме.

Пожалуй, единственная претензия, которую мы можем предъявить к GeForce RTX 3080 с чисто технической стороны — это энергопотребление, которое действительно доходит до честно указанных 320 Вт. Впору воскресить старинный мем «GTX — ПЕЧ», если бы не смена буквы в названии видеокарт. Впрочем, мы и в данном вопросе придерживаемся скорее позитивной, нежели негативной точки зрения. Palit — пожалуй, самый доступный бренд графических ускорителей в России, но плата RTX 3080 GamingPro OC, благодаря которой мы познакомились с Ampere, не испытывает ни малейших проблем c охлаждением и тишиной. А сам по себе расход электроэнергии пользователей хорошо вентилируемых (для RTX 3080 вообще и видеокарты Palit в особенности это принципиальное условие) настольных ПК волновать не должен. Только на разгон GeForce RTX 3080 лучше не рассчитывать — NVIDIA уже сделала это заранее.

Что вызывает настоящие опасения, так это доступность «зеленых» новинок в рознице и, как следствие, их реальные, а не паспортные цены. В прошлые годы мы еще не сталкивались с тем, что свежих видеокарт попросту нигде нет в продаже, хотя у партнеров чипмейкера была масса времени, чтобы наладить выпуск собственных устройств. А Founders Edition недоступен в российском интернет-магазине NVIDIA даже по предзаказу. Кроме того, мы уже писали в первой части обзора потребительских Ampere, что эти ускорители в принципе не созданы дешевыми. Приготовьтесь к тому, что видеокарты из первых поставок GeForce RTX 3080 будут стоит намного больше соблазнительных рекомендованных значений. А лучше повремените с апгрейдом еще месяц-два. Тогда и дефицит пойдет на убыль, и станет ясно, чем ответит на дебют 30-й серии красный конкурент.

⇣ Содержание

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»