Железо

Новая статья: Обзор видеокарты NVIDIA GeForce GTX 1660 Ti: ближе к народу

Но среди геймеров не утихают споры о том, правильно ли поступила NVIDIA, поставив во главу угла передовые методы рендеринга вместо «сырой» производительности графических процессоров. Титульная функция новых видеокарт NVIDIA — трассировка лучей в реальном времени — уже проявила себя в первых играх, где она широко используется для формирования достоверных отражений и глобального освещения (Battlefield V и Metro Exodus), а на очереди еще несколько больших проектов, которые получат поддержку DXR (расширения API Direct3D 12 для Ray Tracing).

Каким бы он стал — Turing без RTX? Те покупатели, которые не видят у трассировки лучей больших перспектив в компьютерных играх, с радостью согласились бы изъять из ускорителей GeForce RTX всю логику, обслуживающую эту функцию, в обмен на рост быстродействия в играх старого образца. С другой стороны, компании придется рано или поздно заменить всю серию GeForce 10 устройствами на основе GPU, выпущенных по технологии 12 нм. Конечно, NVIDIA не собирается выпускать аналог GeForce RTX 2080 или RTX 2080 Ti без RT-ядер специально для неверующих. Так где же на ценовой линейке NVIDIA проведет отметку, ниже которой аппаратная трассировка лучей уже лишена практического смысла?

GeForce RTX 2060 остался наиболее доступным представителем нового поколения, который обладает совместимостью с DXR, а «Тьюринги» бюджетной категории выделили в новую серию, GeForce 16, которая занимает промежуточное положение между GeForce 10 и GeForce 20. Теперь нам известен ответ на этот вопрос. Как мы помним, RTX 2060 уже оказался весьма выгодным предложением по соотношению цены и быстродействия в «старых» играх на фоне общего удорожания видеокарт NVIDIA. И родоначальником этой серии стал GeForce GTX 1660 Ti. Посмотрим, чем продолжилось шествие архитектуры Turing — уже без RTX — в зоне ниже $300.

⇡#Графический процеcсор TU116

Как ни крути, а TU106 — «младший из старших» чипов семейства Turing, уже применяется в двух ускорителях серии GeForce RTX — 2060 и 2070. Для того, чтобы выпустить графическую карту на основе архитектуры Turing и прогрессивного техпроцесса 12 нм FinFET, но отбросить функции, связанные с аббревиатурой RTX (трассировку лучей и аппаратное ускорение нейронных сетей), NVIDIA пришлось создать отдельную модель графического процессора — TU116. Подвергнуть его дальнейшей деконструкции ради GeForce GTX 1660 Ti едва ли было бы целесообразно с экономической точки зрения.

Скальпель инженеров NVIDIA отсек лишь новые компоненты — тензорные и RT-ядра — а по другим параметрам TU116 отличается от TU106 в основном количественным, нежели качественным образом. Блок-схема TU116 производит такое впечатление, как будто никакого RTX не было и в помине, а микроархитектура Turing отличается от предшествующей Pascal лишь в части организации функциональных блоков, выполняющих традиционные функции рендеринга. А точнее, целочисленные и FP-ALU, объединенные внутри CUDA-ядра, в архитектуре Turing получили раздельные каналы передачи данных, и это позволяет диспетчерам команд в течение двух тактов полностью нагрузить SM операциями того и другого типа. Так, наряду с CUDA-ядрами, выполняющими операции стандартной точности над числами с плавающей запятой (FP32), внутри потокового мультипроцессора (SM — Streaming Multiprocessor) TU116 есть равное количество ядер для целочисленных операций (INT32). По оценкам NVIDIA, за счет такой организации пропускная способность GPU в шейдерных расчетах может возрастать в полтора раза.

Блок-схема графического процессора NVIDIA TU116

Это неожиданное и даже подозрительное качество для чипа, который создали специально для условно бюджетных графических карт, лишенных функций RTX. С другой стороны, TU116 не уступает прочим чипам архитектуры Turing в способности выполнять операции половинной точности (FP16) с пропускной способностью в отношении 2:1 к операциями FP32. Конечно, формат FP16 уже нашел применение в компьютерной графике для шейдерных программ, не требующих более точного представления данных, но честно говоря, трудно поверить, что NVIDIA потратила время разработчиков и площадь чипа (наверняка существенную) специально ради таких, по-прежнему маргинальных в играх на ПК, ситуаций. Дело вот в чем: операции FP16 в старших «Тьюрингах» выполняются силами тензорных ядер, даже если приложение напрямую не обращается к ним через API CUDA. NVIDIA просто редуцировала их управляющую логику, либо, что более вероятно, заблокировала доступ программным путем (в первую очередь, для DLSS), чтобы лучше дифференцировать GeForce GTX 1660 Ti и GeForce RTX 2060, которые в остальном довольно-таки близки по своему вычислительному потенциалу. Двойную мощность в операциях FP16 проще объяснить тем, что тензорные ядра на самом деле есть в кремнии TU116.

Производитель

NVIDIA

Название

GP106

GP104

TU116

TU106

TU104

Микроархитектура

Pascal

Pascal

Turing

Turing

Turing

Техпроцесс, нм

16 nm FinFET

16 nm FinFET

12 нм FFN

12 нм FFN

12 нм FFN

Число транзисторов, млн

4400

7 200

6 600

10 800

13 600

Площадь чипа, мм2

200

314

284

445

545

Конфигурация SM/TPC/GPC

Число SM

10

20

24

36

48

Число TPC

5

20

12

18

24

Число GPC

2

4

3

3

6

Конфигурация потокового мультипроцессора (SM)

FP32-ядра

128

128

64

64

64

FP64-ядра

4

4

2

2

2

INT32-ядра

Нет

Нет

64

64

64

Тензорные ядра

Нет

Нет

Нет

8

8

RT-ядра

Нет

Нет

Нет

1

1

Объем кеша L1, Кбайт

48

48

32/64 из 96 (общий с разделяемой памятью)

32/64 из 96 (общий с разделяемой памятью)

32/64 из 96 (общий с разделяемой памятью)

Объем разделяемой памяти, Кбайт

96

96

32/64 из 96 (общий с кешем L1)

32/64 из 96 (общий с кешем L1)

32/64 из 96 (общий с кешем L1)

Объем регистрового файла, Кбайт

256

256

256

256

256

Программируемые вычислительные блоки GPU

FP32-ядра

1280

2 560

1 536

2 304

3 072

FP64-ядра

40

80

48

72

96

INT32-ядра

Нет

Нет

1 536

2 304

3 072

Тензорные ядра

Нет

Нет

Нет

288

384

RT-ядра

Нет

Нет

Нет

36

48

Блоки GPU фиксированной функциональности

TMU (блоки наложения текстур)

80

160

96

144

192

ROP

48

64

48

64

64

Конфигурация памяти

Объем кеша L2, Кбайт

1 536

2 048

1 536

4 096

4 096

Разрядность шины RAM, бит

192

256

192

256

256

Тип микросхем RAM

GDDR5

GDDR5/GDDR5X

GDDR6

GDDR6

GDDR6

Интерфейс SLI/NVLINK

Нет

2 × SLI Gen. 2

Нет

Нет

1 × NVLink 2.0 x8

В результате по транзисторному бюджету TU116 оказался в промежутке между двумя чипами предыдущего поколения — GP106 и GP104, а по числу главных исполнительных блоков (32-битных CUDA-ядер и текстурных модулей) ближе к первой, нежели второй модели. Что бы в действительности ни произошло с тензорными ядрами TU116, новый чип трудно сравнить по площади и количеству транзисторов с TU106: эти параметры NVIDIA уменьшила на 26 и 39 % соответственно. У TU116 и GP106 одинаковый объем кеш-памяти второго уровня (1,5 Мбайт), регистрового файла в пересчете на один SM (256 Кбайт) и разрядность шины RAM (192 бит).

Это и кеш первого уровня, обладающий сниженной латентностью за счет слияния с разделяемой памятью, и отдельный кеш инструкций нулевого уровня, и возможность относительно независимой планировки потоков. Вместе с тем, чипы архитектуры Turing отличаются от Pascal массой оптимизаций конвейера, которые в совокупности позволяют лучше раскрыть теоретическую производительность GPU в реальных задачах. Но для того, чтобы описать суть и функцию всех нововведений, нам пришлось бы повторить добрую часть вводной статьи, посвященной архитектуре Turing — лучше освежите память с ее помощью.

NVIDIA TU116

 

NVIDIA TU106

⇡#Технические характеристики, цена

По сравнению с GeForce RTX 2060 младшая модель сохранила 80 % данных вычислительных ресурсов, но благодаря тому, что GTX 1660 Ti характеризуется наивысшими тактовыми частотами в таблице референсных спецификаций ускорителей на чипах Turing, по теоретическому быстродействию в операциях с плавающей запятой стандартной точности (FP32) и скорости наложения текстур он отвоевал уже 84 % вычислительной мощности GeForce RTX 2060. В составе GeForce GTX 1660 Ti используется полностью функциональная версия TU116, которая несет 1536 шейдерных ALU (32-битных CUDA-ядер) и 96 блоков наложения текстур.

Так, GeForce GTX 1060 и GeForce GTX 1660 Ti работают в рамках одинакового резерва мощности (120 Вт) и близки по тактовым частотам (Boost Clock у этих моделей достигает 1708 и 1770 МГц соответственно). Если же сравнивать GTX 1660 Ti с видеокартами семейства GeForce 10, то новинка дает хорошее представление о тех преимуществах, которые подарили видеокартам NVIDIA техпроцесс 12 нм и архитектура Turing, не обремененная тензорными (если верить NVIDIA) и RT-ядрами. Но в новом чипе инженеры NVIDIA смогли поместить на 20 % больше 32-битных CUDA-ядер и текстурных блоков, а пиковая производительность в операциях FP32, как следствие, увеличилась на 24 %.

Производитель

NVIDIA

Модель

GeForce GTX 1060 6 Гбайт

GeForce GTX 1070

GeForce RTX 1660 Ti

GeForce RTX 2060

GeForce RTX 2070

GeForce RTX 2080

GeForce RTX 2080 Ti

Графический процессор

Название

GP106

GP104

TU116

TU106

TU106

TU104

TU102

Микроархитектура

Pascal

Pascal

Turing

Turing

Turing

Turing

Turing

Техпроцесс, нм

16 нм FinFET

16 нм FinFET

12 нм FFN

12 нм FFN

12 нм FFN

12 нм FFN

12 нм FFN

Число транзисторов, млн

4400

7 200

6 600

10 800

10 800

13 600

18 600

Тактовая частота, МГц: Base Clock / Boost Clock

1506/1708

1 506 / 1 683

1500/1770

1365/1680

1 410 / 1 620 (Founders Edition: 1 410 / 1 710)

1 515 / 1 710 (Founders Edition: 1 515 / 1 800)

1 350 / 1 545 (Founders Edition: 1 350 / 1 635)

Число шейдерных ALU

1280

1 920

1536

1920

2304

2944

4352

Число блоков наложения текстур

80

120

96

120

144

184

272

Число ROP

48

64

48

48

64

64

88

Оперативная память

Разрядность шины, бит

192

256

192

192

256

256

352

Тип микросхем

GDDR5 SDRAM

GDDR5 SDRAM

GDDR6 SDRAM

GDDR6 SDRAM

GDDR6 SDRAM

GDDR6 SDRAM

GDDR6 SDRAM

Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)

2000 (8000) 2250 (9000)

2 000 (8 000)

1 500 (12 000)

1 750 (14 000)

1 750 (14 000)

1 750 (14 000)

1 750 (14 000)

Объем, Мбайт

6 144

8 192

6 144

6 144

8 192

8 192

11 264

Шина ввода/вывода

PCI Express 3.0 x16

PCI Express 3.0 x16

PCI Express 3.0 x16

PCI Express 3.0 x16

PCI Express 3.0 x16

PCI Express 3.0 x16

PCI Express 3.0 x16

Производительность

Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)

4372

6 463

5437

6451

7 465 / 7 880 (Founders Edition)

10 069 / 10 598 (Founders Edition)

13 448 / 14 231 (Founders Edition)

Производительность FP32/FP64

1/32

1/32

1/32

1/32

1/32

1/32

1/32

Производительность FP32/FP16

1/128

1/128

2/1

2/1

2/1

2/1

2/1

Пропускная способность оперативной памяти, Гбайт/с

192/216

256

288

336

448

448

616

Вывод изображения

Интерфейсы вывода изображения

DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b

DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b

DL DVI-D, DisplayPort 1.4a, HDMI 2.0b

DL DVI-D, DisplayPort 1.4a, HDMI 2.0b

DL DVI-D, DisplayPort 1.4a, HDMI 2.0b

DisplayPort 1.4a, HDMI 2.0b

DisplayPort 1.4a, HDMI 2.0b

TBP/TDP, Вт

120

150

120

160

175/185 (Founders Edition)

215/225 (Founders Edition)

250/260 (Founders Edition)

Розничная цена (США, без налога), $

249 (рекомен-дованная) / 299 (Founders Edition, nvidia.com)

349 (рекомен-дованная) / 399 (Founders Edition, nvidia.com)

279 (рекомен-дованная)

349 (рекомен-дованная) / 349 (Founders Edition, nvidia.com)

499 (рекомен-дованная) / 599 (Founders Edition, nvidia.com)

699 (рекомен-дованная) / 799 (Founders Edition, nvidia.com)

999 (рекомен-дованная) / 1 199 (Founders Edition, nvidia.com)

Розничная цена (Россия), руб.

НД (рекомен-дованная) / 22 990 (Founders Edition, nvidia.ru)

НД (рекомен-дованная) / 31 590 (Founders Edition, nvidia.ru)

22 990 (рекомен-дованная)

НД (рекомен-дованная) / 31 990 (Founders Edition, nvidia.ru)

НД (рекомен-дованная) / 47 990 (Founders Edition, nvidia.ru)

НД (рекомен-дованная) / 63 990 (Founders Edition, nvidia.ru)

НД (рекомен-дованная) / 95 990 (Founders Edition, nvidia.ru)

Вот еще одна черта, которая роднит GeForce GTX 1660 Ti со старшими «Тьюрингами» — кадровый буфер на основе микросхем GDDR6. Как мы уже поняли, GeForce GTX 1660 Ti по своим основным характеристикам является продолжателем традиций серии GeForce RTX, только без трассировки лучей и с поправкой на иной набор вычислительных блоков. Как бы то ни было, итоговая ПСП у GTX 1660 Ti на 33 % выше по сравнению с модификациями GeForce GTX 1060 второй волны, которые оснащаются чипами GDDR5 9 Гбит/с. Однако пропускная способность шины памяти (ПСП), которую дают чипы номинала 14 Гбит/с на контакт, TU116 ни к чему, поэтому новинка довольствуется скоростью 12 Гбит/с.

Но не будем забывать и о том, что в практических задачах чипам архитектуры Turing проще достигнуть своей теоретической производительности, чем их прародителям из семейства Pascal, благодаря оптимизированной структуре потокового мультипроцессора, увеличенному кешу первого уровня и другим не столь существенным нововведениям — это уже доказали видеокарты под маркой GeForce RTX. В итоге GeForce GTX 1660 Ti можно охарактеризовать как модернизированный аналог GeForce GTX 1060, который за счет усиленного набора вычислительных блоков сделал крупный шаг в сторону GeForce GTX 1070. Так что в предварительных оценках реального быстродействия все-таки нужно поместить GTX 1660 Ti ближе к GTX 1070, нежели GTX 1060.

Как видим, NVIDIA и в этом случае продает новую видеокарту дороже, чем ее прямого предшественника (GeForce GTX 1060 стартовал на отметке $249), хотя ни о какой трассировке лучей уже речи не идет. GeForce GTX 1660 Ti поступит в продажу по рекомендованной стоимости $279. Но прежде чем в очередной раз возмутиться алчности производителя, стоит окинуть взглядом положение дел, которое сложилось на рынке потребительских видеокарт ценой до $400.

А ведь GeForce GTX 1660 Ti наверняка не слишком отличается от последнего по быстродействию в играх. Ближайшая модель серии GeForce RTX — 2060 — обладает рекомендованной стоимостью $349, и такую же цену получил в начале своего пути GeForce GTX 1070. Получается, и тут продукт NVIDIA стартовал с более низкой позиции. С другой стороны, формальный конкурент GTX 1660 Ti — Radeon RX 590 — сейчас стоит не меньше $259, хотя начинал с $279.

Какими бы ни были розничные цены первых партий GeForce GTX 1660 Ti, геймерам, рассматривающим видеокарты этой категории, стоит повременить с покупкой — прайс-листы наверняка будет сильно штормить. Что касается российского рынка, то для GTX 1660 Ti объявлена рекомендованная цена в 22 990 рублей, но едва ли она удержится долго, ведь за такие деньги уже можно купить одну из простейших модификаций GeForce RTX 2060, а Radeon RX 590 у нас стоит от 18 660 р.

⇡#GIGABYTE GeForce GTX 1660 Ti OC: конструкция

Нет сомнений, что эта фирма выпустит несколько устройств на чипе TU116 для покупателей с разным уровнем потребностей и достатка. Для знакомства с физическим воплощением GeForce GTX 1660 Ti нам прислали видеокарту GIGABYTE. Но это как раз к лучшему, ведь на сей раз речь идет о массовой видеокарте, которую следует изучить, убрав из уравнения такие переменные, как избыточно мощная система охлаждения и отбор кристаллов GPU с наилучшим частотным потенциалом. Но перед нам явно бюджетное устройство — это видно уже по маркировке, в которой нет сокращенных слов AORUS и WINDFORCE, сигнализирующих о принадлежности к более изысканным маркам в каталоге GIGABYTE.

Не известно, сколь сильно производитель увеличил частоты GPU — точных спецификаций этой видеокарты нам не сообщили, а базовую частоту устройств на чипах Turing партнеры NVIDIA практически никогда не меняют. Впрочем, наш экземпляр GIGABYTE GeForce GTX 1660 Ti имеет маркировку OC, которая указывает на заводской оверклокинг. Но едва ли GIGABYTE GeForce GTX 1660 Ti разогнана настолько, чтобы дать TU116 неоправданное преимущество в тестах, где мы столкнем ее с референсными устройствами NVIDIA и AMD.

Корпус ускорителя целиком сделан из пластика — даже защитная панель на обратной стороне печатной платы выполнена из него же. Внешний вид и особенности конструкции GIGABYTE GeForce GTX 1660 Ti не нуждаются в подробном описании. Иных украшений видеокарта лишена. Но если честно, металлический щиток, который монтируют на PCB более дорогих моделей, порой тоже выполняет чисто декоративную функцию и не участвует в охлаждении компонентов. В частности, на ней нет ни единого светодиода, не говоря уже об RGB-подсветке или возможности питания светодиодных лент.

За охлаждение устройства отвечают два вентилятора диаметром 87 мм — здесь тоже нет никаких изысков, но применяется решение, которое GIGABYTE и некоторые другие производители ввели для снижения турбулентности воздушного потока: крыльчатки вращаются в противоположные стороны.

Единственная теплотрубка диаметром 5 мм согнута в S-образную форму и пропущена через основание радиатора таким образом, что ее середина примыкает к кристаллу GPU. Радиатор кулера представляет собой простую конструкцию из блока алюминиевых ребер и плоского основания, которое накрывает графический процессор и два из шести чипов памяти GDDR6. К чести производителя стоит выделить тот факт, что компоненты регулятора напряжения тоже отдают тепло основному радиатору СО вместо отдельного «огрызка», как это часто делали в недорогих устройствах прошлых лет, причем активное охлаждение получили не только полевые транзисторы с интегрированным драйвером, но и дроссели VRM.

⇡#GIGABYTE GeForce GTX 1660 Ti OC: печатная плата

На основе этой PCB вполне можно сделать видеокарту форм-фактора Mini-ITX, и если судить по пустующим площадкам для двух чипов GDDR6, она уже используется в составе какого-то другого устройства на чипе семейства Turing, причем с 256-битной шиной памяти. Пластиковый кожух, который обернут вокруг свободного конца печатной платы GIGABYTE GeForce GTX 1660 Ti, маскирует ее небольшие габариты. Преобразователь напряжения GIGABYTE GeForce GTX 1660 Ti изначально рассчитан на восемь фаз, но в связи с умеренным энергопотреблением TU116 на текстолите распаяны компоненты лишь шесть из них: четыре для графического процесссора и две для микросхем RAM. Среди всех продуктов серии GeForce RTX есть лишь один подходящий кандидат — RTX 2070, а чипы TU116 и TU106, выходит, являются электрически взаимозаменяемыми. DrMOS или «силовые каскады» — power stages), благодаря которым ШИМ-контроллер точнее регулирует напряжение на стоке транзистора и возрастает КПД преобразования. Впрочем, как и в ускорителях серии GeForce RTX, в составе VRM здесь применяются полевые транзисторы с интегрированным драйвером (т.н.

Кристалл TU116 на этой плате не имеет буквы А в среднем блоке маркировки, которая у старших моделей на чипах Turing выделяет GPU отборного качества, обладающие повышенным частотным потенциалом. Микросхемы GDDR6 производства Micron с маркировкой 8XA77 D9WCR работают со штатной пропускной способностью 12 Гбит/с на контакт шины. Независимо от того, какая версия соответствует действительности, разогнать эту видеокарту будет особенно интересно, ведь она покажет, на что можно рассчитывать в попытках оверклокинга простых модификаций GeForce GTX 1660 Ti, доступных за умеренные деньги. Стало быть, NVIDIA отказалась от предварительной категоризации образцов TU116, а может, нам наконец-то попался Turing «второго сорта».

Следующая страница →

⇣ Содержание

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

3dnews.ru/www/delivery/avw.php?zoneid=1778&cb=INSERT_RANDOM_NUMBER_HERE&n=a08ada54" border="0" alt=""/> <img src="https://ad.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть