Хабрахабр

Архитектура Intel Gen11 GPU и дискретная видеокарта от Intel


Дискретная видеокарта начального уровня Intel Graphics Xe, официальный анонс состоялся 20 марта на игровой конференции GDC 2019

Ожидается, что архитектура Intel Gen11 станет основой для будущей архитектуры дискретной видеокарты Xe, поэтому описанные здесь технологии можно рассматривать как предварительный просмотр по крайней мере некоторых функций, которые реализуют в этих видеокартах. Компания Intel опубликовала документацию на графические процессоры Gen11 с описанием, чем они будут отличаться от предыдущего поколения. Пока что о будущих видеокартах Intel ничего не рассказывала, только показала несколько фотографий (или рендеров).

Архитектура процессора Intel Core, системы на кристалле (SoC) и кольцевой системы внутренних соединений (Ring Interconnect)

В таких сравнениях Intel исторически получала преимущество за счёт более мощного процессора по сравнению c APU, производными от микроархитектуры AMD Bulldozer. Исторически сложилось так, что графические процессоры Intel среднего уровня GT2 для настольных компьютеров и некоторые мобильные чипы уступали по производительности чипам от AMD. Ryzen обладает гораздо более эффективным процессорным ядром, а мобильные процессоры AMD Ryzen гораздо более конкурентоспособны с Intel. Теперь ситуация изменилась. Поэтому последней необходимо что-то предпринимать, в том числе решать проблему с производительностью GPU.


Детальная блок-схема Gen11

Но некоторые специалисты считают, что Intel сможет гораздо эффективнее конкурировать с AMD. По технической документации сложно судить о производительности Gen11. По крайней мере эффективнее, чем когда-либо прежде.

Это значительное расширение ресурсов на чипе должно улучшить общую производительность по сравнению с предыдущим поколением. В новой архитектуре Intel GT2 предусмотрено 64 блока исполнения команд (EU, execution unit) по сравнению с 24 блоками в процессорах класса Skylake. В таблице ниже приведены сравнительные характеристики графических подсистем Gen9 и Gen11.


Ключевые метрики Gen9 и Gen11

Пропускная способность блоков растровых операций (ROP) удвоилась, как и количество тестов high-Z за такт. Исходя из технических характеристик, производительность вычислений в Gen11 вырастет примерно в 2,67 раза, как и пропускная способность для текстур (texture sampling).

Пропускная способность памяти при использовании DDR4 должна остаться такой же, но поддержка LPDDR4 теоретически допускает более высокие тактовые частоты. Кэш L3 увеличился в четыре раза, а пропускная способность GPU на запись удвоилась до 64 байт на такт.

Блоки видеодекодера улучшены для уменьшения битрейта. Кэш последнего уровня используется совместно GPU и CPU, чтобы сократить трафик с перемещением данных. Добавлена поддержка адаптивной синхронизации и улучшенное декодирование HD-видео. Они позволяют осуществлять одновременное декодирование нескольких потоков 4K и 8K.

Intel утверждает, что это снижает задержку и повышает эффективность «атомарных операций». Теперь у GPU общая локальная память, которая не блокирует доступ к кэшу L3 при чтении.


Иерархия памяти на уровне микросхемы SoC и её максимальная теоретическая пропускная способность

Intel утверждает, что значительно улучшила общую пропускную способность памяти в Gen11.

В документации описано две новых технологии, которые Intel реализовала в графическом ускорителе:

  • грубое затенение пикселей (Coarse Pixel Shading, CPS);
  • затенение по позиции (Position Only SHading, POSH).

Грубое затенение пикселей снижает нагрузку на GPU, уменьшая количество цветовых сэмплов, которые используются для рендеринга изображения. Скриншот иллюстрирует, что CPS практически не отражается на качестве рендеринга.

Хотя грубое затенение пикселей уменьшает количество вызовов шейдеров, на дисплее с высокой плотностью пикселей практически нет заметной разницы.
Кадр из игры Citadel 1 в разрешении 2560×1440 (слева pixel rate 1×1, а справа 2×2). Для сравнения показано также масштабированное изображение без применения сглаживания, в разрешении 1280×720

Уменьшение количества вызовов пиксельного шейдера экономит энергию и повышает производительность, то есть частоту кадров, на 20-40%.


На этом изображении объекты в красных рамках идентифицируется как достаточно удалённые от камеры и имеющие небольшое значение для общего качества изображения, поэтому детализацию можно уменьшить без заметного влияния на качество изображения с последующим повышением фреймрейта

Это часть системы рендеринга по позиции тайлов (Position Only Tile-Based Rendering, PTBR). Конвейер POSH запускает позиционный шейдер параллельно с основным приложением, что обычно позволяет генерировать результат намного быстрее, сказано в документации.

Первые два поколения AMD Ryzen Mobile конкурировали со слабой графикой Skylake. В целом, Gen11 станет значительным обновлением для процессоров Intel. Третьему поколению Ryzen Mobile APU, когда бы оно ни вышло, придётся конкурировать с гораздо более мощным чипом Intel, пишет издание ExtremeTech.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть