Хабрахабр

[Перевод] Второе поколение AMD Ryzen: тестирование и подробный анализ

В начале 2018 года были озвучены планы: Ryzen второго поколения должен появиться в середине года, после чего выйдет второе поколение Threadripper, на 12-нм процессе GlobalFoundries. С окончанием 2017 года, в котором процессор Ryzen стал одним из самых успешных продуктов AMD, возник закономерный вопрос: что же дальше? Это выпуск компонентов с некоторыми улучшениями, плюс возможность использовать производственный процесс, который позволяет поднять лимит частоты и производительности. Это еще не следующая новая микроархитектура AMD, которая, как мы знаем, будет Zen 2 на 7 нм техпроцессе. Сегодня AMD запускает четыре процессора, мы протестировали их все.

Сразу к сути: новые процессоры

Для читателей, которые желают сразу перейти к сути, сообщаем: AMD запускает Ryzen 7 2700X, Ryzen 7 2700, Ryzen 5 2600X и Ryzen 5 2600.

Это дополнительно +100 МГц и +300 МГц соответственно, что выше средних пределов разогнанного 1800X. Теперь Ryzen 7 2700X занимает первое место, смещая с пьедестала Ryzen 7 1800X, и ценой дополнительных 10 Вт TDP выдает базовую частоту 3,7 ГГц и турбо частоту 4,3 ГГц на восьми ядрах с одновременной многопоточностью.

Да, совсем недавно 1800X упал в цене до 349 долларов, чтобы составить конкуренцию мощным процессорам Intel. Важная новость: с 2700X AMD снизила максимальную стоимость топового процессора AM4 Ryzen: при запуске 1800X стоил 499 долларов и поставлялся без кулера. AMD решительно наступает по всем фронтам: агрессивное ценообразование, максимальная производительность и лучшая комплектация, все за один раз и в одном продукте. 2700X заткнул за пояс обоих чемпионов, выйдя на рынок с рекомендованной розничной ценой 329 долларов США, к тому же в комплекте с лучшим кулером бизнес класса: AMD Wraith Prism RGB.

При 95 Вт TDP и рекомендованной розничной цене $ 229 он поставляется в комплекте с кулером AMD Wraith Spire, который, опять же, является весьма впечатляющим стоковым продуктом. Ryzen 5 2600X — это шестиядерный вариант процессора, также с агрессивной частотной стратегией: 3,6 ГГц и 4,2 ГГц турбо.

Все процессоры будут поддерживать двухканальную память DDR4-2933, что выше максимальной частоты поддержки памяти DDR4-2666 процессоров Ryzen 2017 года. Ryzen 7 2700 и Ryzen 5 2600 — это 65-ватные версии X-аналогов, предлагающие почти те же частоты на 30 долларов дешевле. Одно из главных изменений заключается в том, что теперь каждый процессор поставляется в комплекте с кулером, начиная от моделей Silent 65W Stealth и заканчивая большим Prism RGB, каждый из которых достаточен для стабильной работы процессора в турборежиме.

Планируемая AMD линейка AM4 Ryzen теперь будет выглядеть следующим образом:

AMD пересмотрела свою линейку продуктов и заменила три продукта прошлого поколения двумя новыми Ryzen, возможно, исходя из показателей продаж. Взлетая на вершину Олимпа, 2700X лишает первенства 1700X и 1800X. Как будет видно из нашего обзора, 2700X выжимает из текущего кремниевого процесса все до предела.

Мы уже подробно изучили APU в недавних обзорах, и показали, что они вполне успешно заменили некоторые из оригинальных моделей первого поколения. Полный список в конечном счете представляет собой сочетание процессоров серии Ryzen 2000 (новые), APU Ryzen серии 2000, плюс пара продуктов серии Ryzen 1000. Итак, четыре новых процессора серии 2000 теперь занимают вершину списка, но AMD часто фокусируется на новых продуктах, поэтому со временем (вполне вероятно) появится еще несколько новинок серии 2000.

Другая информация из сегодняшнего обзора

Конечно, наш обзор только начинается, ведь мы еще не поговорили об опциях. AMD использует 12-нм производственный процесс GlobalFoundries, преимущества которого очевидны. Имеется множество улучшений встроенного ПО, обновленные функции и роли для технологий AMD Precision Boost и XFR, которые могут иметь непосредственное влияние на производительность. Есть новый чипсет (вместе с 30 + материнскими платами), готовый работать с новой линейкой процессоров, а также новые или переименованные функции, такие как StoreMI. Мы хотим изучить, как эти новые продукты вписываются в долгосрочные планы AMD и соответствуют ли им в целом.

Здесь же вы найдете и результаты тестирования. Рассмотрим эти вопросы в статье.

Конкурент AMD Ryzen 2000: Intel’s Coffee Lake

В рамках запуска нового продукта, AMD предоставила обширную информацию о тестировании своих новых чипов. Из представленных данных было совершенно ясно, что новые процессоры нацелены составить конкуренцию самым современным процессорам Intel: Coffee Lake. Это контрастирует с тем, что серия Ryzen 1000, вышедшая в прошлом году, противопоставляла восьмиядерный Ryzen 7 1800X Интеловскому 8-ядерному Broadwell-E: примерно в это время Intel обновила основную линейку процессоров до шести высокочастотных ядер.

Это важный момент — сейчас оба основных игрока на рынке процессоров x86 столкнули свои последние продукты друг против друга, лоб в лоб. В итоге, теперь AMD предлагает сравнить Ryzen 7 2700X с Core i7-8700K и Ryzen 5 2600X с Core i5-8500K. Тем не менее некоторые показатели остались на своих местах с выпуска прошлого года: Такого не случалось уже несколько поколений.

  • Ожидается, что Intel имеет преимущество в частоте и IPC
  • AMD не особо отстанет по частоте и предложит больше ядер по той же цене

Корона многопоточности AMD особенно сверкает на внутреннем тестировании, однако производительность одного потока все еще отстает от конкурента. Ряд новых функций серии Ryzen 2000 должен исправить ситуацию: несколько более высокий IPC, более высокие частоты, более высокий TDP и улучшенная модель динамического повышения частоты. Мы рассмотрим их на следующих нескольких страницах.

То, что AMD и Intel имеют разные модели кэша, сыграет значительную роль. Частота и количество ядер – это лишь часть уравнения. Что касается цены, AMD Ryzen 7 2700X дешевле i7-8700K, + добавлен кулер Wraith Prism RGB, который легко заменяет кулер стоимостью 30-40 долларов, экономя деньги потребителя. Один из моментов, который мы увидим в этом анализе, — это сравнительные показатели кэш-памяти, и настройка, которую AMD сделала, чтобы закрыть проблемные места.

Эти процессоры не отличаются количеством ядер, хотя у Ryzen 5 вдвое больше потоков. Показатели Ryzen 5 2600X и Core i5-8600K более схожи, чем у их старших братьев. Core i5-8600K имеет чуть более высокую частоту ядра и, как и ожидалось, преимущество IPC. Для любой многопоточной рабочей нагрузки, которая в состоянии использовать одновременную многопоточность, это, вероятно, важный показатель. Опять же, AMD предлагает процессор, оснащенный хорошим кулером, тогда как предложение Intel – «голый» процессор.

У нас есть несколько способов проверить это. В целом, AMD заявляет, что ее новые высококлассные процессоры покажут результаты в пределах 1-2% от конкурентов при играх 1440p, но дадут прирост 20% в «творческой производительности».

Статьи в этом обзоре:

  1. AMD запускает Ryzen 7 2700X, Ryzen 7 2700, Ryzen 5 2600X и Ryzen 5 2600
  2. Говоря о 12nm и Zen +
  3. Усовершенствование иерархии кэша
  4. В переводе на IPC (instructions per cycle): все это ради 3%?
  5. Precision Boost 2 и XFR2: Нужно больше герц
  6. Новые чипсеты и материнские платы X470
  7. StoreMI путь к более быстрому JBOD
  8. Параметры тестирования
  9. Системные тесты CPU
  10. CPU Rendering Tests
  11. CPU Web Tests
  12. CPU Encoding Tests
  13. CPU Office Tests
  14. CPU Legacy Tests
  15. Gaming Performance: Civilization 6
  16. Gaming Performance: Shadow of Mordor
  17. Gaming Performance: Rise of the Tomb Raider
  18. Gaming Performance: Rocket League
  19. Gaming Performance: Grand Theft Auto
  20. Выводы: бремя конкуренции

Говоря о 12nm и Zen +

Одним из основных моментов запуска серии Ryzen 2000 является то, что эти процессоры используют производственный процесс GlobalLoundries 12LP, после процесса 14LPP первого поколения процессоров Ryzen. Как AMD, так и GlobalFoundries обсудили различия в процессах, однако стоит понимать, что цели компаний разные: AMD должна продвигать только то, что помогает ее продуктам, тогда как GlobalFoundries — крупный производитель полупроводниковой продукции с большой «клиентской базой», и может предоставлять цифры и данные «идеального сценария». В этом году мы были приглашены в GlobalFoundries Fab 8 (северной части штата Нью-Йорк), там мы смогли взять интервью у доктора Гэри Паттона, технического директора.

Во-первых, технический директор не обязательно должен заботиться о том, как называются определенные техпроцессы: их клиенты знают производительность данного процесса независимо от объявленной цифры «nm» на основании предоставленных им инструментов разработки. В этом интервью было освещено несколько интересных моментов. Апгрейд получен в результате частичного оптического уменьшения и незначительного изменения правил производства в бек-энде и средней части производственного процесса. Во-вторых: 12LP представляет собой всего лишь несколько улучшенный процесс 14LPP – минорные изменения для улучшения производительности. В прошлом такие изменения, возможно, не стали бы причиной столь громких новостей, однако клиенты GF хотят получить преимущество за счет улучшенного процесса.

В целом, GlobalFoundries заявила, что ее 12LP-процесс обеспечивает 10% -ное улучшение производительности и 15% -ное улучшение плотности элементов в сравнении с 14LPP.

Это было интерпретировано различными способами, такими как дополнительная 10% частота при той же мощности или более низкая мощность для той же частоты, или как возможность создавать чипы меньшего размера.

В рамках сегодняшнего запуска AMD разъяснила, что означал переход на 12LP процесс для серии Ryzen 2000:

  • Рост максимальной тактовой частоты на ~ 250 МГц (~ 6%)
  • Работа ядер в турбо режиме на частоте 4,2 ГГц
  • Снижение напряжения на ядре на ~ 50 мВ

Все же заявления немного неоднозначны, так как у AMD есть другие новые технологии в серии 2000, которые повлияют на производительность. AMD терпеливо объясняет, что на той же частоте новые процессоры серии Ryzen 2000 потребляют на 11% меньше энергии, чем серия Ryzen 1000, а это означает +16% производительности при той же мощности.

В конечном итоге это, похоже, противоречит здравому смыслу – неужели AMD не захочет использовать меньшие матрицы, чтобы вместить больше чипов на пластину? Один интересный момент заключается в том, что, хотя GF утверждает, что произошло улучшение плотности на 15%, AMD заявляет, что эти процессоры имеют те же размер матрицы и количество транзисторов, что и предыдущее поколение.

AMD называет дизайн ядер Zen +, чтобы отличать их от дизайна предыдущего поколения Zen, в основном это связано с тем, как функции микроархитектуры расположены на кремнии. В конечном счете, новые процессоры являются почти точными копиями старых, как с точки зрения дизайна, так и микроархитектуры. Многие из ключевых функций не изменились — они просто занимают меньше места, оставляя пустой кремний между элементами.

Слева — дизайн 14LPP, и каждая из шести функций имеет определенный размер и подключается к шине. Вот очень грубое представление функций, привязанных к пути данных. Справа — представление дизайна 12LP: каждая из функций была уменьшена по размеру, попросту оставляя «темный кремний» между элементами (белые квадраты показывают оригинальный размер функции). Между элементами находится «темный кремний» — неиспользуемый кремний, который либо рассматривается как бесполезный, либо может использоваться в качестве теплового буфера между элементами с высоким выделением энергии. Но если где-то в дизайне возникали термические ограничения из-за близости «горячих» элементов, теперь между ними расстояния больше, дабы элементы не мешали друг другу. В этом контексте количество транзисторов не изменилось, как и размер матрицы.

AMD подтвердила, что использует 9T-транзисторные библиотеки, как и в предыдущем поколении, хотя GlobalFoundries также предлагает дизайн 7. Для справки, AMD озвучивает размеры этих новых процессоров как 213 мм2, содержащие 4,8 миллиарда транзисторов, идентично дизайну кремния первого поколения. 5T.

Итак, Zen +: новая микроархитектура или изменение технологического узла?

Помимо изменения узла производственного процесса и вероятных незначительных корректировок, основные улучшения находятся в прошивке и поддержке: В конечном счете, ничего в большей части физического дизайна Zen + не является новым.

  • Корректировка задержек кэша, приводящая к + 3% IPC
  • Поддержка увеличенной частоты DRAM для DDR4-2933
  • Улучшенные кривые напряжения / частоты, приводящие к + 10% производительности в целом
  • Улучшенная производительность при использовании Precision Boost 2
  • Лучшая тепловая реакция с XFR2

Усовершенствование иерархии кэша

Наибольшее внутреннее изменение у процессоров серии Ryzen 2000 — снижение времени ожидания кэша. AMD утверждает, что они смогли убрать один цикл из кэшей L1 и L2, несколько циклов из L3 и улучшить производительность DRAM. Поскольку чистая базовая IPC тесно переплетается с кэшами (размер, латентность, пропускная способность), эти цифры приводят AMD к утверждению, что новые процессоры могут обеспечить + 3% прирост IPC по сравнению с предыдущим поколением.

Цифры, предоставленные AMD:

  • 13% улучшение латентности L1 (1.10ns против 0.95ns)
  • 34% улучшение латентности L2 (4.6ns против 3.0ns)
  • 16% улучшение латентности L3 (11.0ns против 9.2ns)
  • 11% улучшение латентности памяти (74ns против 66ns на DDR4-3200)
  • Поддержка увеличенной частоты DRAM (DDR4-2666 против DDR4-2933)

Интересно, что в официальной презентации AMD упоминает латентность, измеряемую как время, хотя в частных беседах на нашем брифинге это обсуждалось в терминах тактовых циклов. В конечном счете латентность, измеряемая временем, может использовать преимущества других внутренних улучшений; однако настоящий инженер предпочитает обсуждать тактовые циклы.

Естественно, мы рассмотрели два аспекта этого уравнения: действительно ли показатели кэша ниже, и получим ли мы повышение IPC?

Так что там насчет кэша?

Для этого теста мы использовали следующее: Для тестирования мы используем средство проверки латентности памяти на каждом шагу иерархии кэша одного ядра.

  • Ryzen 7 2700X (Zen+)
  • Ryzen 5 2400G (Zen APU)
  • Ryzen 7 1800X (Zen)
  • Intel Core i7-8700K (Coffee Lake)
  • Intel Core i7-7700K (Kaby Lake)

Наиболее наглядно сравнение между процессорами AMD. Здесь у нас есть Ryzen 7 1800X первой серии, Ryzen 5 2400G APU, который объединяет ядра Zen с графикой Vega, и новый процессор Ryzen 7 2700X.


Этот график логарифмичен в обеих осях

Самое большое различие заключается в латентности кэша L2, но L3 также имеет значительный прирост. Этот график показывает, что на каждой фазе дизайна кэша новейший Ryzen 7 2700X требует меньше циклов ядра. Причина, по которой выигрыш L2 настолько велик, особенно между 1800X и 2700X, — весьма любопытна.

Это было довольно много — оказалось, что инженеры изначально предполагали, что L2-латентность будет 12 циклов, но нехватка времени для настройки прошивки и компоновки, прежде чем отправлять проект в производство, вынудила оставить 17 циклов как лучший компромисс, что бы дизайн был работоспособен и не вызывал проблем. Когда AMD впервые запустила Ryzen 7 1800X, латентность L2 была протестирована и определена в 17 циклов. Теперь с серией Ryzen 2000 AMD сократила латентность до 11 циклов. С Threadripper и APU Ryzen AMD подправила дизайн достаточно, чтобы достичь латентности L2 в 12 циклов, однако в то время этот факт не освещался, несмотря на преимущества, которые он предоставляет. В нашем тестировании мы фактически видели среднюю латентность L2 в 10,4 цикла, по сравнению с 16,9 циклами на Ryzen 7 1800X. Нам сказали, что это связано как с новым производственным процессом, так и с дополнительными настройками, обеспечивающими согласованность сигналов.

Мы увидели изменение с 10,7 нс до 8,1 нс, что означает снижение с 39 до 30 циклов. Разница в латентности L3 немного неожиданна: AMD заявила об уменьшении задержки на 16%: с 11,0 нс до 9,2 нс.

И сравнение оказалось очень интересным. Конечно, мы не могли обойтись без сравнения AMD с Intel. Теперь конфигурации кэша между Ryzen 7 2700X и Core i7-8700K различны:

AMD имеет больший кэш L2, однако кэш AMD L3 — это не инклюзивный victim-кэш, что означает, что он не может использовать предвыборку (prefetching) в отличие от кэша Intel L3.

В DRAM существует значительная разница, однако основные показатели производительности здесь находятся в нижних кэшах. Результат был неожиданный, ведь стало очевидным, что AMD имеет преимущество во времени ожидания в кэшах L2 и L3.

Мы можем расширить тест, включив в него три чипа AMD, а также ядра Intel Lake Lake и Kaby Lake.

У Intel небольшое преимущество в L1, однако более крупные кэши L2 в проектах AMD Zen означают, что Intel достигнет более высокой задержки L3 раньше. Это график, использующий циклы, а не временную задержку. И все же Intel делает свою работу быстро за счет малой задержки DRAM.

В переводе на IPC (instructions per cycle): все это ради 3%?

Вопреки распространенному мнению, увеличение IPC очень непростая задача. Попытка гарантировать, что каждый порт задействован в каждом цикле, требует наличия широких декодеров, больших очередей инструкций, быстрых кэшей и правильной конфигурации порта исполнения. Может показаться, что это легко скомпилировать, но как физика, так и экономика говорят «нет»: чип еще должен быть термически эффективным, и он должен приносить деньги компании. Каждое обновление дизайна процессоров будет направлено на то, что называют «низко висящими фруктами»: небольшие изменения, которые приносят наибольший выигрыш при минимальных усилиях. Обычно сокращение латентности кэша не является самой легкой задачей, а для инженеров не из «полупроводниковой» сферы (включая меня), это вообще звучит как большой труд ради маленького выигрыша.

Каждый процессор выделяет четыре ядра без дополнительных потоков, а режимы питания отключены, так что ядра работают только на определенной частоте. Для тестирования IPC мы используем следующие правила. Недавно велись споры на тему, справедливо это или нет, и вот мнение: это тест IPC, а не тест эффективности системы. DRAM настроен так, как официально поддерживает процессор, поэтому в новых процессорах это DDR4-2933, а для предыдущего поколения DDR4-2666. Запуск двух процессоров на той же частоте DRAM дает несправедливое преимущество одному из них: это либо большой оверклок / андерклок, либо отклонение от предполагаемого дизайна. Официальная поддержка DRAM является частью технических характеристик оборудования, равно как и размер кэшей или количество портов выполнения.

Мы используем каждый процессор на четырех ядрах, без многопоточности, на частоте 3,0 ГГц. Итак, для теста был взят новый Ryzen 7 2700X, первое поколение Ryzen 7 1800X и до-Zen Bristol Ridge на базе A12-9800, основан на платформе AM4 и использует DDR4. Приступим к тестам.

Проблема с попыткой определить увеличение IPC на 3% состоит в том, что 3% могут легко затеряться в шуме контрольного прогона: если кэш не будет полностью установлен до запуска, мы можем столкнуться с разной производительностью. В этом графике мы использовали первое поколение Ryzen 7 1800X в качестве 100-процентного маркера, а синие столбцы — как Ryzen 7 2700X. Как показано выше, большее количество тестов приходится на диапазон ± 2%.

Мы не включили результаты подтестов GeekBench в вышеприведенный график, но большинство из них показывает прирост 2-5%. Однако при вычислении тяжелых задач преимущество составило 3-4%: здесь есть Corona, LuxMark, CineBench и GeekBench.

Звучит, как звон монет для AMD. Если мы возьмем результат Cinebench R15 nT и тесты памяти Geekbench, среднее значение прироста по всем тестам составит + 3,1% для нового Ryzen 2700X.

Вероятно, это признак того, что AMD также отрегулировала управление одновременной многопоточностью. Возвращаясь к результату Cinebench R15 nT, который показал 22-процентный прирост: у нас также было несколько других тестов IPC, выполненных на 3,0 ГГц, но с 8C / 16T (которые мы не могли сравнить с Bristol Ridge), и некоторые другие тесты также показали 20% + прирост. Этот вопрос требует дальнейшего тестирования.

Общее улучшение на 10%

С учетом преимуществ нового производственного процесса 12LP у нас возник вопрос, почему AMD не переработала некоторые элементы микроархитектуры для получения еще более высокого результата. В конечном счете оказывается, что «дармовое» увеличение частоты достаточно просто перенести на тот же дизайн (как уже упоминалось ранее, дизайн 12LP основан на 14LPP с улучшением производительности). В прошлом такое решение, возможно, не упоминалось бы как отдельная линейка продуктов. Таким образом, продвижение продукта по одному и тому же дизайну — это легкая победа, позволяющая командам сосредоточиться на следующем крупном редизайне ядра.

Подытожив вышесказанное, AMD ранее уже заявляла о своих намерениях касательно Zen + Core — на CES в начале года AMD сказала, что хочет, чтобы Zen + и будущие продукты вышли за пределы «отраслевого стандарта» 7-8% производительности каждый год.

Это около 10% прироста, но по крайней мере, на бумаге. Очевидно, что 3% IPC недостаточно, поэтому AMD сочетает в себе прирост производительности с увеличением частоты +250 МГц, что составляет примерно еще 6% -ный прирост пиковой частоты, с лучшей работой в турборежиме с Precision Boost 2 / XFR 2. Посмотрим, что скажут тесты.

Precision Boost 2 и XFR2: Нужно больше герц

Одно из самых серьезных изменений в новой серии Ryzen-2000 – реализация турбо режима процессора. До этого момента (за исключением недавнего запуска APU) процессоры полагались на пошаговую реализацию функции: система определяет, сколько потоков загружено, пытается реализовать определенную частоту на этих ядрах, если это возможно, а затем обращается к справочной таблице отношения количества потоков к частоте. Цель AMD Precision Boost 2 — сделать этот процесс более динамичным.

Этими факторами могут быть любые из нижеперечисленных (хотя и не только они): На слайде от AMD представлена эта функция: система будет определять, какая часть запаса производительности все еще доступна, и турбировать процессор, насколько это возможно, пока не достигнет одного из ограничивающих факторов.

  • Общая пиковая мощность чипа
  • Индивидуальное напряжение / частотный отклик
  • Тепловые взаимодействия между соседними ядрами
  • Ограничения мощности для отдельных ядер / групп ядер
  • Общие тепловые характеристики

Новое программное обеспечение AMD Ryzen Master 1.3, используемое на процессоре серии Ryzen 2000, имеет несколько индикаторов для определения предельных факторов. По большей части, способ турбирования процессора и реагирования на окружающую среду будет прозрачным для пользователя.

Мы можем рассматривать внутреннее расчетное энергопотребление каждого ядра индивидуально, так как, к счастью, AMD оставила эти регистры открытыми, и мы получили следующие данные: Лучший способ проверить это в действии, с моей точки зрения, — взглянуть на энергопотребление процессоров первого и второго поколения Ryzen.

Это означает, что мы получаем цифры, отличающиеся от номинального TDP, но опасность здесь в том, что у Ryzen 7 2700X на 10 Вт TDP выше, чем у Ryzen 7 1800X, где 2700X потребляет больше энергии, и может показаться, что это ответ TDP. Это только потребляемая мощность ядер, а не всего процессора, которая будет включать контроллер DRAM, Infinity Fabric и процессор IO.

Построение графика потребления энергии дает такую картину:

Давайте изменим график как функцию пиковой мощности: Даже в этом случае ясно, что Ryzen 7 2700X потребляет больше энергии, до 20 Вт, при различном количестве потоков.

Результаты уже не так очевидны: похоже, 1800X потребляет в процентах от максимальной мощности больше при низком количестве потоков, но 2700X потребляет больше на среднем количестве потоков.

Пользователи, которые хотят разместить процессор с низким энергопотреблением в системе небольшого форм-фактора, могут захотеть отключить этот режим и вернуться к стандартной пошаговой функции для контроля термального режима. Стоит отметить, что конечный результат Precision Boost 2 имеет две стороны: более высокая производительность, но также повышенное энергопотребление.

Он похож на Multi-Core Enhancement, который является особенностью некоторых материнских плат Intel, предназначенных для выхода за лимиты турбо режима процессора. Замечание — несмотря на то, что маркетинговое название звучит как Precision Boost 2, внутреннее имя функции в BIOS «Core Performance Boost». Первоначально мы отключили его, думая, что это инструмент производителя материнских плат, чтобы провести некоторые чистые тесты. Однако, это всего лишь стандартная PB2 от AMD: при отключении «Core Performance Boost» отключит PB2. Выглядит как странное разногласие между инженерами и маркетингом AMD.

Extended Frequency Range 2 (XFR2)

Для серии Ryzen 2000 AMD изменила работу XFR. В предыдущем поколении он применялся на некоторых процессорах, позволяя им превышать максимальную частоту турбо режима, когда тепловая ситуация способствует более высоким частотам и более высокому напряжению в состояниях с низким количеством потоков. У нового поколения XFR по-прежнему имеет отношение к тепловому режиму, однако теперь применяется к любой нагрузке на ядро: если температура процессора до 60ºC, частота может увеличиваться независимо максимальной частоты Precision Boost 2 (так почему бы не получить больше от применения PB2?). Тем не менее ядро все же должно находиться в подходящем диапазоне напряжения / частоты, чтобы сохранить стабильность.

ASUS не вникает в конкретные детали, однако я подозреваю, что он реализует более агрессивную версию, возможно, расширяя кривую напряжения / частоты, поднимая пределы мощности и / или регулируя температурный предел.
На некоторых материнских платах, таких как ASUS Crosshair VII Hero, есть дополнительные возможности для поддержки XFR2 за пределами реализации AMD.

Новые чипсеты и материнские платы X470

Фокус на мощности

Это две high-end материнские платы на новом чипсете X470. Для наших обзоров продукции AMD мы получили две материнские платы: ASUS ROG Crosshair VII Hero (Wi-Fi) и MSI X470 Gaming M7 AC.

Или просто любит сидеть на образцах для обзоров
Катамари любит материнские платы.

Технически X470 имеет ту же поддержку PCIe и SATA, что и в более старом наборе микросхем X370, и некоторое время AMD будет реализовывать оба чипсета одновременно для основных производителей материнских плат. Новый чипсет X470 должен занять место над чипсетом X370, хотя, глядя на спецификации, пользователи могут даже не заметить разницы. Обе материнки будут использовать сокет AM4, который AMD поддерживает уже несколько поколений.

В настоящее время чипсет X370, построенный на 55-нм производственном процессе с использованием ASMedia IP, работает на 6,8 Вт TDP (при полной нагрузке). Основные изменения в чипсете касаются энергопотребления. Это связано с улучшенной инфраструктурой питания внутри чипа, и AMD также утверждает, что общая пропускная способность улучшена. Касательно X470 нам сообщили, что это тот же процесс и IP, но чип теперь будет потреблять на пике 4,8 Вт и 1,9 Вт в режиме ожидания. Микропрограммное обеспечение чипсета также настроено на обеспечение лучшей поддержки overclocked памяти и её стабильности.

Эта новая опция технически не требует поддержки чипсета, однако установщик проверяет наличие чипсета X470 перед предоставлением бесплатной лицензии, в противном случае программное обеспечение обойдется в 20 долларов США, и будет без брендинга AMD. Следующая важная составляющая — StoreMI, чему мы посвятим следующую статью.

Новые материнские платы X370, у которых уже обновлен BIOS, будут иметь логотип «Ryzen 2000 Desktop Ready» на коробке, однако платы X470 поддерживают новые процессоры в любом случае. Все платы X470 и платы X370 с последними обновлениями BIOS будут поддерживать новые процессоры Ryzen 2nd Gen.

Boot Kit AMD

Для покупателей материнских плат X370 / B350 / A320, имеющих старую прошивку, AMD предлагает решить проблему через страницу поддержки. Потребители должны сначала попытаться заменить плату на новую с обновленным BIOS у розничного поставщика, но в случае неуспеха пользователи с зарегистрированными покупками могут получить «загрузочный комплект AMD» — процессор A-серии в краткосрочную аренду, с помощью которого можно обновить BIOS под свой новый процессор.

AMD предоставит комплект бесплатно, если пользователь:

  • Покажет фото новой материнской платы серии 300,
  • Покажет фото нового процессора серии Ryzen 2000,
  • С номерами моделей / уникальными серийными номерами в кадре и,
  • Копию счет-фактуры на покупку.

Это означает, что пользователям, которые хотят воспользоваться преимуществами Boot Kit, придется покупать компоненты в розницу, и бывшие в употреблении. В комплект входит процессор A-серии (Bristol Ridge) и кулер, а также предварительно оплаченная маркировка для возврата оборудования. Такой щедрый набор для обновления BIOS материнской платы – неслыханное ранее предложение. До этого пользователям приходилось решать вопрос через продавца и платить за RMA. Однако можно предположить, что AMD имеет достаточное количество процессоров серии A, чтобы это не было проблемой, а положительная реакция от такого сервиса перевешивает затраты на отправку и возврат.

Пользователи, которым нужен Boot Kit, могут перейти по этой ссылке, чтобы найти официальные данные.

Материнские платы X470

Каждый производитель уже анонсировал несколько новых материнских плат под чипсет, хотя ясно, что это далеко не полный стек.


Большинство продавцов будут предлагать X470 и X370 одновременно, и X470 займет нишу премиум — продукта.

ASUS ROG Crosshair VII Hero

Первая материнка, которую мы открыли, была ASUS ROG Crosshair VII Hero (Wi-Fi). Упаковка оказалась изрядно потрепанной – то ли при доставке, то ли при хранении.

2 и усиленным PCIe для работы с SLI x8 / x8. С первого взгляда мы видим несколько отличных опций: комбинированную 12-фазную подачу питания (вероятнее всего 10 + 2) на CPU, с двумя слотами M. Задняя панель ввода-вывода предварительно прикреплена к системе с помощью кожуха, и имеется небольшой кабель, соединяющий встроенные светодиоды на материнской плате.

Механизм защелки тот же, как и размеры кулера. Сокет не изменился: AM4 с 1331 отверстием для процессора.

ASUS добавила на плату ряд RGB-разъемов, а также что-то, что выглядит как удобные точки считывания напряжения (или точки, позволяющие использовать любую 5-вольтовую систему, например, подсветку с холодным катодом?).

2 один — PCIe 3. Из двух сокетов M. 0 x4 от чипсета. 0 x4 от CPU, а другой — PCIe 2. Для подключения устройств хранения также имеется шесть портов SATA.

1, USB 3. На плате находятся различные USB 3. 0 порты, хотя мне показалось довольно забавным, что ASUS решила подписать порты «Native USB», чтобы подчеркнуть, что это относится к чипсету, а не контроллеру. 0 и USB 2. Это имеет смысл для VR, для которого требуются собственные порты, что позволяет пользователю устанавливать разъемы передней панели в нативные USB-разъемы.

Она базируется на кастомном кодеке Realtek ALC1220A, аудиоконденсаторах Nichicon, экранах EMI, разъединении PCB и комплекте софта. Что бы премиум-плата сияла ещё ярче, ASUS разместила свою звуковую карту SupremeFX.

11ac Wi-Fi; два порта USB 2. На обратной стороне мы имеем: кнопку ASUS BIOS Flashback, так что пользователи могут обновлять BIOS без установки CPU / GPU / DRAM; кнопку Clear CMOS; 802. 0, два порта USB 3. 0; комбинированный PS/2, восемь портов USB 3. 1 (один тип-C), порт гигабитного Ethernet и аудиоразъемы.

MSI X470 Gaming M7 AC

В отличие от предыдущей, упаковка MSI X470 Gaming M7 AC не была испорчена, и продемонстрировала изображение материнской платы непосредственно на лицевой стороне. Обычно мы привыкли наблюдать имена «MSI» и «ACK» на материнских платах Gaming M7 с Wi-Fi, что указывает на использование сетевого контроллера Killer, но не здесь.

Очевидными функциями являются поддержка DRAM, множество дросселей питания и U-образный радиатор, который скрывает два слота M. С первого взгляда материнская плата выглядит менее сосредоточенной на «стиле», чем ASUS, хотя MSI тоже бросается в глаза. 2.

Мы можем спорить, имеет ли смысл вышеуказанная концепция (это, безусловно, помогает PCIe), но здесь явно нашлось место для эстетики. Близкий взгляд на разъемы DRAM показывает, что именно так MSI развивает свою концепцию «усиленного слота памяти».

Теплоотводы питания не соединены вместе, что, возможно, свидетельствует о стоимости, или уверенности MSI в эффективности подачи электроэнергии. Я подсчитал 14 дросселей на этой материнской плате, и это, возможно, крупнейшая опция доставки питания на любой материнской плате AM4. Стоит отметить, что MSI использует здесь 8-контактное подключение питания к CPU, по сравнению с 8 + 4-контактным расположением на ASUS ROG.

Это функция разгона Game Boost от MSI, разработанная таким образом, что каждый поворот дает больший уровень разгона процессору. Одной из наиболее эзотерических особенностей последних материнских плат MSI является эта большая ручка, с цифрами до 11. К счастью, рядом с ручкой есть кнопки выключения питания / перезагрузки. Раньше такая функция была бы слишком тяжелой для большинства процессоров, в попытке повысить частоту как можно больше, ранее мы никогда не могли выйти за рамки «2» при воздушном охлаждении.

MSI добавляет программное обеспечение по лицензии компании Nahimic, которое предлагает различные настройки эквалайзера и дополнительные преимущества для геймеров. Брендированный MSI Audio Boost 6 аудио не особо отличается от конкурентов: кодек Realtek ALC1220 со специализированными аудиоконденсаторами, экраном EMI и разъемом PCB.

На задней панели мы видим два порта USB 2. Как и ASUS, MSI предлагает функцию обновления BIOS без установленного CPU / GPU / DRAM. 0, модуль Wi-Fi 802. 0: порт PS/2, четыре порта USB 3. 1, порт Gigabit Ethernet и аудиоразъемы. 11ac, два порта USB 3.

Поскольку большинство корпусов предназначены для размещения любых форм-факторов материнской платы, пользователи, которые используют более старые корпуса и не удаляют ненужные опорные винты, могут вызвать короткое замыкание и, возможно, разрушение аппаратной части. Несколько интересных замечаний касательно задней панели платы — около области радиатора чипсета, MSI разместила предупреждение о том, винты-стойки не должны кататься материнской платы. Хотя, если пользователь не удаляет старые опоры, я сомневаюсь, что он озаботиться чтением текста на обратной стороне материнской платы.

В данном случае шесть. Вот приятное дополнение к материнской плате: пользователю сообщают количество слоев PCB. Материнские платы, для которых цена не является аргументом, например, серверные системы, могут иметь двенадцать. Что бы было понятнее, самые дешевые материнские платы обычно имеют три или четыре слоя, большинство основных плат будет иметь шесть или иногда восемь, а хай-энд материнки для настольных ПК обычно имеют восемь или десять. Дополнительные опции, такие как двойная медь или защита от высокой влажности, могут добавить + 50% к стоимости чистой печатной платы.

StoreMI путь к более быстрому JBOD

Когда AMD выпустила APU Ryzen в начале этого года, одним из второстепенных анонсов стало продвижение программного обеспечения под названием FuzeDrive от Enmotus. Софт предлагался потребителям за дополнительные 20 долларов. Для новых десктоп процессоров серии Ryzen-2000 и платформы X470 это программное обеспечение стало частью программного стека AMD и может быть бесплатно загружено с сайта AMD под брендом StoreMI.

Преимущества кэша

Принцип работы StoreMI заключается в том, что пользователь может взять систему среднего уровня, работающую на медленном диске, и добавить небольшой, но быстрый привод, чтобы увеличить скорость работы с наиболее часто используемыми файлами. Программное обеспечение создает «систему хранения» из быстрого и медленного привода, предоставляя пользователю один диск с общей емкостью двух дисков, в то время как софт реализует распознавание паттернов, чтобы понять, какие файлы нужно разместить на быстром диске для максимального ускорения системы.

Быстрые системы хранения несколько затратны, в то время как объем данных обычно велик: сети доставки контента (CDN), такие как Netflix или Steam, используют многоуровневое хранилище и кэширование. Многоуровневое хранилище не новость — оно используется во многих корпоративных системах хранения, поддерживаемых сложным программным обеспечением. Таким образом часто используемые фильмы или игры доступны из хранилища, которое находится рядом с пользователем и одновременно является самым быстрым из доступных.

Сюда загружаются файлы и программы, когда процессору необходимо получить доступ к данным или держать данные «близко» для постоянного доступа. В современном компьютере самым быстрым хранилищем является встроенная память / DRAM. В последние годы некоторые энтузиасты использовали RAMDisks, создавая дисковое пространство с использованием оперативной памяти, чтобы получить быстрый репозиторий. Так было в течение всей истории программного обеспечения. Единственным недостатком такого метода является то, что данные теряются при перезагрузке, поскольку данные, хранящиеся в DRAM, являются неустойчивыми (или не постоянными).

Эти же пользователи часто имеют механический жесткий диск, основанный на вращающихся пластинах, в качестве резервного хранилища для больших объемов, обычно называемый жестким диском (HDD), а скорость ограничена тем, как система считывает данные с диска, который вращается со скоростью 7200 или 5400 раз в секунду. Машина современного энтузиаста скорее будет включать какой-то твердотельный накопитель (SSD) на основе флэш-памяти NAND: либо диск, подключенный через полосы PCIe, как супербыстрое хранилище, либо подключенный через порт SATA. Многие машины по-прежнему поставляются с жесткими дисками в качестве основного и массового хранилища, что очень беспокоит пользователей, которых привлекают преимущества использования SSD.

Объединенный одиночный привод будет иметь емкость всех дисков в стеке, и программное обеспечение будет управлять тем, какие данные следует переместить в быстродействующий накопитель. С StoreMI пользователь может использовать любую конфигурацию PCIe SSD, SATA SSD или HDD и реализовать их виде многоуровневого накопителя. Этот процесс является постепенным, программному обеспечению потребуется время, чтобы узнать, какие файлы являются самыми важными – а это значит, что эффект не будет заметен сразу, но после третьей или четвертой загрузки программного обеспечения или игры, система должна показать хорошие результаты.

Этот процесс не добавляет дополнительной емкости «единому диску», но DRAM действует как самый быстрый кэш и будет хранить только копии данных, хранящихся на других дисках, чтобы избежать потери данных. Инструмент StoreMI также позволяет пользователю добавлять до 2 ГБ оперативной памяти в стек хранилища. В беседе с AMD нам сообщили, что 2 ГБ является хорошим объемом памяти для кэша DRAM: из-за особенностей работы программного обеспечения, больший кэш не покажет ощутимого прироста, по словам кампании. Как упоминалось выше, поскольку встроенная память нестабильна, кэш в памяти для ускорения работы будет потерян при перезапуске. Софт позволяет даже системам с всего лишь 8 ГБ общей системной памяти использовать программное обеспечение.

Конфигурации

В отличие от технологии кэширования RST (которая недавно поддерживала кэширование на незагрузочных дисках), StoreMI от AMD можно использовать в любое время жизненного цикла системы. Для любого пользователя, который хочет отложить покупку SSD-накопителя NVMe или SSD SATA, или повременить с покупкой более крупного диска, есть возможность не спешить и добавить новый диск в многоуровневое хранилище позднее.

При работе с загрузочным диском AMD рекомендует сначала установить операционную систему на более медленный и вместительный диск, а после произвести добавление чистого SSD в качестве уровня быстрого доступа, хотя противоположное также возможно для пользователей, которые хотят добавить более объемный диск позже (могут быть дополнительные шаги для завершения процесса). StoreMI может поддерживать практически любую конфигурацию, с участием загрузочных дисков и дисков хранения. Единственное различие заключается в том, что программное обеспечение, скорее всего, переместит большое количество данных в начале работы.

Конфигурации, которые предлагаются для StoreMI:

  • HDD + DRAM
  • HDD + SATA SSD
  • HDD + SATA SSD + DRAM
  • HDD + NVMe SSD
  • HDD + NVMe SSD + DRAM
  • SATA SSD + DRAM
  • SATA SSD + NVMe SSD + DRAM
  • NVMe SSD + DRAM

Наибольшее заметное улучшение должно произойти в конфигурации 4, когда SSD NVMe сопряжен с механическим жестким диском.

AMD заявляет, что если стек хранилища распространяется от родного чипсета до портов SATA на базе контроллера, программное обеспечение, скорее всего, перенесет файлы, связанные со спящим режимом, на диск на родных портах SATA для обеспечения стабильности; этот процесс может занять до 30 минут.

Удаленный диск останется с нулевыми данными и может быть удален из системы или использован для других целей. Пользователи также могут удалять диски из многоуровневого хранилища, если есть достаточно места для размещения всех данных на диске, который остается в уровне.

Серьезное ограничение: 256 ГБ на Fast Tier

Важный момент, не упомянутый в наших первоначальных брифингах, когда FuzeDrive был запущен вместе с APU, но ясно освещенный в руководстве пользователя StoreMI, заключается в том, что совместная лицензия AMD и Enmotus оговаривает, что более быстрый диск в уровне может иметь размер не более 256 ГБ.

При добавлении диска размером более 256 ГБ в качестве уровня быстрого доступа, система автоматически разбивает пустой диск, предлагая дополнительную емкость как отдельную букву диска.

Пользователям в этом случае потребуется перенести операционную систему (используя другое программное обеспечение) с SSD на HDD, затем загрузить систему с жесткого диска, и добавить (теперь пустой) SSD в качестве быстрого уровня доступа. Добавление емкого жесткого диска в качестве медленного уровня к загрузочному диску SSD приведет к проблемам только в том случае, если емкость SSD больше 256 Гб.

Как решение — оставить диски разделенными, и такие элементы, как папка Steam, вручную разнести на разные диски, оставив любимые игры на SSD. Некоторые пользователи могут решить, что здесь требуется слишком много усилий — добавление 3Гб жесткого диска к SSD-накопителю размером 512 ГБ не должно быть таким сложным. Такой случай рассматривается как наиболее вероятный. Однако StoreMI больше ориентирован на системы, которые изначально имеют емкий жесткий диск, — для добавления небольшого быстрого SSD, скажем, 64 ГБ-128 ГБ.

Частота отказов: недостатки JBOD

Большинство вариантов объединения дисков в массиве модифицируют элемент скорости (чтение данных по многим дискам одновременно), и защиту от сбоев (данные реплицируются или вводится бит четности). Обычно параметры массива хранилища объединяют обе функции, при этом фокусируясь на одной функции в ущерб другой. Для пользователей, которым нужно хранить файлы, один из вариантов объединения дисков известен как JBOD или «просто куча дисков». JBOD не предлагает ни дополнительной скорости, ни защиты от сбоев.

Включение восьми дисковых накопителей на 10 ТБ в JBOD будет видно системе как один диск на 80 Тбайт. Массив JBOD делает одно: он объединяет диски в массив, чтобы отображать их как одно общее файловое пространство, и воспринимает массив именно так. В результате он по-прежнему работает только с одним приводом, но, если один из дисков в массиве JBOD выходит из строя, массив теряет целостность и разрушается. Однако он не считывает и не записывает на диски одновременно — JBOD будет попросту записывать данные последовательно, и считывать данные с диска, на котором они находятся. И если один привод имеет среднюю частоту отказа, то ожидаемая частота отказа при работе восьми накопителей одновременно будет в восемь раз выше, чем для каждого диска отдельно. Без специализированных инструментов все данные из всего массива, как и данные на этом конкретном диске, почти наверняка будут потеряны.

Нет механизма, с помощью которого данные будут защищены, и, если один диск в стеке выйдет из строя — данные на всех дисках теряются. В этом контексте хорошо видно, что StoreMI страдает от такой же недостаточной защиты от сбоев дисков. Если загрузочный диск – это дешевый SSD с NAND низкого качества, или жесткий диск устарел, то потеря данных на обоих дисках оказывается реальной возможностью.

Например, если пользователь хочет разместить 10 дисков в стеке, это может означать катастрофу. Первоначально я считал, что это серьезная проблема. Это означает, что большинство пользователей, по всей вероятности, смогут только соединить только два диска в один уровень. Однако критичность проблемы сильно упала, когда я узнал о максимальном размере быстрого уровня в 256 ГБ. Поскольку StoreMI перемещает данные между SSD и жестким диском, может возникнуть дополнительная проблема. Реакция AMD на угрозу сбоев состояла в том, чтобы показать, что пользователи должны использовать резервное копирование в любом случае, и никаких конкретных комментариев не было сделано на тему увеличения частоты отказов двухдискового стека в сравнении с одним диском. Ни AMD, ни AnandTech не воспринимают этот недостаток как-нибудь серьёзно, учитывая, что современные твердотельные диски MLC и TLC очень хорошо справляются с управлением поврежденными блоками данных и имеют встроенное избыточное представление. В этом случае происходит больше записей данных на SSD с течением времени, чем у отдельного загрузочного диска обычного пользователя, в результате NAND быстрее изнашивается.

А тесты !?

В настоящее время мы не успели напрямую протестировать StoreMI, сосредоточившись на других проектах и предстоящих событиях. Если у нас будет время, мы предоставим полноценную статью о StoreMI.

Параметры тестирования

Тестирование с установленными патчами Spectre и Meltdown

Для нашего тестирования новых процессоров AMD Ryzen 2000 и процессоров Intel мы использовали последнюю версию Microsoft Windows с последними обновлениями, а также обновления микрокода BIOS, чтобы быть уверенными, что уязвимости Spectre и Meltdown были пропатчены, как это могло бы быть. Это означает, что некоторые данные, используемые в этом обзоре, не сопоставимы с предыдущими ревью, однако со временем мы планируем обновить свою базу данных последними исправлениями.

Тестовый стенд

В соответствии с нашей политикой тестирования процессора мы берем материнскую плату категории премиум-класса, подходящую для сокета, и оснащаем систему подходящим объемом памяти, работающим на максимальной поддерживаемой частоте производителя.

Хотя эти комментарии имеют смысл, в конечном итоге очень немногие потребители используют профили памяти (XMP или другие), поскольку они требуют взаимодействия с BIOS, и большинство пользователей отказываются от поддерживаемых скоростей JEDEC — сюда относятся как домашние пользователи, так и поставщики, которые могут захотеть снизить наценку на пару центов или остаться в пределах, установленных производителем. Отмечается, что некоторые пользователи оспаривают такой подход, упоминая, что иногда максимальная поддерживаемая частота является довольно низкой, или более быстрая память доступна по аналогичной цене, или что использование поддерживаемых частот может снижать показатели производительности. Там, где это возможно, мы расширим тестирование, чтобы добавить более быстрые модули памяти — либо в этом обзоре, либо позднее.

Анализ мощности

Один из ключевых дебатов вокруг питания сводится к тому, как интерпретируется TDP, как он измеряется и что именно должен означать. TDP или Thermal Design Power, обычно используется как значение требуемой способности рассеивания тепла для используемого кулера, а не потребляемой мощности. Есть несколько тонких физических различий у этих двух понятий, но для простоты большинство пользователей рассматривают TDP как номинальное энергопотребление процессора.

Для любого процессора Intel номинальный TDP — это фактические требования к тепловому рассеиванию (или потребляемая мощность), когда процессор работает на своей базовой частоте. То, что на самом деле обозначает показатель TDP, достаточно сложно определить. Весьма удивляет то, что официальное значение TDP для турбо-режима Core i7-8700 рассчитывается для 3,8 ГГц на всех ядрах, что намного выше указанной базовой частоты. Поэтому для чипа, такого как Core i5-8400, который рассчитан на 65 Вт, это означает, что рейтинг 65 Вт применим только на частоте 2,8 ГГц. Это важный момент для термически ограниченных сценариев, но это также означает, что без этого предела в прошивке потребление энергии не привязано к TDP: Intel не предоставляет значение TDP выше базовой частоты, несмотря на то, что в реальности частота (в турбо-режиме) намного выше. По правде говоря, если процессор ограничен в прошивке до 65 Вт, мы увидим максимум 3,2 ГГц, если загружены все ядра.

Раньше это определялось как пиковая потребляемая мощность ЦП, включая турбо режим, при загрузке всех ядер (такое возможно при вирусе в системе). У AMD TDP вычисляется несколько иначе. AMD определяет TDP как разницу между температурой крышки процессора и температурой заборника вентилятора, разделенной на минимальную требуемую производительность кулера. Теперь TDP является скорее мерой измерения охлаждения. В результате мы получаем скользящую шкалу: если AMD хочет определить кулер с более высокой тепловой производительностью, это снизит TDP. Или, говоря иначе, минимальная производительность охладителя определяется как разность температур, деленная на TDP.

При более холодных тепловых характеристиках 0,4 ºC / Вт TDP будет рассчитан как 50 Вт, или значение 0,1 даст 198 Вт. Для Ryzen AMD диктует, что эта разность температур составляет 19,8ºC (61,8 ºC на процессоре, когда на заборнике вентилятора 42ºC), что означает, что для 105 Вт TDP тепловые характеристики охладителя должны выдерживать 0,189 ºC на ватт.

Это, в конечном счете, делает TDP AMD в большей части показателем производительности охлаждения, чем энергопотребления.

В конечном итоге для некоторых процессоров турбо-режимы определяются справочной таблицей. При тестировании мы также зависимы от прихотей производителя материнской платы. Производители материнских плат не только могут изменить эту таблицу в каждой версии прошивки, но Intel ещё и прекратила делать эти данные официальными. Если система использует X-ядер, то процессор должен работать на частоте Y. В некоторых обзорах у нас было три разных производителя материнских плат, у которых разные таблицы поиска, но все три заявили, что следуют спецификациям Intel. Таким образом, мы не можем сказать, соответствует ли производитель материнской платы спецификациям Intel или нет. Ок, хорошо когда всё просто и понятно.

Даже в случае, когда два процессора произведены одинаково, реакция процессоров на напряжение и частоту на самом деле может быть очень разной. Если этого мало, стоит заметить, что мы ещё зависим и от прихоти случая. Как AMD, так и Intel проходят процесс под названием «биннинг», благодаря чему каждый процессор с производственной линии тестируется в соответствии с определенными стандартами — если он превосходит лучшие стандарты, он маркируется как лучший процессор. Штамп на коробке — это всего лишь гарантированный минимум, а фактическая производительность или тепловые характеристики процессора могут варьироваться от этого самого минимума до чего-то действительно, действительно хорошего. Известен также факт, что если изготовителю нужно большее количество процессоров среднего класса, он может уменьшить процент компонентов, которые соответствуют высокому стандарту, и те же высококачественные процессоры будут маркироваться, как если бы они соответствовали среднему стандарту. Если же он не соответствует этим стандартам, он может быть помечен как что-то еще. Так что процессор — это лотерея.

Этот метод, строго говоря, не самый точный – и поэтому мы будем применять собственные мультиметры. В нашем тестировании мы считываем значения мощности из внутренних регистров процессора, предназначенных для оценки энергопотребления и применения параметров турбо- и кулера. Современные многоядерные процессоры используют разные планы напряжений для разных частей процессора или даже для каждого ядра, поэтому показания программного обеспечения дают нам хорошее понимание разделения мощности для разных частей процессора. И всё же первый метод дает нам больше информации, чем мультиметры. В большинстве ситуаций мы можем получить только два основных важных параметра: расчетное энергопотребление всего чипа и расчетное энергопотребление всех ядер (без контроллера памяти или интерконнекта). Очень удобно, если процессор делает такую информацию доступной, но это не всегда так.

Интерконнект AMD, Infinity Fabric, в сочетании с другими не-ядерными компонентами чипа, потребляет намного больше энергии, чем чипы Intel. Есть очень заметная разница между чипами Intel и AMD, — разница между мощностью ядер и мощностью всего чипа. Как было сказано, AMD привязывает энергопотребление к значению TDP: наш Ryzen 7 2700 показал очень высокую эффективность, хотя мы, похоже, видим средние показатели на Ryzen 5 2600. И это, возможно, оставляет больший запас энергии для Intel, чтобы поднять частоты. Напротив, Intel Core i7-8700K очень легко вырывается за пределы своего TDP, тогда как более старые процессоры Kaby Lake больше соответствуют собственным значениям TDP.

Наши благодарности

Спасибо Sapphire за предоставленные нам нескольких видеокарт AMD. Мы встретились с Sapphire на Computex 2016 и обсудили платформу для будущего тестирования с графическими процессорами AMD на их оборудовании в нескольких предстоящих проектах. Sapphire передал пару RX 460, которые мы используем в качестве карт тестирования процессора. Объем потребляемой мощности GPU может напрямую влиять на производительность ЦП, особенно если процессор должен тратить все свое время на работу с графическим процессором. RX 460 – очень хорошая карта для наших тестов, так как она мощная, имеет низкое энергопотребление и не требует каких-либо дополнительных разъемов питания. Sapphire Nitro RX 460 2GB как и прежде следует философии Nitro, и в этом случае представляет собой мощную карту по низкой цене. Его 896 SPs работают на частотах 1090/1216 МГц, и она сопряжена с 2 ГБ GDDR5 с эффективными 7000 МГц.

Несмотря на размер AnandTech, обеспечение высокопроизводительных графических карт для проведения гейм-тестов CPU — довольно сложная задача. Мы также должны поблагодарить MSI за предоставление нам GPU GTX 1080 Gaming X 8GB. Графическая карта MSI GTX 1080 Gaming X 8GB является превосходным продуктом с воздушным охлаждением, занимающим место ниже Seahawk с водяным охлаждением, но выше версий Aero и Armor. MSI очень любезно предоставила нам пару своих хай-энд видеокарт. Карта использует кремниевую матрицу GP104-400 на 16-нм TSMC-процессе, содержит 2560 ядер CUDA и может работать на частоте до 1847 МГц в режиме OC (или 1607-1733 МГц в режиме Silent). Карта достаточно большая, с двумя вентиляторами Torx, индивидуальным дизайном печатной платы, технологией Zero-Frozr, улучшенной PWM и большой задней панелью для облегчения охлаждения. Весьма продолжительное время GTX 1080 оставалась картой №1. Интерфейс памяти составляет 8 ГБ GDDR5X, работающей на частоте 10010 МГц.

Критический компонент для нашей задачи, так как список тестов растет с новыми бенчмарками и играми, а 1TB MX200 – сильное подспорье. Спасибо Crucial за предоставленные нам SSD MX200. Модели 1TB, которые мы используем здесь, поддерживают шифрование TCG Opal 2. Основанные на контроллере 88S9189 от Marvell и использующие микросхему Micron с 16-нм 128-Гбит MLC, это 7-миллиметровые, 2,5-дюймовые приводы, рассчитанные на 100K случайных считываний IOP и с 555/500 МБ/с последовательной скорости чтения и записи. 0 и IEEE-1667 (eDrive) и имеют номинальную выносливость 320 Тбайт с трехлетней гарантией.

AX1200i был первым источником питания, предлагающим цифровой контроль и управление через систему Corsair Link, но под капотом он выдает рейтинг 1200 Вт при 50 ° C с Platinum сертификацией. Спасибо Corsair за предоставленные блоки питания AX1200i. AX1200i полностью модульный, с более крупной 200-миллиметровой конструкцией, с двойным шарикоподшипниковым 140-мм вентилятором для высокопроизводительного использования. Это позволяет обеспечить минимум 89-92% эффективности при 115 В и 90-94% при 230 В. AX1200i также оснащен режимом Zero RPM для вентилятора, который позволяет выключить вентилятор, если источник питания работает под нагрузкой менее 30%. AX1200i спроектирован как рабочая лошадка, с 8 разъемами PCIe для работы с 4 х GPU системами.

Skill за предоставленную память. Спасибо G. Skill поддерживает AnandTech в тестировании процессоров и материнских плат, даже если обзор не касается памяти. На протяжении многих лет G. Skill проводится мировой турнир по разгону с жидким азотом прямо на выставочном этаже. Мы сообщал об их высокопроизводительных и высокочастотных наборах ОЗУ, и о том, что каждый год на Computex G.

Системные тесты CPU

Наш первый набор тестов — общие системные тесты. Этот набор тестов призван эмулировать по большей части то, что люди обычно делают с компьютером, например, открытие больших файлов или обработка небольших стеков данных. Это несколько отличается от нашего офисного тестирования, где используются тестирование по индустриальным стандартам. Так же некоторые из тестов здесь относительно новые и необычные.

Обработка FCAT

Одной из наиболее интересных нагрузок, которая используется на нашем стенде в последних кварталах, является FCAT — инструмент, который мы используем для измерения задержек в играх из-за упавших или пропущенных кадров. Процесс FCAT требует включения цветного оверлея в игру, записи игрового процесса и последующего анализа видеофайла с помощью соответствующего программного обеспечения. Такой софт обычно однопоточный, поскольку видео в примитивном RAW формате, что предполагает большой размер файла, и требует перемещения большого количества данных. Для нашей проверки мы берем 90-секундную запись теста Rise of the Tomb Raider, работающего на GTX 980 Ti на 1440p, размер которой составляет около 21 ГБ, и измеряем время, необходимое для обработки с помощью инструмента визуального анализа.

Со стороны AMD, Ryzen 5 показывает себя лучше, чем Ryzen 7, но результаты находятся в пределах погрешности. FCAT — только однопоточная задача, и она показывает преимущества высокочастотных компонентов и высокого IPC от Intel.

Dolphin Benchmark

Многие эмуляторы связаны однопроцессорной производительностью процессора, а общие отчеты, как правило, предполагают, что Haswell значительно повысил производительность эмулятора. Этот бенчмарк запускает программу Wii, в которой луч отслеживает сложную трехмерную сцену внутри эмулятора Dolphin Wii. Результаты этого теста – вполне надежный показатель скорости процессорной эмуляции Dolphin, которая представляет собой интенсивную одноядерную задачу, использующую большинство аспектов процессора. Результаты приведены в минутах, где сам Wii показал результат 17,53 минуты (1052 секунды).

Новая серия Ryzen-2000, с выросшими IPC и частотой, всё продвигается вперед, обгоняя Skylake от Intel. Dolphin также является однопоточным тестом и исторически предоставляет преимущество процессорам Intel.

3D Movement Algorithm Test v2.1

Это последняя версия написанного нами 3DPM бенчмарка. Цель 3DPM – симулировать частично оптимизированные научные алгоритмы, взятые непосредственно из моей докторской диссертации. Версия 2.1 отличается от 2.0 тем, что передает основные структуры частиц ссылкой, а не значением, и уменьшает количество преобразований double->float->double, выполняемых компилятором. Это дает ускорение на 25% по сравнению с версией 2.0, что означает новые данные.

Однако шестиядерный Coffee Lake i7-8700K зажат между Ryzen 5 2600X и Ryzen 5 2600. В этом многопоточном тесте новый 8-ядерный Ryzen 7 2700X поднялся еще на одну голову выше 8-ядерного Skylake-X от Intel — по сравнению с 1800X.

Agisoft Photoscan 1.3:

Photoscan остается в нашем тестовом наборе из предыдущей версии тестов, однако теперь мы работаем в Windows 10, поэтому в игру вступают такие функции, как Speed Shift на новейших процессорах. Концепция Photoscan – преобразование множества 2D-изображений в 3D-модель — поэтому чем более детализированы изображения, и чем больше таковых, тем лучше модель. Алгоритм состоит из четырех этапов: нескольких однопоточных и нескольких многопоточных, а также имеет некоторую зависимость от кэша и памяти. Для некоторых более разнообразных рабочих задач с многопоточными функциями такие опции, как Speed Shift и XFR, смогут использовать преимущества ожидания или простоев CPU, давая значительный прирост производительности на новых микроархитектурах.

Более медленная сетчатая архитектура Intel в Skylake-X на 8-ядерном 7820X по сравнению с кольцевой архитектурой Coffee Lake 8700K означает, что два меньших ядра на 8700K позволяют ему подняться повыше, и всё же он по-прежнему проигрывает около четырех минут Ryzen 7 2700X. Photoscan — это тест с переменной многопоточностью, эволюция от 1800X до 2700X показывает, что дополнительные TDP и Precision Boost 2 могут буквально сбривать минуты с теста. Для победы Intel здесь нужен большой 18-ядерный процессор, i9-7980XE.

Civilization6 AI Test

В нашем тесте Civilization AI используется Стим версия Civilization 6 и выполняется внутриигровой тест AI для обработки 25 раундов сохранения поздней стадии игры. Мы запускаем бенчмарк на нашем GTX 1080 на 1080p, чтобы гарантировать, что рендеринг не является лимитирующим фактором, а результаты приведены как среднее геометрическое для 25 раундов, чтобы получить среднее время обработки одного раунда AI.

Хотя в тесте AI все же используется несколько потоков, однако высокие одноядерные характеристики Intel приводят эти процессоры к победе.

CPU Rendering Tests

Рендеринг тесты – давно признанный фаворит обзоров и тестов, поскольку код, используемый пакетами рендеринга, обычно оптимизирован, чтобы выжать каждый бит производительности. Иногда рендеринг программ также сильно зависит от памяти — когда у вас есть много потоков, переносящих тонны данных, память с малой задержкой отклика может быть ключом ко всему. Здесь мы берем несколько обычных пакетов рендеринга под Windows 10, а также несколько новых интересных тестов.

Corona 1.3

Corona — это автономный пакет, предназначенный для поддержки программного обеспечения, такого как 3ds Max и Maya, фотореализмом с помощью трассировки лучей. Это просто – направляешь лучи, получаешь пиксели. Ладно, немного сложнее, но этот бенчмарк рендерит фиксированную сцену шесть раз, и выдает результаты в разрезе времени и количества лучей в секунду. В официальных таблицах бенчмарка представлены результаты пользователей с точки зрения времени, однако я считаю, что «лучей в секунду» является лучшим показателем (да и в общем, результаты, где «больше означает лучше», проще объяснять). Corona любит нагромождать потоки, поэтому результаты оказываются в сильной зависимости именно от количества потоков.

Blender 2.78

Старик в мире рендеринг-тестов, Blender всё еще очень популярный инструмент. Нам удалось запустить стандартную рабочую нагрузку на билде Blender от 5 февраля, и измерить время, необходимое для рендеринга первого кадра сцены. Блендер является одним из крупнейших инструментов с открытым исходным кодом, это означает, что как AMD, так и Intel работают активно, чтобы помочь улучшить кодовую базу, что может идти как на пользу, так и во вред их собственной микроархитектуре.

Хотя по соотношению цены и результата Ryzen 7 2700X легко выигрывает у лучших исполнителей. Это тот многопоточный тест, в котором 8-ядерный процессор Intel на базе Skylake выигрывает у нового AMD Ryzen 7 2700X; переменная многопоточность Blender означает, что здесь хорошо себя показывают сеточная архитектура и пропускная способность памяти. Ryzen 5 2600 легко обходит Core i7-6700K.

LuxMark v3.1

Как синтетический, LuxMark может показаться несколько ненадежным в качестве средства визуализации, учитывая, что он в основном используется для тестирования графических процессоров. Однако он предлагает как OpenCL, так и стандартный режим C ++. В этом случае, помимо сравнения в каждом варианте кодирования ядер и IPC, мы также видим, что код C ++ и OpenCL показывают разную производительность на одних и тех же процессорах.

POV-Ray 3.7.1b4

Еще один регулярный бенчмарк в большинстве наборов, POV-Ray. Еще один трассировщик лучей с многолетней историей. Как это часто случается, во время подготовки AMD к запуску Ryzen, база кода стала активно обновляться, так как разработчики вносят изменения в код и выпускают новые апдейты. Наша версия для тестов была взята как раз перед началом таких событий, но со временем мы видим, что код POV-Ray корректируется в соответствии с новыми требованиями.

Cinebench R15

Последняя версия CineBench также стала одной из тех программ, которые использовались везде, в частности, как индикатор производительности одного потока. Высокий уровень IPC и высокая частота дают производительность в ST, тогда как наличие хорошего масштабирования и многих ядер — это результат теста MT.

Intel по-прежнему остается однопоточным чемпионом в таких тестах, как CineBench, но, похоже, Ryzen 7 2700X занял лидерство в многопоточном тесте.

CPU Web Tests

Одна из проблем при запуске веб-тестов — это привычка современных браузеров автоматически устанавливать обновления. Это означает, что в любой продолжительный период бенчмаркинга правило «обновляй это за пределами состояния сравнения» будет всегда нарушено, особенно когда браузеры начинают обновляться, если вы дадите им хоть полсекунды подумать об этом. Несмотря на это, нам удалось найти ряд команд для создания необновляемой версии Chrome 56 для нашего тестового набора 2017. И хотя это означает, что мы не можем быть в ногу со временем с последней версией браузера, это делает оценки сравнения процессоров сопоставимыми.

SunSpider 1.0.2:<a href="">link

Самый старый веб-тест в этой части нашего обзора – SunSpider. Это очень простой инструмент на основе JavaScript-алгоритма, и в конечном итоге является более мерилом IPC и быстродействия памяти, чем что-либо еще, причем большинство высокопроизводительных процессоров показывают примерно равный результат. Базовый тест выполняет 10 циклов и выдает среднее значение. Мы выполняем этот базовый тест 4 раза.

Mozilla Kraken 1.1:link

Kraken — это еще один тест на основе Javascript, использующий тот же тестовый набор, что и SunSpider, но сосредоточенный на более строгих реальных случаях использования и библиотеках, таких как обработка звука и фильтры изображений. Опять же, основное тело теста проходит 10 циклов, и мы выполняем этот базовый тест четыре раза.

Google Octane 2.0:link

Крупнейшие разработчики браузеров, такие как Google и Mozilla, знают, что максимальная производительность JS зачастую является критическим моментом при сравнении с другими разработчиками ОС. Точно так же, как SunSpider является очень ранним тестом JS, а Kraken немного новее, Octane стремится быть более релевантным для реальных рабочих нагрузок, особенно в устройствах с ограниченными возможностями, таких как смартфоны и планшеты.

WebXPRT 2015:link

В то время как предыдущие три теста выполняют вычисления в фоновом режиме, а затем показывают набранные очки, WebXPRT предназначен для лучшей интерпретации визуальных рабочих нагрузок, с которыми сталкиваются профессиональные пользователи. Например, приложения на основе браузера, графические изображения, редактирование изображений, сортировка и анализ данных, научный анализ и финансовые инструменты.

CPU Encoding Tests

Одним из интересных элементов современных процессоров является производительность кодирования. Это включает в себя шифрование / дешифрование, а также перекодирование видео из одного видеоформата в другой. В случае шифрования / дешифрования производительность по-прежнему актуальна для шифрования конфиденциальных данных «на лету» — процесса, с помощью которого современные устройства обычно обеспечивают безопасность программного обеспечения. Использование перекодирования видео для подгонки качества, размера файла и разрешения видеофайла испытывает настоящий бум в последнее время. Это необходимо для подгонки видео под девайс потребителя, или для гейм-стримеров, которые желают выгружать перекодированный поток видео с камеры в режиме реал-тайм. По мере того, как мы переходим в живое 3D-видео, эта задача будет еще более приоритетной, и оказывается, что быстродействие определенных алгоритмов определяется функцией ввода / вывода содержимого.

7-Zip 9.2:link

Одним из фриварных архиваторов, позволяющих оценить производительность процессоров, является 7-Zip. Он работает под лицензией с открытым исходным кодом, является быстрым и простым в использовании инструментом для опытных пользователей. Мы запускаем тестовый режим через командную строку, выполняем четыре цикла и получаем результат.

WinRAR 5.40: link

Для тестового пакета 2017 мы воспользуемся последней версией WinRAR в нашем тесте архиваторов. WinRAR в некоторых аспектах более удобен для пользователя, чем 7-Zip, поэтому мы решили включить его в пакет. Вместо использования бенчмарк режима, как в случае с 7-Zip, здесь мы берем набор файлов, представляющих общий стек (33 видеофайла в 1,37 ГБ, 2834 файла меньшего размера в 370 папках по 150 МБ) сжимаемых и несжимаемых форматов. Показанные результаты — это время, затраченное на кодирование файла. Из-за кэширования DRAM мы запускаем тест 10 раз и получаем среднее значение для последних пяти запусков, когда бенчмарк находится в устойчивом состоянии.

Высокий IPC Core i7-8700K также прекрасно работает. WinRAR требует хорошей базы памяти, поэтому мы видим, что четырехканальные процессоры возглавляют список.

AES Encoding

Алгоритмы, использующие AES-кодирование, широко распространились по всему миру в качестве вездесущего инструмента для шифрования. Однако, это еще один тест-для-ЦПУ, а современные ЦПУ имеют расширение системы команд AES для увеличения производительности шифрования. Мы часто рассматриваем масштабирование как по частоте, так и по ядрам с помощью этого бенчмарка. Мы используем последнюю версию TrueCrypt и запускаем его в бенчмарк-режиме с 1 ГБ данных в DRAM. Показанные результаты — это среднее значение GB / s для шифрования и дешифрования.

HandBrake v1.0.2 H264 and HEVC: link

Как упоминалось выше, перекодирование видео (как кодирование, так и декодирование) является горячей темой в показателях производительности, поскольку темпы создания нового контента нарастают. Первое предположение – изменение стандарта форматирования видео, которое может происходить как с потерей, так и без потери качества. Так же возможно уменьшение качества видео в угоду размера файла. Наряду с любимым кодеком Google, VP9, есть еще два других часто используемых: H264, старый кодек, есть практически везде и оптимизирован для видео 1080p, и HEVC (или H265), целью которого является обеспечение того же качества, что и H264, но при более низком размере файла (или более высоком качестве для одного и того же размера). HEVC важен, поскольку способен передавать потоковое видео в качестве 4к, что означает передачу меньшего количества бит для одного и того же качественного контента.

Handbrake является предпочтительным инструментом для перекодирования, поэтому наш тестовый режим покрывает три области.

Низкое качество / разрешение H264: здесь мы перекодируем 2-часовую 640x266 H264 видеозапись и меняем кодировку с Main profile на High profile, используя very-fast предустановку.

Высокое качество / разрешение H264: аналогичный тест, но на этот раз мы берем десятиминутный двойной файл 4K (3840x4320), отображаемый на частоте 60 Гц и перекодированный с Main на High, используя very-fast предустановку.

Тест HEVC: используя то же видео в HQ, мы меняем разрешение и кодек исходного видео с 4K60 в H264 на 4K60 HEVC.

Core i5-8400 так же показывает себя хорошо, но уступает процессорам Ryzen.
Для перекодирования видео большого размера у HandBrake предыдущего поколения есть проблема с новыми процессорами серии Ryzen-2000, но даже с учетом этого Core i7-8700K впереди с приличным отрывом.

CPU Office Tests

Офисные программы, которые мы используем для бенчмаркинга, — это не конкретные программы, а отраслевые стандартные тесты, которые имеют вес в профессиональной среде. Цель этих тестов — использовать набор программ и методов, с которыми может столкнуться обычный офисный пользователь, например, видеоконференции, редактирование документов, архитектурное моделирование и так далее и тому подобное.

Chromium Compile (v56)

Наш новый тест компиляции использует Windows 10 Pro, VS Community 2015.3 с Win10 SDK для компиляции ночной сборки Chromium. Мы подготовили тест для сборки в конце марта 2017 года, и в нашем тесте мы запускаем новую полную компиляцию. Компиляция — типичный пример рабочей нагрузки с переменной многопоточностью — некоторые процессы компиляции и привязки линейны, тогда как другие части являются многопоточными.

Производительность за доллар у 8700K и 2700X, похоже, оказалась примерно одинаковой. Проведя тестирование на компиляцию, мы видим, что новые компоненты серии Ryzen-2000 сделали серьёзный шаг вперед по сравнению с первым поколением, вероятно, из-за уменьшения времени ожидания кэша и нового precision boost.

PCMark8: link

Несмотря на то, что PCMark впервые появился на свет в 2008/2009 году, Futuremark поддерживает PCMark8, и он остаётся актуальным в 2017 году. В масштабах сложных задач PCMark больше ориентируется на низкопроцентный диапазон профессиональных нагрузок, что делает его хорошим индикатором того, что люди считают «офисной работой». Мы запускаем бенчмарк из командной строки в «традиционном» режиме, то есть C ++ без OpenCL, чтобы удалить графическую карту из уравнения и сосредоточиться исключительно на процессоре. PCMark8 предлагает Home, Work и Creative рабочую нагрузку, при этом некоторые тесты программного обеспечения являются общими, а другие уникальны для каждого набора тестов.

PCMark 10

GeekBench4

Что касается многопоточных тестов, лучшие компоненты Intel и AMD идут ноздря в ноздрю, однако видно, что четырехъядерные процессоры предыдущего поколения отстают.
Если вы живете и дышите GeekBench 4, то результаты однопоточных тестов вознесет Intel на первое место.

CPU Legacy Tests

Наши устаревшие тесты представляют собой контрольные показатели, которые когда-то были впереди своего времени. Некоторые из них являются синтетическими стандартами в промышленности, и у нас есть данные, приходящие в течение уже 10 лет. Все данные здесь были повторно запущены в Windows 10, и мы планируем вернуться к нескольким поколениям компонентов, чтобы узнать, как развилась производительность.

3D Particle Movement v1

3DPM — это написанный нами тест, применяющий базовые алгоритмы 3D-движения, используемые в симуляциях Броуновского движения, и их тестирование на скорость. Высокая производительность вычислений с плавающей точкой, МГц и IPC покажут себя в версии с одним потоком, тогда как многопоточная версия работает с потоками и любит много ядер. Это оригинальная версия, написанная в стиле типичного «не компьютерного» студента, кодирующего алгоритм для теоретической проблемы. Она поставляется без каких-либо неочевидных оптимизаций, которые еще не выполняются компилятором, например false sharing.

CineBench 11.5 and 10

Cinebench — широко известный инструмент для измерения производительности, имеющий отношение к анимационному программному обеспечению MAXON Cinema 4D. Cinebench оптимизировался в течение десятилетия и фокусируется только на мощности процессора. Это означает, что если есть несоответствие характеристик пропускной способности, Cinebench, скорее всего, покажет это несоответствие. Возможно, другое программное обеспечение не использует все доступные инструменты для нагрузки процессора, поэтому релевантность теста для реального мира может быть чисто академической, но, учитывая нашу большую базу данных для Cinebench, трудно игнорировать небольшой пятиминутный тест. В этом тесте мы запускаем современную версию 15, а также старые 11,5 и 10 из-за наших сохраненных данных.

x264 HD 3.0

Аналогично, пакет x264 HD 3.0, который мы здесь используем, также хранится для исторических регрессионных данных. Последняя версия 5.0.1, и она кодирует видеоролик 1080p в высококачественный x264-файл. Версия 3.0 выполняет то же тест в файле 720p, и в большинстве случаев производительность программного обеспечения достигает предела для high-end процессоров, но все еще хорошо работает для среднего и младшего уровня. Кроме того, эта версия выполняется всего несколько минут, тогда как последняя может занять более 90 минут.

Gaming Performance: Civilization 6

Итак, первая игра в наших процессорных гейм-тестах — Civilization 6. Изначально запущенная Sid Meier и его командой, Civ серия пошаговых стратегий стала культовой классикой. Было принесено много извинений за бессонные ночи игроков, которые не могли заставить Ганди начать войну из-за переполнения целых чисел. По правде говоря, я никогда не играл первую версию, но зато играл в каждую часть со второй по шестую, в том числе четвертую, озвученный покойным Леонардом Нимоем. Это игра, в которую легко играть, но трудно играть хорошо.

Однако с Civilization 6 Firaxis ударилась в хардкор и подняла планку визуализации, пытаясь вовлечь вас в игру. Бенчмаркинг Civilization всегда был чем-то вроде оксиморона — для пошаговой стратегической игры частота кадров не особенно важна, и при правильном настроении, достаточно всего 5 кадров в секунду для хорошей игры. В результате, Civilization может потребовать от игрока новую видеокарту и процессор, особенно если играть с высокой детализацией под DirectX 12.

Новая версия Civilization имеет интегрированный «AI Benchmark», хотя в настоящее время она еще не входит в наш портфель тестов по техническим причинам, которые мы пытаемся решить. Возможно, более востребованный результат будет виден во время поздней игры, когда, в более старых версиях, Civilization могло потребоваться 20 минут, чтобы сделать ход игроков AI и передать контроль человеку. Вместо этого мы запускаем графический тест, который обеспечивает пример средних настроек игры в опциях.

Civilization 6 имеет слайдеры для MSAA, Использование Производительности и Использование Памяти. Для разрешений 1920x1080 и 4K мы запускаем одинаковые настройки. Мы запускаем наш Civ6-тест в четвертой позиции для производительности (ультра) и 0 в памяти, а MSAA — 2x. Последние два относятся к детализации и размеру текстур соответственно и оцениваются от 0 (самый низкий) до 5 (экстремальный).

Для обзоров, где мы используем тесты 8K и 16K (Civ6 позволяет сравнивать экстремальные разрешения на любом мониторе) на нашем GTX 1080, мы запускаем тесты 8K, такие же, как 4K, но тесты 16K установлены на самый низкий вариант производительности.

MSI GTX 1080 Gaming 8G Performance

Shadow of Mordor

Следующее имя в нашей битве производительности – РПГ-экшн с открытым миром Middle Earth: Shadow of Mordor (коротко SoM). Игра создана Monolith на движке LithTech Jupiter EX с множеством дополнительных надстроек. SoM углубляется в детализацию и сложность. Основной сюжет игры был написан тем же писателем, что писал Red Dead Redemption, и SoM получила награду Zero Punctuation's Game of the Year в 2014 году.

В то время SoM был уникальным, предлагая динамическое разрешение экрана, позволяющее пользователям использовать настройки с высоким разрешением, которые затем уменьшаются до возможностей монитора. Игры 2014 года весьма устарели для современного тестирования, но SoM имеет стабильный код и множество поклонников, и всё еще может дать стрессовую нагрузку на компьютер игрока. Эта форма естественной передискретизации была спроектирована так, чтобы позволить пользователю получить более полное представление о том, чего хотели разработчики, если у вас есть достаточно мощное графическое оборудование, но нет монитора под разрешение-4K.

Настройки графики включают стандартные параметры, такие как Graphical Quality, Lighting, Mesh, Motion Blur, Shadow Quality, Textures, Vegetation Range, Depth of Field, Transparency и Tessellation. В игре имеется встроенный бенчмарк, и его мы запускаем с применением скрипта, который производит настройку графики, стартует бенчмарк, и парсит результаты, которые тест сбрасывает на диск. Так же имеются стандартные предустановки.

Результаты усредняются по четырем прогонам, и мы выводим средний FPS, 99 процентиль и time under анализ. Мы запускаем бенчмарк на 1080p и нативном 4K, используя наши 4K-мониторы, в настройках Ultra.

MSI GTX 1080 Gaming 8G Performance

Rise of the Tomb Raider

Одной из новейших игр в нашем наборе игровых тестов является Rise of the Tomb Raider (RoTR), разработанная компанией Crystal Dynamics, она же сиквел популярного Tomb Raider, который был любим за свой встроенный автоматический бенчмарк режим. Но не обманитесь: бенчмарк режим в RoTR сильно отличается от прошлого.

Это приводит к интересному набору требований к аппаратным средствам: некоторые разделы игры, как правило, ограничены графическим процессором, тогда как другие, с большим количеством физики на больших дистанциях могут быть ограничены ЦП, в зависимости от того, как драйвер распределит рабочую нагрузку DirectX 12. Визуально предыдущий Tomb Raider поднял планку реализма практически до уровня TressFX, и новый RoTR поднимается еще на ступеньку выше в плане достоверности графики.

Это три сцены, которые должны быть взяты из игры, но было отмечено, что сцены, подобные 2-Пророку, показанные в эталонном тесте, могут быть самыми ограниченными из CPU элементами всего этого уровня, а показанная сцена представляет собой лишь небольшую часть этого уровня. Там, где у старой игры была одна эталонная сцена, в новой игре есть три разных сцены с разными требованиями: геотермальная долина (1-Долина), Могила Пророка (2-Пророк) и позвоночник горы (3-го гора) — и мы тестируем все три. Из-за этого мы сообщаем результаты для каждой сцены на каждой видеокарте отдельно.

Настройки графики для RoTR похожи на опции других игры этого типа, предлагая некоторые пресеты или позволяя пользователю настраивать качество текстуры, уровни анизотропного фильтра, качество теней, мягкие тени, окклюзию, глубину резкости, тесселяцию, отражения, листву, блюм и фичи наподобие PureHair, которые позволяет использовать библиотека TressFX.

На 1080p мы запускаем пресет High, а в 4K мы используем предварительную настройку Medium, которая по-прежнему наносит значительный удар по частоте кадров. По-прежнему, мы тестируем игру на разрешении 1920x1080 и 4K, используя наши собственные 4K-дисплеи.

Тем не менее, несмотря на сложности, мы подготовили сценарий для автоматического запуска бенчмарка четыре раза и парсинга результатов. Стоит отметить, что тест RoTR немного отличается от наших других эталонных тестов тем, что игра сохраняет свои графические настройки в реестре, а не стандартный INI-файл, и в отличие от предыдущей игры встроенный бенчмарк TR не может быть вызван из командной строки. Из полученных данных мы выводим средний FPS, 99 процентиль и time under анализ.

MSI GTX 1080 Gaming 8G Performance

Rocket League

Веселые простые игры в стиле «играй – собирай» отличная забава. По этой причине я большой поклонник франшизы Katamari – просто жмешь «старт» на контроллере, и катишься вперед, подбирая предметы, чтобы вырасти. Чрезвычайно просто. Ну а пока мы не получим версию Катамари на ПК, которую я могу протестировать, мы сосредоточимся на Rocket League.

Игра создана на движке Unreal Engine 3, который на данный момент хотя и устарел, но зато позволяет пользователям как запускать игру на низко-производительных системах, так и выжать все ресурсы из систем помощнее. Rocket League применяет элементы pick-up-and-play, позволяя пользователям вступать в игру с другими людьми (или ботами), чтобы сыграть в футбол без правил на автомобилях. Пользователи, которые тренируются играть, становятся очень серьезными, сражаясь в командах и лигах с очень небольшим количеством настроек, и все находятся на одном уровне. С момента выпуска в 2015 году было продано более 5 миллионов копий игры, которая, похоже, стала звездой в локальных сетях и игровых шоу. Rocket League уверенно становится одним из громких названий в мире киберспорта, а что особенно приятно — когда соревнования можно посмотреть прямо из игрового интерфейса.

К сожалению, большая часть автоматических тестов для игр здесь не подойдет. Исходя из перечисленных факторов, а также потому, что это эту игру очень приятно запустить и поиграть, мы решили найти лучший способ протестировать её. В этом случае мы должны разработать плотный прогон и записать частоту кадров. Кроме того, благодаря движку Unreal 3, Rocket League не имеет бенчмарк режима.

Мы применяем следующий подход: используя Fraps для записи времени, затраченного на показ каждого кадра (и общей частоты кадров), мы применим инструмент автоматизации, чтобы запустить игру с ботами 4v4, при этом система должна выполнить серию действий во время матча, например, переключение углов камеры и движение. Как уже сказано, у Rocket League нет бенчмарк режима, поэтому мы должны выполнить серию автоматических действий, подобных гоночной игре с фиксированным числом кругов.

Чтобы поддерживать согласованность, применяемые нами команды не являются случайными, а так же фиксированны по времени. Так вышло, что описанный метод весьма точно отображает данные по реальному матчу с ботами, включая движение, столкновения, усиления или даже получение внезапной помощи, как бы это ни странно звучало для автоматизированного набора команд. Мы начинаем запись сразу после начала матча и записываем в течение 4 минут игрового времени (думаю, 5 кругов DIRT: Rally benchmark), и определяем среднюю частоту кадров, 99-й процентиль и time under. Мы также проводим тесты на одной и той же карте (Aquadome, которая, как известно, является тяжелой картой для графических процессоров из-за воды / прозрачности) и с постоянными настройками автомобиля.

MSI GTX 1080 Gaming 8G Performance

Grand Theft Auto

Долгожданная итерация франшизы Grand Theft Auto попала на полки 14 апреля 2015 года, и AMD, и NVIDIA приложили усилия для оптимизации игры. В GTA нет графических пресетов, но все же игра открывает новые возможности для пользователей и расширяет границы современной графики, нагружая даже самые мощные компьютеры до предела при помощи Advanced Game Engine от Rockstar под DirectX 11. Независимо от того, летает ли пользователь высоко в горах, где понадобится прорисовка мира на дальних дистанциях, или имеет дело с сортированным мусором в городе, когда он сгибается до максимума, игра создает потрясающие визуальные эффекты, плюс напряженную работу как для процессора, так и для графической карты.

Внутренний бенчмарк включат пять сценариев: четыре коротких панорамных сцены с переменным освещением и погодными эффектами, плюс пятая – последовательность действий продолжительностью около 90 секунд. Для тестирования мы написали несколько скриптов для встроенного в игру бенчмарка. Это отличное сочетание рендеринга дальних дистанций, за которым следуют действия с рендерингом на ближней дистанции. Мы решили использовать только последнюю сцену, которая включает полет на реактивном самолете, затем поездку на автомобиле через город через несколько перекрестков, и в конце — столкновение с бензовозом, который взрывается, как и автомобили вокруг него. И к счастью, игра выдаёт все необходимые результаты тестов.

Некоторые параметры, такие как текстура / тень / шейдеры / качество воды переключаются от низкого качества до очень высокого. В GTA нет графических предустановок, зато пользователь может вручную настраивать параметры, такие как плотность населения и дальность прорисовки с помощью слайдеров. В верхней части экрана есть удобная опция, который показывает, сколько видеопамяти будет потреблять игра при этих параметрах, с очевидными последствиями, если пользователь запрашивает больше видеопамяти, чем имеет на карте (хотя нет очевидной подсказки, если у вас слабая GPU с большим количеством видеопамяти, например, R7 240 4 ГБ). Другие варианты настроек включают MSAA, мягкие тени, пост-эффекты, разрешение теней и расширенные настройки дистанционного рендеринга.

Результатом будут средние значения по четырем прогонам, средний показатель частоты кадров, 99-м процентиль и time-under анализ. В итоге, мы запускаем тесты в разрешении 1920x1080, используя значения Very High в настройках, а также на 4K с использованием значения High в большинстве из них.

MSI GTX 1080 Gaming 8G Performance

Выводы: бремя конкуренции

На протяжении всех приключений AMD и Zen погоня за высокопроизводительными вычислениями x86 имеет две цели: быть конкурентоспособными, и быть лучшими. Несомненно, первое поколение Ryzen преуспело в том, чтобы быть конкурентоспособным, а аналитики и торговые точки демонстрируют процессоры Ryzen в топ-списках продаж, и предоставляют аналитические тесты, где лучшие чипы AMD конкурируют с высокопроизводительными десктоп компонентами Intel. Цель на следующие нескольких лет состоит в том, чтобы захватить эти легкодоступные преимущества микроархитектурны, а позднее получить и использовать преимущества нового техпроцесса. Первый этап — второе поколение Ryzen, известное как серия Ryzen-2000.

Объединив это с увеличением частоты, полученным от производственного процесса GlobalFoundries 12nm, и турбо-функциями, как Precision Turbo Boost, которые делают интуитивно понятным большинство температурных ограничений, AMD в целом достигла 10-процентного прироста производительности между поколениями. В этом обзоре мы показали, что AMD выполнила свою задачу по дополнительному увеличению чистой производительности на 3%, при этом наши показатели показывают + 3,1%. Если бы это была Intel, мы бы кричали о большом и резком прорыве, но AMD все сидит на Zen дизайне, и основное внимание уделяется следующему полному микроархитектурному обновлению в Zen 2. Это звучит не так уж и честно, так как на первый взгляд это всего лишь небольшие улучшения процесса производства, а также некоторое разумное сокращение латентности кэша. Поэтому большинство пользователей и журналистов поднимают большие пальцы вверх в знак доверия к AMD сейчас, надеясь увидеть больший скачок в следующий раз.

4K гейминг анализ

Тем не менее, все хотят знать о результатах тестов серии Ryzen 2000. Мы начинаем с игр, и в первую очередь с наших графиков производительности/цены по итогам хай-энд 4K гейминга. Наши результаты берут R7 1800X в качестве базовых «100%», и мы показываем среднее геометрическое по всем нашим игровым тестам на 4K.

Процессоры Intel были на 0-4% выше 1800X, причем оба процессора Coffee Lake находились на этой вершине в +4%. Как видно из результатов, новые процессоры серии Ryzen 2000 улучшили показатели по сравнению с Ryzen 7 1800X, и даже с Ryzen 5 2600, на 1-3%. В тестах, ограниченных графическим процессором, есть определенная польза от одноядерной производительности, но все современные процессоры на разумной частоте справляются вполне успешно.

Для наших тестов Intel, 6700K / 7700K предыдущих поколений отстают на 3% по сравнению с 1800X, а остальные на 4% превышают 1800X. Для 99-х процентильных графиков новые процессоры AMD либо набирают уровень, либо уже превзошли Ryzen 1000-series. Фаворит Intel — Coffee Lake — получает первое место, но все процессоры (за исключением Bristol Ridge, A12-9800) повысили свои результаты.

Гейминг анализ 1080p

Ключевым аспектом для многих пользователей является игра с более низким разрешением: 1920x1080 по-прежнему доминирует в игровых настройках, независимо от того, насколько мы, энтузиасты, хотим видеть большее количество пикселей. Некоторые читатели обратились к нам с заявлением, что они по-прежнему покупают лучшую возможную графическую карту, но работают с частотой 200+ FPS при низких разрешениях, просто для оперативности. Тесты с низким разрешением — плохое представление о будущей производительности процессора, но нам важно то, что мы видим сегодня.

Пользователи, которые смотрят на бюджетный Ryzen 5 1600, бестселлер AMD в прошлом году, теперь могут обратить внимание на 2600 (+7%) или 2600X за (+10% в сравнении с 1600) В этом разрешении Ryzen 7 2700X поднимается примерно на +7% по сравнению с предыдущим поколением 1800X, а новые 65W-компоненты легко соответствуют 1800X.

Благодаря более высокой скорости IPC и тактовой частоте процессоры Coffee Lake на 8-10% выше по сравнению с Ryzen 7 2700X, и находятся в диапазоне от +3% до +25% в зависимости от модели. И всё же Intel выигрывает и здесь. При этом наши результаты показывают, что Ryzen 7 2700X поднялся выше процессоров прошлого поколения Intel, позволяя 2700X победить с небольшим отрывом от Kaby Lake и 5% + отрывом от Skylake.

Из всех показателей, где AMD должна быть конкурентоспособной, это тот, где новое повышение производительности работает лучше всего, но похоже, есть над чем потрудиться. График 99-го процентиля на 1080p выглядит как растянутая версия графика средней частоты кадров, и это в целом это так: процессоры, лучшие на 1080p, работают еще лучше на процентили. AMD также имеет дефицит скорости отклика DRAM в основной памяти, который мы назвали фактором в предыдущем тестировании на 99-процентную частоту кадров. Честно говоря, результаты будут выглядеть лучше, если и когда AMD сможет соответствовать Intel по частоте. Будет интересно, если AMD сможет обеспечить более высокую поддерживаемую частоту памяти быстрее, чем Intel, потому что это действительно важно здесь.

Анализ рабочей станции

В соревновании основных процессорных серий, с Ryzen-1000 AMD поставила восемь ядер и шестнадцать потоков против Intel Kaby Lake с четырьмя ядрами и восемью потоками. На этот раз Intel предлагает шесть ядер в Coffee Lake, и теперь 12 потоков Intel противостоят 16-ти на AMD. AMD так же подняло планку частоты турбо режима, но Intel выводит бюджет мощности далеко за пределы, указанные для процессора. Итак, в среднем диапазоне, где было четыре потока против двенадцати, теперь шесть против двенадцати, однако Intel снова выдает более высокие частоты.

В прошлом раунде сравнений Intel по-прежнему имела некоторое преимущество, но теперь они равны. В наших однопоточных тестах новые серии Ryzen-2000 теперь соответствуют производительности процессоров Intel Skylake. Это означает, что Core i5-8400 действительно превосходит лучшие AMD при однопоточности, а Core i7-8770K – просто царь горы. К огорчению AMD, Intel всё ещё на два поколения впереди, благодаря Kaby Lake и Coffee Lake, которые показывают прекрасные одноядерные характеристики за счет дополнительной частоты.

Это характер потока в каждом ядре, какие части ядра являются динамическими или статически разделенными, управление памятью и кэшем. В многопоточных рабочих нагрузках вступает в игру ряд дополнительных переменных. Здесь AMD была агрессивна в отношении латентности и размера кэша низкого уровня, однако неинклюзивный кэш AMD L3 соревнуется здесь с write-back кэшем L3 от Intel, который является более полезным, а также с основной памятью, имеющей более низкую задержку.

В этом ценовом диапазоне, большее количество потоков чипа AMD дает ему здоровое преимущество над Coffee Lake i7-8700K, а также он затмевает восьмиъядерный Skylake-X Core i7-7820X в большинстве тестов. То, что наблюдаем здесь касательно AMD — только Ryzen 7 2700X затмевает старый Ryzen 7 1800X, а 2700 — отстает. Важно заметить, что предыдущие поколения процессоров Intel i7-6700K и i7-7700K очень сильно отстают от конкурентов, и даже от самого последнего процессора AMD Ryzen второго поколения — Ryzen 5 2600.

Но вот мы и говорим об успехе AMD. Если бы кто-то сказал несколько лет назад, что AMD разработает процессор Ryzen второго поколения в 2018 году, который затмит процессоры Intel Skylake и Kaby Lake, я бы рассмеялся. Это не сражение, а избиение. Если пользователь хочет получить чип для многопоточной рабочей нагрузки, $ 199 Ryzen 5 2600 — лучший бюджетный процессор на рынке сегодня.
В этом средне-уровневом ценовом соревновании Ryzen 5 2600 также легко обходит Core i5-8400.

Общие мысли

Производитель где-то теряет, где-то выигрывает, но клиенты выигрывают всегда

Нести эту ношу непросто, с существующими взаимоотношениями и высокими бюджетами. Когда существует конкуренция, каждый продукт должен сделать свою лучший рывок вперед. В последние годы Intel в основном критикуют за застой — незначительные обновления текущего процесса в ожидании появления нового; с такой продолжительной стагнацией всё, что конкурентоспособно, будет выглядеть привлекательно на рынке. Но каждый прорыв заставляет конкурента реагировать, и это победа для клиентов. Те, кто находится внутри индустрии, могут сказать, что, хотя Intel выпускает итерации по аналогичному 14-нм дизайну каждый год, ожидая выхода 10 нм, AMD сделала свой лучший шаг вперед с Zen и Ryzen на 14 нм, теперь следующий с Ryzen 2 на GF 12 нм.

На этот раз сведение итогов до простых рекомендаций на самом деле будет очень простым.

Любые пользователи, которым нужна высокая однопоточная производительность или высокопроизводительные игры 1080p с использованием графического процессора среднего класса, могут выбрать Core i5-8400 от Intel как отличное решение.

В каждой ценовой позиции AMD может соответствовать потребностям игрока в 4K, и выигрывает в чистой пропускной способности.
AMD также поставляет с каждым процессором вполне достойный кулер, чем Intel в последние годы пренебрегает, что делает продукт еще более привлекательным. Для хардкорных энтузиастов, работающих на high-end графике на 4K или, как и в их общих вычислениях, серия Ryzen 2000 выглядит наилучшим выбором.

Вам нравятся наши статьи? Спасибо, что остаетесь с нами. Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? Хотите видеть больше интересных материалов? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки? Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть