Хабрахабр

1155 vs 2011. В бой идут одни старики

В 2017 году AMD в очередной раз приоткрыла ящик Пандоры, выпустив на рынок mainstream процессоры с количеством ядер больше четырёх, при этом с производительностью на ядро хотя бы сравнимой с современными процессорами Intel при равных частотах. Полного паритета не вышло, но полутора-двукратного разрыва в зависимости от типа нагрузки, как во времена FX-ов, уже нет. В синтетике производительность ядер Ryzen примерна равна производительности ядер Ivy Bridge (3xxx). Ход оказался довольно таки сильным, так что синей команде пришлось спешно выпускать шестиядерники на обновлённом 1151. К чему это я? А собственно к тому, что с прошлого года шести и более ядерные процессоры с быстрыми ядрами перебрались в потребительский сегмент из узкой HEDT ниши. Кроме всего прочего это значит, что массовое ПО наконец всё же начали оптимизировать под многоядерные многопоточные CPU.

Это частота 3. Что такое современный массовый 6-8-ядерный процессор? 5GHz, относительно быстрая межъядерная шина той или иной архитектуры, двухканальная память DDR4 с частотой 2. 5-4. При этом ядра того же Ryzen рекордов производительности на такт не бьют. 4+ GHz. Тем более предприимчивые китайцы, увидев такую ситуацию, оперативно освоили массовый выпуск материнских плат под эту платформу, а остальные комплектующие, процессор с памятью, стоят на вторичном рынке сравнительно недорого да и старению особо не подвержены. А что если… вместо современной и достаточно дорогой платформы взять старую 2011 платформу Intel, благо сейчас предложение списанных серверных процессоров линеек E5 v1 и v2 под этот сокет явно превышает спрос? Пропускная способность регистровой DDR3 памяти пониже будет на один канал, чем у DDR4, но зато и каналов памяти на этой платформе четыре.

В общем-то сравниваются малосравнимые в своё время (по крайней мере по цене) платформы, но время всех уравнивает. Платформы Ryzen у меня под рукой нет, поэтому будем сравнивать имеющиеся конфиги, все относящиеся к поколения Ivy Bridge.

Участники тестирования

В тесте принимали участие следующие конфигурации:

CPU: Intel Core I7-3770K@4440MHz
MB: ASUS P8Z77-V LX
RAM: 2 x DDR3 Kingston Hyper-X 8GB 1600@2150MHz

49p (BIOS 4. CPU: Intel Xeon E5-1650v2@4100MHz
MB: Huanan X79 v2. 5)
RAM: 4 x DDR3 Samsung 4GB 1333@1866MHz 6.

49p
RAM: 4 x DDR3 Samsung 4GB 1333@1866 CPU: Intel Xeon E5-2680v2
MB: Huanan X79 v2.

Вне зачёта идёт платформа на Kaby Lake:
CPU: Intel I5-7600K@4500
MB: Gigabyte Z270M-D3H
RAM: 2 x DDR4 Kingston Hyper-X 16GB 2400@3200MHz

Там, где сравнение с ней уместно, она упоминается. Непосредственно тестовые замеры на ней не проводились, но есть ряд наблюдений за время её эксплуатации.

Во всех тестах также использовались:
Накопитель: NVME SSD ADATA SX8000NP
Видеокарта: Palit GeForce GTX1080Ti

Первый тест очень хорошо выявляет проблемы с памятью или её контроллером, второй — с цепями питания и системой охлаждения. Стабильность платформ проверялась последовательными 10-15минутными прогонами OCCT Large Dataset и Linpack в версии под AVX.

Методика тестирования

Тесты проводились под управлением ОС Windows 10 Pro 1803 (сборка 17134.320)

Защита от Spectre и Meltdown деактивирована на всех тестовых системах с помощью утилиты InSpectre.

Брался максимальный результат, остальные прогоны теста проводились для проверки возможных аномалий. Все тесты проводились по несколько раз (не менее трёх-четырёх), результат первого прогона отбрасывался, так как на результат первого прогона заметно сильнее влияют задержки ввода-вывода.

Тестирование

Синтетические тесты

AIDA64 memtest

Производительность и задержки памяти

СrystalDiskMark

Производительность NVME накопителя

I7 3770K, MB ASUS P8Z77-V, NVME SSD @ PCI-E 2.0 x4

49p, NVME SSD @ PCI-E 3. E5-1650v2, HUANAN X79 2. 0 x4" src="http://orion-int.ru/wp-content/uploads/2018/10/1155-vs-2011-v-boj-idut-odni-stariki-1.png"/> 0 x4
<img title="E5-1650v2, HUANAN, NVME SSD @ PCI-E 3.

49p, NVME SSD @ M2

На платформе LGA1155 пиковая производительность NVME накопителей в синтетических тестах ограничивается пропускной способностью шины PCI Express v2. На китайской материнской плате SSD заработал без ограничений интерфейса как в PCI-E слоте, так и в M2.

Рендеринг


Рендеринг, наряду с кодированием видео — это один из классов задач, которые распараллеливаются практически идеально и в теории практически линейно масштабируются при увеличении количества ядер CPU. Что собственно и подтвердили тесты.

Cinebench R15.0

Corona 1.3 benchmark

Синтетический тест игровой производительности

3D Mark Time Spy

ПО для обработки фотографий

Методика тестирования

Я взял набор снимков с пэйнтбола, снятых на старый добрый Nikon D60 в формате NEF. Всего 329 кадров. Время импорта, построения превью и прочие операции не замерялись, так как не совсем понятно, как их замерять с достаточной точностью. Измерялось время преобразования этой пачки файлов в JPEG. Время обработки задания оценивалось по разнице во времени изменения первого и последнего экспортированного JPEG-а. Не самый точный показатель, согласен, 3-5 секунд на старте процесса экспорта не учитываются, но зато легко автоматизируемый тест и не нужно постоянно сидеть и мониторить ход процесса с секундомером, как пришлось бы при попытке оценить время импорта, да и все системы при этом в равных условиях. В диск обработка точно не упиралась, исходники и папка экcпорта были на SSD.

Adobe Lightroom 5.7

Результаты получились на первый взгляд довольно странные. Казалось бы процесс проявки RAW снимков должен хорошо распараллеливаться. И даже если проявка конкретного кадра не может быть раскидана на несколько ядер, в очереди обработки было более трёхсот снимков! Знай себе раскидывай каждый кадр на своё ядро. Но, судя по загрузке процессора, которая колебалась от 40% на i7 до 20% на E5-2680v2, старый Lightroom этого делать не умеет. По графику загрузки CPU видно, что больше 4 потоков он толком использовать не может, отсюда и минимальный прирост. Удивительно, что он вообще есть — скорость на поток на 10-ядернике должна быть заметно ниже разогнанного i7. В общем приложение образца 2013 года заточено максимум под двух-четырёхпоточные процессоры и не в состоянии извлечь выгоду от современных (и не очень) многопоточных процессоров.

Adobe Lightroom Classic CC (7.5)

После результатов тестов Lightroom 5.7, которые вызвали разочарование, решил проверить, как обстоят дела на актуальных версиях ПО от Adobe.

Были активированы аппаратное ускорение отрисовки UI (судя по мониторингу, Lighroom Classic поддерживает отрисовку с использованием DX12) и использование OpenCL для Adobe Camera RAW, потому что при отсутствии проблем совместимости никто в здравом уме отключать эти опции не будет, а тестирую я производительность системы в целом в тех или иных задачах. Тестирование проводилось опять же с реальными настройками.

Не считая того, что и на I7 свежая версия показала намного лучшую скорость, лишние пара ядер дали сокращение времени обработки пачки почти на минуту (55 секунд, если быть точными), то есть примерно на 26%. Adobe Lightroom Classic CC показал себя намного лучше версии Lightroom образца 2013 года. Отлично само по себе, а если сравнить результаты i7 и E5-2680v2, то и вовсе впечатляюще. Добавка ещё в 4 ядра дала ускорение на 51 секунду или на 30%. Масштабирование более чем линейное, если учитывать, что i7 работает на частоте 4. Десятиядерник справляется с задачей ровно в 2 раза быстрее, чем четырёхядерник. 2GHz при нагрузке на все ядра. 44GHz, а E5-2680v2 в бусте выжимает из себя 3.

ПО тоже должно быть соответствующее. Разница в поведении разных версий одного и того же приложения явно демонстрирует, что нельзя просто так взять и ускорить ПО, просто дав ему кучу ядер.

Последний Lightroom, который можно было купить, а не арендовать — это шестая его версия. Да, новый Lightroom Classic CC хорош, но триал скоро закончится, а выкладывать каждый месяц по 900 рублей за подписку желания нет, я бы лучше разок заплатил полную сумму, но Adobe не предлагает такого варианта. 7 на 6.х. Но опять же, надеяться на обновление этой версии не приходится, так же как на заметные скидки при апгрейде с 5. Не интересно.

Nikon Capture NX? Интересно, чем его можно заменить? Кажется, его поломало какое-то из последних обновлений Windows 10, но в любом случае, даже если там и есть нормальный многопоток, ожидать, что в него завезут поддержку OpenCL, бессмысленно, а без неё он обречём многократно проигрывать Lightroom Classic. Может быть, но он у меня стабильно падал на обработке 2-3 кадра из очереди, так что провести тесты не удалось.

Даже не смешно. Raw Therapee? Зависнуть при клике на папку и не отвечать секунд 15 без какой-либо индикации процесса? Не смотря на богатые функциональные возможности, пользоваться этим чудом Open Source, которого явно не касалась рука UX-дизайнера, приходилось себя заставлять. 7 (замер сделать не удалось, минут за 5 Raw Therapee кое как прожевал где-то треть пачки, и мне надоело ждать)? Время обработки, в разы превышающее даже Lightroom 5. Наверное. Это норма. Может быть. Для кого-нибудь. Что там у нас есть из платных аналогов, работающего под Windows? Но я лучше заплачу за адекватный интерфейс и нормальную скорость работы. Кто ещё производит графическое ПО?

Corel AfterShot Pro 3

Corel с его Corel AfterShot Pro 3. Да ещё с заявками на победу вида «Corel AfterShot Pro 3 is up to 4x faster than Adobe Lightroom». Уже интересно.

На E5-1650v2 никаким четырёхкратным превосходством над Lightroom-ом тоже пахнет, более того, разрыв сократился, но 36 секунд или 24% на 300+ снимках он отыграл. С учетверенной относительно Lightroom скоростью Corel, конечно, загнул, но на I7-3770K Corel AfetrShot Pro 3 отыгрывает у Adobe Lightroom CC примерно 84 секунды из 211 или 40%. WTF?! А вот на 20 потоках меня ждал неприятный сюрприз — время обработки пачки увеличилось в полтора раза по сравнению с 12 потоками. На 10 потоках он вполне нормально работает, заканчивает на пол минуты быстрее, чем на шестиядернике. А если отключить HT? А примерно так же работает. А если просто руками установить ограничение на количество потоков, а HT на процессоре включить обратно? Ну, тоже результат. То есть AfterShot Pro на количестве потоков более 10 начинает на ровном месте дико тупить. А Corel AfetrShot Pro 3 явно затачивался под 4-8 потоков. Очередное доказательство, что для того, чтобы многоядерные CPU могли себя проявить, им требуется соответствующее ПО.

Игры

Выбор в основном обусловлен не репрезентативностью выборки, а тем, что было под рукой из тех игр, в которых есть встроенные бенчмарки, позволяющие получать более менее стабильные и повторяемые результаты. Но какая-никакая логика прослеживается.

Методика тестирования

Настройки во всех играх максимальные за исключением настроек антиалиасинга. AA отключен, чтобы не упираться в лимит fillrate. В зачёт шёл минимальный усреднённый FPS как основной показатель комфортности игрового процесса на тестируемом железе с максимальными настройками. Показатель «очень редких событий», 0.1% min fps, всё же является больше индикатором случайных событий, и если микрофризы не идут сплошным потоком раз в несколько секунд, то на комфорт игры он, как мне кажется, влияет не особо. Естественно, график фреймтайма я проверял, и если у игры действительно возникали проблемы с микрофризами, то они фиксировались. Результаты замеров брались из встроенного бенчмарка игры, если бенчмарк не позволяет получить в явном виде статистику, как в GTA V, использовался Riva Tuner Statics Server для фиксации параметров производительности.

GTA V

Относительно немолодая мультиплатформенная игра, на Windows использует графическое API DX11. Так как выходила на приставках, с поддержкой многопоточности у неё все довольно неплохо, а требования к производительности ядер умеренные, тк игра поддерживает приставки прошлого поколения. Так как тест не умеет выдавать статистику, для сбора результатов тестирования использовался Riva Tuner Statistics Server. Для того, чтобы усложнить процессору задачу, были включены опции увеличения дальности детализации и отрисовки теней.

скриншоты настроек игры для теста

результаты тестов

I7-3770K
22-09-2018, 18:58:21 GTA5.exe benchmark completed, 8234 frames rendered in 115.485 s Average framerate : 71.2 FPS Minimum framerate : 45.3 FPS Maximum framerate : 269.9 FPS 1% low framerate : 46.3 FPS 0.1% low framerate : 39.4 FPS E5-1650V2
23-09-2018, 20:50:08 GTA5.exe benchmark completed, 7862 frames rendered in 116.125 s Average framerate : 67.7 FPS Minimum framerate : 48.1 FPS Maximum framerate : 119.2 FPS 1% low framerate : 47.3 FPS 0.1% low framerate : 43.0 FPS E5-2680v2
23-09-2018, 22:48:25 GTA5.exe benchmark completed, 7618 frames rendered in 116.313 s Average framerate : 65.4 FPS Minimum framerate : 47.7 FPS Maximum framerate : 154.8 FPS 1% low framerate : 46.7 FPS 0.1% low framerate : 40.5 FPS

Far Cry 5

Мультиплатформенная игра этого года, на PC опять же работает под DX11. Ориентирована на PC и приставки последнего поколения. Многопоточность имеется, но любит быстрые ядра и почему-то HyperThreading. По крайней мере при его деактивации на платформе E5-2680v2 фреймтайм в тесте при наличии упора в CPU становился очень дёрганным с непонятными просадками в произвольных местах, начинались фризы раз в 5-6 секунд в тестовом отрезке. Если снять упор с CPU, подняв разрешение рендеринга, игра при снижении среднего FPS демонстрировала заметно более комфортный игровой процесс за счёт отсутствия микрофризов и рывков. Показатели среднего и минимального FPS при этом не менялись. После выхода последнего патча с HD текстурами я перетестировал игру на двух конфигурация, и не обнаружил вообще никакой разницы в производительности. Да, потребление VRAM возрастает с 2.4 до 4.6 гигабайт, но для 11-гиговой 1080Ti нагрузку это не меняет.

скриншоты настроек игры для теста

скриншоты результатов тестовых прогонов

I7 3770K@4444

E5-1650v2@4000

E5-2680v2

Deus Ex Mankind Divided

Единственная игра, формально поддерживающая DX12. Тестировалась именно в этом режиме, не смотря на абсолютную его бессмысленность. В теории DX12 должен снижать процессорозависимость. На практике ничего, кроме снижения FPS на 15-20 кадров в секунду он не приносит, ни на йоту не изменяя графику в игре. Несколько искусственный тест получился, но так вышло.

скриншоты настроек игры для теста

скриншоты результатов тестовых прогонов

I7 3770K@4444

E5-1650v2@4000

E5-2680v2

Остальные игры пошли вне зачёта, тк повторяемость показательных игровых отрезков на них околонулевая, но общая тенденция имеется, хоть и выразить её в точных цифрах минимального FPS не получается.

Вне зачёта

Игры на id tech 6. Doom, Wolfenstein New Colossus

ID Tech 6 при использовании API Vulcan обеспечивает утилизацию всех ядер CPU, до которых может дотянуться. Игровой движок от ID Software порадовал. В Doom счётчик кадров упёрся во вшитый лимит в 200 кадров в секунду на максимальных настройках на всех CPU. На E5-2680v2 нагрузка равномерно распределялась на все 20 потоков, чего не мог обеспечить никакой другой движок в тестах.

На I7 разброс показателей больше – от 150 до 270. Wolfenstein New Colossus демонстрирует с одной стороны похожее поведение — он способен с пользой использовать 20 потоков, с другой — в нём нет вшитого лимита на 200 кадров в секунду и более сложная графика, в результате чего результаты стали отличаться: FPS колеблется от 170 до 230 на обоих Xeon-ах. В целом все процессоры обеспечили одинаково комфортную игру. Минимальный FPS в сценах с кучей геометрии ниже, но там, где он упирается в скорость на ядро – FPS улетает в небеса. Отличить на глаз 150 минимальных FPS от 170 сложновато.

Cities Skylines

Ей не нужно ничего кроме пары быстрых ядер, поэтому показатели этой игры на E5-2680v2 удручили. Классическая полуторопоточная игра с нулевой оптимизацией под современные реалии. На E5-1650v2@4100 всё более или менее, FPS в районе 30, на I7-3770K@4444 в районе 35-40 при максимальном приближении и крупном городе. FPS дропается ниже 25, симуляция дёргается, всё плохо. I5-7600K со стабильными 50-60 FPS вне досягаемости.

Однопоточная дичь: DosBox + Carmageddon + nGlide

Единственный тип нагрузки, который вызвал проблемы при попытке запуска на сбалансированной схеме электропитания на Xeon-ах. Суровая однопоточная нагрузка, двойная эмуляция, всё как мы любим. 2 до 3. С одной стороны, нагрузка сугубо однопоточная, с другой стороны, как бы я не крутил настройки, загрузить ядро целиком, хоть с активированным HT, хоть без него, DosBox не в состоянии, в результате чего не включается boost и частота болтается в диапазона от 1. В чём проблема, разобраться так и не удалось. 5 GHz, и всё жутко тупит и дёргается.

Лучше всего это видно на видео:

Тестовый отрезок классического Carmageddon

Лечится включением производительного плана питания, но всё равно загрузка ядра никогда не превышает 70-80%, про загрузку видеокарты и говорить смешно — в таком режиме нет вообще никакой разницы в производительности на интеловской встройке и на GTX1080Ti, но FPS плавает и проседает.

I7 заметно превосходит E5-1650v2 в комфорте – ниже 25 частота кадров не проседает, нет микрофризов, средний FPS выше на 5-7 кадров в секунду. Минимальный FPS временами падает ниже 30 на всех системах, но на E5-2680v2 он временами проваливается ниже 20. I5-7600K@4500 опять же недостижим. E5-1650v2 где-то посередине.

Сводные результаты тестов

Ед. изм.

I7-3770K

E5-1650V2

E5-2680V2

Lightroom 5.7

sec

393

372

347

Lightroom 7.5

sec

221

156

105

Corel AfterShot Pro3

sec

127

118

94

Corona 1.3

1000 rays/sec

1 848

2 433

3 339

CineBench R15

points

817

1 062

1 386

Memory Read

MB/s

31 872

50 143

55 275

Memory Write

MB/s

33 072

36 202

47 102

Memory Copy

MB/s

29 932

48 249

50 877

Memory Latency

ns

46,90

75,20

75,30

3DMark Timespy. Overall score

points

8 364

8 842

9 152

3DMark Timespy. Graphics Score

points

9 756

9 588

9 469

3DMark Timespy. Graphis Test 1

fps

62,60

61,72

60,88

3DMark Timespy. Graphis Test 2

fps

56,72

55,58

54,96

3DMark Timespy. CPU Score

points

4 626

6 137

7 697

3DMark Timespy. CPU Test

fps

15,54

20,62

25,86

Far Cry 5. Minimum FPS

fps

66

65

60

Far Cry 5. Average FPS

fps

89

89

82

Far Cry 5. Maximum FPS

fps

120

124

115

Deus Ex: Mankind Divided, minimum

fps

62,50

62,50

53,10

Deus Ex: Mankind Divided, average

fps

85,50

84,50

73,20

Deus Ex: Mankind Divided, maximum

fps

122,00

122,00

105,30

GTA V Average framerate

fps

71,60

67,70

65,40

GTA V min framerate

fps

47,10

48,80

48,10

GTA V 1% low framerate

fps

46,30

47,30

46,70

GTA V 0.1% low framerate

fps

39,40

43,00

40,50

Выводы

Выводы в принципе ожидаемые. Оба зиона показали себя довольно неплохо, но не без ньюансов.

Не смотря на то, что он всё же уступил более высокочастотным процессорам в играх, тем не игры последних двух-трёх лет на максималках всё ещё играбельны, а в рабочих приложениях конкурентов он просто разорвал. E5-2680v2 ожидаемо отлично себя показал в оптимизированных под многопоточные CPU приложениях и неплохо в относительно современных играх при условии их оптимизации под многоядерные CPU. Ни в одном тесте его температура не превышала 50 градусов, при том, что вентилятор кулера работал на минимальных оборотах и даже и не думал раскручиваться. Ещё одним достоинством этого процессора является то, что он холодный.

Незначительно уступая обычным десктопным моделям в играх, он достаточно серьёзно превосходит их при работе с видео и графикой. E5-1650v2 в разгоне показал себя наиболее универсальным процессором. Но и потребляет он изрядно, и греется сам и греет цепи питания от души.

Не смотря на внушительный возраст, в разгоне этот процессор и по сей день заметно превосходит прошлогодние камни в стоке за эту же цену. I7-3770K. В большинстве случаев он обеспечивает примерно такую же или большую игровую производительность, а работать на нём заметно комфортнее, чем на том же I5-7600K. Да и в разгоне в половине случаев тоже. Превосходство в цифрах не поражает, но отзывчивость системы под нагрузкой на старом I7 куда выше, чем на современном четырёхядернике (теперь ближайший аналог — это I3-8400).

С другой стороны, тот же E5-2680v2 за сравнительно небольшие деньги позволяет собрать двадцатиядерную и сорокапоточную систему с большим объёмом оперативной памяти, но в этом случае нужно чётко понимать цели, для которых собирается такой монстр (например как здесь: ilipin.livejournal.com/161378.html). По ощущениям, наиболее универсальным вариантом под платформу LGA2011v2 должны быть восьмиядерные Xeon-ы E5-2667v2 и E5-2687Wv2 c достаточно высокой частотой ядер в бусте, так как Xeon E5-2680v2 в некоторых сценариях явно упирался в скорость на поток, но это ещё 4-8 тысяч рублей сверху к его цене, что делает целосообразность использования такой конфигурации весьма сомнительной.

При очередной неудачной попытке разгона E5-1650v2 она зависла под OCCT и больше не загрузилась. PS: и да… китайская материнка прожила ровно столько, чтобы успеть снять тесты. Китайцам предъявлять претензии в данном случае странно, всё же разгон – это не беспроигрышная лотерея, и железо временами страдает. В качестве основной системы она проработала недели 3, проблем с ней в качестве платформы для рабочей станции не было вообще.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть