Железо

Новая статья: От Sandy Bridge до Coffee Lake: сравниваем семь поколений Intel Core i7

В таких репликах скорее всего будет раздражённо упоминаться про прирост производительности на неосязаемом уровне «не более пяти процентов в год»; про низкокачественный внутренний термоинтерфейс, который непоправимо испортил современные процессоры Intel; либо про то, что покупать в современных условиях процессоры с таким же, как и несколько лет назад, количеством вычислительных ядер вообще – удел недальновидных дилетантов, так как в них нет необходимого задела на будущее. Практически всегда под любой публикацией, в которой так или иначе затрагивается тема производительности современных интеловских процессоров, рано или поздно появляется несколько сердитых читательских комментариев о том, что прогресс в развитии чипов у Intel давно забуксовал и нет смысла переходить со «старого доброго Core i7-2600K» на что-то новое.

Однако очень похоже, что они многократно преувеличивают имеющиеся проблемы. В том, что все такие реплики не лишены оснований, сомнений нет. Да, какие-то кардинальные перемены с процессорами Intel происходят редко, но тем не менее, они продолжают планомерно совершенствоваться. Лаборатория 3DNews подробно тестирует интеловские процессоры с 2000 года, и мы не можем согласиться с тезисом, что какому бы то ни было их развитию пришёл конец, а происходящее с микропроцессорным гигантом в течение последних лет иначе как стагнацией уже и не назовёшь. Поэтому те чипы серии Core i7, которые можно купить сегодня, заведомо лучше моделей, предлагавшихся несколько лет тому назад.

Поколение Core

Кодовое имя

Техпроцесс

Этап разработки

Время выхода

2

Sandy Bridge

32 нм

Так (Архитектура)

1 кв. 2011

3

Ivy Bridge

22 нм

Тик (Процесс)

2 кв. 2012

4

Haswell

22 нм

Так (Архитектура)

2 кв. 2013

5

Broadwell

14 нм

Тик (Процесс)

2 кв. 2015

6

Skylake

14 нм

Так
(Архитектура)

3 кв. 2015

7

Kaby Lake

14+ нм

Оптимизация

1 кв. 2017

8

Coffee Lake

14++ нм

Оптимизация

4 кв. 2017

Мы решили собрать в одном тесте старшие интеловские процессоры для массовых платформ за последние семь лет, и посмотреть на практике, насколько представители серий Kaby Lake и Coffee Lake ушли вперёд относительно «эталонных» Sandy Bridge, которые за годы гипотетических сравнений и мысленных противопоставлений в представлении обывателей стали настоящей иконой процессоростроения. Собственно, этот материал как раз и является контраргументом для рассуждений о никчёмности выбранной Intel стратегии постепенного развития потребительских CPU.

⇡#Что поменялось в процессорах Intel c 2011 года по настоящее время

И это неспроста. Отправной точкой в новейшей истории развития процессоров Intel принято считать микроархитектуру Sandy Bridge. Несмотря на то, что первое поколение процессоров под маркой Core было выпущено в 2008 году на базе микроархитектуры Nehalem, почти все основные черты, которые присущи современным массовым CPU микропроцессорного гиганта, вошли в обиход не тогда, а парой лет позднее, когда распространение получило следующее поколение процессорного дизайна, Sandy Bridge.

Но всего лишь семь лет назад ситуация была кардинально иной. Сейчас компания Intel приучила нас к откровенно неторопливому прогрессу в разработке микроархитектуры, когда нововведений стало очень мало, и они почти не приводят к росту удельной производительности процессорных ядер. В частности, переход от Nehalem к Sandy Bridge был ознаменован 15-20-процентном ростом показателя IPC (числа исполняемых за такт инструкций), что обуславливалось глубокой переделкой логической конструкции ядер с прицелом на повышение их эффективности.

Например, именно там появился отдельный кеш нулевого уровня для декодированных микроопераций, а также стал применяться физический регистровый файл, снижающий энергозатраты при работе алгоритмов внеочередного выполнения инструкций. В Sandy Bridge были заложены многие принципы, которые с тех пор не менялись и стали стандартными для большинства процессоров сегодняшнего дня.

Скорее всего, в прадедушки современных Coffee Lake общественное мнение поставило именно его, а не какой-нибудь Nehalem и уж тем более не Penryn, именно из-за этой особенности. Но, пожалуй, самым главным нововведением стало то, что Sandy Bridge был спроектирован как унифицированная система-на-чипе, рассчитанная одновременно на все классы применений: на серверные, десктопные и мобильные. В конечном итоге этот дизайн утратил все старые родственные связи с P6 (Pentium Pro), которые то здесь, то там проявлялись во всех предшествующих процессорах Intel. Впрочем, и итоговая сумма всех переделок в глубинах микроархитектуры Sandy Bridge тоже оказалась весьма значительной.

Этот блок проследовал внутрь процессора вслед за контроллером DDR3-памяти, разделяемым L3-кешем и контроллером шины PCI Express. Говоря об общей структуре, нельзя также не вспомнить и о том, что в процессорный кристалл Sandy Bridge впервые в истории интеловских CPU было встроено полноценное графическое ядро. Для соединения вычислительных ядер и всех остальных «внеядерных» частей воедино инженеры Intel внедрили в Sandy Bridge новую на тот момент масштабируемую кольцевую шину, применяемую для организации взаимодействия между структурными единицами в последующих массовых CPU и по сей день.

К настоящему моменту такие инструкции прочно вошли в обиход и не кажутся чем-то необычным, но их реализация в Sandy Bridge потребовала расширения части вычислительных исполнительных устройств. Если же опуститься на уровень микроархитектуры Sandy Bridge, то одной из ключевых её особенностей стала поддержка семейства SIMD-инструкций, AVX, предназначенных для работы с 256-битными векторами. Поэтому вместе с реализацией полноценных 256-битных исполнительных устройств потребовалось и увеличение скорости работы процессора с памятью. Инженеры Intel стремились сделать работу с 256-битными данными такой же быстрой, как и с векторами меньшей разрядности. Логические исполнительные устройства, предназначенные для загрузки и сохранения данных, в Sandy Bridge получили удвоенную производительность, кроме того, симметрично была увеличена пропускная способность кеш-памяти первого уровня при чтении.

Микроархитектура Sandy Bridge

Микроархитектура Sandy Bridge

Благодаря оптимизациям в применяемых алгоритмах и увеличению размеров буферов, архитектура Sandy Bridge позволила сократить процент неверных предсказаний переходов почти вдвое, что не только заметно сказалось на производительности, но и позволило дополнительно снизить энергопотребление этого дизайна. Нельзя не упомянуть и о сделанных в Sandy Bridge кардинальных изменениях в работе блока предсказания ветвлений.

Как и предшественники, данные процессоры продолжили базироваться на техпроцессе с 32-нм нормами, но предложенный ими рост производительности оказался более чем убедителен. В конечном итоге, с сегодняшних позиций процессоры Sandy Bridge можно было бы назвать образцово-показательным воплощением фазы «так» в интеловском принципе «тик-так». 0. И подпитывала его не только обновлённая микроархитектура, но и увеличенные на 10-15 процентов тактовые частоты, а также внедрение более агрессивной версии технологии Turbo Boost 2. Учитывая всё это, хорошо понятно, почему многие энтузиасты до сих пор вспоминают Sandy Bridge самыми тёплыми словами.

Этот процессор получил тактовую частоту на уровне 3,3 ГГц с возможностью авторазгона при неполной нагрузке до 3,8 ГГц. Старшим предложением в семействе Core i7 на момент выхода микроархитектуры Sandy Bridge стал Core i7-2600K. Среди Core i7-2600K нередко можно было встретить экземпляры, способные работать на частотах 4,8-5,0 ГГц, что во многом обуславливалось применением в них качественного внутреннего термоинтерфейса – бесфлюсового припоя. Впрочем, отличали 32-нм представителей Sandy Bridge не только сравнительно высокие для того времени тактовые частоты, но хороший разгонный потенциал.

Через девять месяцев после выпуска Core i7-2600K, в октябре 2011, компания Intel обновила старшее предложение в модельном ряде и предложила немного ускоренную модель Core i7-2700K, номинальная частота которой была доведена до 3,5 ГГц, а максимальная частота в турбо-режиме – до 3,9 ГГц.

Ничего особенного: Ivy Bridge относился к фазе «тик», то есть представлял собой перевод старой микроархитектуры на новые полупроводниковые рельсы. Впрочем, жизненный цикл Core i7-2700K оказался коротким – уже в апреле 2012 года на смену Sandy Bridge пришёл обновлённый дизайн Ivy Bridge. И в этом отношении прогресс действительно был серьёзным – кристаллы Ivy Bridge производились по 22-нм технологическому процессу, основанному на трёхмерных FinFET-транзисторах, которые в то время только входили в употребление.

Были выполнены лишь отдельные косметические переделки, которые ускорили выполнение в Ivy Bridge операций деления и немного повысили эффективность технологии Hyper-Threading. При этом старая микроархитектура Sandy Bridge на низком уровне осталась практически нетронута. Контроллер PCI Express получил совместимость с третьей версией протокола, а контроллер памяти увеличил свои возможности и стал поддерживать скоростную оверклокерскую DDR3-память. Правда, попутно были несколько улучшены «внеядерные» компоненты. Но в итоге рост удельной производительности при переходе от Sandy Bridge к Ivy Bridge составил не более 3-5 процентов.

К сожалению, внедрение 22-нм норм не позволило как-то принципиально нарастить тактовые частоты Ivy Bridge. Не дал серьёзных причин для радости и новый технологический процесс. Улучшилась лишь энергоэффективность, однако пользователей настольных компьютеров этот аспект традиционно волнует слабо. Старшая версия Core i7-3770K получила номинальную частоту 3,5 ГГц с возможностью разгона в турбо-режиме до 3,9 ГГц, то есть с точки зрения частотной формулы она оказалась ничуть не быстрее Core i7-2700K.

Речь – о разгоне. Всё это, конечно, вполне можно списать на то, что на этапе «тик» никаких прорывов происходить и не должно, но кое в чём Ivy Bridge оказались даже хуже предшественников. Начиная с Ivy Bridge для организации внутреннего термоинтерфейса стала использоваться банальная термопаста, и это сразу же ударило по максимально достижимым частотам. При выводе на рынок носителей этого дизайна Intel приняла решение отказаться от использования при финальной сборке процессоров бесфлюсовой пайки галлиевым припоем теплораспределительной крышки к полупроводниковому кристаллу. По разгонному потенциалу Ivy Bridge определённо стали хуже, и в результате, переход от Sandy Bridge к Ivy Bridge стал одним из самых спорных моментов в новейшей истории потребительских процессоров Intel.

В этом поколении, относящемся к фазе «так», должны были появиться серьёзные микроархитектурные улучшения, от которых ожидалась способность как минимум продвинуть вперёд забуксовавший было прогресс. Поэтому на следующий этап эволюции, Haswell, возлагались особенные надежды. Появившиеся летом 2013 года процессоры Core четвёртого поколения действительно приобрели заметные улучшения во внутренней структуре. И в какой-то степени это произошло.

В новой микроархитектуре не просто был проведён ребаланс имеющихся исполнительных устройств, но и появилось два дополнительных исполнительных порта для целочисленных операций, обслуживания ветвлений и генерации адресов. Основное: теоретическая мощность исполнительных устройств Haswell, выражающаяся в количестве исполняемых за такт микроопераций, по сравнению с прошлыми CPU выросла на треть. Кроме того, микроархитектура получила совместимость с расширенным набором векторных 256-битных инструкций AVX2, которые благодаря трёхоперандным FMA-командам увеличили пиковую пропускную способность архитектуры вдвое.

Выросло в размере окно планировщика. В дополнение к этому инженеры Intel пересмотрели ёмкость внутренних буферов, и где это было необходимо, увеличили их. В дополнение ко всему этому, существенно изменилась и подсистема кеш-памяти. Кроме того, были увеличены целочисленный и вещественночисленный физические регистровые файлы, что улучшило возможности процессора по переупорядочиванию порядка исполнения инструкций. L1- и L2-кеши в Haswell получили вдвое более широкую шину.

Но как бы ни так. Казалось бы, перечисленных улучшений должно быть достаточно для того, чтобы заметно поднять удельную производительность новой микроархитектуры. То есть, максимальный темп декодирования x86-кода в микроинструкции остался на уровне 4-5 команд за такт. Проблема дизайна Haswell состояла в том, что он оставил без изменений входную часть исполнительного конвейера и декодер x86-команд сохранил ту же производительность, что и раньше. И в результате при сопоставлении Haswell и Ivy Bridge на одинаковой частоте и нагрузке, не использующей новые AVX2-инструкции, выигрыш в производительности оказался всего лишь на уровне 5-10 процентов.

Микроархитектура Haswell

Микроархитектура Haswell

Опираясь на всё тот же 22-нм техпроцесс, что и Ivy Bridge, новинки не смогли предложить высокие частоты. Имидж микроархитектуры Haswell подпортила и первая волна процессоров, выпущенная на её основе. Например, старший Core i7-4770K вновь получил базовую частоту 3,5 ГГц и максимальную частоту в турбо-режиме на уровне 3,9 ГГц, то есть по сравнению с прошлыми поколениями Core никакого продвижения не наметилось.

В рамках этого обновления Intel смогла заметно увеличить тактовые частоты 22-нм CPU, что действительно вдохнуло в них новую жизнь. В то же время с внедрением следующего технологического процесса с 14-нм нормами у Intel стали возникать разного рода трудности, поэтому через год, летом 2014 года на рынок было выведено не следующее поколение процессоров Core, а вторая очередь Haswell, которая получила кодовые имена Haswell Refresh, или, если говорить о флагманских модификациях, то Devil’s Canyon. Удивительно, что подобное полугигагерцовое ускорение было достигнуто без каких-либо реформ техпроцесса, а лишь за счёт простых косметических изменений в схеме питания процессоров и благодаря улучшению теплопроводящих свойств термопасты, используемой под крышкой CPU. В качестве примера можно привести, новый старший процессор Core i7-4790K, который по номинальной частоте взял отметку в 4,0 ГГц и получил максимальную частоту с учётом турбо-режима на уровне 4,4 ГГц.

На фоне результатов Sandy Bridge их разгон нельзя было назвать выдающимся, к тому же достижение высоких частот требовало сложного «скальпирования» – демонтажа процессорной крышки с последующей заменой штатного термоинтерфейса на какой-либо материал с лучшей теплопроводностью. Впрочем, даже представители семейства Devil’s Canyon особенно жалуемыми в среде энтузиастов предложениями стать не смогли.

Компания долго не могла решить, стоить ли вообще выпускать на рынок десктопные процессоры с этим дизайном, поскольку при попытках изготовления крупных полупроводниковых кристаллов уровень брака превышал приемлемые значения. Из-за сложностей, которые преследовали Intel при переводе массового производства на 14-нм нормы, выступление следующего, пятого по счёту поколения процессоров Core, Broadwell, получилось сильно скомканным. В конечном итоге предназначенные для настольных компьютеров четырёхъядерники Broadwell всё-таки появились, но во-первых, произошло это лишь летом 2015 года – с девятимесячным опозданием относительно изначально запланированного срока, а во-вторых, уже через два месяца после их анонса Intel представила дизайн следующего поколения, Skylake.

И даже более того, в настольных процессорах этого поколения применялись такие решения, к которым ни до того, ни после того Intel никогда не прибегала. Тем не менее, с точки зрения развития микроархитектуры Broadwell трудно назвать вторичной разработкой. И это значит не только то, что процессоры этого семейства обладали самым мощным на тот момент встроенным видеоядром, но и также то, что они комплектовались дополнительным 22-нм кристаллом Crystall Well, представляющим собой основанную на eDRAM кеш-память четвёртого уровня. Уникальность десктопных Broadwell определялась тем, что в них проникло производительное интегрированное графическое ядро Iris Pro уровня GT3e.

Однако установленная в Broadwell память eDRAM архитектурно была выполнена именно как виктимный кеш, и ей могли пользоваться и вычислительные ядра CPU. Смысл добавления в процессор отдельного чипа быстрой встроенной памяти вполне очевиден и обусловлен потребностями производительного встроенного графического ядра в фрейм-буфере с низкой латентностью и высокой пропускной способностью. Правда, при этом несколько пострадал объём расположенного в процессорном кристалле L3-кеша, который был сокращён с 8 до 6 Мбайт. В результате, десктопные Broadwell стали единственными в своём роде массовыми процессорами с 128 Мбайт L4-кеша.

Несмотря на то, что Broadwell относился к фазе «тик», переделки коснулись входной части исполнительного конвейера. Некоторые улучшения были заложены и в базовой микроархитектуре. В сумме все нововведения повысили эффективность внеочередного исполнения команд и предсказания сложных ветвлений кода. Было увеличено окно планировщика внеочередного исполнения команд, в полтора раза вырос объём таблицы ассоциативной трансляции адресов второго уровня, а кроме того, вся схема трансляции приобрела второй обработчик промахов, что позволило обрабатывать по две операции преобразования адресов параллельно. По итогам всего этого Intel даже смогла утверждать, что улучшения микроархитектуры повысили удельную производительность Broadwell по сравнению с Haswell на величину порядка пяти процентов. Попутно были усовершенствованы механизмы выполнения операций умножения, которые в Broadwell стали обрабатываться в существенно более быстром темпе.

И кеш четвёртого уровня, и микроархитектурные изменения лишь пытались скомпенсировать главный изъян Broadwell – низкие тактовые частоты. Но несмотря на всё это, ни о каком существенном преимуществе первых десктопных 14-нм процессоров вести речь было невозможно. Из-за проблем с технологическим процессом базовая частота старшего представителя семейства, Core i7-5775C, была установлена лишь на уровне 3,3 ГГц, а частота в турбо режиме не превышала 3,7 ГГц, что оказалось хуже характеристик Devil’s Canyon на целых 700 МГц.

Предельные частоты, до которых удавалось раскочегаривать десктопные Broadwell без использования продвинутых методов охлаждения, находились в районе 4,1-4,2 ГГц. Подобная же история произошла и с разгоном. Первым же полноценным 14-нм чипом для настольных компьютеров, который смог привлечь к себе внимание широких слоёв пользователей, стал только следующий проект микропроцессорного гиганта – Skylake. Поэтому нет ничего удивительного, что потребители восприняли выпуск Broadwell скептически, и процессоры этого семейства так и остались странным нишевым решением для тех, кто был заинтересован в производительном встроенном графическом ядре.

Однако здесь Intel уже смогла добиться нормальных тактовых частот и разгона: старшая десктопная версия Skylake, Core i7-6700K получила номинальную частоту 4,0 ГГц и авторазгон в рамках турбо-режима до 4,2 ГГц. Производство Skylake, как и процессоров предыдущего поколения, выполнялось по 14-нм техпроцессу. Дело в том, что Skylake – это «так» в интеловской номенклатуре, что означает существенные изменения в микроархитектуре. Это чуть более низкие значения, если сравнивать с Devil’s Canyon, однако более новые процессоры оказались определённо быстрее предшественников.

Улучшений в дизайне Skylake на первый взгляд было сделано не так много, но все они носили прицельный характер и позволили устранить имевшиеся слабые места в микроархитектуре. И они действительно есть. Усовершенствования затронули блок предсказания переходов и входную часть исполнительного конвейера. Если коротко, то Skylake получили увеличенные внутренние буфера для более глубокого внеочередного исполнения инструкций и более высокую пропускную способность кеш-памяти. В довершение разработчики потрудились над повышением эффективности технологии Hyper-Threading. Также был увеличен темп исполнения инструкций деления, и перебалансированы механизмы исполнения операций сложения, умножения и FMA-инструкций. В сумме это позволило добиться примерно 10-процентного улучшения производительности на такт в сравнении с процессорами прошлых поколений.

Микроархитектура Skylake

Микроархитектура Skylake

С одной стороны, за счёт увеличения мощности декодера (с 4 до 5 микроопераций за такт) и скорости работы кеша микроопераций (с 4 до 6 микроопераций за такт) существенно увеличился темп декодирования инструкций. В целом, Skylake можно охарактеризовать как достаточно глубокую оптимизацию исходной архитектуры Core с расчётом на то, чтобы в дизайне процессора не оставалось никаких узких мест. А с другой – выросла эффективность обработки получающихся микроопераций, чему поспособствовало углубление алгоритмов внеочередного исполнения и перераспределение возможностей исполнительных портов вместе с серьёзной ревизией темпа исполнения целого ряда обычных, SSE и AVX-команд.

В Skylake этот дисбаланс был устранён и сложения стали выполняться уже на двух портах. Например, Haswell и Broadwell имели по два порта для исполнения умножений и FMA-операций над вещественными числами, но только один порт предназначался для сложений, что плохо соответствовало реальному программному коду. В конечном итоге всё это привело к тому, что практически для любого типа операций в Skylake всегда есть несколько альтернативных портов. Кроме того, количество портов, способных работать с целочисленными векторными инструкциями, выросло с двух до трёх. А это значит, что в микроархитектуре наконец были успешно устранены практически все возможные причины простоя конвейера.

Кроме того, сократилась ассоциативность кеша второго уровня, что в конечном счёте позволило улучшить его КПД и уменьшить штраф при обработке промахов. Заметные изменения затронули и подсистему кеширования: пропускная способность кеш-памяти второго и третьего уровня была увеличена.

Так, в Skylake вдвое выросла пропускная способность кольцевой шины, которая соединяет воедино все процессорные блоки. Существенные перемены произошли и на более высоком уровне. А в дополнение к этому для соединения процессора с чипсетом стала применяться новая шина DMI 3. Кроме того, в CPU этого поколения обосновался новый контроллер памяти, который получил совместимость с DDR4 SDRAM. 0 в том числе и через чипсет. 0 с увеличенной вдвое пропускной способностью, что дало возможность реализовать скоростные линии PCI Express 3.

А это значит, что и в шестом поколении микроархитектуры Core разработчики Intel продолжили придерживаться тактики поэтапного внедрения улучшений на каждом цикле разработки. Впрочем, как и все предшествующие версии архитектуры Core, Skylake представлял собой ещё одну вариацию на тему изначального дизайна. Но зато при модернизации старых систем ощутимый прирост производительности заметить совсем несложно. В целом это – не слишком впечатляющий подход, который не позволяет увидеть какие-то значимые изменения в производительности сразу – при сравнении CPU из соседних поколений. Например, сама Intel охотно сравнивала Skylake с Ivy Bridge, демонстрируя при этом, что за три года быстродействие процессоров выросло более чем на 30 процентов.

После Skylake какое бы то ни было улучшение удельной производительности процессорных ядер прекратилось совсем. И в действительности это был достаточно серьёзный прогресс, потому что потом всё стало значительно хуже. Неожиданный простой случился из-за того, что Intel не смогла справиться со внедрением следующей версии полупроводникового процесса с 10-нм нормами. Те процессоры, которые представлены на рынке в настоящее время, всё ещё продолжают использовать микроархитектурный дизайн Skylake, несмотря на то, что с момента его появления в десктопных процессорах прошло уже почти три года. В результате весь принцип «тик-так» рассыпался, вынудив микропроцессорного гиганта как-то выкручиваться и заниматься многократным перевыпуском старых продуктов под новыми именами.

Близкие родственные связи между двумя поколениями процессоров особо и не скрывались. Процессоры поколения Kaby Lake, которые появились на рынке в самом начале 2017 года, стали первым и очень ярким примером попыток Intel продать клиентам тот же Skylake во второй раз. При этим под словом «оптимизация» понимались некие улучшения в структуре 14-нм транзисторов, которые открывали возможность увеличения тактовых частот без изменения рамок теплового пакета. Intel честно говорила, что Kaby Lake – это уже не «тик» и не «так», а простая оптимизация предыдущего дизайна. Благодаря этой производственной технологии старший массовый десктопный процессор Kaby Lake, получивший наименование Core i7-7700K, смог предложить пользователям номинальную частоту 4,2 ГГц и частоту турбо-режима 4,5 ГГц. Для видоизменённого техпроцесса был даже придуман специальный термин «14+ нм».

До этого момента каждое последующее поколение процессоров, не важно, относилось оно к фазе «тик» или «так», обеспечивало хоть какой-то прирост показателя IPC. Таким образом, рост частот Kaby Lake по сравнению с оригинальным Skylake составил примерно 5 процентов, и этим всё и ограничивалось, что, честно говоря, ставило под сомнение правомерность отнесения Kaby Lake к следующему поколению Core. Между тем в Kaby Lake никаких микроархитектурных улучшений не было вообще, поэтому эти процессоры логичнее было бы считать просто вторым степпингом Skylake.

Правда, Intel продолжила использовать под процессорной крышкой вместо припоя термопасту, поэтому для полноценного разгона Kaby Lake необходимо было проводить скальпирование. Однако новая версия 14-нм техпроцесса всё же смогла кое в чём положительно проявить себя: разгонный потенциал Kaby Lake по сравнению с Skylake подрос примерно на 200-300 МГц, благодаря чему процессоры данной серии оказались достаточно тепло встречены энтузиастами.

Поэтому в конце прошлого года на рынок была выведена ещё одна разновидность процессоров, построенных на всё той же микроархитектуре Skylake – Coffee Lake. Не справилась Intel и с вводом в строй 10-нм технологии и к началу текущего года. Прошлый год стал периодом кардинальной смены парадигмы на процессорном рынке. Но говорить о Coffee Lake как о третьем обличье Skylake не совсем правильно. Внезапно Intel оказалась в роли догоняющей, и выход Coffee Lake стал не столько попыткой заполнить паузу до долгожданного появления 10-нм процессоров Core, сколько реакцией на выход шести- и восьмиядерных процессоров AMD Ryzen. В «большую игру» вернулась AMD, которая смогла переломить устоявшиеся традиции и создать спрос на массовые процессоры с числом ядер более четырёх.

Однако при этом никаких изменений на уровне микроархитектуры вновь введено не было: Coffee Lake по сути – шестиядерный Skylake, собранный на основе точно таких же по внутреннему устройству вычислительных ядер, которые снабжены увеличенным до 12 Мбайт L3-кешем (по стандартному принципу 2 Мбайт на ядро) и объединены привычной кольцевой шиной. В результате, процессоры Coffee Lake получили важное структурное отличие от своих предшественников: число ядер в них было увеличено до шести штук, что с массовой платформой Intel произошло впервые.

Хотя в микроархитектуре вновь ничего не поменялось, специалистам Intel пришлось потратить немало усилий для того, чтобы шестиядерные процессоры смогли вписаться в стандартную десктопную платформу. Впрочем, несмотря на то, что мы так запросто позволяем себе говорить о Coffee Lake «ничего нового», говорить о полном отсутствии каких-то перемен не совсем справедливо. И результат вышел достаточно убедительным: шестиядерные процессоры остались верны привычному тепловому пакету и, более того, совсем не замедлились по тактовым частотам.

При этом оверклокерский потенциал Coffee Lake, несмотря на его более массивный полупроводниковый кристалл, оказался даже лучше, чем у всех предшественников. В частности, старший представитель поколения Coffee Lake, Core i7-8700K, получил базовую частоту 3,7 ГГц, а в турбо-режиме он может разгоняться до 4,7 ГГц. И это значит, что Coffee Lake хоть и экстенсивный, но существенный шаг вперёд. Core i7-8700K нередко выводятся их рядовыми владельцами на пятигигагерцовый рубеж, причём такой разгон бывает реален даже без скальпирования и замены внутреннего термоинтерфейса.

На четвёртый год его использования для массового производства десктопных чипов Intel удалось добиться действительно впечатляющих результатов. Всё это стало возможным исключительно благодаря очередному усовершенствованию 14-нм технологического процесса. Внедрением шестиядерности Intel, пожалуй, смогла совершить даже более значительный шаг вперёд, чем любым из предшествующих тому улучшений микроархитектуры. Внедрённая третья версия 14-нм норм («14++ нм» в обозначениях производителя) и перекомпоновка полупроводникового кристалла позволили существенно улучшить производительность в пересчёте на каждый затраченный ватт и поднять суммарную вычислительную мощность. И сегодня Coffee Lake смотрится весьма соблазнительным вариантом для модернизации старых систем, основанных на предыдущих носителях микроархитектуры Core.

Кодовое имя

Техпроцесс

Число ядер

GPU

L3 кеш, Мбайт

Число транзисторов, млрд.

Площадь кристалла, мм2

Sandy Bridge

32 нм

4

GT2

8

1,16

216

Ivy Bridge

22 нм

4

GT2

8

1,2

160

Haswell

22 нм

4

GT2

8

1,4

177

Broadwell

14 нм

4

GT3e

6

Н/д

~145 + 77 (eDRAM)

Skylake

14 нм

4

GT2

8

Н/д

122

Kaby Lake

14+ нм

4

GT2

8

Н/д

126

Coffee Lake

14++ нм

6

GT2

12

Н/д

150

⇡#Процессоры и платформы: спецификации

Основные характеристики этих процессоров приведены в следующей таблице. Для проведения сравнения семи последних поколений Core i7 мы взяли старших представителей в соответствующих сериях – по одному от каждого дизайна.

Core i7-2700K

Core i7-3770K

Core i7-4790K

Core i7-5775C

Core i7-6700K

Core i7-7700K

Core i7-8700K

Кодовое имя

Sandy Bridge

Ivy Bridge

Haswell (Devil’s Canyon)

Broadwell

Skylake

Kaby Lake

Coffee Lake

Технология производства, нм

32

22

22

14

14

14+

14++

Дата выхода

23.10.2011

29.04.2012

2.06.2014

2.06.2015

5.08.2015

3.01.2017

5.10.2017

Ядра/потоки

4/8

4/8

4/8

4/8

4/8

4/8

6/12

Базовая частота, ГГц

3,5

3,5

4,0

3,3

4,0

4,2

3,7

Частота Turbo Boost, ГГц

3,9

3,9

4,4

3,7

4,2

4,5

4,7

L3-кеш, Мбайт

8

8

8

6 (+128 Мбайт eDRAM)

8

8

12

Поддержка памяти

DDR3-1333

DDR3-1600

DDR3-1600

DDR3L-1600

DDR4-2133

DDR4-2400

DDR4-2666

Расширения набора инструкций

AVX

AVX

AVX2

AVX2

AVX2

AVX2

AVX2

Интегрированная графика

HD 3000 (12 EU)

HD 4000 (16 EU)

HD 4600 (20 EU)

Iris Pro 6200 (48 EU)

HD 530 (24 EU)

HD 630 (24 EU)

UHD 630 (24 EU)

Макс. частота графического дра, ГГц

1,35

1,15

1,25

1,15

1,15

1,15

1,2

Версия PCI Express

2.0

3.0

3.0

3.0

3.0

3.0

3.0

Линии PCI Express

16

16

16

16

16

16

16

TDP, Вт

95

77

88

65

91

91

95

Сокет

LGA1155

LGA1155

LGA1150

LGA1150

LGA1151

LGA1151

LGA1151v2

Официальная цена

$332

$332

$339

$366

$339

$339

$359

Несмотря на то, что дважды менялся технологический производственный процесс и дважды серьезно оптимизировалась микроархитектура, сегодняшние Core i7 почти не продвинулись вперёд по своей рабочей частоте. Любопытно, что за прошедшие с момента выпуска Sandy Bridge семь лет Intel так и не смогла заметно нарастить тактовые частоты. Новейший Core i7-8700K имеет номинальную частоту 3,7 ГГц, что всего лишь на 6 процентов выше частоты вышедшего в 2011 году Core i7-2700K.

Если же ориентироваться на четырёхъядерный Core i7-7700K, то рост частоты выглядит всё-таки убедительнее: этот процессор ускорился относительно 32-нм Core i7-2700K на достаточно весомые 20 процентов в мегагерцовом выражении. Впрочем, такое сравнение не совсем корректно, ведь Coffee Lake имеет в полтора раза больше вычислительных ядер. Хотя всё равно вряд ли это можно назвать впечатляющим приростом: в абсолютных величинах это конвертируется в прибавку по 100 МГц в год.

Intel продолжает снабжать все свои процессоры индивидуальной кеш-памятью второго уровня объёмом 256 Кбайт на ядро, а также общим на все ядра L3-кешем, размер которого определяется из расчёта 2 Мбайт на ядро. Нет никаких прорывов и в других формальных характеристиках. Развитие Core начиналось с четырёхъядерных CPU, а пришло к шестиядерным. Иными словами, главный фактор, по которому произошёл самый большой прогресс – это число вычислительных ядер. Причём, очевидно, что это ещё не конец, и в ближайшей перспективе мы увидим и восьмиядерные варианты Coffee Lake (либо Whiskey Lake).

Даже шестиядерный Coffee Lake по сравнению с предшествующими четырёхъядерными флагманами подорожал всего лишь на шесть процентов. Впрочем, как нетрудно заметить, за семь лет у Intel почти не менялась и ценовая политика. Все же остальные старшие процессоры класса Core i7 для массовой платформы всегда обходились потребителям в сумму порядка $330-340.

Пропускная способность двухканальной SDRAM с момента выхода Sandy Bridge и до сегодняшнего дня выросла вдвое: с 21,3 до 41,6 Гбайт/с. Любопытно, что самые крупные перемены произошли даже не с самими процессорами, а с поддержкой ими оперативной памяти. И это – ещё одно немаловажное обстоятельство, определяющее преимущество современных систем, совместимых со скоростной DDR4-памятью.

Если вести речь о главных вехах в развитии платформы, то помимо роста скорости совместимой памяти, отметить хочется и появление поддержки графического интерфейса PCI Express 3. Да и вообще, все эти годы вместе с процессорами эволюционировала и вся остальная платформа. Кажется, что скоростная память и быстрая графическая шина наряду с прогрессом в частотах и архитектурах процессоров выступают весомыми причинами того, что современные системы стали лучше и быстрее прошлых. 0. Поддержка DDR4 SDRAM появилась в Skylake, а перевод процессорной шины PCI Express на третью версию протокола произошёл ещё в Ivy Bridge.

Действительно, сегодняшние интеловские чипсеты трёхсотой серии могут предложить гораздо более интересные возможности в сравнении с Intel Z68 и Z77, которые использовались в LGA 1155-материнских платах под процессоры поколения Sandy Bridge. Кроме того, заметное развитие получили и сопутствующие процессорам наборы системной логики. В этом нетрудно убедиться по следующей таблице, в которой мы свели воедино характеристики флагманских интеловских чиспсетов для массовой платформы.

 

P67/Z68

Z77

Z87

Z97

Z170

Z270

Z370

Совместимость с CPU

Sandy Bridge
Ivy Bridge

Haswell

Haswell
Broadwell

Skylake
Kaby Lake

Coffee Lake

Интерфейс

DMI 2.0 (2 Гбайт/с)

DMI 3.0 (3,93 Гбайт/с)

Стандарт PCI Express

2.0

3.0

Линии PCI Express

8

20

24

Поддержка PCIe M.2

Нет

Есть

Есть, до 3 устройств

Поддержка PCI

Есть

Нет

SATA 6 Гбит/с

2

6

SATA 3 Гбит/с

4

0

USB 3.1 Gen2

0

USB 3.0

0

4

6

10

USB 2.0

14

10

8

4

Самое главное: благодаря переходу чипсетов на шину PCI Express 3. В современных наборах логики существенно развились возможности для подключения высокоскоростных носителей информации. И одно только это может стать веским аргументом в пользу модернизации. 0 сегодня в производительных сборках можно использовать быстродействующие NVMe-накопители, которые даже по сравнению с SATA SSD могут предложить заметно лучшую отзывчивость и более высокую скорость чтения и записи.

И речь не только о существенном увеличении числа линий PCI Express, что обеспечивает наличие на платах несколько дополнительных слотов PCIe, заменяющих обычные PCI. Кроме того, современные наборы системной логики предоставляют гораздо более богатые возможности для подключения дополнительных устройств. 0, а многие современные материнские платы снабжаются и портами USB 3. Попутно в сегодняшних чипсетах имеется также и врождённая поддержка портов USB 3. 1 Gen2.

Следующая страница →

⇣ Содержание

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть