Железо

Экзафлопс на перепутье: задержка Intel в освоении новых техпроцессов может повлиять на сроки запуска суперкомпьютера Aurora

Основной темой обсуждений в СМИ пятничного доклада Intel о состоянии дел во втором квартале стало признание проблем с освоением техпроцесса 7 нм и связанные с этим задержки выхода продуктов на его основе, которые могут составить от 6 до 12 месяцев. И одним из таких продуктов является ускоритель Ponte Vecchio, который должен стать ключевым компонентом суперкомпьютера Aurora.

Впрочем, у данной машины, создаваемой для Аргоннской национальной лаборатории (Argonne National Laboratory), непростая судьба. Изначально анонс суперкомпьютера Aurora состоялся в 2015 году. Прежний проект предполагал построением силами Intel и Cray машины производительностью 180 Пфлопс, которая должна была заработать в 2018 году. Основной для ней должны были стать 10-нм чипы Xeon Phi семейства Knights Hill (KNH), выход которых был запланирован на всё тот же 2018 год. Как мы теперь знаем, ни своевременного освоения 10 нм, ни ускорителей KNH компания сделать не смогла. Более того, в конце концов развитие Xeon Phi было остановлено, а финальные партии последнего поколения Knights Mill будут отгружены в конце июля. Та же судьба постигла анонсированный вместе с KNH интерконнект Omni-Path (OPA).

В конце 2017 года произошло сразу три важных для Aurora события. Во-первых, проект суперкомпьютера был полностью переработан — запуск был перенесён на 2021 год, а запланированная производительность поднялась до отметки в 1 Эфлопс. По задумке, Aurora должна была стать самым лучшим и производительным суперкомпьютером в США, а то и в мире. Вместо Xeon Phi, и это во-вторых, для него было запланировано использование ускорителей нового поколения, которые теперь известные как Intel Xe Ponte Vecchio. В-третьих, в Intel перешёл Раджа Кодури (Raja Koduri), который возглавил группу разработки дискретных GPU.

Старая презентация Aurora

Старая презентация Aurora

Очевидным выходом из сложившейся ситуации является обращение к сторонним фабрикам, которые уже освоили необходимые норма. В первую очередь речь идёт, конечно, о TSMC, которая обслуживает конкурирующие AMD и NVIDIA. Сообщается, что Intel разместила на TSMC заказ на 180 тыс. 6-нм (но не 5-нм, как ожидалось) пластин. Ранее Intel использовала TSMC в основном для производства относительно простых и недорогих чипсетов и SoC, а также FPGA. Для сравнения — объём заказов AMD составляет 200 тыс. пластин. Какие именно продукты и компоненты будут производиться на стороне, точно не говорится, хотя в ходе квартального доклада Intel упоминала о разнородных кристаллах в Ponte Vecchio, часть из которых действительно можно было бы отдать стороннему подрядчику.

Архитектура Ponte Vecchio действительно является модульной и предполагает подбор необходимых вычислительных блоков в зависимости от задачи и предназначения устройства. При этом до конца не ясно, предполагается ли многочиповая компоновка для таких блоков или же нет. В прошлогодней презентации Intel Xe HPC, которые и будут установлены в Aurora, явно говорилось только о подключении HBM2-памяти посредством EMIB, а также об упаковке Foveros для формирования Rambo Cache, кеша общей шины XE Memory Fabric, объединяющей CPU, GPU и память.

В комментарии изданию insideHPC аналитик Hyperion Research Стив Конвей (Steve Conway) отмечает, что «запуск Aurora может быть перенесён на конец 2021 года или на самое начало 2022. Это не слишком большая задержка, но всё-таки задержка. <…> Проблемы с техпроцессом касаются не только GPU, но и вообще всех 7-нм компонентов». Конвей говорит, что Intel, по-видимому, будет отдавать часть производства на аутсорс, но только в начальный период времени. Нельзя не отметить, что серверный сегмент важен для Intel.

Новая Aurora

Новая Aurora

В любом случае, эта ситуация может положительно сказаться на AMD. По словам аналитика, нынешние 7-нм AMD EPYC хороши с точки зрения пропускной способности памяти, а цена на эти процессоры зачастую меньше. Комбинация этих двух факторов способствует росту. Сейчас на базе решений AMD (CPU + GPU) разрабатываются два суперкомпьютера: El Capitan с производительностью более 2 Эфлопс, ввод в строй которого намечен на 2023 год, и Frontier мощностью 1,5 Эфплос, который должен быть запущен в следующем году. Как и в случае Aurora, подрядчиком в обоих проектах выступает Cray (теперь уже HPE).

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Источник:

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть