Железо

Новая статья: SC18: RISC — дело благородное

За исключением нефтегазовых компаний, которые иной раз будут побогаче некоторых стран, дело это сугубо государственного уровня, а значит, и политическое во многом. Суперкомпьютинг — занятие увлекательное и в конечном итоге очень даже прибыльное, вот только очень и очень дорогое. Но намного важнее и то, что все участники гонки сознательно стремятся избежать зависимости от этой страны, поэтому вынесенное в заголовок упоминание RISC не случайно. На наших глазах разворачивается гонка за экзафлопсом, так что возврат США в лидеры TOP500 в этом свете особенно важен. Речь про совершенно незаметную и совсем скупую новость о выходе на большую сцену новой архитектуры: Евросоюз хочет с нуля создать собственный суперкомпьютер на базе RISC-V и FPGA. Нет, речь не про уникальное появление в рейтинге первого ARM-суперкомпьютера, которое, конечно, тоже очень важно. Лет через пять узнаем, что из этого выйдет, а пока посмотрим на текущий расклад дел в индустрии. Затея несколько рискованная.

TOP500 и все-все-все

Здесь же по традиции соберём небольшую статистику. Вкратце о свежем списке TOP500 можно узнать из отдельной заметки. Число POWER-систем упало с 15 до 13, но это не важно, потому что конкретно POWER9-инсталляций стало пять. SPARC-машин как было шесть, так и осталось. Обе, конечно, снабжены ускорителями NVIDIA Volta GV100, так что лидерство тут обеспечивает не только IBM. И из этих пяти две машины занимают вершину рейтинга TOP500: Summit и Sierra. А из 153 новичков рейтинга 52 также имеют эти GPU — по большей части это V100, но есть и P100. Ну и в целом около 130 машин из 500 имеют те или иные версии ускорителей NVIDIA. Из непривычных архитектур — всё те же китайцы, которые не ушли с первых строчек TOP500, да японцы, медленно, но верно продвигающиеся к концу списка. В целом в этом сегменте довольно стандартна связка Xeon Skylake/Broadwell + NVIDIA.

Про первое — скромный суперкомпьютер Astra на базе узлов HPE Appolo 70 с ARM-процессорами Cavium (теперь уже Marvel) ThunderX 2 — мы кратко писали в репортаже с ISC 2018. Впрочем, нынешний TOP500 войдёт в историю хотя бы потому, что в нём есть два главных «открытия». С другой стороны, он и заявлялся как экспериментальный, как машина для переноса и отладки ПО, для оценки применимости ARM в HPC. Он действительно довольно скромный и занимает 203 место. Да, это всё ещё немного не тот ARM-процессор, который ждут, — пока без SVE-инструкций, своего рода аналога AVX. Поэтому важно то, что это своего рода первая демонстрация силы ARM, поскольку никаких ускорителей в этой машине нет, всё считается на CPU. Хотя, справедливости ради, не всегда и везде такие инструкции нужны.

Похоже, переход ARM в руки японцев пойдет только на пользу. Что-то такое мы увидим году этак в 2020-м, на примере того же Fujitsu A64FX для проекта Post-K. Однако про Shasta разговор отдельный — эта платформа «берёт» универсальностью устанавливаемых узлов (AMD/Intel, NVIDIA, FPGA), и главная её фишка — в механических решениях и быстром интерконнекте для лёгкого объединения разнородных вычислителей в единую систему. Впрочем, даже на текущих Cavium французы будут делать суперкомпьютер, а из прочих крупных игроков у той же Cray давно ест варианты узлов XC50 с ними, да и новая Shasta обделена ими не будет. Ещё острее этот вопрос стоит для новых специализированных ускорителей вроде NEC Aurora.  С другой стороны, как уже неоднократно говорилось, для успеха ARM важны не только и не столько CPU/SoC, сколько хорошая программная платформа, позволяющая быстро перенести уже имеющийся софт на новую архитектуру без потери производительности, что в случае HPC не всегда просто.

На SC18 несчастные Qulacomm Centriq засветились лишь в одном продукте GIGABYTE, осенние Ampere eMAG на выставке не появились (ну или я, конечно, мог их и не заметить), а про Samsung только циркулируют слухи, но никакой конкретики нет. Ну а в области SoC с лета дела особо не поменялись. Во-первых, похоже, продолжается развитие Phytium Xiaomi (не путать с производителем смартфонов и прочей потребительской электроники) для прототипа суперкомпьютера Tianhe экзафлопсного класса. На помощь приходит Китай. Во-вторых, HiSilicon — дочка Huawei — продолжает разработку собственных чипов Hi16xx. Обещанного три года ждут? У Huawei давно есть сервера TaiShan с CPU этой серии, а некоторые даже побывали в CERN. В феврале 2019-го ожидается появление Hi1620 (7 нм, до 64 ядер, до 64 Мбайт L3, 8 × DDR4-3200, TDP до 200 Вт).

Тут на сцену как раз и выходит ещё одна относительно свежая архитектура, которая, правда, пока что для HPC никаких реальных воплощений не имеет, но есть надежда, что таковые очень скоро появятся. Однако переход ARM к Японии понравился не всем. На SC18 приехала SiFive совместно с Open-Silicon и Credo. Речь, конечно, о RISC-V. Вторая больше известна решенями в области HBM-памяти, а третья занимается SerDes-продуктами. Первая компания — это, наверное, самый известный разработчик. В общем, не самый плохой набор для старта. Присоседилась к ним CCIX, решения которой теперь доступны и в кремнии, так что эту шину можно было увидеть на многих стендах. SiFive предлагает настраиваемые ядра и SoC на их базе. Идея довольно простая. Credo даёт SerDes-шину 112 Гбит/с, а OpenSilicon, поглощённая SiFive, не только добавит в сборку HBM2, но и в принципе всё это добро соберёт, протестирует и подготовит к производству. В данном случае предлагается ядро серии U7. А если надо, то и разместит заказы на фабриках, а также ещё раз проверит и упакует готовые чипы.

Цель: 64-битные многоядерные чипы на 7-нм техпроцессе в 2,5D-упаковке. Все вместе они могут обеспечить заказчику полный цикл производства или взять на себя любой из этапов. "Байкал-Т1"). Пока что U7, судя по всему, несильно отличаются в плане производительности от привычных ARM и MIPS: 2,5 DMIPS/МГц и 4,9 CoreMark/МГц (для сравнения — см. Кроме того, Евросоюз жаждет независимости, поэтому активно вкладывается в разработку собственных процессоров на базе всё тех же ARM и RISC-V. Но архитектура молодая и открытая, так что всё в теории возможно. Да, с учётом относительно небольших партий SoC/CPU, стоимость подобных проектов будет довольно высокой. По слухам, виды на RISC-V имеет и индийское правительство. Зато это позволит хотя бы частично отказаться от продукции США.

Япония, как уже понятно, полностью делает ставку на ARM. В России, напомним, есть собственные "Эльбрусы" (суперкомьютер пока в планах), а также ведётся разработка серверных ARM. А вот Китай не гнушается любых разработок. В США и так всего хватает, но ARM тоже могут появиться. А вот третий ключевой игрок — вовсе не Lenovo или Huawei, а Sugon, ещё одна давно известная компания, которая хоть и имеет в нынешнем TOP500 более 50 инсталляций, знакома пока не всем. Про TaihuLight и Tianhe все и так наслышаны — обе компании активно развивают собственные архитектуры. Да, формально это процессоры Hygon Dhyana (клон EPYC 7501), а не оригинал. А зря, потому что именно она и представила второе «открытие» рейтинга — первый суперкомпьютер на базе AMD EPYC. Правда, узлы этой системы, находящейся сейчас на 38 месте TOP500, также снабжены некими ускорителями с безликим названием Deep Computing Processor (что это?). Но всё равно возврат в высшую лигу для AMD очень важен. В будущем же ожидается создание как минимум одной большой системы Hawk на базе уже EPYC Rome. 

Тоже на базе EPYC, но с ускорителями NVIDIA формата SXM2: 4 + 4. На выставке Sugon показала не узлы этого суперкомпьютера, а одно из своих решений серии Silicon Cube. В данном случае это иммерсионная система на уровне узлов. Сочетание несколько необычное, как и использованная для отвода тепла СЖО. Вообще, половина инсталляций в TOP500 использует Ethernet, но в основном 10/25/40 Гбит/с, и лишь совсем чуть-чуть может похвастаться 100 Гбит/с. Интересно и то, что это единственное решение с интерконнектом 200 Гбит/с Ethernet (возможно, это новый Broadcom Thor). Остальное — проприетарные разработки. InfiniBand установлен почти в 130 машинах, а Omni-Path есть в чуть больше 40. Впрочем, для экзафлопсных машин этого всё равно мало — пока следует ориентироваться на уровень в 500 Гбит/с.

Деньги и цифры

Но это касается только серверной составляющей, а в целом рынок HPC, который включает ещё и СХД, ПО и сопутствующие сервисы, в плане выручки вырастет с $24,3 млрд до 38,4. Выручка от суперкомпьютерного рынка, согласно прогнозу Hyperion Research, вырастет с $12,3 млрд в 2017 до 19,6 в 2022 году. Крупнейшие сектора в деньгах в порядке убывания по итогам 2017 года таковы: государственные лаборатории во всём своём многообразии, академические проекты, инженерные расчёты (CAE), оборонные (хотя тут скорее уж просто военные) исследования и биотехнологии. За полный 2018 год данных пока, конечно, нет, но ожидается рост рынка минимум на 8 %. Например, на погоду, которую часто приводят как хороший пример HPC-задач, потратили всего-то полмиллиарда долларов. Остальные области оцениваются в менее чем $1 млрд каждая.

А потому что гонка за первенство создания систем экзафлопсного класса приобретает уже какие-то фантастические масштабы. Почему «всего-то»? Основные игроки, как уже неоднократно говорилось, всё те же: США, Япония, Китай, Евросоюз. Прогнозируется, что итоговая стоимость подобных суперкомпьютеров может достичь $1 млрд за штуку. Никаких существенных новостей по этим проектам нет, за исключением Китая. Все, кроме США, заняты созданием своих собственных CPU. Последняя и далее будет развивать наработки вроде ShenWei 26010, точная архитектура которых до сих пор неизвестна, хотя в Сети полно спекуляций на тему того, что всё это наследие легендарных DEC Alpha, пусть и изрядно переработанное. Мы уже увидели результат работы Sugon, которая и далее будет сотрудничать с AMD, борясь попутно за финансирование с Sunway.

Предполагается, что третья версия машины получит упомянутые выше Phytium, но слегка обновлённые: 64-битные ARM, 64 ядра, 16-нм техпроцесс, 2-2,4 ГГц. Зато Tianhe точно будет развиваться далее. А ведь, помимо Matrix-ускорителей, там стоят только древние по современным меркам Xeon поколения IvyBridge. И она же будет снабжена наследниками ускорителей Matrix-2000, которые весьма неплохи — нынешнее, второе поколение Tianhe только сейчас удалось сместить с вершины рейтинга. С учётом наработок в области DRAM и Flash, а также усовершенствования фабрик, есть реальный шанс создания полностью «домашнего» суперкомпьютера! Проект Tianhe интересен ещё и тем, что интерконнект там тоже собственный: TH Express-2.

У США есть большая четвёрка — AMD, IBM, Intel, NVIDIA — и Micron, а также пачка компаний поменьше. Япония делает ставку на ARM64 с SVE в своём Post-K, хотя та же NEC, к примеру, развивает активность со своими векторными ускорителями Aurora, которые в кремнии уже готовы, но всё ещё требуют адаптации софта. Предварительно от ETP4HPC в рамках European Processor Initiative ожидается выход в первом квартале 2021 года семейства CPU Rhea EP271x на базе RISC-V + FPGA, а также программных компонентов для него. В Европе развиваются сразу несколько межгосударственных и межиндустриальных проектов, деньги на которые не жалеют: рост инвестиций в эту область выше, чем в США. Впрочем, реально экзафлопсные машины от всех игроков стоит ждать примерно в 2022-2023 годах. Затем появится  серия Cronos. И только Китай рассчитывает выпустить их в 2021 году.

Впервые выделенные в отдельную группу квантовые вычисления пока тоже всё ещё в подвешенном состоянии. Остальные пункты отчёта Hyperion с летней версии особо не поменялись. Впрочем, в целом 2018 год видится весьма успешным для HPC, хотя самая «жара» начнётся только в 2022-м. Не понятно, будут ли они дополнять HPC или окажутся совершенно самостоятельной областью. Ключевые проблемы софта всё те же: сложности с масштабированием на всё более крупные системы, нехватка адаптированных алгоритмов, малая унификация решений, неоптимальное (не на полную мощь) использование гибридных систем. ИИ и прочая аналитика данных показывают рост, но всё равно находятся в самом начале развития, хотя именно за счёт этих технологий сейчас и растёт HPC.

В NASA исследовали и моделировали риски удара астероидов, а в UberCloud занимались двумя совершенно несвязанными областями. Традиционные награды за инновации получили представители NASA и UberCloud. Аналогичный метод пригоден и для лечения болезни Паркинсона. Одна касается неинвазивного индивидуального лечения шизофрении посредством электростимуляции отдельных участков мозга. Исследовать пришлось создать весьма сложную модель жилого здания и проследить её поведение с течением времени, чтобы выяснить, почему они в итоге получило повреждения и кто именно в этом виноват. Вторая, совершенно неожиданно, связана со спором в суде, что происходит впервые в истории.

Что дальше?

Но… всё равно растёт и растёт уверенность, что не всё в порядке в этом королевстве. И вот вроде бы всё хорошо и стабильно в HPC-мире: рынок растёт, юбилеи празднуются, мощности увеличиваются. Напротив, это можно рассматривать как начало большого конца текущей эры. Действительно больших потрясений уже давно не было, а последние крупные сдвиги в этой индустрии — приход и резкий рост ускорителей NVIDIA в HPC, а также безальтернативность СЖО в новых системах — теперь уже не кажутся чем-то удивительным. Просто задумайтесь, в чём отличие домашнего ПК от сервера? И дело не только в Cray с её Shasta, где явно виден переход к гетерогенным вычислениям. Не пора ли что-то поменять? Принципиально уже давно никаких отличий нет. Вот об этом и поговорим в следующей статье. 

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть