Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс
Не только гиганты индустрии, но и молодые компании демонстрировали весьма интересные и заслуживающие внимания новинки. На выставке, посвящённой конференции SC19, очень богато была представлена тема искусственного интеллекта и машинного обучения.
Этот чип является результатом усилий, сконцентрированных на создании ИИ-процессора для систем с низкой латентностью, включая комплексы IoT. Одной из таких новинок стал процессор MN-Core, разработанный силами японской компании Preferred Networks (PFN), основанной в 2014 году на средства корпорации Toyota.
Он рассказал, что компания PFN создала семейство частных суперкомпьютеров для того, чтобы ускорить собственные разработки в области глубокого машинного обучения. В создании MN-Core принимал участие профессор Токийского университета Кей Хираки (Kei Hiraki). Первая такая система, MN-1, была запущена в 2017 году и показала мощность свыше 19 Петафлопс, заняв первое место в рейтинге японских суперкомпьютеров.
Разработчики замахнулись на процессор с теплопакетом 500 Ватт! Первые системы PFN были классическим сочетанием процессоров общего назначения и ускорителей на базе GPU NVIDIA, но уже следующая машина должна будет использовать новый чип MN-Core, который, если верить обещаниям, превзойдет в энергоэффективности существующие решения.
Он не будет монолитным ‒ уже показанный на выставке образец даёт понять, что речь идёт о сборке из четырёх кристаллов в общем корпусе. Производиться MN-Core будет с использованием 12-нм технологических норм на мощностях TSMC. Маркировка GRAPE-DR указывает на преемственность архитектуры, берущей своё начало в разработанном PFN ранее сопроцессоре физических вычислений.
Чип довольно крупный, 85 × 85 миллиметров, общая площадь кристаллов составляет 756,7 мм2, проектная вычислительная мощность — 524 Тфлопс на вычислениях половинной точности (FP16), что даёт удельную производительность порядка 1 Тфлопс на ватт.
Ускоритель на базе MN-Core представляет собой классическую полноразмерную плату расширения с разъёмом PCI Express 3. Несмотря на то, что базовым режимом является FP16, доступны будут и более точные вычисления в форматах FP32/64 — ценой совместной работы вычислительных блоков и соответствующего снижения производительности. Тип памяти и показатели ПСП пока неизвестны. 0, которая, помимо процессора, будет нести на борту и 32 Гбайт памяти.
Каждый серверный узел будущего суперкомпьютера MN-3 будет иметь высоту 7U и включать в себя четыре ускорителя MN-Core. По словам профессора Хираки, главной проблемой разработчиков был высокий уровень тепловыделения, но им удалось создать воздушную систему охлаждения, способную справиться с энергопотреблением в районе 600 ватт. Это позволит достичь производительности почти 2,1 петафлопса на сервер.
Вероятнее всего, речь идёт об Intel Xeon Scalable. Заявлено наличие двух разъёмов для ЦП общего назначения с теплопакетом до 200 Ватт. Каждый сервер получит до 24 дисковых отсеков, из которых как минимум два будут поддерживать протокол NVMe.
Планируется достичь производительности свыше 2 Экзафлопс (1018 операций в секунду) при потреблении электроэнергии порядка 3,36 МВт. Проектируемый сейчас суперкомпьютер MN-3 будет состоять из 4800 чипов MN-Core, но пока неясно, сколько стоек для этого потребуется; сама компания называет цифры в районе 300 единиц. Для сравнения, суперкомпьютер Summit развивает 1,88 Экзафлопса, потребляя 13 МВт.
Поставлять MN-Core другим разработчикам или производителям серверного оборудования PFN не планирует. Компания планирует ввести MN-3 в строй уже в 2020 году, причём система будет использоваться исключительно для обеспечения вычислительными мощностями новых разработок Preferred Networks. Тем самым она идёт по стопам таких гигантов, как Google и Amazon, также разрабатывающих собственные ИИ-процессоры для своих облачных систем и кластеров.