Хабрахабр

Чем интересен новый UCS C480 ML M5 — сервер для машинного обучения от Cisco

В марте этого года компания Cisco представила блейд-сервер Cisco UCS B480 M5. На базе этой системы мы развернули новый пул ресурсов в Санкт-Петербурге и готовим к запуску аналогичный пул в Москве. Но буквально полгода спустя (в сентябре) ИТ-гигант выпустил еще одну новинку — UCS C480 ML M5, «заточенный» для работы с системами искусственного интеллекта. Рассказываем, что внутри, и зачем это все дата-центрам.


/ Wikimedia / Tibigc / CC

Что внутри

Новая разработка компании — модифицированная версия сервера C480 M5. Для ускорения обработки алгоритмов машинного обучения два слота для CPU в том сервере заменили на разъемы для GPU. В эти слоты поместили графические ускорители Tesla V100-32G от NVIDIA.

Производительность каждого из ускорителей в 47 раз превосходит показатели традиционных процессоров на задачах глубокого обучения. Общее количество карт достигает восьми штук. Обмен данными идет через встроенный интерфейс NVLink — это 200 ГБ/с на один GPU.

При этом к серверу можно подключить до 24 HDD или SSD через интерфейсы SAS или SATA. Также в C480 ML M5 установлены два процессора Intel Xeon, каждый из которых поддерживает до 28 ядер, и 3 ТБ оперативной памяти.

Зачем нужен новый сервер

По словам представителей Cisco, сервер должен упростить работу с моделями машинного обучения на всех этапах их разработки: от сбора и анализа данных до вывода результатов обработки. При этом он подходит для работы с конвейеризованными приложениями в многооблачных средах. Речь идет о фреймворках Hadoop и Spark, а также TensorFlow и PyTorch. Дополнительно Cisco ведет переговоры о сотрудничестве с платформой Anaconda, а также совместно с Google работает над Kubeflow.

— Технологии машинного обучения можно использовать для оценки всех процессов, происходящих в ЦОД. «Новый ML M5 упростит работу с системами искусственного интеллекта для облачных провайдеров и компаний, владеющих дата-центрами, — комментирует Сергей Белкин, начальник отдела развития 1cloud. Например, Tetration Analytics собирает данные телеметрии от программных и аппаратных датчиков и обрабатывает их с помощью методов МО». Такие приложения уже есть в экосистеме Cisco.

Cisco предполагают, что к 2019 году 70% хакерских атак будут использовать шифрование трафика, поэтому, по их мнению, дополнительные мощности нового сервера также сыграют важную роль в защите ИТ-инфраструктуры дата-центров. Для этих целей у ИТ-гиганта тоже есть свое решение: Encrypted Traffic Analytics. Система выявляет уязвимые места в инфраструктуре и обнаруживает вредоносные паттерны даже в зашифрованном трафике.


/ Wikimedia / Global Access Point / PD

Аналитикам и разработчикам в этих организациях будет проще извлекать полезную информацию из Big Data. Отметим, что релиз C480 ML M5 повлияет и на работу организаций, которые обрабатывают большие объемы данных, — например медицинских и финансовых. Новый сервер Cisco ускорит процесс обработки крупных сводов информации и поиска паттернов (например, при анализе медицинских снимков).

А к 2035 году технологии МО помогут увеличить производительность организаций на 40%. По словам представителей Cisco, 80% мировых бизнесов уже внедрили сервисы на базе технологий искусственного интеллекта или внедрят такие решения к 2020 году.

Перспективы и планы на будущее


Директор по исследованиям в Gartner Чираг Декате (Chirag Dekate) считает, что C480 ML M5 будет пользоваться спросом у старых и новых клиентов компании. При этом директор по работе с партнерами Скотт Мор (Scott Mohr) говорит, что Cisco продолжит совершенствовать решения для сервисов на основе нейронных сетей, и важную роль в этом процессе сыграет опыт клиентов. Поэтому сейчас новинка тестируется полусотней партнеров Cisco.

Несмотря на ведущиеся тесты, пока сказать что-либо об эффективности нового сервера не представляется возможным. Позже систему сделают доступной для всех сертифицированных партнеров компании. Специалисты Cisco (в отличие от той же NetApp) решили не предоставлять результаты тестов производительности Resnet или Alexnet, поскольку, по их словам, они не отражают положение вещей при работе на реальных проектах с машинным обучением.

Заказать C480 ML M5 можно будет уже в конце этого года.

Несколько материалов по теме из корпоративного блога 1cloud

Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»