Хабрахабр

Как выбрать IaaS-провайдера: 4 критерия, на которые стоит обратить внимание

По прогнозам агентства Gartner, 45% небольших организаций и 40% крупных мировых компаний планируют перенести свои бизнес-процессы в облако за ближайшие три года. И всем им, вне зависимости от размера, придется решать, какого провайдера выбрать.

Сегодня мы решили рассказать, опираясь на свой опыт и опыт наших клиентов, на какие аспекты стоит обратить внимание при выборе надёжного IaaS-провайдера.


/ фото Kin Lane CC

Смотрим на Tier

Практически все сбои в дата-центрах происходят из-за ошибок при проектировании, испытаниях, техническом обслуживании или эксплуатации объекта. Поэтому при выборе поставщика нужно обращать внимание не только на доступные базовые характеристики виртуальных серверов. Важно оценить инфраструктуру провайдера, её надежность.

Поэтому наиболее доступный способ проверки IaaS-провайдера — убедиться в наличии сертификации. Ездить по дата-центрам и самостоятельно проверять все аспекты очень трудозатратно.

C 1990-х годов она является отраслевым ориентиром для провайдеров и знаком должного проектирования и реализации систем дата-центра. Стандартная классификация ЦОД Uptime Institute представляет собой уровневую систему показателей работы дата-центров (от Tier I до Tier IV).

Например, дата-центр с резервированием холодоснабжения, в котором при отказе одной из действующих кондиционирующих установок приходится заменять аппарат на запасной, будет отнесен к классу Tier II. Она оценивает такие параметры, как дублирование критических систем, отказоустойчивость, наличие резервных компонентов и др.

Поэтому такие дата-центры поддерживают параллельный ремонт, что повышает уровень доступности сервисов. Более высокий класс, Tier III или Tier IV, получит ЦОД, у которого в случае отказа системы охлаждения резервная будет подключена автоматически.

Здесь задублированы все инженерные системы и имеются несколько каналов распределения электропитания. Облако «ИТ-ГРАД» размещается в дата-центрах, сертифицированных по классу Tier III. Например, в московском ЦОД DataSpace электропитание резервируется по схеме N+1.

Основная задача дата-центра и провайдера — предоставить качественный сервис для бизнеса, решить его проблему. Однако надо понимать, что классификация дата-центров по системе UI не построена по принципу «от худшего к лучшему». Поэтому малым предприятиям, для которых наличие дублирующих систем некритично, вполне подойдёт ЦОД с базовым уровнем Tier I или Tier II c резервными компонентами. То есть соответствовать в плане задач и масштабов.

Более крупным компаниям, для которых нежелателен простой инфраструктуры даже на короткое время, стоит обратить внимание на дата-центры с подтверждённым классом Tier III (у таких ЦОД допустимое время простоя составляет порядка 1,6 часа в год).

В официальном стандарте UI, эти плюсы не зафиксированы. Если говорить о сертификатах типа Tier+, то мы рекомендуем относиться к ним внимательнее. Плюс говорит о том, что, возможно, один из элементов инфраструктуры выполнен по более надёжной схеме, но на её работе и отказоустойчивости это почти никак не сказывается. Однако это не мешает многим компаниям в коммерческих предложениях добавлять их к обозначению класса. Вам как покупателю это не даёт больших преимуществ, а цена предложения обычно в таких случаях возрастает.

Оцениваем физическую защищенность дата-центра

Помимо сертификата UI, стоит дополнительно обратить внимание и на физическую защищенность периметра ЦОД. Одним из самых труднодоступных ЦОД в мире является площадка компании Visa (Tier IV по стандартизации UI). Дата-центр окружён дренажным прудом, который выполняет функцию рва. Для получения доступа к помещениям центра обработки данных сотрудникам приходится прикладывать палец к датчикам у каждой двери, чтобы система считала биометрические данные.

Однако есть три момента, которые нужно учитывать обязательно: пропускной режим, камеры наблюдения, защищенные «клетки» для серверных стоек. В большинстве случаев, конечно, гнаться за максимальной безопасностью не стоит.

Посетители и транспорт проходят обязательную регистрацию и проверку на территории дата-центра. Например, дата-центр Xelent, в котором развёрнута часть облачной инфраструктуры «ИТ-ГРАД» в Санкт-Петербурге, имеет систему контроля и управления доступом (СКУД).

Сервера «ИТ-ГРАД» находятся под «присмотром» камер круглосуточно. Сама территория оснащена двумя сотнями камер видеонаблюдения, а система контроля включает 5 периметров безопасности. При этом все стойки располагаются в отдельном помещении, защищенном высокопрочными решетками и недоступном для посторонних.

Подводные камни SLA

После проверки надежности и защищенности дата-центра провайдера важно оценить соглашение об уровне обслуживания (SLA), которое должно гарантировать выполнение заранее оговорённых требований. В нем прописывают количественные показатели измерения качества обслуживания (QoS). Например, доступность, время отклика и пропускную способность сети.

Также можно почитать рекомендации, представленные Национальным институтом стандартов и технологий (NIST). Хорошей отправной точкой для изучения могут быть стандарты, прописанные в ISO / IEC 19086.

А далее мы кратко приведем несколько моментов, на которые в SLA нужно обратить особое внимание:

  • При оценке уровня доступности сервиса не забудьте проверить временной период, чтобы не получить условный час простоя в месяц, а не несколько минут в год. Также проверьте согласованное время работоспособности услуги (СВР) — провайдер, например, может гарантировать доступность приложений 99,95% только с 8 часов утра до 22 часов вечера в рабочие дни;
  • Исключения и послабления — пункт, в котором прописаны условия, освобождающие поставщика от его обязанностей. Сюда может быть включён подпункт о том, что провайдер не несёт ответственности, если сбой в работе вызвало ПО, установленное клиентом самостоятельно;
  • Изучите определённые в SLA значения качественных показателей измерения доступности, таких как среднее время восстановления (MTTR) и среднее время между сбоями (MTBF);
  • Уточните у IaaS-провайдера, где заканчивается его зона ответственности при возникновении сетевых задержек или потерь пакетов, чтобы в случае проблем с сетью оперативно обратиться к своему интернет-провайдеру;
  • Оцените размер и правила предоставления денежного возмещения при несоблюдении условий предоставления услуги. В том числе в случае взлома и получения информации компании третьими лицами.

Оцениваем работу техподдержки и доп. услуги

В рамках подписанной SLA поставщик несёт ответственность за простои, поломки, последствия плановых работ и аварийных ситуаций. И в этом случае он должен оперативно реагировать на все возникающие сбои и восстанавливать работоспособность инфраструктуры. Чтобы в этом убедиться, стоит оценить работу технической поддержки (часы работы, какими инструментами пользуется) и наличие дополнительных сервисов, отвечающих за сохранность данных (в частности, системы резервного копирования).

Мы используем методологию ITILv3 и практики ITSM/MOF, а также ресурсно-сервисную модель IaaS в связке с системой мониторинга, в которую интегрирована ITSM-система ServiceNow. Например, в компании «ИТ-ГРАД» техническая поддержка работает круглосуточно без праздников и выходных. Все это даёт более развёрнутую оценку качества работы инфраструктуры.


/ фото Dennis van Zuijlekom CC

Провайдеры часто предоставляют такие сервисы в формате BaaS, что помогает компаниям минимизировать затраты (в том числе на специализированные аппаратные устройства). Что касается аварийных ситуаций, то многие IaaS-провайдеры, как уже было отмечено, предлагают услугу резервного копирования для защиты данных.

Если у заказчика есть своё оборудование, которое можно использовать для хранения бэкапов, мы предлагаем гибридную модель резервирования, позволяющую сократить окна резервного копирования и время восстановления. Например, для работы с бэкапами клиенты компании «ИТ-ГРАД» получают дистрибутивы специальных агентов для резервирования данных требуемых приложений. О том, как с помощью NetApp SnapCenter можно восстановить корпоративные данные, мы рассказывали в одном из наших материалов. При этом, если клиент использует СХД NetApp, у него есть возможность настроить резервное копирование данных так часто, как это необходимо.

Подведем итоги

Подведём итоги всему сказанному о выборе IaaS-провайдера:

  • ЦОД, предлагаемый IaaS-провайдером для развёртывания облака, должен быть сертифицирован в соответствии с требованиями отказоустойчивости по международной системе UI (классы от Tier I до Tier IV). При этом с осторожностью нужно относиться к знаку «+» рядом с классом дата-центра. Такое обозначение отсутствует в стандартной классификации, мало что даёт, но может быть причиной «накрутки» цены;
  • При проверке физической надёжности площадки стоит обратить особое внимание на три пункта: пропускной режим, камеры наблюдения, расположение стоек;
  • SLA должен гарантировать уровень доступности сервисов и порядок денежного возмещения в случае несоблюдения условий предоставления услуги. Также необходимо, чтобы конфигурация у виртуальной инфраструктуры отвечала вашим задачам;
  • Обратите внимание на наличие и условия работы дополнительных сервисов. Например, сервис резервного копирования может послужить гарантией от сбоев и потери информации.

P.S. О чем еще мы пишем в Первом блоге о корпоративном IaaS:
P.P.S. Свежие посты из нашего блога на Хабре:

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть