Хабрахабр

Балансировка нагрузки в Openstack

В крупных облачных системах особенно остро стоит вопрос автоматической балансировки или выравнивания нагрузки на вычислительные ресурсы. Озаботились данным вопросом и в Тиониксе (разработчик и оператор облачных услуг, входим в группу компаний Ростелекома).

Наш выбор пал на Watcher, который мы и решили использовать для своих нужд.

Для начала разберемся с терминами и определениями.
И, поскольку нашей основной платформой разработки является Openstack, а мы, как и все люди, ленивы, то было решено подобрать какой-то готовый модуль, что уже есть в составе платформы.

Термины и определения

Цель — это человекочитаемый, наблюдаемый и поддающийся измерению конечный результат, который должен быть достигнут. Для достижения каждой цели имеются одна или более стратегии. Стратегия — это реализация алгоритма, который способен найти решение для данной цели.

Действие (Action) — это элементарная задача, которая изменяет текущее состояние целевого управляемого ресурса кластера OpenStack, такая как: миграция виртуальной машины (migration), изменение состояния питания узла (change_node_power_state), изменение состояния службы nova (change_nova_service_state), изменение флэвора (resize), регистрация NOP сообщения (nop), отсутствие действий в течении определенной продолжительности времени — пауза (sleep), перенос диска (volume_migrate).

План действий также содержит оцениваемую глобальную эффективность с набором показателей эффективности. План действий (Action Plan) — специфический поток действий, осуществленных в определенном порядке для достижения конкретной Цели. План действий состоит из списка последовательных действий. План действий генерируется Watcher при успешно проведенном аудите, в результате которого использованная стратегия находит решение для достижения цели.

Оптимизация выполняется для того, чтобы достичь одну Цель в данном кластере. Аудит (Audit) — это запрос на оптимизацию кластера. Для каждого успешного аудита Watcher генерирует План действий.

Область аудита определена в каждом шаблоне. Область аудита (Audit Scope) — это набор ресурсов, в рамках которых производится аудит (зона(ы) доступности, агрегаторы узлов, отдельные вычислительные узлы или узлы хранения и т.д.). Если область аудита не указана, производится аудит всего кластера.

Шаблоны необходимы для того, чтобы многократно запускать аудиты с одинаковыми настройками. Шаблон аудита (Audit Template) — сохраненный набор настроек для запуска аудита. Шаблон должен обязательно содержать цель аудита, если стратегии не указываются, то выбираются наиболее подходящие из существующих стратегий.

Кластер (Cluster) — это набор физических машин, которые предоставляют вычислительные ресурсы, ресурсы хранения и сетевые ресурсы и управляются одним и тем же управляющим узлом OpenStack.

Модель данных кластера (Cluster Data Model, CDM) — это логическое представление текущего состояния и топологии управляемых кластером ресурсов.

Показатели эффективности специфичны для конкретной цели и обычно используются для расчета глобальной эффективности итогового плана действий. Показатель эффективности (Efficacy Indicator) — показатель, который указывает на то, как выполняется решение, созданное с помощью данной стратегии.

Действительно, каждое решение, предложенное стратегией, будет проверено на соответствие спецификации, прежде чем рассчитывать его глобальную эффективность. Спецификация эффективности (Efficacy Specification) — это набор специфических особенностей, связанный с каждой Целью, который определяет различные показатели эффективности, которые стратегия, обеспечивающая достижение соответствующей цели, должна обеспечивать в своем решении.

Таким образом, расчет не зависит от среды, в которой он выполняется, — он даст одинаковый результат в любом месте. “Подсчитывающий” движок (Scoring Engine) — это исполняемый файл, который имеет четко определенные входные данные, четко определенные выходные данные и выполняет чисто математическую задачу.

Этот модуль принимает набор действий, сгенерированных стратегией, и создает план рабочего процесса, который определяет, как планировать во времени эти различные действия и для каждого действия, каковы предварительные условия. Watcher планировщик (Watcher Planner) — часть механизма принятия решений Watcher.

Цели и стратегии Watcher

Dummy goal — резервная цель, которая используется для тестирования (reserved goal that is used for testing purposes).

Dummy strategy — фиктивная стратегия, используемая для интеграционного тестирования через Tempest. Связанные стратегии: Dummy Strategy, Dummy Strategy using sample Scoring Engines и Dummy strategy with resize. Эта стратегия не обеспечивает никакой полезной оптимизации, его единственная цель — использовать тесты Tempest.

Dummy strategy using sample Scoring Engines — стратегия аналогична предыдущей, отличается лишь использованием образца “оценивающего движка”, ведущего подсчет с использованием методов машинного обучения.

Dummy strategy with resize — стратегия аналогична предыдущей, отличается лишь использованием изменения флэвора (миграция и ресайз).

Не используется в продакшн.

Стратегия данной цели Saving Energy Strategy совместно со стратегией VM Workload Consolidation Strategy (Server Consolidation) способна выполнять функции динамического управления питанием (DPM), которые экономить электроэнергию за счет динамической консолидации рабочих нагрузок даже в периоды низкой загрузки ресурсов: виртуальные машины переносятся на меньшее количество узлов, а ненужные узлы — отключаются. Saving Energy — минимизировать потребление энергии. Для работы стратегии должен быть включен и настроен Ironic для работы с включением/отключением питания на узлах. После консолидации стратегия предлагает решение о включении/выключении узлов в соответствии с заданными параметрами: “min_free_hosts_num” — количество свободных включенных узлов, которые ожидают нагрузки, и “free_used_percent” — процентное соотношение свободных включенных узлов к количеству узлов, которое занято машинами.

Параметры стратегии

В облаке должно быть минимум два узла. Используемый метод — изменение состояния питания узла (change_node_power_state). Сбора метрик стратегия не требует.

Имеет две стратегии: Basic Offline Server Consolidation и VM Workload Consolidation Strategy. Server Consolidation — минимизировать количество вычислительных узлов (консолидация).

Стратегия Basic Offline Server Consolidation минимизирует общее количество используемых серверов, а также минимизирует количество миграций.

Базовая стратегия требует следующие метрики:

Параметры стратегии: migration_attempts — количество комбинаций для поиска потенциальных кандидатов на выключение (по умолчанию, 0, нет ограничений), period — интервал времени в секундах для получения статической агрегации из источника данных метрики (по умолчанию, 700).

Используемые методы: миграция, изменение состояния службы nova (change_nova_service_state).

Эта стратегия предоставляет решение, которое приводит к более эффективному использованию ресурсов кластера, используя следующие четыре этапа: Стратегия VM Workload Consolidation Strategy основана на эвристической алгоритме первого подходящего (first-fit), который фокусируется на измеренной загрузке CPU и пытается минимизировать узлы, которые имеют слишком большую или слишком небольшую нагрузку с учетом ограничений емкости ресурсов.

  1. Фаза разгрузки — обработка перерасходованных ресурсов;
  2. Фаза консолидации — обработка недостаточно используемых ресурсов;
  3. Оптимизация решения — сокращение количества миграций;
  4. Отключение неиспользуемых вычислительных узлов.

Стратегия требует следующие метрики:
Следующие метрики не являются обязательными, но повышают точности стратегии, если доступны:
Параметры стратегии: period — интервал времени в секундах для получения статической агрегации из источника данных метрики (по умолчанию, 3600).

Подробнее здесь. Использует те же методы, что и предыдущая стратегия.

Цель обладает тремя стратегиями: Workload Balance Migration Strategy, Workload stabilization, Storage Capacity Balance Strategy. Workload Balancing — сбалансировать рабочую нагрузку между вычислительными узлами.

Решение о переносе принимается всякий раз, когда % использования CPU или ОЗУ узла превышает указанный порог. Workload Balance Migration Strategy запускает миграции виртуальных машин на основе рабочей нагрузки виртуальных машин узлов. При этом перемещаемая виртуальная машина должна приблизить узел к средней рабочей нагрузке всех узлов.

Требования

  • Использование физических процессоров;
  • Минимум два физических вычислительных узла;
  • Установленный и настроенный компонент Ceilometer — ceilometer-agent-compute, работающий на каждом вычислительном узле, и Ceilometer API, а также сбор следующих метрик:

Параметры стратегии:
Используемый метод — миграция.

Стратегия основана на алгоритме стандартного отклонения и определяет, существует ли перегрузка в кластере, и реагирует на нее путем запуска миграции машин для стабилизации кластера. Workload stabilization — стратегия, направленная на стабилизацию рабочей нагрузки с использованием живой миграции.

Требования

  • Использование физических процессоров;
  • Минимум два физических вычислительных узла;
  • Установленный и настроенный компонент Ceilometer — ceilometer-agent-compute, работающий на каждом вычислительном узле, и Ceilometer API, а также сбор следующих метрик:

Storage Capacity Balance Strategy (стратегия реализована начиная с Queens) — стратегия переносит диски в зависимости от загруженности пулов Cinder. Решение о переносе принимается всякий раз, когда коэффициент использования пула превышает указанный порог. Перемещаемый диск должен приблизить пул к средней нагрузке всех пулов Cinder.

Требования и ограничения

  • Минимум два пула Cinder;
  • Возможность миграции дисков.
  • Модель данных кластера — Cinder cluster data model collector.

Параметры стратегии:
Используемый метод — миграция диска (volume_migrate).

Собственная стратегия: Noisy Neighbor (используемый параметр стратегии — cache_threshold (значение по умолчанию — 35), при падении производительности до указанного значения запускается миграция. Noisy Neighbor — идентифицировать и перенести “шумного соседа” — виртуальной машины с низким приоритетом, которая негативно влияет на производительность виртуальной машины с высоким приоритетом с точки зрения IPC, чрезмерно используя Last Level Cache. Для работы стратегии необходимы включенные LLC (Last Level Cache) метрики, последний Intel сервер с поддержкой CMT, а также сбор следующих метрик:

Модель данных кластера (по умолчанию): Nova cluster data model collector. Применяемый метод — миграция.

Работа с данной целью через Dashboard не реализована в полном объеме в Queens.

Температура на выходе (вытяжной воздух) является одной из важных тепловых телеметрических систем для измерения состояния тепловой / рабочей нагрузки сервера. Thermal Optimization — оптимизировать температурный режим. Для цели имеется одна стратегия — Outlet temperature based strategy, которая принимает решения о переносе рабочих нагрузок на узлы с благоприятным температурным режимом (самая низкая температура на выходе), когда температура на выходе исходных хостов достигает настраиваемого порога.

0 или более поздней версии, а также сбор следующих метрик:
Для работы стратегии необходим сервер с установленным и настроенным Intel Power Node Manager 3.

Параметры стратегии:
Используемый метод — миграция.

Собственная стратегия — Uniform Airflow using live migration. Airflow Optimization — оптимизировать режим вентилирования. Стратегия  запускает миграцию виртуальной машины всякий раз, когда воздушный поток от вентилятора сервера превышает указанный порог.

Для работы стратегии необходимы:

  • Аппаратное обеспечение: вычислительные узлы <с поддержкой NodeManager 3.0;
  • Минимум два вычислительных узла;
  • Установленный и настроенный на каждом вычислительном узле компонент  ceilometer-agent-compute и Ceilometer API, который может успешно сообщать о таких метриках как поток воздуха, мощность системы, температура на входе:

Для работы стратегии необходим сервер с установленным и настроенным Intel Power Node Manager 3.0 или более поздней версии.

Ограничения: Концепция не предназначена для продакшна.

Предлагается использовать этот алгоритм с непрерывными аудитами, поскольку за одну итерацию планируется миграция только одной виртуальной машины.

Возможны живые миграции.

Параметры стратегии:

Используемый метод — миграция.

Стратегия, относящаяся к данной целе, — Zone migration.  Стратегия является инструментом для эффективной автоматической и минимальной миграции виртуальных машин и дисков в случае необходимости проведения технического обслуживания аппаратных средств. Hardware Maintenance — обслуживание аппаратных средств. Существует два параметра конфигурации: веса действий (action_weights) и распараллеливание (parallelization). Стратегия выстраивает план действий в соответствии с весами: набор действий, который имеет больший вес, будут запланированы раньше других.

Ограничения: необходима настройка весов действий и распараллеливания.

Параметры стратегии:

Элементы массива вычислительных узлов:
Элементы массива узлов хранения:
Элементы приоритетности объектов:
Используемые методы — миграция виртуальных машин, миграция дисков.

Не содержит спецификаций и может использоваться всякий раз, когда стратегия еще не связана с существующей целью. Unclassified — вспомогательная цель, используемая для облегчения процесса разработки стратегии. Связанная с данной целью стратегия — Actuator.    Эта цель также может быть использована в качестве переходного этапа.

Создание новой цели

Watcher Decision Engine имеет интерфейс плагина “внешней цели”, который дает возможность интегрировать внешнюю цель, которая может быть достигнута с помощью стратегии.

Прежде чем создавать новую цель, следует убедиться, что ни одна из существующих целей не соответствует вашим потребностям.

Создание нового плагина

Чтобы создать новую цель, вы должны: расширить класс цели, реализовать метод класса get_name () для возвращения уникального идентификатора новой цели, которую вы хотите создать. Этот уникальный идентификатор должен совпадать с именем точки входа, которую вы декларируете позже.

Далее необходимо реализовать метод класса get_display_name () для возвращения переведенного отображаемого имени цели, которую вы хотите создать (не используйте переменную для возврата переведенной строки, чтобы она могла автоматически собираться инструментом перевода.).

Возвращаемое значение должно совпадать со строкой, переведенной в get_display_name (). Реализуйте метод класса get_translatable_display_name (), чтобы вернуть ключ перевода (фактически английское отображаемое имя) вашей новой цели.

Метод get_efficacy_specification () возвращает экземпляр Unclassified (), предоставленный Watcher. Реализуйте его метод get_efficacy_specification (), чтобы вернуть спецификацию эффективности для вашей цели. Эта спецификация эффективности полезна в процессе разработки вашей цели, поскольку она соответствует пустой спецификации.

→ Подробнее здесь

Архитектура Watcher (подробнее здесь).

Компоненты

Механизмы взаимодействия: CLI, плагин Horizon, Python SDK. Watcher API — компонент, реализующий REST API, предоставляемый Watcher.

Watcher DB — база данных Watcher.

Watcher Applier — компонент, реализующий выполнение плана действий, созданного компонентом Watcher Decision Engine.

Если стратегия не указана, компонент самостоятельно выбирает наиболее подходящую. Watcher Decision Engine — компонент, отвечающий за вычисление набора потенциальных действий по оптимизации для выполнения цели аудита.

Функционал компонента может предоставляться также Ceilometer publisher. Watcher Metrics Publisher — компонент, который собирает и вычисляет некоторые метрики или события и публикует их в конечной точке CEP.

По соображениям производительности может быть несколько экземпляров CEP Engine, работающих одновременно, каждый из которых обрабатывает определенный тип метрики / событий. Complex Event Processing (CEP) Engine — движок комплексной обработки событий. В системе Watcher CEP запускает два типа действий: — записать соответствующие события / метрики в базу данных временных рядов; — отправлять соответствующие события в компонент Watcher Decision Engine, когда это событие может повлиять на результат текущей стратегии оптимизации, поскольку кластер Openstack не является статической системой.

Взаимодействие компонентов осуществляется по протоколу AMQP.

→ Конфигурирование Watcher

Схема взаимодействия с Watcher

Результаты тестирования Watcher

  1. На странице Optimization — Action plans 500 ошибка (как на чистом Queens, так и на стенде с модулями Тионикс), появляется только после того, как запускается аудит и генерируется план действий, пустая открывается нормально.
  2. На вкладке Action details ошибки, не удается получить цель и стратегию аудита (как на чистом Queens, так и на стенде с модулями Тионикс).
  3. Аудиты с целью Dummy (тестовые) создаются и запускаются нормально, генерируются планы действий.
  4. Аудиты с целью Unclassified не создаются, так как цель не является функциональной и предназначена для промежуточной настройки при создании новых стратегий.
  5. Аудиты с целью Workload Balancing (стратегия Storage Capacity balance) создаются успешно, однако план действий не генерируется. Не требуется оптимизация пулов хранения.
  6. Аудиты с целью Workload Balancing (стратегия Workload Balance Migration Strategy) создаются успешно, однако план действий не генерируется.
  7. Аудиты с целью Workload Balancing (стратегия Workload Stabilization Strategy) завершаются ошибкой.
  8. Аудиты с целью Noisy Neighbor создаются успешно, однако план действий не генерируется.
  9. Аудиты с целью Hardware maintenance создаются успешно, план действий генерируется не в полном объеме (генерируются показатели эффективности, но не генерируется сам список действий).
  10. Правки в конфигах nova.conf (в default секции compute_monitors = cpu.virt_driver) на вычислительных и управляющем узле не исправляют ошибки.
  11. Аудиты с целью Server Consolidation (стратегия Basic) также завершаются с ошибкой.
  12. Аудиты с целью Server Consolidation (стратегия VM workload consolidation) завершаются с ошибкой. В логах ошибка получения исходных данных. Обсуждение ошибки, в частности, здесь.
    Попробовали указать в конфиг-файле Watcher (не помогло — в результате ошибки на всех страницах Optimization, возвращение к исходному содержимому конфиг-файла не исправляет ситуацию):

    [watcher_strategies.basic]
    datasource = ceilometer, gnocchi

  13. Аудиты с целью Saving Energy завершаются с ошибкой. Судя по логам, проблема все-таки в отсутствии Ironic, не будет работать без baremetal service.
  14. Аудиты с целью Thermal Optimization завершаются с ошибкой. Трейсбек тот же, что и для Server Consolidation (стратегия VM workload consolidation) (ошибка исходных данных)
  15. Аудиты с целью Airflow Optimization завершаются с ошибкой.

Встречаются также следующие ошибки завершения аудита. Трейсбэк в логах decision-engine.log (не определено состояние кластера).

→ Обсуждение ошибки здесь

Заключение

Результатом наших двухмесячных изысканий стал однозначный вывод о том, что для получения полноценной, работающей системы балансировки нагрузки нам придется, в этой части, вплотную заняться доработкой инструментария для платформы Openstack.

Watcher показал себя серьезным и быстро развивающимся продуктом с огромным потенциалом, для полноценного использования которого потребуется большая и серьезная работа.

Но об этом – в следующих статьях цикла.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть