Хабрахабр

Интервью с Zabbix: 12 откровенных ответов

Это можно сказать и про нашу систему мониторинга. В IT есть такое суеверие: «Работает, не трогай». И, по сути, альтернатив у него не было. В Southbridge мы используем Zabbix — когда мы его выбирали, он был очень крут.

У Zabbix появился мощный конкурент, который превосходил во многих аспектах: скорость работы, HA практически из коробки, красивая визуализация, оптимизация работы в kubernethes окружении. Со временем наша экосистема обросла инструкциями, дополнительными обвязками, появилась интеграция с redmine.

Мы решили заглянуть на огонек в Zabbix и поинтересоваться, какие фишки они планируют сделать в ближайшие релизы. Но мы не торопимся переходить. Что из этого получилось, читайте далее. Мы не церемонились и задавали неудобные вопросы Сергею Сорокину, директору по развитию Zabbix, и Виталию Журавлеву, Solution architect.

Расскажите об истории компании. 1. Как родилась идея продукта?

Алексею казалось неэффективным управлять базами без наличия на руках данных об исторических значениях самых различных параметров, без понимания текущего и исторического состояния окружающей среды. История компании началась в 1997 году, когда основатель и владелец компании Алексей Владышев работал администратором баз данных в одном из банков.

Поэтому Алексей начинает писать различные скрипты, которые позволяют ему эффективно мониторить вверенную ему часть инфраструктуры. При этом присутствующие в тот момент на рынке решение по мониторингу являются очень дорогостоящими, неповоротливыми, и требующими больших ресурсов. Алексей меняет работы, но интерес к проекту остаётся. Это превращается в хобби. При этом встал вопрос, под какой лицензией выпустить существующий код. В 2000-2001 годах проект переписывается с нуля — и Алексей задумывается над тем, чтобы дать возможность другим администраторам использовать наработки. Инструмент сразу заметили в профессиональной среде. Алексей принял решение выпустить его под лицензией GPLv2. Количество таких заказов постоянно росло. Со временем к Алексею стали приходить запросы на оказание поддержки, проведение обучения, расширение возможностей программного обеспечения. Компания была основана 12 апреля 2005 года Так, естественным образом, пришло решение о создании компании.

Какие ключевые точки можете выделить в истории развития Zabbix? 2.

Начало работы Алексея над скриптами — 1997 год.
б. Таких точек на данный момент несколько:
а. Основание компании Zabbix — 2005 год.
г. Публикация кода под лицензией GPLv2 — 2001 год.
в. Основание Zabbix Japan LLC — 2012 год.
е. Заключение первых партнёрских договоров, создание партнёрской программы — 2007 год.
д. Основание ООО Заббикс — 2018 год Основание Zabbix LLC (USA) — 2015 год
ж.

Сколько у вас работает людей? 3.

На данный момент в группе компаний Zabbix работает чуть больше 70 сотрудников: разработчиков, тестировщиков, руководителей проектов, инженеров поддержки, консультантов, продавцов, сотрудников маркетинга.

Как вы пишете roadmap, собираете ли обратную связь от пользователей? 4. Как определяете, куда двигаться дальше?

При создании Roadmap для следующей версии Zabbix мы ориентируемся на следующие важные факторы, точнее, мы собираем Roadmap по следующием категориям:

Стратегические улучшения Zabbix. а. Например, Zabbix agent написанный на Go.
б. Что-то, что Zabbix сам считаем очень важным. И за которые они готовы заплатить.
в. Вещи, которые хотят увидеть в Zabbix клиенты и партнёры Zabbix. Технические долги. Пожелания/предложения от Zabbix community.
г. 🙂 Вещи, которые мы выпустили в прошлых версиях, но не обеспечили полную функциональность, не сделали достаточно гибкими, не предложили все варианты.

Можете сравнить Zabbix и prometheus? 5. Что в Zabbix лучше, а что хуже?

Основное отличие, на наш взгляд, Prometheus является системой в первую очередь для сбора метрик — и чтобы собрать полноценный мониторинг на предприятии, необходимо добавить к прометеусу множество других компонентов, таких как графана для визуализации, отдельное лонг-терм хранилище, отдельно где-то управлять проблемами, отдельно работать с логами…

Настройка Prometheus — конфигурационные файлы. Не будет в Prometheus и никаких типовых шаблонов мониторинга, получив все-все тысячи метрик от экспортеров, нужно будет самостоятельно найти в них проблемные сигналы. Где-то это удобней, где-то нет.

Zabbix — это универсальная платформа для создания мониторинга «от и до», у нас своя визуализация, корреляция проблем и их отображения, распределение прав доступа к системе, аудит действий, множество вариантов сбора данных через агента, прокси, по совершенно различным протоколам, возможность быстро расширить систему плагинами, скриптами, модулями…

Многие пользователи ценят Zabbix за возможность настроить и управлять системой через веб-интерфейс, за возможность описания типовых конфигурация мониторинга в виде шаблонов, которыми можно делиться друг с другом, и содержащих не только метрики, но и правила обнаружения, пороговые значения, графики, описания — полный набор объектов для мониторинга типовых объектов. А можно просто собирать данные, как есть, например, по протоколу HTTP, а дальше превращать ответы в полезные метрики при помощи таких функций препроцессинга, как JavaScript, JSONPath, XMLPath, CSV и тому подобных.

В общем, не хочется устраивать холивар. Многим нравится также возможность автоматизировать управление и настройку через Zabbix API. 2 может снимать данные с экспортеров Prometheus или с него самого. Нам кажется, что обе системы хорошо подходят под свои задачи и могут гармонично дополнять друг друга, например, Zabbix с версии 4.

Не думали над тем, чтобы сделать zabbix saas? 6.

В этом случае стандартный Zabbix должен быть предложен вместе со средствами коммуникации, расширенными средствами для сбора данных и так далее. Думали и сделаем в будущем, но хотим сделать такое решение максимально удобным для клиентов.

Когда ждать zabbix ha? 7. И ждать ли?

Мы очень надеемся увидеть что-то в Zabbix 5. Zabbix HA однозначно ждать. 0. 0 LTS, но ситуация станет яснее в ноябре 2019 года, когда полностью будет подтверждён Roadmap Zabbix 5.

Почему media type имеет такой скудный выбор из коробки? 8. А jabber еще кто-то пользуется? Не планируете добавить Slack, telegram и так далее?

4 убрали, но зато добавили Webhooks. Jabber в версии Zabbix 4. Не секрет, что множество подобных чатов или сервис десков имеют API через HTTP — поэтому в этом году с выходом 4. Касательно media types, не хотелось бы делать конкретные аппликации из системы, но стандартные средства обмена сообщениями. 4 ситуация изменится.

При этом интеграции будут двухсторонние, а не только простые уведомления в одну сторону. С появлением вебхуков в Zabbix можно ожидать все самые востребованные интеграции из коробки в ближайшее время. И другим пользователям нужно будет только импортировать файл, чтобы начать использовать такую интеграцию. А те media types, до которых мы не доберёмся, сделает наше community — ведь теперь media type целиком может быть экспортирован в конфигурационный файл, выложен на share.zabbix.com или github. При этом никаких дополнительных скриптов ставить не придется!

Почему не развивается направление Virtual machine discovery? 9. Многие ждут интеграции с ec2, openstack. Есть только vmware.

Например, в 4. Нет, направление развивается. В 4. 4 появился дискавери datastore через ключ vm.datastore.discovery. Ну, и будут другие важные изменения в этом направлении в Zabbix 5. 4 также появились очень классные ключи wmi.getall – ожидаем, что через него, вместе с ключом perf_counter_en можно будет сделать хороший мониторинг Hyper-V. 0.

Не думали отказаться от шаблонов и сделать как у prometeus, когда забирается все, что отдается? 10.

А шаблон — это больше, чем просто набор метрик, это «контейнер», который содержит всю необходимую типовую конфигурацию мониторинга данного типа ресурса или сервиса. Прометеус автоматом забирает все метрики, это удобно. При этом шаблонами легко делиться с другими пользователями — и они получат хороший мониторинг своей системы, даже не обязательно будучи экспертом в ней. В нем есть уже набор важных триггеров, графиков, правил обнаружения, в нем есть описания метрик и пороговых значений, которые помогают пользователю понять, что собирается, и какие пороги именно проверяются и почему.

Почему так мало метрик из коробки? 11. Это же сильно усложняет настройку с точки зрения operation.

Zabbix 4. Если из коробки вы имеете в виду готовые шаблоны, то именно сейчас мы работаем над расширением и улучшением наших шаблонов. 4 вышел с новым, улучшенным набором и с лучшими возможностями.

Но мы решили, что должны делать базовые шаблоны и сами, показывая пример остальным, а также освобождая пользователей от написания в очередной раз шаблона для какого-нибудь MySQL. Для Zabbix всегда можно на share.zabbix.com найти готовый шаблон практически под любую систему. Поэтому сейчас в Zabbix официальных шаблонов с каждой версией будет становиться только больше.

Когда можно будет строить триггеры, не привязанные к хостам, а например на основание labels. 12. Например, у нас мониторится сайт из n разных точек, и мы хотим простой триггер, который срабатывает когда сайт не доступен из 2-х и более точек.

Клиент — ICANN. На самом деле, такая функциональность есть в Zabbix уже несколько лет, написанная для одного из клиентов. Сейчас активно работаем над тем, чтобы упростить создание подобных проверок. Также подобные проверки можно сделать, например, через aggregated items или используя Zabbix API.

S.: На одном из Слёрмов разработчики Zabbix поинтересовались у нас, что мы хотим увидеть в продукте, чтобы мониторить кластеры Kubernetes именно с помощью Zabbix, а не Prometheus. P.

И теперь мы каждый релиз встречаем с искренним интересом — радует то, что всё больше и больше фич, о которым мы говорили, обретают плоть и кровь. Здорово, когда разработчики идут навстречу клиентам, а не остаются вещью себе.

Будем следить за новыми релизами Zabbix. Пока разработчики не замыкаются в себе, а интересуются потребностями клиентов, продукт живет и развивается.

P. P. Кому интересно, подписывайтесь, чтобы не пропустить анонс. S.: Мы через несколько месяцев запустим онлайн-курс по мониторингу. А пока можно пройти наш Слёрм по Kubernetes.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть