site reliability engineer
-
Хабрахабр
[Перевод] Внедряем устойчивый SRE-подход в компании
Сложно управлять микросервисами, не придерживаясь принципов SRE (site reliability engineering — обеспечение надёжности информационных систем). В этой статье мы расскажем, как наладили процесс SRE в компании Reputation. В 2020 году у компании Reputation было больше 150 микросервисов, которые собирали и обрабатывали миллионы отзывов из интернета, извлекая из них полезную информацию для наших клиентов. Правда, данных и сервисов у нас было столько, что нам…
Читать далее » -
Хабрахабр
Сказка об Иване-Царевиче, Бабе-Яге и канонiчном SRE (комикс)
Комикс придумали и нарисовали дизайнеры Слёрма Екатерина Заволокина и Юлия Самохвалова. Благодарим за помощь в создании спикера интенсива по SRE Артёма Артемьева и СТО Слёрма Марселя Ибраева. Ставьте плюсы, делитесь с друзьями, тогда мы нарисуем еще что-нибудь!
Читать далее » -
Хабрахабр
Как Лёха стал инженером по SRE: выдуманная история про невыдуманные проблемы
Направление Site Reliability Engineering становится всё более популярным. Хайп не на пустом месте: проблемы и задачи, которые решает SRE, действительно насущны для многих компаний. Популярность SRE растёт, но знаний о нём всё ещё недостаточно. Я не буду повторять формальные определения, а вместо этого расскажу несколько историй из жизни системного инженера Лёхи. Путь выдуманного Лёхи во многом похож на путь, который…
Читать далее » -
Хабрахабр
«Цель SRE — надёжная система». Обзор основных метрик SRE
Site Reliability Engineering (SRE) — это одна из форм реализации DevOps. SRE-подход возник в Google и стал популярен в среде продуктовых IT-компаний после выхода одноимённой книги в 2016 году. В статье опишем, как SRE-подход соотносится с DevOps, какие задачи решает инженер по SRE и о каких показателях заботится. От DevOps к SRE Во многих IT-компаниях разработкой и эксплуатацией занимаются разные…
Читать далее » -
Хабрахабр
[Перевод] Цели уровня обслуживания — опыт Google (перевод главы книги Google SRE)
Считается фреймворком для DevOps и говорит как добиться успеха в применение DevOps-практик. SRE (Site Reliability Engineering) — подход к обеспечению доступности веб-проектов. Этот перевод я готовил самостоятельно и полагался на собственный опыт понимания процессов мониторинга. В этой статье перевод Главы 4 Service Level Objectives книги Site Reliability Engineering от Google. В телеграм-канале monitorim_it и прошлом посте на Хабре я публиковал…
Читать далее »