отказоустойчивость

  • ХабрахабрФото Во что обойдется линеаризуемость в распределенной системе

    Во что обойдется линеаризуемость в распределенной системе

    Всем привет, меня зовут Сергей Петренко, я программист в Tarantool. Сегодня мы посмотрим, с какими трудностями сталкивается клиент, когда вместо того чтобы общаться с системой, расположенной на одном инстансе, начинает общаться с распределенной системой. И разумеется, поговорим о том, как эти трудности преодолеть. Я расскажу, что такое линеаризуемость, как мы ее реализуем в Tarantool и как это делают другие СУБД.…

    Читать далее »
  • ХабрахабрФото Кот в мешке: как приручить дикий бинарник

    Кот в мешке: как приручить дикий бинарник

    Всем привет. Меня зовут Василий. Я работаю SRE в Яндекс Маркете. Недавно у нас прошли тренировки по DevOps от Young&&Yandex. Сегодня я разберу финальное задание, как и обещал участникам тренировок. Оно состоит в том, чтобы развернуть инсталляцию приложения из готового бинарника, которая будет соответствовать SLA из ТЗ. Выглядит предельно просто, но только на первый взгляд. Под катом — один из…

    Читать далее »
  • ХабрахабрФото Отказоустойчивая архитектура: почему Tarantool не падает?

    Отказоустойчивая архитектура: почему Tarantool не падает?

    Основная проблема в высоконагруженных приложениях — отказоустойчивость. Нагрузка с упавших узлов в кластере должна переключаться на живые. Это кажется несложной задачей, но на практике появляется много подводных камней. Мы с yngvar_antonsson потратили много времени на поддержку различных кластеров, построенных на Tarantool и наших кластерных фреймворках Cartridge и TDG, и сегодня расскажем вам, как обеспечивается отказоустойчивость в наших приложениях. Будет интересно…

    Читать далее »
  • ХабрахабрФото Хороший ретрай, плохой ретрай, или История одного падения

    Хороший ретрай, плохой ретрай, или История одного падения

    Порой простое и очевидное решение может потянуть за собой хвост проблем в будущем. Например, добавление ретраев. Меня зовут Денис Исаев, и я работаю в Яндекс Go. Сегодня я поделюсь опытом решения проблем с отказоустойчивостью из-за ретраев. Основано на реальных инцидентах в системе из 800 микросервисов. Этот пост — продолжение вымышленных историй о разработчике Васе, который несколько лет назад разбирался с…

    Читать далее »
  • ХабрахабрФото Откат операционной системы, с отечественной аппаратной картой «ЛанСил»

    Откат операционной системы, с отечественной аппаратной картой «ЛанСил»

    Друзья, я вспомнил про классную карту восстановления данных — у меня она в свое время вызвала вау-эффект и потому хочу поделиться процедурой использования, в настоящее время. Рассмотрим отечественную карту «ЛанСил» поближе, протестируем в реальных условиях. Этой «железке» немало лет, до категории «ретро» она не дотягивает, но тем не менее, может быть интересна. Эксперименты мы будем проводить в пределах старенького IDE-интерфейса…

    Читать далее »
  • ХабрахабрФото Монолог про отказоустойчивость микросервисных приложений, или Что может пойти не так?

    Монолог про отказоустойчивость микросервисных приложений, или Что может пойти не так?

    Привет, меня зовут Антон Гращенков, я занимаюсь разработкой достаточно давно — больше 15 лет. Писал на С++, на Java, даже на ActionScript немножко. Успел позаниматься и мультимедиа, и восстановлением данных, а сейчас работаю в финтехе — лидом в Альфа-Банке.  Наши команды занимаются разработкой приложений для внутреннего пользования, которые помогают сотрудникам выдавать кредитные продукты: карты, кредиты наличными и всё, что с этим…

    Читать далее »
  • ХабрахабрФото [Перевод] Внутреннее устройство DRBD: алгоритмы работы отказоустойчивого хранилища

    [Перевод] Внутреннее устройство DRBD: алгоритмы работы отказоустойчивого хранилища

    Глубокое понимание внутреннего устройства DRBD позволяет более тонко настраивать работу системы и правильно планировать ресурсы. К счастью, у команды DRBD уже есть отличная документация, которая довольно подробно разбирает эту тему. Мы опирались на нее в своей работе, и решили перевести и выложить в открытом доступе 17-ю главу — как удобную шпаргалку по внутреннему устройству DRBD. Так что это не обычная…

    Читать далее »
  • ХабрахабрФото Как в 3 раза снизить затраты на отказоустойчивую инфраструктуру, переехав с Hazelcast на Redis

    Как в 3 раза снизить затраты на отказоустойчивую инфраструктуру, переехав с Hazelcast на Redis

    Redis на хайпе. Но мы переехали на него с Hazelcast не из-за этого, а потому, что в какой-то момент осознали, что не замечать сколько инцидентов у нас возникает из-за Hazelcast, дальше невозможно. Привет, меня зовут Ян Чикнизов, я Java TechLead, в Альфе работаю 4 года, из которых 1,5 курирую направление Redis. Сегодня расскажу вам замечательную историю как мы всем Альфа-Мобайлом…

    Читать далее »
  • ХабрахабрФото YTsaurus: основная система для хранения и обработки данных Яндекса теперь open source

    YTsaurus: основная система для хранения и обработки данных Яндекса теперь open source

    Привет! Меня зовут Максим Бабенко, я руковожу отделом технологий распределённых вычислений в Яндексе. Сегодня мы выложили в опенсорс платформу YTsaurus — одну из основных инфраструктурных BigData-систем, разработанных в Яндексе. YTsaurus — результат почти десятилетнего труда, которым нам хочется поделиться с миром. В этой статье мы расскажем историю возникновения YT,  ответим на вопрос, зачем нужен YTsaurus, опишем ключевые возможности системы и…

    Читать далее »
  • ХабрахабрФото Как работают объектные хранилища: OpenStack Swift

    Как работают объектные хранилища: OpenStack Swift

    Неожиданный мартовский мороз ласкает щеки городских жителей, спешно марширующих вдоль проспектов по направлению к своим рабочим местам. В их головах широким спектром разливается сладкая истома — предвкушение отдыха. Раз меньше времени работе, то больше — знаниям. Меня зовут Рома, и я работаю в объектном хранилище — самой высоконагруженной услуге Selectel. Здесь мы непрерывно трудимся над улучшением и развитием архитектуры, удовлетворяя…

    Читать далее »


Кнопка «Наверх»