Делаем Такси надёжнее и доступнее для пользователей
Служба надёжности отвечает за стабильность работы Яндекс Такси: проверяет сервис на готовность к внештатным ситуациям, предотвращает инциденты и быстро восстанавливает системы после сбоев. Всё ради того, чтобы пользователи могли добраться в нужное место в любое время
Задачи распределены между двумя командами, каждая из которых отвечает за свою область: улучшает инфраструктуру продакшена, разрабатывает инструменты для учений, проверяет надежность сервиса и оперативно устраняет проблемы
Александр Фишер
Руководитель Службы
надежности Такси
надежности Такси
Развивал «Почту@mail.ru», Delivery Club, Вконтакте, занимался общей инфраструктурой. Считает, что можно верить только проведённым учениям, а надежда — плохая стратегия надёжности
«Надёжность — это научиться лежать 3 минуты, чтобы не лежать 2 часа. Мы придумываем и разрабатываем инструменты, позволяющие быстро подниматься, быстро находить причину поломок, плавно деградировать сервис, не прерывая обслуживания, поддерживать требуемый уровень надёжности — и масштабировать это на 1000+ микросервисов и сотни разработчиков продукта»
читать далее