Онлайн-занятия, Домашние задания, Обратная связь кураторов, Занятия в записи (автовебинары)
Есть рассрочка платежа:
Да
Трудоустройство:
Нет
Поделиться с друзьями:
Особенности курса:
Для SRE-инженеров, которые хотят взять под контроль состояние системы. Научитесь агрегировать SLO/SLI в одну или несколько высокоуровневых метрик.
Для кого подойдет курс:
Для тех, у кого есть базовые знания о SRE-практиках
Для SRE-инженеров, которые хотят повысить отказоустойчивость системы
Командам, которым нужно наладить внутренние процессы и научиться настраивать мониторинг
Компаний, где уже внедрены error budget и SLO, но эти процессы не отработаны до конца
Описание курса:
На какие вопросы поможет ответить курс:
Достало, что про сбои в работе вы узнаете от пользователей и саппорта, но не знаете, как это изменить?
Как увидеть инцидент в зачатке на графике и по алерту, и предотвратить панику и стресс в моменте?
Представим, у тебя есть 100 микросервисов, ты умеешь мерить надежность каждого, но что говорить бизнесу? Бизнес хочет что-то простое и понятное, а не 100 независимых метрик.
Как объяснить руководителю, зачем собирать бизнес-метрики приложения, и сколько он теряет в момент инцидента?
Как договориться с бизнесом, что делать: выкатывать фичи или работать над надежностью?
Как увидеть и оценить результаты работы над надежностью?
Чему вы научитесь на курсе:
Non Functional Requirements: требования для оценки качества технической работы системы
Выбирать метрики, чтобы с их помощью успешно определять надежность системы
«Читать» по метрикам, что с системой что-то не так