О проекте

Keep-Alive - соревнование для разработчиков, DevOps-инженеров и системных администраторов.

Мы ломаем модельный продакшен, игроки чинят.

Почти как дежурство на проде — только безопасно и даже весело.

>> Тушение пожаров на продакшене - очень комплексная активность и возможно самый беспощадный скилл-чек для инженера. Именно поэтому она отлично подходит для развития специалистов.

>> Мы настоятельно не рекомендуем вам ломать свой продакшен специально! Это как минимум стоит денег и репутации.

>> Предлагаем воспользоваться нашей платформой и модельными сервисами. Большинство навыков довольно универсальны и могут быть применимы как при тушении вашего продакшена, так и в обычной работе!

>> plz scroll down to continue...

Инцидент - это экзамен, который никто не назначал.

Никто не может научить тушить горящий продакшен, но мы можем к этому подготовить.

Для этого у нас есть все инструменты.

Реализм

>> Для каждой команды разворачиваем настоящие backend-приложения, развернутые в Kubernetes.

>> Команды работают как настоящие дежурные: ищут root-cause, анализируют логи и графики, катят фиксы.

Сложность

>> Мы тщательно готовим сервисы и продумываем как они будут отыгрываться.

>> Сервисы полны заложенных проблем: race conditions, хитрые утечки памяти и другие тщательно спрятанные поломки.

>> Сбои не происходят случайно, мы используем пользовательский трафик в качестве триггера, контролируя время и масштаб поломок.

Инженерное соревнование

>> Команды из 3–5 человек работают 6–8 часов в условиях конкуренции и стресса.

>> Баллы начисляются за uptime и корректную работу сервисов.

>> Для победы нужно быстро принимать сложные решения и слаженно работать в команде.

>> После игры публикуем каноничные решения и отвечаем на вопросы.