Keep-Alive - соревнование для разработчиков, DevOps-инженеров и системных администраторов.
Мы ломаем модельный продакшен, игроки чинят.
Почти как дежурство на проде — только безопасно и даже весело.
>> Тушение пожаров на продакшене - очень комплексная активность и возможно самый беспощадный скилл-чек для инженера. Именно поэтому она отлично подходит для развития специалистов.
>> Мы настоятельно не рекомендуем вам ломать свой продакшен специально! Это как минимум стоит денег и репутации.
>> Предлагаем воспользоваться нашей платформой и модельными сервисами. Большинство навыков довольно универсальны и могут быть применимы как при тушении вашего продакшена, так и в обычной работе!
>> plz scroll down to continue...
Инцидент - это экзамен, который никто не назначал.
Никто не может научить тушить горящий продакшен, но мы можем к этому подготовить.
Для этого у нас есть все инструменты.
>> Для каждой команды разворачиваем настоящие backend-приложения, развернутые в Kubernetes.
>> Команды работают как настоящие дежурные: ищут root-cause, анализируют логи и графики, катят фиксы.
>> Мы тщательно готовим сервисы и продумываем как они будут отыгрываться.
>> Сервисы полны заложенных проблем: race conditions, хитрые утечки памяти и другие тщательно спрятанные поломки.
>> Сбои не происходят случайно, мы используем пользовательский трафик в качестве триггера, контролируя время и масштаб поломок.
>> Команды из 3–5 человек работают 6–8 часов в условиях конкуренции и стресса.
>> Баллы начисляются за uptime и корректную работу сервисов.
>> Для победы нужно быстро принимать сложные решения и слаженно работать в команде.
>> После игры публикуем каноничные решения и отвечаем на вопросы.