← Vissza a listához
Állás

Igazgató, Site Reliability Engineering (x/f/m)

Backend Developer • Helyszíni • Teljes munkaidő • 📍 Berlin

A Doctolib Site Reliability Engineering igazgatójaként - a Platform Engineering VP-jének beszámolva - Te felelsz az alapinfrastruktúra rétegeiért, amelyeken minden fut: felhőinfrastruktúra, adatbázis-üzemeltetés, hálózati infrastruktúra és observability. Vezeted a Doctolib Operations Centert, és határozott váltást vezényelsz le a reaktív üzemeltetésről egy proaktív, világszínvonalú megbízhatósági kultúrára, egy nagyszabású multi-cloud platformátállás és nemzetközi terjeszkedés idején.

Feladatok

  • Világszínvonalú, 25+ mérnökből álló SRE-szervezet felépítése és működtetése a felhő, adatbázis és tárolás, hálózat, observability és a Doctolib Operations Center területein
  • Az infrastruktúra-stratégia és -ütemterv birtoklása, valamint a vállalati OKR-ek teljesítése
  • A Doctolib Operations Center vezetése: incidenskezelési sztenderdek meghatározása, az MTTR csökkentése és a hibáztatásmentes post-mortem kultúra meghonosítása
  • A multi-cloud stratégia megtervezése és végrehajtása a vendor lock-in csökkentésére, a migrációs költségek mérséklésére és a nemzetközi terjeszkedés támogatására
  • A hálózati infrastruktúra birtoklása nagy léptékben: terheléselosztás, CDN/WAF, VPC-k, peering és zero-trust hálózat
  • Az observability termékként való kezelése, valós rálátást biztosítva a rendszerállapotra 700+ mérnök számára

Elvárások

  • Legalább 12 év szoftvermérnöki tapasztalat, ebből legalább 5 év vezetők irányításában és infrastruktúra- vagy SRE-szervezetek nagy léptékű működtetésében
  • Bizonyított eredmény az SRE-gyakorlatok reaktívról proaktívra alakításában, mérhető incidens- és MTTR-csökkentéssel
  • Erős multi-cloud és hálózati infrastruktúra tapasztalat: terheléselosztás, CDN/WAF, VPC-k, peering nagy forgalmú léptékben
  • Mély adatbázis-üzemeltetési háttér: nagy léptékű tranzakciós rendszerek (PostgreSQL, Aurora), streaming/CDC (Kafka), adatréteg FinOps
  • Tapasztalat observability platformok építésében (metrikák, logok, trace-ek, riasztás)
  • Éles folyamatszemlélet: SLO-k, error budgetek, incidenskezelés és hibáztatásmentes post-mortemek

Soft skillek

Eredményorientált vezetésStratégiai gondolkodás és priorizálásNagy mérnöki szervezetek vezetésének és fejlesztésének képességeCsapatközi együttműködés és befolyásolás
Nyelvtudás: angol