← Vissza a listához
Állás · Lead

Lead Site Reliability Engineer

Backend Developer • Lead • Remote • Teljes munkaidő • 📍 Remote (US)

A Mattermost egy együttműködési munkafolyamat-platform a védelmi, hírszerzési, biztonsági és kritikus infrastruktúra szektor számára, amelyben az Egyesült Államok Hadügyminisztériuma (Department of War) és Fortune 500 cégek bíznak, on-premises és privát felhőkben futva. A cég tapasztalt Lead Site Reliability Engineert keres, hogy irányítsa a biztonságos, missziókritikus együttműködési platformot hajtó infrastruktúra architektúráját, megbízhatóságát és operatív kiválóságát. A pozíció technikai vezetést biztosít az SRE funkción át, skálázhatósági, observability-, teljesítmény- és automatizálási kezdeményezéseket hajtva felhős és hibrid környezetekben, mérnököket mentorálva és a fejlesztési, biztonsági és üzemeltetési csapatokkal együttműködve, hogy a védelmi, kormányzati és kritikus infrastruktúra ügyfelek megbízhatóságot tapasztaljanak. Ez remote-first amerikai pozíció, $145,000-$200,000 fizetési sávval.

Feladatok

  • Az SRE funkció stratégiájának, architektúrájának és roadmapjének meghatározása, az infrastruktúra-kezdeményezéseket a termék- és üzleti célokhoz igazítva
  • A production-grade konténerizált workloadok, infrastructure-as-code és megfelelőségi felhőkörnyezetek tervezésének, telepítésének és optimalizálásának vezetése szabályozott területeken (pl. FedRAMP, DoD)
  • Observability-, monitorozó- és riasztó keretrendszerek kialakítása és fejlesztése a teljesítmény, megbízhatóság és kapacitástervezés érdekében nagy léptékben
  • Az incidenskezelési folyamatok irányítása, beleértve az on-call rotációkat, a gyökérok-elemzést és a rendszerszintű megbízhatósági fejlesztéseket
  • Együttműködés a biztonsági és megfelelőségi csapatokkal az adatszuverenitási, biztonsági és szabályozási követelmények teljesítéséhez
  • Az automatizálás és az operatív kiválóság előmozdítása a hatékonyság javítása, a kockázat csökkentése és az üzemeltetés skálázása érdekében
  • A felhőköltség-kezelés és kapacitástervezés felügyelete az infrastruktúra-kiadások optimalizálásához a teljesítménycélok teljesítése mellett
  • Fejlesztői platform építése és karbantartása, amely gyors, biztonságos szoftverszállítást tesz lehetővé és javítja az alkalmazások stabilitását éles környezetben
  • Az SRE csapattagok mentorálása és coachingja, a tanulás, együttműködés és technikai kiválóság kultúrájának ápolása

Elvárások

  • BSc számítástudományban, kiberbiztonságban, szoftvermérnöki vagy kapcsolódó technikai területen, vagy ezzel egyenértékű tapasztalat, 5+ év releváns tapasztalattal site reliability engineering, DevOps vagy felhőinfrastruktúra szerepkörökben
  • Igazolt szakértelem konténer-orkesztrációs platformokban, ideálisan Kubernetesben
  • Kiterjedt tapasztalat infrastructure-as-code-ban, ideálisan Terraformban
  • Erős háttér felhőplatformokban, ideálisan AWS-ben
  • Igazolt tapasztalat monitorozási, riasztási és teljesítményoptimalizálási stratégiák tervezésében és megvalósításában
  • Kivételes hibaelhárítási és incidenskezelési készségek elosztott rendszerekhez
  • Jártasság legalább egy szkript- vagy programozási nyelvben automatizáláshoz
  • Kiváló kommunikációs készség, igazolt eredménnyel a funkcióközi csapatok befolyásolásában
  • Tapasztalat globálisan elosztott csapatok vezetésében remote-first környezetben
  • A pozíció igényelheti egy amerikai kormányzati biztonsági tanúsítvány (security clearance) megszerzését és fenntartását, és a jelölteknek meg kell felelniük a szövetségi jogosultsági követelményeknek
  • A jelölteknek meg kell felelniük az export-ellenőrzött információkhoz való hozzáférés jogosultsági követelményeinek az amerikai exportellenőrzési törvények szerint (EAR és ITAR)

Előny

  • Jártasság observability stackekben, mint a Grafana és a Prometheus
  • Tapasztalat magas rendelkezésre állású, disaster recovery és skálázási architektúrák tervezésében
  • Kitettség GCP és Azure felhőkörnyezeteknek
  • Vezetői tapasztalat erősen szabályozott iparágakban, mint a védelem, pénzügy vagy kritikus infrastruktúra
  • Tapasztalat amerikai szövetségi megfelelőségi keretrendszerekkel és engedélyezési folyamatokkal (FedRAMP, DoD ATO, NIST 800-53 és kapcsolódó szabványok)
  • Tapasztalat szoftverajánlatok előkészítésében, szállításában és karbantartásában AWS Marketplace-en és más felhő marketplace-eken (Azure, Google Cloud)
  • Nyílt forráskódú hozzájárulások megbízhatósági, DevOps vagy infrastruktúra-eszköz területen
  • Tanúsítványok felhőinfrastruktúra, megbízhatóság vagy DevOps mérnöki területen (pl. CKA, CKAD, AWS Certified Solutions Architect)

Soft skillek

Technikai vezetés és mentorálásFunkcióközi befolyás és együttműködésKiváló kommunikációStratégiai gondolkodás

Amit kínálunk

  • Fizetési sáv: $145,000-$200,000 (piaci alapú fizetés)
  • Remote-first, nyílt forráskódú cég
Végzettség: BS in Computer Science, Cybersecurity, Software Engineering or a related technical field, or equivalent experience