← Vissza a listához
Állás

Senior Site Reliability Engineer (SRE)

Backend Developer • Remote • Teljes munkaidő • 📍 Budapest

Senior SRE pozíció a SEON-nál, amely egy csalásmegelőzési és AML compliance platform; a feladat az AWS-alapú felhőinfrastruktúra megbízhatóságának, skálázhatóságának és teljesítményének biztosítása. A munkavégzés Budapesten hibrid formában vagy Európán belül teljesen távolról lehetséges.

Feladatok

  • A rendszerek megbízhatóságának, rendelkezésre állásának és teljesítményének biztosítása SRE best practice-ek alkalmazásával
  • Monitoring és riasztási rendszerek építése és karbantartása Prometheus, Grafana, ELK stack és hasonló eszközökkel
  • Incidenskezelés és gyökérok-elemzés (root cause analysis) éles hibáknál
  • Postmortem elemzések készítése a hibákból való tanuláshoz és a megbízhatóság folyamatos javításához
  • A felhőinfrastruktúra teljesítményének monitorozása és optimalizálása a hatékony erőforrás-felhasználás és költséghatékonyság érdekében
  • Rutinfeladatok és folyamatok automatizálása a manuális munka csökkentésére
  • Kapacitástervezés a jövőbeli növekedéshez, hogy az infrastruktúra skálázódjon az igényekkel
  • SLO-k és SLI-k definiálása, mérése és monitorozása a megbízhatósági célokhoz mérten
  • Együttműködés a fejlesztői és termékcsapatokkal az új architektúrákkal kapcsolatos visszajelzéshez
  • Dokumentáció írása és karbantartása az architektúráról, infrastruktúráról és hibakeresési folyamatokról
  • On-call támogatás a folyamatos rendelkezésre állásért
  • A rendszerek biztonsági és compliance követelményeinek biztosítása rendszeres auditokkal
  • Naprakészség az új technológiákkal és iparági trendekkel kapcsolatban

Elvárások

  • Legalább 6 év tapasztalat SRE, DevOps vagy hasonló mérnöki szerepkörben, megbízhatósági fókusszal
  • Erős, gyakorlati Kubernetes tapasztalat (AWS EKS előnyben)
  • Erős, gyakorlati Terraform szaktudás
  • Kiterjedt tapasztalat multi-region és multi-account AWS környezetekben
  • Erős tapasztalat monitoring és logging eszközökkel, mint Prometheus, Grafana, Elasticsearch és Kibana
  • Erős tapasztalat skálázható elosztott komponensek deploy-olásában, karbantartásában és hibakeresésében microservice architektúrában
  • Tapasztalat ügyfélkritikus latency-, rendelkezésre állási és teljesítményproblémák kivizsgálásában és javításában
  • Komplex infrastrukturális problémák gyors hibakeresésének képessége
  • Jártasság incidenskezelő eszközökben, mint PagerDuty vagy Opsgenie
  • Jártasság CI pipeline-okban és eszközökben (GitHub Actions előnyben)
  • Tapasztalat GitOps gyakorlatokkal és CD eszközökkel (ArgoCD előnyben)
  • Proaktív, önálló problémamegoldó hozzáállás
  • Kiváló kommunikációs és együttműködési készség

Soft skillek

Proaktív problémamegoldásKiváló kommunikációCross-funkcionális együttműködés

Amit kínálunk

  • Hibrid munkavégzés Budapesten vagy teljesen távoli munka Európán belül
Nyelvtudás: English