Állás

Senior Site Reliability Engineer (SRE)

Backend Developer • Remote • Teljes munkaidő • 📍 Budapest

Senior SRE pozíció a SEON-nál, amely egy csalásmegelőzési és AML compliance platform; a feladat az AWS-alapú felhőinfrastruktúra megbízhatóságának, skálázhatóságának és teljesítményének biztosítása. A munkavégzés Budapesten hibrid formában vagy Európán belül teljesen távolról lehetséges.

Stack

AWS elasticsearch GitHub Grafana Kubernetes Prometheus Terraform

Feladatok

▹A rendszerek megbízhatóságának, rendelkezésre állásának és teljesítményének biztosítása SRE best practice-ek alkalmazásával
▹Monitoring és riasztási rendszerek építése és karbantartása Prometheus, Grafana, ELK stack és hasonló eszközökkel
▹Incidenskezelés és gyökérok-elemzés (root cause analysis) éles hibáknál
▹Postmortem elemzések készítése a hibákból való tanuláshoz és a megbízhatóság folyamatos javításához
▹A felhőinfrastruktúra teljesítményének monitorozása és optimalizálása a hatékony erőforrás-felhasználás és költséghatékonyság érdekében
▹Rutinfeladatok és folyamatok automatizálása a manuális munka csökkentésére
▹Kapacitástervezés a jövőbeli növekedéshez, hogy az infrastruktúra skálázódjon az igényekkel
▹SLO-k és SLI-k definiálása, mérése és monitorozása a megbízhatósági célokhoz mérten
▹Együttműködés a fejlesztői és termékcsapatokkal az új architektúrákkal kapcsolatos visszajelzéshez
▹Dokumentáció írása és karbantartása az architektúráról, infrastruktúráról és hibakeresési folyamatokról
▹On-call támogatás a folyamatos rendelkezésre állásért
▹A rendszerek biztonsági és compliance követelményeinek biztosítása rendszeres auditokkal
▹Naprakészség az új technológiákkal és iparági trendekkel kapcsolatban

Elvárások

▹Legalább 6 év tapasztalat SRE, DevOps vagy hasonló mérnöki szerepkörben, megbízhatósági fókusszal
▹Erős, gyakorlati Kubernetes tapasztalat (AWS EKS előnyben)
▹Erős, gyakorlati Terraform szaktudás
▹Kiterjedt tapasztalat multi-region és multi-account AWS környezetekben
▹Erős tapasztalat monitoring és logging eszközökkel, mint Prometheus, Grafana, Elasticsearch és Kibana
▹Erős tapasztalat skálázható elosztott komponensek deploy-olásában, karbantartásában és hibakeresésében microservice architektúrában
▹Tapasztalat ügyfélkritikus latency-, rendelkezésre állási és teljesítményproblémák kivizsgálásában és javításában
▹Komplex infrastrukturális problémák gyors hibakeresésének képessége
▹Jártasság incidenskezelő eszközökben, mint PagerDuty vagy Opsgenie
▹Jártasság CI pipeline-okban és eszközökben (GitHub Actions előnyben)
▹Tapasztalat GitOps gyakorlatokkal és CD eszközökkel (ArgoCD előnyben)
▹Proaktív, önálló problémamegoldó hozzáállás
▹Kiváló kommunikációs és együttműködési készség

Soft skillek

Proaktív problémamegoldásKiváló kommunikációCross-funkcionális együttműködés

Amit kínálunk

▹Hibrid munkavégzés Budapesten vagy teljesen távoli munka Európán belül

Nyelvtudás: English