← Vissza a listához
Állás
Site Reliability Engineer (csak USA - 100% remote)
Backend Developer
• Remote
• Teljes munkaidő
• 📍 Remote (US)
A Close 2013 óta épít kommunikáció-központú CRM-et, és bootstrapped, nyereséges, 120 fős, teljesen remote cég. Ez az SRE pozíció azt a platformot üzemelteti, amelytől a Close minden más rendszere függ: több terabájtos MongoDB-, PostgreSQL- és Elasticsearch-klaszterek, több Kubernetes-klaszter tízezernyi poddal, valamint telemetria a Grafana LGTM stackjén és ClickHouse-on, amely havonta több mint 130 TB-ot dolgoz fel, AI-t szolgálva éles környezetben 11 000 fizető ügyfélnek, 4 éve ütemezett leállás nélkül. Az infrastruktúra AWS-en fut (EKS, MSK, RDS, ElastiCache, EC2), Docker-alapú CI/CD-vel, és erősen automatizált Terraformmal és Ansible-lel. A pozícióhoz USA-beli tartózkodás szükséges (ET, CT, MT, PT).
Stack
Feladatok
- ▹Az adatbázisok teljes életciklusának automatizálása: a több terabájtos MongoDB, PostgreSQL és Elasticsearch provisioningje, skálázása, failoverje és kivezetése a platform által, nem kézzel
- ▹A statikus hitelesítő adatok kiszorítása a rendszerből, rövid élettartamú, identitásalapú auth felé haladva a szolgáltatások és az infrastruktúra között
- ▹A leállás és a fennakadás új mélységekbe szorítása a karbantartás, a deployok és a disaster recovery során, amit az ügyfelek soha nem éreznek
- ▹A több régiós disaster recovery megerősítése, hogy a failover gyorsabb, automatikusabb és megbízhatóbb legyen
- ▹A telemetria és a CI/CD gerinc birtoklása: a Grafana LGTM + ClickHouse pipeline, amely havonta 130 TB-ot dolgoz fel, és a GitHub Actions + ArgoCD útvonal
Elvárások
- ▹Senior vagy Staff szint: a Senior 1 & 2 jelöltek 5+ év tapasztalattal rendelkeznek modern infrastruktúra-rendszerek építésében; a Staff jelöltek 8+ évvel
- ▹Folyékony mozgás az infrastruktúra stackben: CI/CD (GitHub Actions, ArgoCD), konfigurációkezelés (Ansible, Terraform), adatbázisok (Elasticsearch, MongoDB, PostgreSQL, ClickHouse), felhő (Kubernetes, AWS) és telemetria (Loki, Tempo, Grafana, Mimir/Prometheus, OTEL)
- ▹Robusztus rendszerek építése minőségi komponensekből, az egyszerűséget a megszokottság elé, az ellenállóképességet a sebesség elé helyezve
- ▹A végső eszkalációs pont és a missziókritikus éles rendszerek utolsó támogatási vonala
- ▹A gyakori hálózati és adatátviteli protokollok, mint a DNS, HTTP és TCP erős ismerete
- ▹AI-eszközök használata a napi munkafolyamatban
- ▹Harcedzett: pager-viselés valós ügyfélhatású dolgokért, runbookon kívüli incidensek debugolása, vagy sikeres disaster response átélése
- ▹Kényelmes mozgás egy gyors tempójú, teljesen elosztott csapatban, jó időbeosztással és világos angol kommunikációval
- ▹USA-beli tartózkodás (ET, CT, MT, PT)
Előny
- ▹Tapasztalat MLOps rendszerek üzemeltetésében
- ▹Tapasztalat a Temporal skálázásában
Soft skillek
Nyugalom nyomás alatt (szikla a viharban)Erős felelősségvállalás végső eszkalációs pontkéntVilágos angol kommunikációJó időbeosztás egy elosztott csapatban
Amit kínálunk
- ▹Versenyképes fizetés és szervezet-szintű, célalapú bónusz
- ▹~5 hét PTO induláskor, plusz 1 hetes egész cégre kiterjedő téli ünnepi szünet és fizetett amerikai ünnepnapok, évente 2 plusz nappal
- ▹80% munkalehetőség: választható standard 5 napos hét vagy 4 napos hét 80% fizetésért
- ▹Fizetett szülői szabadság elsődleges és másodlagos gondozóknak
- ▹1 hónap fizetett sabbatical 5 évente
- ▹Egészségügy (USA-lakosok): két orvosi csomag, amelynél a Close a díj 99%-át fedezi, plusz fogászat, látás, HSA, FSA és cég által fizetett hosszú távú rokkantsági biztosítás
- ▹401k (USA-lakosok): hozzájárulás 6%-ig, azonnali vesztinggel
Nyelvtudás: English
Végzettség: 5+ years building modern infrastructure systems for Senior 1 & 2; 8+ years for Staff