ML Platform Engineer
A Synthesia, az üzleti felhasználásra szánt, világelső AI videóplatform (amelyet a Fortune 100 vállalatok több mint 90%-a használ) mérnököt keres az ML Platform csapatába. A csapat azokat a rendszereket építi és üzemelteti, amelyek lehetővé teszik a kutatók és termékcsapatok számára a generatív modellek megbízható és hatékony tanítását, kiszolgálását és telepítését – ide tartozik a kutatási infrastruktúra, az éles kiszolgálórendszerek, a belső eszközök és az ezeket összekötő platforminterfészek –, egyre nagyobb hangsúlyt fektetve az automatizálásra és az ágens-orientált munkafolyamatokra. Ez egy gyakorlatias, önálló közreműködői (IC) szerepkör jelentős felelősséggel, erős generalista, rendszerszemléletű szakembereknek; nem klasszikus ML Engineer pozíció.
Feladatok
- ▹A modellek tanítását, kiértékelését és éles kiszolgálását támogató platformrendszerek tervezése és fejlesztése
- ▹Olyan infrastruktúra és eszközök építése, amelyek megbízhatóbbá, skálázhatóbbá és költséghatékonyabbá teszik az ML munkaterheléseket
- ▹Belső eszközök és munkafolyamatok fejlesztése, amelyeket emberek és ágensek is könnyen tudnak kezelni
- ▹A modellek telepítésének, kiszolgálásának és üzemeltetésének architektúrájával való munka a kutatási és termékkörnyezetekben
- ▹A GPU-kon és felhőinfrastruktúrán futó munkaterhelések ütemezésének, monitorozásának és hibakeresésének javítása
- ▹Belső eszközök, absztrakciók és ágens-rendszerek fejlesztése, amelyek csökkentik a kutatók és mérnökök üzemeltetési terheit
- ▹Fejlesztések az observability, automatizálás, megbízhatóság és fejlesztői élmény területén
- ▹Szoros együttműködés kutatókkal és termékmérnökökkel a problémák robusztus platformképességekké alakításáért
- ▹Hozzájárulás a technikai irányvonalhoz és pragmatikus architekturális kompromisszumok meghozatala a platform növekedésével
Elvárások
- ▹Erős tapasztalat éles rendszerek építésében vagy üzemeltetésében, a megbízhatóságra, skálázhatóságra és karbantarthatóságra fókuszálva
- ▹Rendszerszemlélet: szűk keresztmetszetekben, hibamódokban, interfészekben, erőforrás-használatban és hosszú távú üzemeltethetőségben való gondolkodás
- ▹Megalapozott gyakorlati tapasztalat felhőinfrastruktúrával, Linuxszal és infrastruktúra-automatizálással
- ▹Tapasztalat Kubernetesszel és elosztott munkaterhelések éles üzemeltetésével
- ▹Erős programozási készségek, ideálisan Pythonban vagy hasonló, backend rendszerekhez és eszközökhöz használt nyelvekben
- ▹Jó megítélés abban, hol jelent előnyt az automatizálás, és hol fontosabb az emberi kontroll és megbízhatóság
- ▹Tapasztalat belső platformok, fejlesztői eszközök vagy más mérnökök által használt infrastruktúra-absztrakciók építésében
- ▹Komfort bizonytalan környezetben való munkával és nyitott technikai problémák felvállalásával
- ▹Pragmatikus hozzáállás: a megfelelő probléma jó megoldására fókuszálva, túltervezés nélkül
Előny
- ▹ML infrastruktúra vagy modellkiszolgáló rendszerek éles üzemeltetése
- ▹Kutatási vagy adatintenzív munkaterhelések támogatása
- ▹Munka GPU-alapú vagy más teljesítményérzékeny infrastruktúrával
- ▹Tapasztalat observabilityvel és hibakereséssel elosztott rendszerekben
- ▹Jártasság Terraformmal, Datadoggal, GitHub Actionsszel vagy hasonló eszközökkel
- ▹Tapasztalat ágens- vagy LLM-alapú belső eszközök építésében
- ▹Tapasztalat munkafolyamat-orkesztrációs rendszerekkel, például Temporallal
- ▹Tapasztalat a kutatás és az éles mérnöki munka határterületén
- ▹Jártasság teljesítményoptimalizálási, ütemezési vagy erőforrás-allokációs problémákban
- ▹Tapasztalat könnyűsúlyú termék- vagy fejlesztőközpontú eszközök építésében