← Vissza a listához
Állás

Anthropic Fellows Program, Reinforcement Learning

Anthropic
AI / ML Engineer • Remote • Teljes munkaidő • 📍 London

Az Anthropic küldetése megbízható, értelmezhető és irányítható AI-rendszerek létrehozása. Az Anthropic Fellows Program az AI-kutatói és -mérnöki tehetségeket gondozza azzal, hogy finanszírozást és mentorálást nyújt ígéretes technikai tehetségeknek, korábbi tapasztalattól függetlenül. A fellow-k elsősorban külső infrastruktúrát (nyílt forráskódú modellek, nyilvános API-k) használva dolgoznak egy empirikus projekten, amely az Anthropic kutatási prioritásaihoz illeszkedik, és a cél egy nyilvános kimenet (pl. egy publikáció). A program 4 hónapos teljes munkaidős, megosztott munkaterekkel Londonban vagy Berkeley-ben, és távmunkás fellow-kat is fogadnak az Egyesült Királyságból, az USA-ból vagy Kanadából. Ez a munkafolyamat a Reinforcement Learning, amely az RL-környezetekre, a tréningadat minőségére, a generalizációra és a Claude-modellekhez tartozó RL-algoritmusokra fókuszál.

Stack

Feladatok

  • Empirikus RL-kutatási projekten dolgozni azzal a céllal, hogy nyilvános kimenet szülessen
  • Modellalapú eszközök építése az AI-tréningadatok jobb megértésére és a tréningadat minőségének javítására
  • Kutatási projekt a generalizáció jobb megértésére
  • RL-környezetek létrehozása a Claude-modellek képességeinek javítására a saját szakterületeden
  • RL-környezetek építése biztonsággal kapcsolatos feladatokhoz
  • Kutatás és megoldások implementálása olyan területeken, mint az RL-algoritmusok

Elvárások

  • Folyékony Python-programozási tudás
  • Elérhetőség a Fellows program teljes munkaidős elvégzéséhez
  • Erős technikai háttér számítástechnikában, matematikában vagy fizikában
  • Ötletek gyors megvalósítása és világos kommunikáció
  • Motiváció aziránt, hogy az AI biztonságos és hasznos legyen a társadalom egésze számára
  • Lelkesedés az empirikus AI-kutatásba való átmenet iránt, és érdeklődés egy teljes munkaidős anthropic-os szerep iránt
  • Munkavállalási engedély az USA-ban, az Egyesült Királyságban vagy Kanadában, és tartózkodás abban az országban a program alatt (a fellow-knak nincs vízumszponzoráció)

Előny

  • Erős szoftvermérnöki készségek komplex ML-rendszerek építésében szerzett tapasztalattal
  • Képesség a kutatási felfedezés és a mérnöki szigor, valamint az üzemeltetési megbízhatóság egyensúlyozására
  • Szívesen működik együtt a kutatási és mérnöki diszciplínák között
  • Otthonos a nagy léptékű elosztott rendszerekben és a nagy teljesítményű számításban
  • Tapasztalat nagy nyelvi modellek tréningezésében, finomhangolásában vagy kiértékelésében
  • Jártasság a modelltréning-folyamatok elemzésében és hibakeresésében

Soft skillek

Jól teljesít gyors tempójú, együttműködő környezetbenVilágos kommunikációÖtletek gyors megvalósítása

Amit kínálunk

  • Heti ösztöndíj 3 850 USD / 2 310 GBP / 4 300 CAD + juttatások (országonként eltérő), heti 40 óra 4 hónapon át
  • Közvetlen mentorálás Anthropic-kutatóktól
  • Hozzáférés megosztott munkatérhez a kaliforniai Berkeley-ben vagy a londoni irodában
  • Számítási kapacitás finanszírozása (~15 000 USD/hó) és egyéb kutatási költségek fedezése
  • Kapcsolódás a tágabb AI-biztonsági kutatói közösséghez
Végzettség: Bachelor's degree or an equivalent combination of education, training and/or experience; required field of study relevant to the role