Állás

Anthropic Fellows Program, AI Safety (AI-biztonság)

Anthropic

AI / ML Engineer • Remote • Teljes munkaidő • 📍 London

Az Anthropic küldetése megbízható, értelmezhető és irányítható AI-rendszerek létrehozása. Az Anthropic Fellows Program az AI-kutatói és -mérnöki tehetségeket gondozza azzal, hogy finanszírozást és mentorálást nyújt ígéretes technikai tehetségeknek, korábbi tapasztalattól függetlenül. A fellow-k elsősorban külső infrastruktúrát (nyílt forráskódú modellek, nyilvános API-k) használva dolgoznak egy empirikus projekten, amely az Anthropic kutatási prioritásaihoz illeszkedik, és a cél egy nyilvános kimenet (pl. egy publikáció). A program 4 hónapos teljes munkaidős, megosztott munkaterekkel Londonban vagy Berkeley-ben, és távmunkás fellow-kat is fogadnak az Egyesült Királyságból, az USA-ból vagy Kanadából. Ez a munkafolyamat (workstream) az AI Safety, olyan kutatási területekkel, mint a scalable oversight, az adversarial robustness és AI control, a model organisms of misalignment, a mechanistic interpretability és az AI welfare.

Stack

Python

Feladatok

▹Empirikus AI-biztonsági kutatási projekten dolgozni azzal a céllal, hogy nyilvános kimenet (pl. publikáció) szülessen
▹Olyan kutatási területek művelése, mint a scalable oversight - a nagyon képes modellek segítőkész és őszinte viselkedésének megőrzése
▹Adversarial robustness és AI control - a fejlett AI-rendszerek biztonságának megőrzése ismeretlen vagy ellenséges helyzetekben
▹Model organisms - a misalignment modell-organizmusainak létrehozása annak megértésére, hogyan keletkeznek az alignment-hibák
▹Modellbelsők / mechanistic interpretability - a nagy nyelvi modellek belső működésének megértése
▹AI welfare - a lehetséges AI-jólléti kérdések megértésének javítása és kapcsolódó kiértékelések, mitigációk fejlesztése

Elvárások

▹Folyékony Python-programozási tudás
▹Elérhetőség a Fellows program teljes munkaidős elvégzéséhez
▹Erős technikai háttér számítástechnikában, matematikában vagy fizikában
▹Ötletek gyors megvalósítása és világos kommunikáció
▹Motiváció aziránt, hogy az AI biztonságos és hasznos legyen a társadalom egésze számára
▹Lelkesedés az empirikus AI-kutatásba való átmenet iránt, és érdeklődés egy teljes munkaidős anthropic-os szerep iránt
▹Munkavállalási engedély az USA-ban, az Egyesült Királyságban vagy Kanadában, és tartózkodás abban az országban a program alatt (a fellow-knak nincs vízumszponzoráció)

Előny

▹Motiváció a fejlett AI-rendszerekből eredő katasztrofális kockázatok csökkentésére
▹Tapasztalat empirikus ML-kutatási projektekben
▹Tapasztalat nagy nyelvi modellekkel való munkában
▹Tapasztalat a felsorolt kutatási területek egyikében
▹Nyílt forráskódú hozzájárulások felmutatható múltja

Soft skillek

Jól teljesít gyors tempójú, együttműködő környezetbenVilágos kommunikációÖtletek gyors megvalósítása

Amit kínálunk

▹Heti ösztöndíj 3 850 USD / 2 310 GBP / 4 300 CAD + juttatások (országonként eltérő), heti 40 óra 4 hónapon át
▹Közvetlen mentorálás Anthropic-kutatóktól
▹Hozzáférés megosztott munkatérhez a kaliforniai Berkeley-ben vagy a londoni irodában
▹Számítási kapacitás finanszírozása (~15 000 USD/hó) és egyéb kutatási költségek fedezése
▹Kapcsolódás a tágabb AI-biztonsági kutatói közösséghez

Végzettség: Bachelor's degree or an equivalent combination of education, training and/or experience; required field of study relevant to the role