Állás

AI Inference gyakornoki program

AI / ML Engineer • Remote • Teljes munkaidő • 📍 London

A Perplexity 13 hetes gyakornoki programot kínál kiváló mesterszakos vagy PhD-hallgatóknak, akik számítástechnikát vagy mérnöki tudományt tanulnak az Egyesült Királyságban, és közvetlenül az AI Inference csapattal dolgoznak együtt, amely a Perplexity termékei mögötti modellek futtatásáért felel. A csapat a single-node embeddingektől az elosztott, ritka Mixture-of-Experts modellekig terjedő modellek inference engine-jét és deploymentjeit tartja karban nagy GPU-klasztereken, a teljes serving stacket birtokolva, a latency és a throughput fókuszában. A program személyes jelenléttel zajlik Londonban (hibrid: 3 nap iroda, 2 nap home office), a 2026-os évfolyamban 2-3 hellyel, és a kiemelkedő teljesítményt nyújtók teljes munkaidős ajánlatot kaphatnak.

Feladatok

▹Együttműködés az inference csapattal a serving latency és throughput javítása érdekében
▹Új modellek, valamint élvonalbeli inference-optimalizálások vagy kvantálási sémák támogatásának bevezetése
▹Az inference optimalizálása a teljes stacken, a GPU kernelektől a serving endpointokig

Elvárások

▹Erős mérnöki háttér, az alapok és programozási nyelvek bizonyított ismeretével (többszálú programozás, hálózatkezelés, fordítás, rendszerprogramozás stb.)
▹Folyamatban lévő mesterszakos vagy PhD-tanulmányok számítástechnikából, teljesítményközpontú témákra fókuszálva (HPC, fordítóprogramok, elosztott rendszerek)
▹Tapasztalat ML keretrendszerekkel (Torch, JAX)
▹Tapasztalat GPU-programozással (CUDA, Triton)
▹Tapasztalat High-Performance Computing területén (OpenMPI)

Amit kínálunk

▹13 hetes gyakornoki program, teljes vagy részmunkaidőben, személyes jelenléttel a londoni irodában (hibrid: 3 nap iroda, 2 nap home office)
▹Teljes munkaidős ajánlat lehetősége a kiemelkedő teljesítményt nyújtóknak

Végzettség: Pursuing a Master's or PhD in Computer Science or Engineering (enrolled in the 2025-2026 academic year in the UK), with a focus on performance-related subjects (HPC, Compilers, Distributed Systems)