AI Inference gyakornoki program
A Perplexity 13 hetes gyakornoki programot kínál kiváló mesterszakos vagy PhD-hallgatóknak, akik számítástechnikát vagy mérnöki tudományt tanulnak az Egyesült Királyságban, és közvetlenül az AI Inference csapattal dolgoznak együtt, amely a Perplexity termékei mögötti modellek futtatásáért felel. A csapat a single-node embeddingektől az elosztott, ritka Mixture-of-Experts modellekig terjedő modellek inference engine-jét és deploymentjeit tartja karban nagy GPU-klasztereken, a teljes serving stacket birtokolva, a latency és a throughput fókuszában. A program személyes jelenléttel zajlik Londonban (hibrid: 3 nap iroda, 2 nap home office), a 2026-os évfolyamban 2-3 hellyel, és a kiemelkedő teljesítményt nyújtók teljes munkaidős ajánlatot kaphatnak.
Feladatok
- ▹Együttműködés az inference csapattal a serving latency és throughput javítása érdekében
- ▹Új modellek, valamint élvonalbeli inference-optimalizálások vagy kvantálási sémák támogatásának bevezetése
- ▹Az inference optimalizálása a teljes stacken, a GPU kernelektől a serving endpointokig
Elvárások
- ▹Erős mérnöki háttér, az alapok és programozási nyelvek bizonyított ismeretével (többszálú programozás, hálózatkezelés, fordítás, rendszerprogramozás stb.)
- ▹Folyamatban lévő mesterszakos vagy PhD-tanulmányok számítástechnikából, teljesítményközpontú témákra fókuszálva (HPC, fordítóprogramok, elosztott rendszerek)
- ▹Tapasztalat ML keretrendszerekkel (Torch, JAX)
- ▹Tapasztalat GPU-programozással (CUDA, Triton)
- ▹Tapasztalat High-Performance Computing területén (OpenMPI)
Amit kínálunk
- ▹13 hetes gyakornoki program, teljes vagy részmunkaidőben, személyes jelenléttel a londoni irodában (hibrid: 3 nap iroda, 2 nap home office)
- ▹Teljes munkaidős ajánlat lehetősége a kiemelkedő teljesítményt nyújtóknak