← Vissza a listához
Állás

AI Inference gyakornoki program

Perplexity
AI / ML Engineer • Remote • Teljes munkaidő • 📍 London

A Perplexity 13 hetes gyakornoki programot kínál kiváló mesterszakos vagy PhD-hallgatóknak, akik számítástechnikát vagy mérnöki tudományt tanulnak az Egyesült Királyságban, és közvetlenül az AI Inference csapattal dolgoznak együtt, amely a Perplexity termékei mögötti modellek futtatásáért felel. A csapat a single-node embeddingektől az elosztott, ritka Mixture-of-Experts modellekig terjedő modellek inference engine-jét és deploymentjeit tartja karban nagy GPU-klasztereken, a teljes serving stacket birtokolva, a latency és a throughput fókuszában. A program személyes jelenléttel zajlik Londonban (hibrid: 3 nap iroda, 2 nap home office), a 2026-os évfolyamban 2-3 hellyel, és a kiemelkedő teljesítményt nyújtók teljes munkaidős ajánlatot kaphatnak.

Feladatok

  • Együttműködés az inference csapattal a serving latency és throughput javítása érdekében
  • Új modellek, valamint élvonalbeli inference-optimalizálások vagy kvantálási sémák támogatásának bevezetése
  • Az inference optimalizálása a teljes stacken, a GPU kernelektől a serving endpointokig

Elvárások

  • Erős mérnöki háttér, az alapok és programozási nyelvek bizonyított ismeretével (többszálú programozás, hálózatkezelés, fordítás, rendszerprogramozás stb.)
  • Folyamatban lévő mesterszakos vagy PhD-tanulmányok számítástechnikából, teljesítményközpontú témákra fókuszálva (HPC, fordítóprogramok, elosztott rendszerek)
  • Tapasztalat ML keretrendszerekkel (Torch, JAX)
  • Tapasztalat GPU-programozással (CUDA, Triton)
  • Tapasztalat High-Performance Computing területén (OpenMPI)

Amit kínálunk

  • 13 hetes gyakornoki program, teljes vagy részmunkaidőben, személyes jelenléttel a londoni irodában (hibrid: 3 nap iroda, 2 nap home office)
  • Teljes munkaidős ajánlat lehetősége a kiemelkedő teljesítményt nyújtóknak
Végzettség: Pursuing a Master's or PhD in Computer Science or Engineering (enrolled in the 2025-2026 academic year in the UK), with a focus on performance-related subjects (HPC, Compilers, Distributed Systems)