
āđāļāļ§āļīāļ āđāļĄāļĨ āđāļāđāļāļĢāđāļ§āļĄāļāļđāđāđāļāļĩāļĒāļāđāļĨāļ°āļāļđāđāļāļđāđāļĨ Ingero āļāļķāđāļāđāļāđāļāļāļąāļ§āđāļāļ eBPF āđāļāļāđāļāđāļāđāļāļāļāļĢāđāļŠāļŠāļģāļŦāļĢāļąāļāļāļēāļĢāļŠāļąāļāđāļāļāļāļēāļĢāļāđ GPU āļĢāļ°āļāļąāļ CUDA āđāļāļēāļĄāļĩāļāļ§āļēāļĄāđāļāļĩāđāļĒāļ§āļāļēāļāđāļāļāļēāļĢāļāļīāļāļāļēāļĄāļĢāļ°āļāļąāļāđāļāļāļĢāđāđāļāļĨāļāļāļāđāļ§āļīāļĢāđāļāđāļŦāļĨāļ AI āđāļāļāļēāļĢāļāļĨāļīāļ


บทความนี้เป็นผลจากการตรวจสอบระดับเคอร์เนล GPU โดยใช้ eBPF uprobes ในปัญหาของ PyTorch จริง (#154318) ฐานข้อมูลการตรวจสอบถูกเผยแพร่ใน仓หลัก Ingero ที่เปิดกว้างสำหรับการตรวจสอบอิสระ TL;DR DataLoader ของ PyTorch สามารถช้ากว่าการอ้างอิงเทนเซอร์โดยตรงถึง 50-124 เท่า สำหรับงาน GPU ในหน่วยความจำ เราได้ทำซ้ำปัญหา PyTorch จริงบน RTX...