Skip to content

AI Systems Performance Engineering

Resources

Books

AI Systems Performance Engineering: Optimizing Model Training and Inference Workloads with GPUs, CUDA, and PyTorch (2025.12)
- Code

Articles

Talks

The Engineering Behind Training a 2 Trillion Parameter LLM (2026.04)

GPU