Skip to content

AI Data Center Systems

Select theme

AI Data Center Network
Efficient LLM Inference Systems
Deep Learning for Network Engineers
AI Systems Performance Engineering
CME295 Lecture Notes
Training
Storage

Efficient LLM Inference Systems
appendix
- Appendix
- hardware-architectures
- llm-inference
  - LLM Inference
- transformer
  - Transformer
week01
- Efficient LLM Inference Systems
week02
- Week 2 — Hardware Foundations for Inference
week03
- Week 3 — Transformer Inference and the KV Cache
week04
- Week 4 — Quantization
- results
  - Week 4 Lab Results

Select theme

On this page

Overview

On this page

Overview

Appendix

Reusable background notes for LLM inference topics that appear across multiple weeks.

Hardware Architectures for LLM Inference
LLM Inference
Transformer

Last updated: Jun 23, 2026

Previous
Efficient LLM Inference Systems Next
Hardware Architectures for LLM Inference