#qat - Tags - ML Learning Lab

3 posts · Transformer Series

Tag: #qat

Exploring the Transformer Series (35) --- Fundamentals of Large Model Quantization

🗓 2026-04-11 • Transformer Series • ⏱ 62 min read

Large model quantization fundamentals: outliers, superweights, massive activations, PTQ, QAT, and common quantization strategies.

#transformer #quantization #llm #outlier #ptq #qat

Read →

Exploring the Transformer Series (36) --- Large Model Quantization Scheme

🗓 2026-04-11 • Transformer Series • ⏱ 106 min read

Large model quantization schemes across 8-bit, 4-bit, and low-bit settings, including LLM.int8(), ZeroQuant, SmoothQuant, GPTQ, AWQ, LLM-QAT, QLoRA, FlatQuant, SqueezeLLM, SpQR, BitNet, and OneBit.

#transformer #quantization #llm-compression #ptq #qat #low-bit-quantization

Read →

Exploring the Transformer Series (34) --- Quantitative Fundamentals

🗓 2026-04-11 • Transformer Series • ⏱ 48 min read

Quantization fundamentals for Transformer LLMs: compression background, numerical representations, PTQ/QAT workflows, calibration, granularity, and acceleration.

#transformer #quantization #llm-compression #ptq #qat #model-quantization

Read →

| #qat

Tag: #qat

Exploring the Transformer Series (35) --- Fundamentals of Large Model Quantization

Exploring the Transformer Series (36) --- Large Model Quantization Scheme

Exploring the Transformer Series (34) --- Quantitative Fundamentals