#low-bit-quantization - Tags

1 post · Transformer Series

Tag: #low-bit-quantization

Exploring the Transformer Series (36) --- Large Model Quantization Scheme

🗓 2026-04-11 • Transformer Series • ⏱ 106 min read

Large model quantization schemes across 8-bit, 4-bit, and low-bit settings, including LLM.int8(), ZeroQuant, SmoothQuant, GPTQ, AWQ, LLM-QAT, QLoRA, FlatQuant, SqueezeLLM, SpQR, BitNet, and OneBit.

#transformer #quantization #llm-compression #ptq #qat #low-bit-quantization

Read →

| #low-bit-quantization

Tag: #low-bit-quantization

Exploring the Transformer Series (36) --- Large Model Quantization Scheme