Research

Academic or research source. Check the methodology, sample size, and whether it's been replicated.

SPQ: An Ensemble Technique for Large Language Model Compression

This study presents an ensemble technique, SPQ (SVD-Pruning-Quantization), for large language model (LLM) compression that combines variance-retained singular value decomposition (SVD), activation-based pruning, and…

arXiv cs.CL · Feb 20, 2026 18:44 UTC · Paper: ~15 min

Read Original

SPQ: An Ensemble Technique for Large Language Model Compression

TLDR

Artifacts

Paper PDF

Open

O open S save B back M mode