DeepSeek-Coder-V2-Lite Instruct

16B

DeepSeek

MoE architecture coding model. Active params ~2.4B, total ~16B. Exceptional code quality.

⬇ 76.5K HF downloads♥ 166 likesbartowski/DeepSeek-Coder-V2-Lite-Instruct-GGUF· stats from 6/24/2026

Consumer GPUMac / Apple Silicon

164K

Max Context

Quant Variants

GGUF Q8_0

Best Quality

99.8%

Accuracy Retained

Quantization Variants

Per-quant VRAM, quality loss, and inference speed on RTX 4090

Format	Level	BPW	VRAM	PPL Loss	Speed	Actions
GGUF	Q4_K_M	4.85	11.1 GB	3.1%	145 tok/s	Calc HF
GGUF	Q8_0	8.5	17.5 GB	0.2%	118 tok/s	Calc HF
AWQ	INT4	4	9.8 GB	4.1%	192 tok/s	Calc HF