Yi 1.5 34B Chat

34B

01.AI Yi

01.AI's strong bilingual (EN/ZH) model. Competitive with Qwen 32B.

Consumer GPUPro GPU

Max Context

Quant Variants

GGUF Q4_K_M

Best Quality

97.2%

Accuracy Retained

Quantization Variants

Per-quant VRAM, quality loss, and inference speed on RTX 4090

Format	Level	BPW	VRAM	PPL Loss	Speed	Actions
GGUF	Q4_K_M	4.85	22.5 GB	2.8%	40 tok/s	Calc HF
AWQ	INT4	4	19.8 GB	4.0%	52 tok/s	Calc HF