Qwen3B params128k contesto

Qwen 2.5 VL 3B in locale

Qwen 2.5 VL 3B è un LLM open-weight della famiglia Qwen, con 3B parametri. Uso principale: multimodal image workflows. Hardware minimo rilevato: GTX 1650 (4 GB).

Scheda tecnica
Parametri3B
Contesto massimo128k
Q4_K_M1.9 GB
Q5_K_M2.3 GB
Q83.4 GB
FP166.7 GB
FamigliaQwen
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
1.9GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
2.3GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
3.4GB

Qualità quasi FP16. Comoda in produzione.

FP16
6.7GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire Qwen 2.5 VL 3B su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per Qwen 2.5 VL 3B con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

2× GTX 1650

Qwen 2.5 VL 3B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12