MiniCPM2B params4k contesto

MiniCPM 2B in locale

MiniCPM 2B è un LLM open-weight della famiglia MiniCPM, con 2B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: GTX 1650 (4 GB).

Scheda tecnica
Parametri2B
Contesto massimo4k
Q4_K_M1.3 GB
Q5_K_M1.5 GB
Q82.2 GB
FP164.5 GB
FamigliaMiniCPM
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
1.3GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
1.5GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
2.2GB

Qualità quasi FP16. Comoda in produzione.

FP16
4.5GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire MiniCPM 2B su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per MiniCPM 2B con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

2× GTX 1650

MiniCPM 2B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12