Nemotron4B paramspopolare

Nemotron Mini 4B Instruct in locale

Nemotron Mini 4B Instruct è un LLM open-weight della famiglia Nemotron, con 4B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: GTX 1650 (4 GB).

Scheda tecnica
Parametri4B
Q4_K_M2.5 GB
Q5_K_M3.1 GB
Q84.5 GB
FP168.9 GB
FamigliaNemotron
Ultima sync2026-06-23

Quantization disponibili

Q4_K_M
2.5GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
3.1GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
4.5GB

Qualità quasi FP16. Comoda in produzione.

FP16
8.9GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire Nemotron Mini 4B Instruct su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per Nemotron Mini 4B Instruct con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

2× GTX 1650

Nemotron Mini 4B Instruct with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-06-23