Nemotron9B paramspopolare

NVIDIA Nemotron Nano 9B in locale

NVIDIA Nemotron Nano 9B è un LLM open-weight della famiglia Nemotron, con 9B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: GTX 1060 6GB (6 GB).

Scheda tecnica
Parametri9B
Q4_K_M5.7 GB
Q5_K_M6.9 GB
Q810.1 GB
FP1620.1 GB
FamigliaNemotron
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
5.7GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
6.9GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
10.1GB

Qualità quasi FP16. Comoda in produzione.

FP16
20.1GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire NVIDIA Nemotron Nano 9B su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per NVIDIA Nemotron Nano 9B con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

2× GTX 1650

NVIDIA Nemotron Nano 9B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12