Nemotron340B params4k contesto

Nemotron 340B in locale

Nemotron 340B è un LLM open-weight della famiglia Nemotron, con 340B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: Instinct MI325X (256 GB).

Scheda tecnica
Parametri340B
Contesto massimo4k
Q4_K_M213.7 GB
Q5_K_M261.2 GB
Q8380.0 GB
FP16760.0 GB
FamigliaNemotron
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
213.7GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
261.2GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
380.0GB

Qualità quasi FP16. Comoda in produzione.

FP16
760.0GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire Nemotron 340B su una sola scheda, ordinate per margine VRAM.

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12