Nemotron340B params4k contexto
Nemotron 340B en local
Nemotron 340B es un LLM open-weight de la familia Nemotron, con 340B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: Instinct MI325X (256 GB).
Ficha técnica
Parámetros340B
Contexto máximo4k
Q4_K_M213.7 GB
Q5_K_M261.2 GB
Q8380.0 GB
FP16760.0 GB
FamiliaNemotron
Última sync2026-05-12
Quantizations disponibles
pesos GGUFQ4_K_M
213.7GB
Aceptable. Buen compromiso si la VRAM es limitada.
Q5_K_M
261.2GB
Buena calidad. Punto dulce tamaño / precisión.
Q8
380.0GB
Calidad casi FP16. Cómodo para producción.
FP16
760.0GB
Precisión de referencia. Máxima calidad, más VRAM.
GPUs compatibles
3 single-GPUGPUs capaces de ejecutar Nemotron 340B en una sola tarjeta, ordenadas por margen de VRAM.
Modelos similares
Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12