Mistral12B params128k contextopopular

Mistral Nemo 12B en local

Mistral Nemo 12B es un LLM open-weight de la familia Mistral, con 12B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: GTX 1070 (8 GB).

Ficha técnica
Parámetros12B
Contexto máximo128k
Q4_K_M7.5 GB
Q5_K_M9.2 GB
Q813.4 GB
FP1626.8 GB
FamiliaMistral
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
7.5GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
9.2GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
13.4GB

Calidad casi FP16. Cómodo para producción.

FP16
26.8GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar Mistral Nemo 12B en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para Mistral Nemo 12B con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

2× GTX 1060 6GB

Mistral Nemo 12B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Modelos similares

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12