MPT30B params8k contexto

MPT 30B en local

MPT 30B es un LLM open-weight de la familia MPT, con 30B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: RTX A4500 (20 GB).

Ficha técnica
Parámetros30B
Contexto máximo8k
Q4_K_M18.9 GB
Q5_K_M23.1 GB
Q833.5 GB
FP1667.1 GB
FamiliaMPT
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
18.9GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
23.1GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
33.5GB

Calidad casi FP16. Cómodo para producción.

FP16
67.1GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar MPT 30B en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para MPT 30B con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

4× GTX 1060 6GB

MPT 30B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Modelos similares

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12