MPT30B params8k contesto

MPT 30B in locale

MPT 30B è un LLM open-weight della famiglia MPT, con 30B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: RTX A4500 (20 GB).

Scheda tecnica
Parametri30B
Contesto massimo8k
Q4_K_M18.9 GB
Q5_K_M23.1 GB
Q833.5 GB
FP1667.1 GB
FamigliaMPT
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
18.9GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
23.1GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
33.5GB

Qualità quasi FP16. Comoda in produzione.

FP16
67.1GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire MPT 30B su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per MPT 30B con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

4× GTX 1060 6GB

MPT 30B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12