InternLM20B params33k contesto

InternLM 2.5 20B in locale

InternLM 2.5 20B è un LLM open-weight della famiglia InternLM, con 20B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: RTX 4060 Ti 16GB (16 GB).

Scheda tecnica
Parametri20B
Contesto massimo33k
Q4_K_M12.6 GB
Q5_K_M15.4 GB
Q822.4 GB
FP1644.7 GB
FamigliaInternLM
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
12.6GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
15.4GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
22.4GB

Qualità quasi FP16. Comoda in produzione.

FP16
44.7GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire InternLM 2.5 20B su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per InternLM 2.5 20B con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

2× GTX 1070

InternLM 2.5 20B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12