Llama1B paramspopolare

LLaMA 1B dj refine 150B in locale

LLaMA 1B dj refine 150B è un LLM open-weight della famiglia Llama, con 1B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: GTX 1650 (4 GB).

Scheda tecnica
Parametri1B
Q4_K_M0.6 GB
Q5_K_M0.8 GB
Q81.1 GB
FP162.2 GB
FamigliaLlama
Ultima sync2026-05-14

Quantization disponibili

Q4_K_M
0.6GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
0.8GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
1.1GB

Qualità quasi FP16. Comoda in produzione.

FP16
2.2GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire LLaMA 1B dj refine 150B su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per LLaMA 1B dj refine 150B con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

2× GTX 1650

LLaMA 1B dj refine 150B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-14