Llama405B params128k contestopopolare

Llama 3.1 405B in locale

Llama 3.1 405B è un LLM open-weight della famiglia Llama, con 405B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: Instinct MI325X (256 GB).

Scheda tecnica
Parametri405B
Contesto massimo128k
Q4_K_M254.6 GB
Q5_K_M311.2 GB
Q8452.6 GB
FP16905.2 GB
FamigliaLlama
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
254.6GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
311.2GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
452.6GB

Qualità quasi FP16. Comoda in produzione.

FP16
905.2GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire Llama 3.1 405B su una sola scheda, ordinate per margine VRAM.

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12