Falcon0.5B params33k contesto

Falcon H1 0.5B in locale

Falcon H1 0.5B è un LLM open-weight della famiglia Falcon, con 0.5B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: GTX 1650 (4 GB).

Scheda tecnica
Parametri0.5B
Contesto massimo33k
Q4_K_M0.3 GB
Q5_K_M0.4 GB
Q80.6 GB
FP161.1 GB
FamigliaFalcon
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
0.3GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
0.4GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
0.6GB

Qualità quasi FP16. Comoda in produzione.

FP16
1.1GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire Falcon H1 0.5B su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per Falcon H1 0.5B con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

2× GTX 1650

Falcon H1 0.5B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12