Falcon180B params2k contexto

Falcon 180B en local

Falcon 180B es un LLM open-weight de la familia Falcon, con 180B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: Instinct MI250 (128 GB).

Ficha técnica
Parámetros180B
Contexto máximo2k
Q4_K_M113.2 GB
Q5_K_M138.3 GB
Q8201.2 GB
FP16402.3 GB
FamiliaFalcon
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
113.2GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
138.3GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
201.2GB

Calidad casi FP16. Cómodo para producción.

FP16
402.3GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar Falcon 180B en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para Falcon 180B con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

4× RTX 5090

Falcon 180B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Modelos similares

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12