Qwen72B paramspopular

Qwen2.5 72B Instruct en local

Qwen2.5 72B Instruct es un LLM open-weight de la familia Qwen, con 72B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: Quadro RTX 8000 (48 GB).

Ficha técnica
Parámetros72B
Q4_K_M45.3 GB
Q5_K_M55.3 GB
Q880.5 GB
FP16160.9 GB
FamiliaQwen
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
45.3GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
55.3GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
80.5GB

Calidad casi FP16. Cómodo para producción.

FP16
160.9GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar Qwen2.5 72B Instruct en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para Qwen2.5 72B Instruct con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

4× RTX 2060 12GB

Qwen2.5 72B Instruct with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Modelos similares

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12