Qwen14B paramspopular

Qwen3 14B en local

Qwen3 14B es un LLM open-weight de la familia Qwen, con 14B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: RTX 3080 10GB (10 GB).

Ficha técnica
Parámetros14B
Q4_K_M8.8 GB
Q5_K_M10.8 GB
Q815.6 GB
FP1631.3 GB
FamiliaQwen
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
8.8GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
10.8GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
15.6GB

Calidad casi FP16. Cómodo para producción.

FP16
31.3GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar Qwen3 14B en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para Qwen3 14B con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

2× GTX 1060 6GB

Qwen3 14B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Modelos similares

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12