Qwen4B paramspopular

Qwen3 4B Instruct 2507 en local

Qwen3 4B Instruct 2507 es un LLM open-weight de la familia Qwen, con 4B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: GTX 1650 (4 GB).

Ficha técnica
Parámetros4B
Q4_K_M2.5 GB
Q5_K_M3.1 GB
Q84.5 GB
FP168.9 GB
FamiliaQwen
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
2.5GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
3.1GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
4.5GB

Calidad casi FP16. Cómodo para producción.

FP16
8.9GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar Qwen3 4B Instruct 2507 en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para Qwen3 4B Instruct 2507 con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

2× GTX 1650

Qwen3 4B Instruct 2507 with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Modelos similares

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12