Yi6B params33k contexto

Yi 1.5 6B en local

Yi 1.5 6B es un LLM open-weight de la familia Yi, con 6B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: GTX 1650 (4 GB).

Ficha técnica
Parámetros6B
Contexto máximo33k
Q4_K_M3.8 GB
Q5_K_M4.6 GB
Q86.7 GB
FP1613.4 GB
FamiliaYi
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
3.8GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
4.6GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
6.7GB

Calidad casi FP16. Cómodo para producción.

FP16
13.4GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar Yi 1.5 6B en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para Yi 1.5 6B con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

2× GTX 1650

Yi 1.5 6B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Modelos similares

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12