Gemma2B params8k contexto

CodeGemma 2B en local

CodeGemma 2B es un LLM open-weight de la familia Gemma, con 2B parámetros. Uso principal: code and developer agents. Hardware mínimo detectado: GTX 1650 (4 GB).

Ficha técnica
Parámetros2B
Contexto máximo8k
Q4_K_M1.3 GB
Q5_K_M1.5 GB
Q82.2 GB
FP164.5 GB
FamiliaGemma
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
1.3GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
1.5GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
2.2GB

Calidad casi FP16. Cómodo para producción.

FP16
4.5GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar CodeGemma 2B en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para CodeGemma 2B con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

2× GTX 1650

CodeGemma 2B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Modelos similares

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12