Athene70B params8k contexto

Athene 70B en local

Athene 70B es un LLM open-weight de la familia Athene, con 70B parámetros. Uso principal: chat, RAG and general assistance. Hardware mínimo detectado: Quadro RTX 8000 (48 GB).

Ficha técnica
Parámetros70B
Contexto máximo8k
Q4_K_M44.0 GB
Q5_K_M53.8 GB
Q878.2 GB
FP16156.5 GB
FamiliaAthene
Última sync2026-05-12

Quantizations disponibles

Q4_K_M
44.0GB

Aceptable. Buen compromiso si la VRAM es limitada.

Q5_K_M
53.8GB

Buena calidad. Punto dulce tamaño / precisión.

Q8
78.2GB

Calidad casi FP16. Cómodo para producción.

FP16
156.5GB

Precisión de referencia. Máxima calidad, más VRAM.

GPUs compatibles

GPUs capaces de ejecutar Athene 70B en una sola tarjeta, ordenadas por margen de VRAM.

Rigs multi-GPU recomendados

Para Athene 70B con quantization más alta o más contexto, un rig multi-GPU da más margen.

Rig recomendado

4× RTX 2060 12GB

Athene 70B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configurar

Estimaciones VRAM: parámetros x bits/8 más margen. El rendimiento real varía según motor, contexto y batch.
sync: 2026-05-12