Aya35B params8k contesto

Aya 23 35B in locale

Aya 23 35B è un LLM open-weight della famiglia Aya, con 35B parametri. Uso principale: chat, RAG and general assistance. Hardware minimo rilevato: TITAN RTX (24 GB).

Scheda tecnica
Parametri35B
Contesto massimo8k
Q4_K_M22.0 GB
Q5_K_M26.9 GB
Q839.1 GB
FP1678.2 GB
FamigliaAya
Ultima sync2026-05-12

Quantization disponibili

Q4_K_M
22.0GB

Accettabile. Buon compromesso con VRAM limitata.

Q5_K_M
26.9GB

Buona qualità. Punto dolce tra dimensione e precisione.

Q8
39.1GB

Qualità quasi FP16. Comoda in produzione.

FP16
78.2GB

Precisione di riferimento. Qualità massima, più VRAM.

GPU compatibili

GPU capaci di eseguire Aya 23 35B su una sola scheda, ordinate per margine VRAM.

Rig multi-GPU consigliati

Per Aya 23 35B con quantization più alta o più contesto, un rig multi-GPU offre più margine.

Rig consigliato

4× GTX 1060 6GB

Aya 23 35B with Ubuntu, vLLM, Open WebUI and the model already downloaded.

Configura

Modelli simili

Stime VRAM: parametri x bits/8 più margine. Prestazioni reali secondo engine, contesto e batch.
sync: 2026-05-12