Catálogo · 242 modelos

242 LLM abiertos,
una sola calculadora.

Índice completo de modelos disponibles en local. Para cada modelo: VRAM requerida, GPUs compatibles y rig recomendado. Datos sincronizados el 2026-05-12 vía HuggingFace.

242

modelos indexados

familias

156

populares ★

MoE

▲ Top 10 · recomendados por nivel

Los 10 modelos que realmente recomendamos.

En vez de ahogarte con 240 modelos, aquí está nuestra selección para 2026, agrupada por tamaño de rig. La calculadora queda accesible para el resto.

Para el rig Starter

1× RTX 5090 · 32 GB VRAM

→ rig

Qwen 3 32B32B
Qwen 3 — sweet spot 2026 taille/qualité. Bilingue, code, raisonnement amélioré vs 2.5.
Gemma 4 31B31B
Gemma 4 Google. Multimodal natif, contexte 128k, qualité 2026.
Qwen 3 14B14B
Le mid-range Qwen 3. Léger, rapide, polyvalent — idéal pour expérimentation et agents.
Phi-4 14B14B
Microsoft Phi-4. Petit mais redoutable en raisonnement et code.

Para el rig Pro

2× RTX 5090 · 64 GB VRAM

→ rig

Llama 3.3 70B70B
Le LLM open source de référence 2026. Quasi GPT-4o, écosystème énorme.
Qwen 3 30B A3B30B·MoE
Qwen 3 MoE (3B actifs/token). Débit serveur élevé, idéal multi-user RAG.
Qwen 2.5 72B72B
Le challenger chinois 72B. Excellent en code et multilingue (en attendant Qwen 3 70B+).
DeepSeek R1 Distill 70B70B
Top du raisonnement open source. Chain-of-thought, math, code, analyse step-by-step.

Para el rig Empresa

2× RTX A6000 NVLink · 96 GB VRAM

→ rig

Mistral Large 123B123B
Flagship français. Souveraineté + qualité GPT-4-class, contexte 128k.
Llama 4 Scout 17Bx16109B·MoE
Llama 4 Scout (109B MoE). Contexte 10M tokens, multimodal natif. À partir de 2× A6000.

¿Quieres ir más lejos? Abrir la calculadora (240+ modelos) →

¿No sabes cuál elegir?

La calculadora cruza 242 modelos con 204 GPUs en tiempo real.

Abrir calculadora →

242 LLM abiertos,una sola calculadora.

Los 10 modelos que realmente recomendamos.

¿No sabes cuál elegir?

242 LLM abiertos,
una sola calculadora.