LocalIA / explorer242 modèles · 201 GPUs
Kzoek

Hoeveel kost je favoriete LLM echt?

ONZE RIGS · KLIK OM DE CONFIG TE LADEN
JAARLIJKS CLOUDVERLIES vs Claude Sonnet 4
13 440 €
Llama 3.3 70B 70B · RTX 5090 · 80 Mtok/maand
LOKAAL / MAAND
0,0 €
alleen elektriciteit
RIG-ROI
vs Claude Sonnet 4 · rig „Starter" 4 990 € excl. btw

Modellen op RTX 5090 · Q4_K_M

10 gevonden · 10 getoond
Qwen 3 32B32B
Qwen
OK
20.2 GB requis32 GB dispo
TOK/S
84,6
€/Mtok
0,330 €
vs API GPT-4o35× moins cher
Gemma 4 31B31B
Gemma
OK
19.5 GB requis32 GB dispo
TOK/S
87,4
€/Mtok
0,320 €
vs API GPT-4o36× moins cher
Qwen 3 30B A3B30B·MoE
Qwen · moe
OK
18.9 GB requis32 GB dispo
TOK/S
90,3
€/Mtok
0,310 €
vs API GPT-4o mini5× moins cher
Qwen 3 14B14B
Qwen
OK
8.8 GB requis32 GB dispo
TOK/S
193,4
€/Mtok
0,145 €
vs API GPT-4o mini10× moins cher
Phi-4 14B14B
Phi
OK
8.8 GB requis32 GB dispo
TOK/S
193,4
€/Mtok
0,145 €
vs API GPT-4o mini10× moins cher
Llama 3.3 70B70B
Llama
Non
44.1 GB requis32 GB dispo
TOK/S
€/Mtok
vs API Claude Sonnet 4
DeepSeek R1 Distill 70B70B
DeepSeek · reasoning
Non
44.1 GB requis32 GB dispo
TOK/S
€/Mtok
vs API Claude Sonnet 4
Qwen 2.5 72B72B
Qwen
Non
45.4 GB requis32 GB dispo
TOK/S
€/Mtok
vs API Claude Sonnet 4
Llama 4 Scout 17Bx16109B·MoE
Llama · moe
Non
68.7 GB requis32 GB dispo
TOK/S
€/Mtok
vs API GPT-4o mini
Mistral Large 123B123B
Mistral
Non
77.5 GB requis32 GB dispo
TOK/S
€/Mtok
vs API Claude Sonnet 4
RIG SUR-MESURE
Aucun modèle ne tient ? On dimensionne pour vous.
livré, configuré, on-prem en France
Demander un devis →
Formules : tok/s ≈ bandwidth × 0.85 / footprint · €/Mtok local = TDP × 70 % × s/Mtok × kWh · ratio = €/M API ÷ €/Mtok local · ROI = rig_price ÷ (coût API mensuel − coût électrique mensuel).
Comparé à : Claude Sonnet 4 à 14.00 €/M tokens (mix RAG typique 80 % input + 20 % output, contrat ZDR). Autres baselines disponibles via le sélecteur : GPT-4o (11.50 €/M), Claude Sonnet 4 (14.00 €/M), Mistral Large (8.00 €/M), Claude Haiku 4 (3.50 €/M), GPT-4o mini (1.50 €/M).
Sources : bench public HuggingFace + Lambda Labs · pricing API publics mai 2026 · Q4_K_M ≈ 0,56 bytes/param · KV cache & overhead +12 %. Estimations théoriques, variance réelle ±30 %.
Données : 201 GPUs (NVIDIA, AMD, Apple, Intel) · 242 modèles open source · synchronisation HuggingFace quotidienne · TDP/bandwidth disponibles pour ~80 GPUs principaux.
Damien OGRYZEK · SIREN 918 508 862 · France · catalogue modèles · catalogue GPUs · contact@getlocalia.com