LocalIA / explorer242 modèles · 201 GPUs

⌘Kzoek

Hoeveel kost je favoriete LLM echt?

REFERENTIECONFIGURATIES · KLIK OM DE CONFIG TE LADEN

▲ JAARLIJKS CLOUDVERLIES vs Claude Sonnet 4

13 440 €

Llama 3.3 70B 70B · RTX 5090 · 80 Mtok/maand

LOKAAL / MAAND

0,0 €

alleen elektriciteit

RIG-ROI

—

vs Claude Sonnet 4 · rig „Starter" 4 990 € excl. btw

Modellen op RTX 5090 · Q4_K_M

10 gevonden · 10 getoond

★Qwen 3 32B32B

Qwen

20.2 GB requis32 GB dispo

TOK/S

84,6

€/Mtok

0,330 €

vs API GPT-4o35× moins cher

★Gemma 4 31B31B

Gemma

19.5 GB requis32 GB dispo

TOK/S

87,4

€/Mtok

0,320 €

vs API GPT-4o36× moins cher

★Qwen 3 30B A3B30B·MoE

Qwen · moe

18.9 GB requis32 GB dispo

TOK/S

90,3

€/Mtok

0,310 €

vs API GPT-4o mini5× moins cher

★Qwen 3 14B14B

Qwen

8.8 GB requis32 GB dispo

TOK/S

193,4

€/Mtok

0,145 €

vs API GPT-4o mini10× moins cher

★Phi-4 14B14B

Phi

8.8 GB requis32 GB dispo

TOK/S

193,4

€/Mtok

0,145 €

vs API GPT-4o mini10× moins cher

★Llama 3.3 70B70B

Llama

Non

44.1 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API Claude Sonnet 4—

★DeepSeek R1 Distill 70B70B

DeepSeek · reasoning

Non

44.1 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API Claude Sonnet 4—

★Qwen 2.5 72B72B

Qwen

Non

45.4 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API Claude Sonnet 4—

★Llama 4 Scout 17Bx16109B·MoE

Llama · moe

Non

68.7 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API GPT-4o mini—

★Mistral Large 123B123B

Mistral

Non

77.5 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API Claude Sonnet 4—

RIG SUR-MESURE

Aucun modèle ne tient ? On dimensionne pour vous.

on dimensionne, vous montez · ressource indépendante

Nous écrire pour un conseil →

↳ Formules : tok/s ≈ bandwidth × 0.85 / footprint · €/Mtok local = TDP × 70 % × s/Mtok × kWh · ratio = €/M API ÷ €/Mtok local · ROI = rig_price ÷ (coût API mensuel − coût électrique mensuel).
↳ Comparé à : Claude Sonnet 4 à 14.00 €/M tokens (mix RAG typique 80 % input + 20 % output, contrat ZDR). Autres baselines disponibles via le sélecteur : GPT-4o (11.50 €/M), Claude Sonnet 4 (14.00 €/M), Mistral Large (8.00 €/M), Claude Haiku 4 (3.50 €/M), GPT-4o mini (1.50 €/M).
↳ Sources : bench public HuggingFace + Lambda Labs · pricing API publics mai 2026 · Q4_K_M ≈ 0,56 bytes/param · KV cache & overhead +12 %. Estimations théoriques, variance réelle ±30 %.
↳ Données : 201 GPUs (NVIDIA, AMD, Apple, Intel) · 242 modèles open source · synchronisation HuggingFace quotidienne · TDP/bandwidth disponibles pour ~80 GPUs principaux.
↳ Damien OGRYZEK · SIREN 918 508 862 · France · catalogue modèles · catalogue GPUs · contact@getlocalia.com