LocalIA / explorer242 modèles · 201 GPUs

⌘Krecherche

Combien votre LLM préféré vous coûte vraiment ?

CONFIGS DE RÉFÉRENCE · CLIQUEZ POUR CALER LA CONFIG

▲ PERTE ANNUELLE EN CLOUD vs Claude Sonnet 4

13 440 €

Llama 3.3 70B 70B · RTX 5090 · 80 Mtok/mo

LOCAL / MOIS

0,0 €

électricité seule

ROI DU RIG

—

vs Claude Sonnet 4 · rig « Starter » 4 990 € HT

Modèles sur RTX 5090 · Q4_K_M

10 trouvés · 10 affichés

★Qwen 3 32B32B

Qwen

20.2 GB requis32 GB dispo

TOK/S

84,6

€/Mtok

0,330 €

vs API GPT-4o35× moins cher

★Gemma 4 31B31B

Gemma

19.5 GB requis32 GB dispo

TOK/S

87,4

€/Mtok

0,320 €

vs API GPT-4o36× moins cher

★Qwen 3 30B A3B30B·MoE

Qwen · moe

18.9 GB requis32 GB dispo

TOK/S

90,3

€/Mtok

0,310 €

vs API GPT-4o mini5× moins cher

★Qwen 3 14B14B

Qwen

8.8 GB requis32 GB dispo

TOK/S

193,4

€/Mtok

0,145 €

vs API GPT-4o mini10× moins cher

★Phi-4 14B14B

Phi

8.8 GB requis32 GB dispo

TOK/S

193,4

€/Mtok

0,145 €

vs API GPT-4o mini10× moins cher

★Llama 3.3 70B70B

Llama

Non

44.1 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API Claude Sonnet 4—

★DeepSeek R1 Distill 70B70B

DeepSeek · reasoning

Non

44.1 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API Claude Sonnet 4—

★Qwen 2.5 72B72B

Qwen

Non

45.4 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API Claude Sonnet 4—

★Llama 4 Scout 17Bx16109B·MoE

Llama · moe

Non

68.7 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API GPT-4o mini—

★Mistral Large 123B123B

Mistral

Non

77.5 GB requis32 GB dispo

TOK/S

—

€/Mtok

—

vs API Claude Sonnet 4—

RIG SUR-MESURE

Aucun modèle ne tient ? On dimensionne pour vous.

on dimensionne, vous montez · ressource indépendante

Nous écrire pour un conseil →

↳ Formules : tok/s ≈ bandwidth × 0.85 / footprint · €/Mtok local = TDP × 70 % × s/Mtok × kWh · ratio = €/M API ÷ €/Mtok local · ROI = rig_price ÷ (coût API mensuel − coût électrique mensuel).
↳ Comparé à : Claude Sonnet 4 à 14.00 €/M tokens (mix RAG typique 80 % input + 20 % output, contrat ZDR). Autres baselines disponibles via le sélecteur : GPT-4o (11.50 €/M), Claude Sonnet 4 (14.00 €/M), Mistral Large (8.00 €/M), Claude Haiku 4 (3.50 €/M), GPT-4o mini (1.50 €/M).
↳ Sources : bench public HuggingFace + Lambda Labs · pricing API publics mai 2026 · Q4_K_M ≈ 0,56 bytes/param · KV cache & overhead +12 %. Estimations théoriques, variance réelle ±30 %.
↳ Données : 201 GPUs (NVIDIA, AMD, Apple, Intel) · 242 modèles open source · synchronisation HuggingFace quotidienne · TDP/bandwidth disponibles pour ~80 GPUs principaux.
↳ Damien OGRYZEK · SIREN 918 508 862 · France · catalogue modèles · catalogue GPUs · contact@getlocalia.com