↳
Formules : tok/s ≈ bandwidth × 0.85 / footprint · €/Mtok local = TDP × 70 % × s/Mtok × kWh · ratio = €/M API ÷ €/Mtok local · ROI = rig_price ÷ (coût API mensuel − coût électrique mensuel).
↳
Comparé à : Claude Sonnet 4 à
14.00 €/M tokens (mix RAG typique 80 % input + 20 % output, contrat ZDR). Autres baselines disponibles via le sélecteur : GPT-4o (11.50 €/M), Claude Sonnet 4 (14.00 €/M), Mistral Large (8.00 €/M), Claude Haiku 4 (3.50 €/M), GPT-4o mini (1.50 €/M).
↳
Sources : bench public HuggingFace + Lambda Labs · pricing API publics mai 2026 · Q4_K_M ≈ 0,56 bytes/param · KV cache & overhead +12 %. Estimations théoriques, variance réelle ±30 %.
↳
Données : 201 GPUs (NVIDIA, AMD, Apple, Intel) · 242 modèles open source · synchronisation HuggingFace quotidienne · TDP/bandwidth disponibles pour ~80 GPUs principaux.
↳
Damien OGRYZEK · SIREN 918 508 862 · France ·
catalogue modèles ·
catalogue GPUs ·
contact@getlocalia.com