○ cloud reste compétitif
PME — 100 req/jour
3k tokens input + 1k output
- Coût API/an
- 292 €
- Rig amorti/an
- 250 € (élec)
- Break-even
- 285 ans 6 mois
Même modèle, deux mondes : Bedrock vous facture au token sur AWS US, en local c'est sur votre LAN.
| Axe | Llama 3.3 70B hébergé | Llama 3.3 70B local |
|---|---|---|
| Qualité | Strictement identique (même modèle). Seule la latence, le coût marginal et la juridiction diffèrent. | |
| Coût | 1.86 €/Mtok input · 2.42 €/Mtok output | Rig Pro 11 990 € HT + ~250 €/an élec |
| RGPD / juridiction | Région : EU Régions AWS EU (Paris, Francfort) sélectionnables. Cloud Act US applicable. | FR / LAN Données ne quittent jamais le réseau. Pas de sous-traitant. |
| Latence 1ʳᵉ token | 200-800 ms (RTT internet + queue provider) | 50-200 ms (LAN, prévisible, sans rate limit) |
Volumes typiques observés en PME française. Hypothèses : rig Pro (11 990 € HT), 250€/an d'électricité, amortissement linéaire. Prix API au tarif public AWS Bedrock 2026.
3k tokens input + 1k output
4k tokens input + 2k output
4k tokens input + 1k output
Cas où la qualité du modèle est tranchée, le choix porte sur l'amortissement et le Cloud Act.
Si ce comparatif vous parle, deux portes selon votre profil. Aucune ne déclenche d'appel automatique.