RTX 4080 Super
- VRAM16 GB
- Bande passante mémoire736 GB/s
- TDP nominal320 W
- Catégorieconsumer
- Mémoire unifiéenon
Quel GPU pour faire tourner quel modèle en local. Comparatif sur VRAM, bande passante mémoire, consommation, et les modèles populaires que chacun peut charger en Q4 single-GPU.
Liste des modèles populaires (Llama 70B, Qwen 72B, Mistral Large…) qui passent en VRAM single-GPU en quantization Q4. Pour les multi-GPU ou les quants moins agressifs, ouvrir le calculateur.
★ = exclusivité (ne tourne pas sur l'autre GPU en single-GPU Q4)
Les deux ont 16 GB de VRAM — même seuil de modèles atteignable. Côté débit, RTX 5080 a 960 GB/s contre 736 GB/s pour RTX 4080 Super — soit ~30% plus de tok/s en inférence quantization-bound.
Meilleur compromis VRAM/débit/prix pour ton use case précis.
→ Fiche RTX 4080 SuperMeilleur compromis VRAM/débit/prix pour ton use case précis.
→ Fiche RTX 5080Le calculateur estime tok/s, €/Mtok et break-even cloud pour ces GPUs avec le modèle de ton choix.