Quels LLM tournent sur un GPU à petit budget (RTX 3060, 3070) en 2026 ?
Pas besoin d'une RTX 5090 pour débuter en IA locale. Les meilleurs GPU par budget (RTX 3060 12 Go, 4060 Ti 16 Go, 3090 24 Go), ce qui tient selon la VRAM, et le roi du rapport VRAM/prix d'occasion.

TL;DR.Pas besoin d'une RTX 5090 pour commencer. Une RTX 3060 12 Go d'occasion(~250 €) fait tourner des modèles 7-14B confortablement, et une RTX 3090 24 Go (~650 €) reste le roi du rapport VRAM/prixpour aller jusqu'à du 32B. La règle est toujours la même : la VRAM décide de ce qui rentre, le reste décide de la vitesse.
C'est la question la plus saine quand on débute en IA locale : quel est le GPU le moins cher qui fait vraiment le job ? Voici les bons choix par budget en 2026, du point de vue qui compte : quels LLM tournent, et à quelle vitesse.
Le sweet spot : RTX 3060 12 Go
À ~250-300 € d'occasion, la RTX 3060 12 Go est le meilleur point d'entrée. Ses 12 Go de VRAM (plus que la 3070 !) lui permettent de tenir des modèles jusqu'à 14B en Q4 :
- Mistral 7B, Llama 3.1 8B en Q5/Q8 : confortable.
- Qwen 2.5 14B, Phi-4 14B en Q4 : ça rentre.
- Qwen 2.5-Coder 7B (assistant de code) : excellent, ~25-35 tok/s.
Ce qui tient selon la VRAM
| VRAM | GPU budget typique | Ce qui tourne bien |
|---|---|---|
| 8 Go | RTX 3070 / 2070 / GTX 1070 | 7-8B en Q4 (contexte court) |
| 12 Go | RTX 3060 12 Go | 7-8B confort, 14B en Q4 |
| 16 Go | RTX 4060 Ti 16 Go | 14B en Q5, 22B en Q4 |
| 24 Go | RTX 3090 (occasion) | 32B en Q4, 70B en Q3 serré |
Les cartes 8 Go (RTX 3070, 2070, GTX 1070)
8 Go suffisent pour le segment 7-8B, qui couvre déjà énormément d'usages : chat, résumé, et surtout les assistants de code 7Bcomme Qwen 2.5-Coder 7B. Attention au contexte : sur 8 Go, garder une fenêtre raisonnable (4-8k tokens) pour ne pas saturer.
Le roi du budget pour les gros modèles : RTX 3090 24 Go
Si tu veux dépasser le 14B sans exploser le budget, la RTX 3090 d'occasion(~600-700 €) est imbattable : 24 Go de VRAM, soit autant qu'une RTX 4090 neuve à moitié prix. Elle avale du Qwen 2.5 32B en Q4et s'approche du Llama 70B en Q3. C'est ~27 €/Go de VRAM, le meilleur ratio du marché d'occasion.
Et deux 3090 ?
2× RTX 3090 = 48 Go (et elles supportent le NVLink, contrairement aux 4090). C'est la config « maison » préférée pour faire tourner du 70B en Q4 sans passer au matériel pro. À ~1 300 € le duo d'occasion, c'est redoutable.
Le verdict par budget
| Budget | Notre choix | Pour quoi faire |
|---|---|---|
| ~250 € | RTX 3060 12 Go | Débuter, 7-14B, coding 7B |
| ~450 € | RTX 4060 Ti 16 Go | 16 Go neufs, jusqu'à 22B |
| ~650 € | RTX 3090 24 Go | 32B, le meilleur €/Go |
| ~1 300 € | 2× RTX 3090 NVLink | 70B en Q4 à la maison |