AMDconsumerRDNA 2

Radeon RX 6800 XT pour l'IA locale

Le Radeon RX 6800 XT est un GPU milieu de gamme (16 GB de VRAM) destiné aux configurations grand public et workstations. Sur les 242 modèles open source de notre catalogue, 168 tournent confortablement dessus en mono-carte.

VRAM
16GB
Catégorie
Consumer
Série
RDNA 2
Vendor
AMD

Modèles qui tournent confortablement

Ces modèles tiennent dans 16GB avec marge pour le contexte long et l'inférence stable. Triés du plus gros au plus petit.

Reka Flash 3 21Breka13.2 GBcompatibleQ4 · / 16 GB
InternLM 2.5 20Binternlm12.6 GBcompatibleQ4 · / 16 GB
DeepSeek V2 Litedeepseek · MoE12.3 GBcompatibleQ5 · / 16 GB
DeepSeek Coder V2 Litedeepseek · MoE12.3 GBcompatibleQ5 · / 16 GB
StarCoder 2 15Bstarcoder11.5 GBcompatibleQ5 · / 16 GB
Phi-4 Reasoning Vision 15Bphi11.5 GBcompatibleQ5 · / 16 GB
Qwen 2.5 14Bqwen10.8 GBcompatibleQ5 · / 16 GB
Qwen 2.5 Coder 14Bqwen10.8 GBcompatibleQ5 · / 16 GB
Qwen 3 14Bqwen10.8 GBcompatibleQ5 · / 16 GB
DeepSeek R1 Distill 14Bdeepseek10.8 GBcompatibleQ5 · / 16 GB
Phi-3 Medium 14Bphi10.8 GBcompatibleQ5 · / 16 GB
Phi-4 14Bphi10.8 GBcompatibleQ5 · / 16 GB
GLM-4.5 Airglm10.8 GBcompatibleQ5 · / 16 GB
Qwen2.5 Coder 14B Instructqwen10.8 GBcompatibleQ5 · / 16 GB
Qwen3 14Bqwen10.8 GBcompatibleQ5 · / 16 GB
Qwen2.5 14B Instructqwen10.8 GBcompatibleQ5 · / 16 GB
Llama 2 13Bllama10.0 GBcompatibleQ5 · / 16 GB
CodeLlama 13Bcodellama10.0 GBcompatibleQ5 · / 16 GB
OLMo 2 13Bolmo10.0 GBcompatibleQ5 · / 16 GB
Vicuna 13Bvicuna10.0 GBcompatibleQ5 · / 16 GB
Mistral Nemo 12Bmistral13.4 GBcompatibleQ8 · / 16 GB
Gemma 3 12Bgemma13.4 GBcompatibleQ8 · / 16 GB
StableLM 2 12Bstable13.4 GBcompatibleQ8 · / 16 GB
Solar 10.7Bsolar12.0 GBcompatibleQ8 · / 16 GB
Falcon 3 10Bfalcon11.2 GBcompatibleQ8 · / 16 GB
Gemma 2 9Bgemma10.1 GBcompatibleQ8 · / 16 GB
Yi 1.5 9Byi10.1 GBcompatibleQ8 · / 16 GB
Qwen 3.5 9Bqwen10.1 GBcompatibleQ8 · / 16 GB
GLM-4 9Bglm10.1 GBcompatibleQ8 · / 16 GB
GLM-4.7 Flashglm10.1 GBcompatibleQ8 · / 16 GB

+ 138 autres — voir le calculateur complet →

Modèles serrés (possibles mais lents)

Ces modèles tiennent tout juste. Tournent mais le contexte disponible est limité, et l'inférence peut être lente si on dépasse la VRAM (offload CPU).

Mistral Small 3 24Bmistral15.1 GBserréQ4 · / 16 GB
Mistral Small 3.1 24Bmistral15.1 GBserréQ4 · / 16 GB
Mistral Small 3.2 24Bmistral15.1 GBserréQ4 · / 16 GB
Devstral Small 2 24Bdevstral15.1 GBserréQ4 · / 16 GB
Mistral Small 22Bmistral13.8 GBserréQ4 · / 16 GB
Codestral 22Bcodestral13.8 GBserréQ4 · / 16 GB

Débloqués en rig 2×

Avec 2 cartes en parallèle (32 GB total), vous accédez à des modèles plus gros et à des quantizations plus hautes.

Llama 3_3 Nemotron Super 49B v1_5llama30.8 GBserréQ4 · / 32 GB
Mixtral 8x7Bmistral · MoE29.5 GBserréQ4 · / 32 GB
Falcon 40Bfalcon25.1 GBcompatibleQ4 · / 32 GB
Command R 35Bcommand26.9 GBcompatibleQ5 · / 32 GB
Aya 23 35Baya26.9 GBcompatibleQ5 · / 32 GB
CodeLlama 34Bcodellama26.1 GBcompatibleQ5 · / 32 GB
Yi 1.5 34Byi26.1 GBcompatibleQ5 · / 32 GB
dolphin 2.9.1 yi 1.5 34byi26.1 GBcompatibleQ5 · / 32 GB
Qwen 2.5 32Bqwen24.6 GBcompatibleQ5 · / 32 GB
Qwen 2.5 Coder 32Bqwen24.6 GBcompatibleQ5 · / 32 GB
Qwen 3 32Bqwen24.6 GBcompatibleQ5 · / 32 GB
QwQ 32Bqwq24.6 GBcompatibleQ5 · / 32 GB
DeepSeek R1 Distill 32Bdeepseek24.6 GBcompatibleQ5 · / 32 GB
Qwen 2.5 VL 32Bqwen24.6 GBcompatibleQ5 · / 32 GB
Granite 4 H-Small 32B-A9Bgranite · MoE24.6 GBcompatibleQ5 · / 32 GB

Débloqués en rig 4×

Configuration entreprise / serveur (64 GB total) : vous accédez aux flagships open source 70B+ et aux MoE moyens.

Qwen 2.5 72Bqwen45.3 GBcompatibleQ4 · / 64 GB
Qwen 2.5 VL 72Bqwen45.3 GBcompatibleQ4 · / 64 GB
Qwen2.5 72B Instructqwen45.3 GBcompatibleQ4 · / 64 GB
Llama 2 70Bllama53.8 GBcompatibleQ5 · / 64 GB
Llama 3 70Bllama53.8 GBcompatibleQ5 · / 64 GB
Llama 3.1 70Bllama53.8 GBcompatibleQ5 · / 64 GB
Llama 3.3 70Bllama53.8 GBcompatibleQ5 · / 64 GB
CodeLlama 70Bcodellama53.8 GBcompatibleQ5 · / 64 GB
DeepSeek R1 Distill 70Bdeepseek53.8 GBcompatibleQ5 · / 64 GB
Hermes 3 70Bhermes53.8 GBcompatibleQ5 · / 64 GB

GPUs similaires

// données mises à jour le 2026-06-27 via HuggingFace API.
// estimations VRAM : (params × bits/8) × overhead 20 %.