face-à-face · LLM local

Mistral Large 123B vs Mixtral 8x22B

Comparatif chiffré : VRAM requise par quantization, GPUs compatibles pour faire tourner chacun en local, et verdict construit depuis les specs réelles. Pas de bench truqué, juste les chiffres.

123B

params Mistral Large 123B

141B

params Mixtral 8x22B

Mistral

famille A

Mistral

famille B

▲ Specs côte à côte

Les chiffres bruts.

Mistral · 123B

Mistral Large 123B

Total paramètres123B
Contexte max128k tokens
FamilleMistral
TypeDense

→ Fiche Mistral Large 123B

Mistral · 141B · MoE 39B actifs

Mixtral 8x22B

Total paramètres141B
Paramètres actifs (MoE)39B
Contexte max66k tokens
FamilleMistral
TypeMoE

→ Fiche Mixtral 8x22B

▲ VRAM par quantization

Combien de VRAM il te faut.

Estimation incluant l'overhead (KV cache + activations) ×1.12. Pour un MoE, on prend les paramètres totaux car le modèle complet doit être chargé en mémoire (les experts inactifs aussi).

Quant	Mistral Large 123B	Mixtral 8x22B	Écart
Q3	60.3 GB	28.7 GB	31.6 GB
Q4	77.5 GB	36.9 GB	40.6 GB
Q5	94.7 GB	45 GB	49.7 GB
Q6	111.9 GB	53.2 GB	58.7 GB
Q8	137.8 GB	65.5 GB	72.3 GB
FP16	275.5 GB	131 GB	144.5 GB

▲ GPU minimum pour chacun en Q4

Quel GPU suffit pour quoi.

Pour Mistral Large 123B en Q4

NVIDIA A100 80GB

80 GB de VRAM — suffisant pour les 77.5 GB requis en Q4.

→ Fiche NVIDIA A100 80GB

Pour Mixtral 8x22B en Q4

NVIDIA A100 40GB

40 GB de VRAM — suffisant pour les 36.9 GB requis en Q4.

→ Fiche NVIDIA A100 40GB

▲ Verdict

Ce que les chiffres disent.

Mistral Large 123B et Mixtral 8x22B sont de taille comparable (123B vs 141B), donc le choix se joue sur la famille, le contexte et le use case. Mixtral 8x22B est un MoE (39B actifs par token) — débit plus élevé sur serveur dédié, mais charge VRAM complète à charger.

Choisir Mistral Large 123B

Souveraineté FR/EU, qualité GPT-4-class sur le flagship, équipe basée en France.

→ Fiche Mistral Large 123B

Choisir Mixtral 8x22B

Souveraineté FR/EU, qualité GPT-4-class sur le flagship, équipe basée en France.

→ Fiche Mixtral 8x22B

Tester avec ton GPU ?

Le calculateur croise ces 2 modèles avec 200+ GPUs et te donne tok/s estimés, €/Mtok et break-even cloud.

Ouvrir le calculateur →Voir les rigs prêts