Mistral123 B params128 k context★ populaire

Mistral Large 123B en local

Mistral Large 123B est un LLM open source de la famille Mistral, très grand (123 milliards de paramètres). Il est principalement utilisé pour le chat, le RAG et l'assistance générale. Le matériel minimum pour le faire tourner localement est NVIDIA A100 80GB (80 GB).

Vérifier sur mon GPU →Hugging Face ↗

Paramètres123 B

Contexte max128 k

Q4_K_M poids77.3 GB

Q5_K_M poids94.5 GB

Q8 poids137.5 GB

FP16 poids274.9 GB

FamilleMistral

Dernier sync2026-06-27

Quantizations disponibles

poids GGUF · llama.cpp 0.4+

Q4_K_M

77.3GB

Acceptable. Configs limitées en VRAM.

Q5_K_M

94.5GB

Bonne qualité. Sweet spot taille / précision.

137.5GB

Quasi-identique au FP16. Production.

FP16

274.9GB

Référence. Précision max, VRAM doublée.

GPUs compatibles

vérifié · 12 configs mono-carte

GPUs qui peuvent faire tourner Mistral Large 123B sur une seule carte, classés du plus accessible au plus haut de gamme.

NVIDIA A100 80GB

NVIDIA

80 GB · Ampere DC

77.3 / 80 GB◐ serré · Q4

NVIDIA H100 80GB

NVIDIA

80 GB · Hopper

77.3 / 80 GB◐ serré · Q4

NVIDIA H100 NVL

NVIDIA

94 GB · Hopper

77.3 / 94 GB★ confortable · Q4

RTX Pro 6000 Blackwell

NVIDIA

96 GB · RTX Pro Blackwell

77.3 / 96 GB★ confortable · Q4

MacBook Pro 14 M2 Max (96GB)

Apple

96 GB · MacBook Pro 14

77.3 / 96 GB★ confortable · Q4

MacBook Pro 14 M3 Max (96GB)

Apple

96 GB · MacBook Pro 14

77.3 / 96 GB★ confortable · Q4

MacBook Pro 16 M2 Max (96GB)

Apple

96 GB · MacBook Pro 16

77.3 / 96 GB★ confortable · Q4

Mac Studio M2 Max (96GB)

Apple

96 GB · Mac Studio

77.3 / 96 GB★ confortable · Q4

Mac Studio M3 Ultra (96GB)

Apple

96 GB · Mac Studio

77.3 / 96 GB★ confortable · Q4

Gaudi 2

Intel

96 GB · Gaudi

77.3 / 96 GB★ confortable · Q4

Instinct MI250

AMD

128 GB · Instinct CDNA 1-2

94.5 / 128 GB★ confortable · Q5

Instinct MI250X

AMD

128 GB · Instinct CDNA 1-2

94.5 / 128 GB★ confortable · Q5

Rigs multi-GPU recommandés

consumer · 2× ou 4× cartes

Pour faire tourner Mistral Large 123B en quantization plus haute (Q8, FP16) ou avec plus de marge pour le contexte long, un rig à plusieurs GPU consumer offre le meilleur rapport perf/€.

4× Radeon RX 7900 XT

AMD

80 GB · RDNA 3

77.3 / 80 GB◐ serré · Q4

4× TITAN RTX

NVIDIA

96 GB · RTX 20

77.3 / 96 GB★ confortable · Q4

4× RTX 3090

NVIDIA

96 GB · RTX 30

77.3 / 96 GB★ confortable · Q4

4× RTX 3090 Ti

NVIDIA

96 GB · RTX 30

77.3 / 96 GB★ confortable · Q4

4× RTX 4090

NVIDIA

96 GB · RTX 40

77.3 / 96 GB★ confortable · Q4

4× Radeon RX 7900 XTX

AMD

96 GB · RDNA 3

77.3 / 96 GB★ confortable · Q4

4× RTX 5090

NVIDIA

128 GB · RTX 50

94.5 / 128 GB★ confortable · Q5

Rig prêt à l'emploi

Recommandation

Rig Pro — pré-installé avec Mistral Large 123B

4× TITAN RTX, OS Ubuntu, vLLM + Open WebUI, modèle déjà téléchargé. Vous branchez, c'est en ligne.

8 990 €

Configurer →

Modèles similaires

// données mises à jour le 2026-06-27 via HuggingFace API.
// estimations VRAM : (params × bits/8) × overhead 20 %.
// les valeurs réelles varient selon le moteur (llama.cpp, vLLM, MLX), la longueur de contexte utilisée et le batch size.