Mistral141B params39B actief (MoE)66k context
Mixtral 8x22B lokaal
Mixtral 8x22B is een open-weight LLM uit de Mistral-familie met 141B parameters. Hoofdgebruik: chat, RAG and general assistance. Gedetecteerde minimumhardware: NVIDIA H100 NVL (94 GB).
Technische info
Parameters141B
Max context66k
Q4_K_M88.6 GB
Q5_K_M108.3 GB
Q8157.6 GB
FP16315.2 GB
FamilieMistral
Laatste sync2026-05-12
Beschikbare quantizations
GGUF-gewichtenQ4_K_M
88.6GB
Acceptabel. Goede keuze bij beperkte VRAM.
Q5_K_M
108.3GB
Goede kwaliteit. Sweet spot voor grootte en precisie.
Q8
157.6GB
Bijna FP16-kwaliteit. Comfortabel voor productie.
FP16
315.2GB
Referentieprecisie. Maximale kwaliteit, dubbele VRAM.
Compatibele GPUs
12 single-GPUGPUs die Mixtral 8x22B op één kaart kunnen draaien, gesorteerd op VRAM-marge.
NVIDIA H100 NVL
NVIDIA94 GB · Hopper
88.6 / 94 GBkrap · Q4
RTX Pro 6000 Blackwell
NVIDIA96 GB · RTX Pro Blackwell
88.6 / 96 GBkrap · Q4
MacBook Pro 14 M2 Max (96GB)
Apple96 GB · MacBook Pro 14
88.6 / 96 GBkrap · Q4
MacBook Pro 14 M3 Max (96GB)
Apple96 GB · MacBook Pro 14
88.6 / 96 GBkrap · Q4
MacBook Pro 16 M2 Max (96GB)
Apple96 GB · MacBook Pro 16
88.6 / 96 GBkrap · Q4
Mac Studio M2 Max (96GB)
Apple96 GB · Mac Studio
88.6 / 96 GBkrap · Q4
Mac Studio M3 Ultra (96GB)
Apple96 GB · Mac Studio
88.6 / 96 GBkrap · Q4
Gaudi 2
Intel96 GB · Gaudi
88.6 / 96 GBkrap · Q4
Instinct MI250
AMD128 GB · Instinct CDNA 1-2
108.3 / 128 GBcomfortabel · Q5
Instinct MI250X
AMD128 GB · Instinct CDNA 1-2
108.3 / 128 GBcomfortabel · Q5
MacBook Pro 14 M3 Max (128GB)
Apple128 GB · MacBook Pro 14
108.3 / 128 GBcomfortabel · Q5
MacBook Pro 14 M4 Max (128GB)
Apple128 GB · MacBook Pro 14
108.3 / 128 GBcomfortabel · Q5
Aanbevolen multi-GPU rigs
2x / 4x consumer GPUsVoor Mixtral 8x22B met hogere quantization of meer context geeft een multi-GPU rig meer marge.
4× TITAN RTX
NVIDIA96 GB · RTX 20
88.6 / 96 GBkrap · Q4
4× RTX 3090
NVIDIA96 GB · RTX 30
88.6 / 96 GBkrap · Q4
4× RTX 3090 Ti
NVIDIA96 GB · RTX 30
88.6 / 96 GBkrap · Q4
4× RTX 4090
NVIDIA96 GB · RTX 40
88.6 / 96 GBkrap · Q4
4× Radeon RX 7900 XTX
AMD96 GB · RDNA 3
88.6 / 96 GBkrap · Q4
4× RTX 5090
NVIDIA128 GB · RTX 50
108.3 / 128 GBcomfortabel · Q5
Aanbevolen rig
4× RTX 5090
Mixtral 8x22B with Ubuntu, vLLM, Open WebUI and the model already downloaded.
Vergelijkbare modellen
VRAM-schatting: parameters x bits/8 plus marge. Echte prestaties hangen af van engine, context en batch.
sync: 2026-05-12