face-à-face · LLM local

Qwen 3 32B vs QwQ 32B

Comparatif chiffré : VRAM requise par quantization, GPUs compatibles pour faire tourner chacun en local, et verdict construit depuis les specs réelles. Pas de bench truqué, juste les chiffres.

32B
params Qwen 3 32B
32B
params QwQ 32B
Qwen
famille A
QwQ
famille B
▲ Specs côte à côte

Les chiffres bruts.

Qwen · 32B

Qwen 3 32B

  • Total paramètres32B
  • Contexte max128k tokens
  • FamilleQwen
  • TypeDense
→ Fiche Qwen 3 32B
QwQ · 32B

QwQ 32B

  • Total paramètres32B
  • Contexte max33k tokens
  • FamilleQwQ
  • TypeDense
→ Fiche QwQ 32B
▲ VRAM par quantization

Combien de VRAM il te faut.

Estimation incluant l'overhead (KV cache + activations) ×1.12. Pour un MoE, on prend les paramètres totaux car le modèle complet doit être chargé en mémoire (les experts inactifs aussi).

QuantQwen 3 32BQwQ 32BÉcart
Q315.7 GB15.7 GB0.0 GB
Q420.2 GB20.2 GB0.0 GB
Q524.6 GB24.6 GB0.0 GB
Q629.1 GB29.1 GB0.0 GB
Q835.8 GB35.8 GB0.0 GB
FP1671.7 GB71.7 GB0.0 GB
▲ GPU minimum pour chacun en Q4

Quel GPU suffit pour quoi.

Pour Qwen 3 32B en Q4

TITAN RTX

24 GB de VRAM — suffisant pour les 20.2 GB requis en Q4.

→ Fiche TITAN RTX
Pour QwQ 32B en Q4

TITAN RTX

24 GB de VRAM — suffisant pour les 20.2 GB requis en Q4.

→ Fiche TITAN RTX
▲ Verdict

Ce que les chiffres disent.

Qwen 3 32B et QwQ 32B sont de taille comparable (32B vs 32B), donc le choix se joue sur la famille, le contexte et le use case.

Choisir Qwen 3 32B

Excellent en code et multilingue (zh/en), souvent en tête sur les benchs open source 2026.

→ Fiche Qwen 3 32B
Choisir QwQ 32B

Mieux placé sur ton use case spécifique selon ta famille de modèles de référence.

→ Fiche QwQ 32B

Tester avec ton GPU ?

Le calculateur croise ces 2 modèles avec 200+ GPUs et te donne tok/s estimés, €/Mtok et break-even cloud.