AMDDatacenterInstinct CDNA 3+

Instinct MI325X voor lokale AI

Instinct MI325X biedt 256 GB VRAM voor lokale AI. In de LocalIA-catalogus draaien 234 van 242 modellen comfortabel op één kaart.

VRAM
256GB
Categorie
Datacenter
Serie
Instinct CDNA 3+
Vendor
AMD

Modellen die comfortabel draaien

Deze modellen passen in 256 GB met marge voor context en stabiele inference.

Nemotron 340Bnemotron213.7 GBcomfortabelQ4 · / 256 GB
DeepSeek V2deepseek181.3 GBcomfortabelQ5 · / 256 GB
DeepSeek Coder V2deepseek181.3 GBcomfortabelQ5 · / 256 GB
Qwen 3 235B A22Bqwen180.6 GBcomfortabelQ5 · / 256 GB
Qwen3 235B A22Bqwen180.6 GBcomfortabelQ5 · / 256 GB
Falcon 180Bfalcon201.2 GBcomfortabelQ8 · / 256 GB
Mixtral 8x22Bmistral157.6 GBcomfortabelQ8 · / 256 GB
Mistral Large 123Bmistral137.5 GBcomfortabelQ8 · / 256 GB
NVIDIA Nemotron 3 Super 120B A12B BF16nemotron134.1 GBcomfortabelQ8 · / 256 GB
Llama 4 Scout 17Bx16llama121.8 GBcomfortabelQ8 · / 256 GB
Command R+ 104Bcommand116.2 GBcomfortabelQ8 · / 256 GB
Qwen3 Next 80B A3B Instructqwen178.8 GBcomfortabelFP16 · / 256 GB
Qwen 2.5 72Bqwen160.9 GBcomfortabelFP16 · / 256 GB
Qwen 2.5 VL 72Bqwen160.9 GBcomfortabelFP16 · / 256 GB
Qwen2.5 72B Instructqwen160.9 GBcomfortabelFP16 · / 256 GB
Llama 2 70Bllama156.5 GBcomfortabelFP16 · / 256 GB
Llama 3 70Bllama156.5 GBcomfortabelFP16 · / 256 GB
Llama 3.1 70Bllama156.5 GBcomfortabelFP16 · / 256 GB
Llama 3.3 70Bllama156.5 GBcomfortabelFP16 · / 256 GB
CodeLlama 70Bcodellama156.5 GBcomfortabelFP16 · / 256 GB
DeepSeek R1 Distill 70Bdeepseek156.5 GBcomfortabelFP16 · / 256 GB
Hermes 3 70Bhermes156.5 GBcomfortabelFP16 · / 256 GB
Llama 3.1 Nemotron 70Bnemotron156.5 GBcomfortabelFP16 · / 256 GB
Athene 70Bathene156.5 GBcomfortabelFP16 · / 256 GB
Llama 3.3 70B Instructllama156.5 GBcomfortabelFP16 · / 256 GB
Llama 3.1 70B Instructllama156.5 GBcomfortabelFP16 · / 256 GB
Mixtral 8x7Bmistral105.1 GBcomfortabelFP16 · / 256 GB
Falcon 40Bfalcon89.4 GBcomfortabelFP16 · / 256 GB
Command R 35Bcommand78.2 GBcomfortabelFP16 · / 256 GB
Aya 23 35Baya78.2 GBcomfortabelFP16 · / 256 GB

Krappe modellen

Deze modellen passen net. Ze kunnen draaien, maar context en snelheid zijn beperkt.

Llama 3.1 405Bllama254.6 GBkrapQ4 · / 256 GB
Hermes 3 405Bhermes254.6 GBkrapQ4 · / 256 GB
Llama 4 Maverick 17Bx128llama251.5 GBkrapQ4 · / 256 GB

Vrijgespeeld in 2x-rig

Met twee kaarten parallel (512 GB totaal) worden grotere modellen bereikbaar.

DeepSeek V3.2deepseek430.6 GBcomfortabelQ4 · / 512 GB
DeepSeek V4 Prodeepseek430.6 GBcomfortabelQ4 · / 512 GB
DeepSeek R1deepseek421.8 GBcomfortabelQ4 · / 512 GB
DeepSeek V3deepseek421.8 GBcomfortabelQ4 · / 512 GB
DeepSeek R1 (0528 snapshot)deepseek421.8 GBcomfortabelQ4 · / 512 GB

Vergelijkbare GPUs

VRAM-schattingen bijgewerkt 2026-05-12.