AppleAppleMac Studiomemoria unificada

Mac Studio M3 Ultra (96GB) para IA local

Mac Studio M3 Ultra (96GB) ofrece 96 GB de VRAM para IA local. En el catálogo LocalIA, 227 de 242 modelos funcionan cómodamente en una sola tarjeta.

VRAM
96GB
Categoría
Apple
Serie
Mac Studio
Vendor
Apple

Modelos que funcionan cómodamente

Estos modelos caben en 96 GB con margen para contexto e inferencia estable.

Mistral Large 123Bmistral77.3 GBcómodoQ4 · / 96 GB
Llama 4 Scout 17Bx16llama68.5 GBcómodoQ4 · / 96 GB
Command R+ 104Bcommand79.9 GBcómodoQ5 · / 96 GB
Qwen3 Next 80B A3B Instructqwen61.5 GBcómodoQ5 · / 96 GB
Qwen 2.5 72Bqwen80.5 GBcómodoQ8 · / 96 GB
Qwen 2.5 VL 72Bqwen80.5 GBcómodoQ8 · / 96 GB
Qwen2.5 72B Instructqwen80.5 GBcómodoQ8 · / 96 GB
Llama 2 70Bllama78.2 GBcómodoQ8 · / 96 GB
Llama 3 70Bllama78.2 GBcómodoQ8 · / 96 GB
Llama 3.1 70Bllama78.2 GBcómodoQ8 · / 96 GB
Llama 3.3 70Bllama78.2 GBcómodoQ8 · / 96 GB
CodeLlama 70Bcodellama78.2 GBcómodoQ8 · / 96 GB
DeepSeek R1 Distill 70Bdeepseek78.2 GBcómodoQ8 · / 96 GB
Hermes 3 70Bhermes78.2 GBcómodoQ8 · / 96 GB
Llama 3.1 Nemotron 70Bnemotron78.2 GBcómodoQ8 · / 96 GB
Athene 70Bathene78.2 GBcómodoQ8 · / 96 GB
Llama 3.3 70B Instructllama78.2 GBcómodoQ8 · / 96 GB
Llama 3.1 70B Instructllama78.2 GBcómodoQ8 · / 96 GB
Mixtral 8x7Bmistral52.5 GBcómodoQ8 · / 96 GB
Falcon 40Bfalcon44.7 GBcómodoQ8 · / 96 GB
Command R 35Bcommand78.2 GBcómodoFP16 · / 96 GB
Aya 23 35Baya78.2 GBcómodoFP16 · / 96 GB
CodeLlama 34Bcodellama76.0 GBcómodoFP16 · / 96 GB
Yi 1.5 34Byi76.0 GBcómodoFP16 · / 96 GB
dolphin 2.9.1 yi 1.5 34byi76.0 GBcómodoFP16 · / 96 GB
Qwen 2.5 32Bqwen71.5 GBcómodoFP16 · / 96 GB
Qwen 2.5 Coder 32Bqwen71.5 GBcómodoFP16 · / 96 GB
Qwen 3 32Bqwen71.5 GBcómodoFP16 · / 96 GB
QwQ 32Bqwq71.5 GBcómodoFP16 · / 96 GB

Modelos justos

Estos modelos caben por poco. Pueden funcionar, pero contexto y velocidad serán limitados.

Mixtral 8x22Bmistral88.6 GBjustoQ4 · / 96 GB

Desbloqueados en rig 2x

Con dos tarjetas en paralelo (192 GB total), modelos más grandes son posibles.

DeepSeek V2deepseek148.4 GBcómodoQ4 · / 192 GB
DeepSeek Coder V2deepseek148.4 GBcómodoQ4 · / 192 GB
Qwen 3 235B A22Bqwen147.7 GBcómodoQ4 · / 192 GB
Qwen3 235B A22Bqwen147.7 GBcómodoQ4 · / 192 GB
Falcon 180Bfalcon138.3 GBcómodoQ5 · / 192 GB

Desbloqueados en rig 4x

Configuración servidor (384 GB total) para los modelos open-weight más grandes.

Llama 3.1 405Bllama311.2 GBcómodoQ5 · / 384 GB
Hermes 3 405Bhermes311.2 GBcómodoQ5 · / 384 GB
Llama 4 Maverick 17Bx128llama307.3 GBcómodoQ5 · / 384 GB
Nemotron 340Bnemotron261.2 GBcómodoQ5 · / 384 GB

GPUs similares

Estimaciones VRAM actualizadas 2026-05-12. Apple Silicon: parte de la memoria unificada queda reservada al sistema.