NVIDIAConsumerGTX 16

GTX 1650 para IA local

GTX 1650 ofrece 4 GB de VRAM para IA local. En el catálogo LocalIA, 76 de 242 modelos funcionan cómodamente en una sola tarjeta.

Ver modelos compatibles →Rig con 1650 ↗

VRAM

4GB

Categoría

Consumer

Serie

GTX 16

Vendor

NVIDIA

Modelos que funcionan cómodamente

76 models

Estos modelos caben en 4 GB con margen para contexto e inferencia estable.

01Qwen 3 4Bqwen3.1 GBcómodoQ5 · / 4 GB

02★Gemma 3 4Bgemma3.1 GBcómodoQ5 · / 4 GB

03Nemotron Mini 4Bnemotron3.1 GBcómodoQ5 · / 4 GB

04★Gemma 4 E4B (Efficient)gemma3.1 GBcómodoQ5 · / 4 GB

05★Qwen3 4B Instruct 2507qwen3.1 GBcómodoQ5 · / 4 GB

06★Qwen3 4Bqwen3.1 GBcómodoQ5 · / 4 GB

07★Qwen3 4B Baseqwen3.1 GBcómodoQ5 · / 4 GB

08★Qwen3 4B Thinking 2507qwen3.1 GBcómodoQ5 · / 4 GB

09Phi-3 Mini 3.8Bphi2.9 GBcómodoQ5 · / 4 GB

10★Phi-3.5 Mini 3.8Bphi2.9 GBcómodoQ5 · / 4 GB

11Phi-4 Mini 3.8Bphi2.9 GBcómodoQ5 · / 4 GB

12★Phi-4 Mini Instruct 3.8Bphi2.9 GBcómodoQ5 · / 4 GB

13Phi Tiny MoE 3.8Bphi2.9 GBcómodoQ5 · / 4 GB

14Granite 3 3B A800Mgranite2.5 GBcómodoQ5 · / 4 GB

15★Llama 3.2 3Bllama3.4 GBcómodoQ8 · / 4 GB

16Ministral 3Bmistral3.4 GBcómodoQ8 · / 4 GB

17★Qwen 2.5 3Bqwen3.4 GBcómodoQ8 · / 4 GB

18Falcon 3 3Bfalcon3.4 GBcómodoQ8 · / 4 GB

19StarCoder 2 3Bstarcoder3.4 GBcómodoQ8 · / 4 GB

20Qwen 2.5 VL 3Bqwen3.4 GBcómodoQ8 · / 4 GB

21★SmolLM 3 3Bsmollm3.4 GBcómodoQ8 · / 4 GB

22★Granite 4 Micro 3Bgranite3.4 GBcómodoQ8 · / 4 GB

23★Qwen2.5 3B Instructqwen3.4 GBcómodoQ8 · / 4 GB

24★Llama 3.2 3B Instructllama3.4 GBcómodoQ8 · / 4 GB

25★Llama 3.2 3Bllama3.4 GBcómodoQ8 · / 4 GB

26★Qwen2.5 3Bqwen3.4 GBcómodoQ8 · / 4 GB

27★Qwen2.5 Coder 3B Instructqwen3.4 GBcómodoQ8 · / 4 GB

28★Qwen2.5 Coder 3Bqwen3.4 GBcómodoQ8 · / 4 GB

29Gemma 2 2Bgemma2.2 GBcómodoQ8 · / 4 GB

30CodeGemma 2Bgemma2.2 GBcómodoQ8 · / 4 GB

Modelos justos

2 models

Estos modelos caben por poco. Pueden funcionar, pero contexto y velocidad serán limitados.

01Yi 1.5 6Byi3.8 GBjustoQ4 · / 4 GB

02★Phi-4 Multimodal 5.6Bphi3.5 GBjustoQ4 · / 4 GB

Desbloqueados en rig 2x

8 GB

Con dos tarjetas en paralelo (8 GB total), modelos más grandes son posibles.

01★Mistral Nemo 12Bmistral7.5 GBjustoQ4 · / 8 GB

02★Gemma 3 12Bgemma7.5 GBjustoQ4 · / 8 GB

03StableLM 2 12Bstable7.5 GBjustoQ4 · / 8 GB

04Solar 10.7Bsolar6.7 GBcómodoQ4 · / 8 GB

05Falcon 3 10Bfalcon6.3 GBcómodoQ4 · / 8 GB

06★Gemma 2 9Bgemma5.7 GBcómodoQ4 · / 8 GB

07Yi 1.5 9Byi5.7 GBcómodoQ4 · / 8 GB

08★Qwen 3.5 9Bqwen5.7 GBcómodoQ4 · / 8 GB

09★GLM-4 9Bglm5.7 GBcómodoQ4 · / 8 GB

10★GLM-4.7 Flashglm5.7 GBcómodoQ4 · / 8 GB

11GLM-4.1V 9B Thinkingglm5.7 GBcómodoQ4 · / 8 GB

12★NVIDIA Nemotron Nano 9Bnemotron5.7 GBcómodoQ4 · / 8 GB

13★gemma 2 9b itgemma5.7 GBcómodoQ4 · / 8 GB

14Llama 3 8Bllama6.1 GBcómodoQ5 · / 8 GB

15★Llama 3.1 8Bllama6.1 GBcómodoQ5 · / 8 GB

Desbloqueados en rig 4x

16 GB

Configuración servidor (16 GB total) para los modelos open-weight más grandes.

01★Mistral Small 3 24Bmistral15.1 GBjustoQ4 · / 16 GB

02★Mistral Small 3.1 24Bmistral15.1 GBjustoQ4 · / 16 GB

03★Mistral Small 3.2 24Bmistral15.1 GBjustoQ4 · / 16 GB

04★Devstral Small 2 24Bdevstral15.1 GBjustoQ4 · / 16 GB

05Mistral Small 22Bmistral13.8 GBjustoQ4 · / 16 GB

06★Codestral 22Bcodestral13.8 GBjustoQ4 · / 16 GB

07Reka Flash 3 21Breka13.2 GBcómodoQ4 · / 16 GB

08InternLM 2.5 20Binternlm12.6 GBcómodoQ4 · / 16 GB

09DeepSeek V2 Litedeepseek12.3 GBcómodoQ5 · / 16 GB

10DeepSeek Coder V2 Litedeepseek12.3 GBcómodoQ5 · / 16 GB

Estimaciones VRAM actualizadas 2026-05-12.