NVIDIAConsumerRTX 40

RTX 4070 for local AI

RTX 4070 provides 12 GB of VRAM for local AI. In the LocalIA catalog, 168 out of 242 models run comfortably on a single card.

View all compatible models →Rig around the 4070 ↗

VRAM

12GB

Models that run comfortably

168 models

These models fit in 12 GB with room for context and stable inference.

01DeepSeek V2 Litedeepseek10.1 GBcomfortableQ4 · / 12 GB

02DeepSeek Coder V2 Litedeepseek10.1 GBcomfortableQ4 · / 12 GB

03StarCoder 2 15Bstarcoder9.4 GBcomfortableQ4 · / 12 GB

04★Phi-4 Reasoning Vision 15Bphi9.4 GBcomfortableQ4 · / 12 GB

05★Qwen 2.5 14Bqwen8.8 GBcomfortableQ4 · / 12 GB

06Qwen 2.5 Coder 14Bqwen8.8 GBcomfortableQ4 · / 12 GB

07★Qwen 3 14Bqwen8.8 GBcomfortableQ4 · / 12 GB

08★DeepSeek R1 Distill 14Bdeepseek8.8 GBcomfortableQ4 · / 12 GB

09Phi-3 Medium 14Bphi8.8 GBcomfortableQ4 · / 12 GB

10★Phi-4 14Bphi8.8 GBcomfortableQ4 · / 12 GB

11★GLM-4.5 Airglm8.8 GBcomfortableQ4 · / 12 GB

12★Qwen2.5 14B Instructqwen8.8 GBcomfortableQ4 · / 12 GB

13★Qwen3 14Bqwen8.8 GBcomfortableQ4 · / 12 GB

14★Qwen2.5 Coder 14B Instructqwen8.8 GBcomfortableQ4 · / 12 GB

15★DeepSeek R1 Distill Qwen 14Bqwen8.8 GBcomfortableQ4 · / 12 GB

16Llama 2 13Bllama10.0 GBcomfortableQ5 · / 12 GB

17CodeLlama 13Bcodellama10.0 GBcomfortableQ5 · / 12 GB

18OLMo 2 13Bolmo10.0 GBcomfortableQ5 · / 12 GB

19Vicuna 13Bvicuna10.0 GBcomfortableQ5 · / 12 GB

20★Mistral Nemo 12Bmistral9.2 GBcomfortableQ5 · / 12 GB

21★Gemma 3 12Bgemma9.2 GBcomfortableQ5 · / 12 GB

22StableLM 2 12Bstable9.2 GBcomfortableQ5 · / 12 GB

23Solar 10.7Bsolar8.2 GBcomfortableQ5 · / 12 GB

24Falcon 3 10Bfalcon7.7 GBcomfortableQ5 · / 12 GB

25★Gemma 2 9Bgemma10.1 GBcomfortableQ8 · / 12 GB

26Yi 1.5 9Byi10.1 GBcomfortableQ8 · / 12 GB

27★Qwen 3.5 9Bqwen10.1 GBcomfortableQ8 · / 12 GB

28★GLM-4 9Bglm10.1 GBcomfortableQ8 · / 12 GB

29★GLM-4.7 Flashglm10.1 GBcomfortableQ8 · / 12 GB

30GLM-4.1V 9B Thinkingglm10.1 GBcomfortableQ8 · / 12 GB

Unlocked in a 2x rig

24 GB

With two cards in parallel (24 GB total), larger models become reachable.

01Command R 35Bcommand22.0 GBtightQ4 · / 24 GB

02Aya 23 35Baya22.0 GBtightQ4 · / 24 GB

03CodeLlama 34Bcodellama21.4 GBtightQ4 · / 24 GB

04Yi 1.5 34Byi21.4 GBtightQ4 · / 24 GB

05★dolphin 2.9.1 yi 1.5 34byi21.4 GBtightQ4 · / 24 GB

06★Qwen 2.5 32Bqwen20.1 GBcomfortableQ4 · / 24 GB

07★Qwen 2.5 Coder 32Bqwen20.1 GBcomfortableQ4 · / 24 GB

08★Qwen 3 32Bqwen20.1 GBcomfortableQ4 · / 24 GB

09★QwQ 32Bqwq20.1 GBcomfortableQ4 · / 24 GB

10★DeepSeek R1 Distill 32Bdeepseek20.1 GBcomfortableQ4 · / 24 GB

11Qwen 2.5 VL 32Bqwen20.1 GBcomfortableQ4 · / 24 GB

12★Granite 4 H-Small 32B-A9Bgranite20.1 GBcomfortableQ4 · / 24 GB

13GLM-4.6glm20.1 GBcomfortableQ4 · / 24 GB

14★GLM-4.7glm20.1 GBcomfortableQ4 · / 24 GB

15★GLM-5glm20.1 GBcomfortableQ4 · / 24 GB

Unlocked in a 4x rig

48 GB

Server-style configuration (48 GB total) for the largest open-weight models.

01★Qwen 2.5 72Bqwen45.3 GBtightQ4 · / 48 GB

02Qwen 2.5 VL 72Bqwen45.3 GBtightQ4 · / 48 GB

03★Qwen2.5 72B Instructqwen45.3 GBtightQ4 · / 48 GB

04Llama 2 70Bllama44.0 GBtightQ4 · / 48 GB

05Llama 3 70Bllama44.0 GBtightQ4 · / 48 GB

06Llama 3.1 70Bllama44.0 GBtightQ4 · / 48 GB

07★Llama 3.3 70Bllama44.0 GBtightQ4 · / 48 GB

08CodeLlama 70Bcodellama44.0 GBtightQ4 · / 48 GB

09★DeepSeek R1 Distill 70Bdeepseek44.0 GBtightQ4 · / 48 GB

10Hermes 3 70Bhermes44.0 GBtightQ4 · / 48 GB

Similar GPUs

VRAM estimates updated 2026-05-12.