NVIDIAConsumerGTX 10

GTX 1080 Ti for local AI

GTX 1080 Ti provides 11 GB of VRAM for local AI. In the LocalIA catalog, 162 out of 242 models run comfortably on a single card.

View all compatible models →Rig around the Ti ↗

VRAM

11GB

Models that run comfortably

162 models

These models fit in 11 GB with room for context and stable inference.

01★Qwen 2.5 14Bqwen8.8 GBcomfortableQ4 · / 11 GB

02Qwen 2.5 Coder 14Bqwen8.8 GBcomfortableQ4 · / 11 GB

03★Qwen 3 14Bqwen8.8 GBcomfortableQ4 · / 11 GB

04★DeepSeek R1 Distill 14Bdeepseek8.8 GBcomfortableQ4 · / 11 GB

05Phi-3 Medium 14Bphi8.8 GBcomfortableQ4 · / 11 GB

06★Phi-4 14Bphi8.8 GBcomfortableQ4 · / 11 GB

07★GLM-4.5 Airglm8.8 GBcomfortableQ4 · / 11 GB

08★Qwen2.5 Coder 14B Instructqwen8.8 GBcomfortableQ4 · / 11 GB

09★Qwen3 14Bqwen8.8 GBcomfortableQ4 · / 11 GB

10★Qwen2.5 14B Instructqwen8.8 GBcomfortableQ4 · / 11 GB

11Llama 2 13Bllama8.2 GBcomfortableQ4 · / 11 GB

12CodeLlama 13Bcodellama8.2 GBcomfortableQ4 · / 11 GB

13OLMo 2 13Bolmo8.2 GBcomfortableQ4 · / 11 GB

14Vicuna 13Bvicuna8.2 GBcomfortableQ4 · / 11 GB

15★Mistral Nemo 12Bmistral9.2 GBcomfortableQ5 · / 11 GB

16★Gemma 3 12Bgemma9.2 GBcomfortableQ5 · / 11 GB

17StableLM 2 12Bstable9.2 GBcomfortableQ5 · / 11 GB

18Solar 10.7Bsolar8.2 GBcomfortableQ5 · / 11 GB

19Falcon 3 10Bfalcon7.7 GBcomfortableQ5 · / 11 GB

20★Gemma 2 9Bgemma6.9 GBcomfortableQ5 · / 11 GB

21Yi 1.5 9Byi6.9 GBcomfortableQ5 · / 11 GB

22★Qwen 3.5 9Bqwen6.9 GBcomfortableQ5 · / 11 GB

23★GLM-4 9Bglm6.9 GBcomfortableQ5 · / 11 GB

24★GLM-4.7 Flashglm6.9 GBcomfortableQ5 · / 11 GB

25GLM-4.1V 9B Thinkingglm6.9 GBcomfortableQ5 · / 11 GB

26★NVIDIA Nemotron Nano 9Bnemotron6.9 GBcomfortableQ5 · / 11 GB

27★gemma 2 9b itgemma6.9 GBcomfortableQ5 · / 11 GB

28Llama 3 8Bllama8.9 GBcomfortableQ8 · / 11 GB

29★Llama 3.1 8Bllama8.9 GBcomfortableQ8 · / 11 GB

30Ministral 8Bmistral8.9 GBcomfortableQ8 · / 11 GB

Tight models

4 models

These models barely fit. They can run, but context and speed will be limited.

01DeepSeek V2 Litedeepseek10.1 GBtightQ4 · / 11 GB

02DeepSeek Coder V2 Litedeepseek10.1 GBtightQ4 · / 11 GB

03StarCoder 2 15Bstarcoder9.4 GBtightQ4 · / 11 GB

04★Phi-4 Reasoning Vision 15Bphi9.4 GBtightQ4 · / 11 GB

Unlocked in a 2x rig

22 GB

With two cards in parallel (22 GB total), larger models become reachable.

01CodeLlama 34Bcodellama21.4 GBtightQ4 · / 22 GB

02Yi 1.5 34Byi21.4 GBtightQ4 · / 22 GB

03★dolphin 2.9.1 yi 1.5 34byi21.4 GBtightQ4 · / 22 GB

04★Qwen 2.5 32Bqwen20.1 GBtightQ4 · / 22 GB

05★Qwen 2.5 Coder 32Bqwen20.1 GBtightQ4 · / 22 GB

06★Qwen 3 32Bqwen20.1 GBtightQ4 · / 22 GB

07★QwQ 32Bqwq20.1 GBtightQ4 · / 22 GB

08★DeepSeek R1 Distill 32Bdeepseek20.1 GBtightQ4 · / 22 GB

09Qwen 2.5 VL 32Bqwen20.1 GBtightQ4 · / 22 GB

10★Granite 4 H-Small 32B-A9Bgranite20.1 GBtightQ4 · / 22 GB

11GLM-4.6glm20.1 GBtightQ4 · / 22 GB

12★GLM-4.7glm20.1 GBtightQ4 · / 22 GB

13★GLM-5glm20.1 GBtightQ4 · / 22 GB

14★GLM-5.1glm20.1 GBtightQ4 · / 22 GB

15★Qwen3 32Bqwen20.1 GBtightQ4 · / 22 GB

Unlocked in a 4x rig

44 GB

Server-style configuration (44 GB total) for the largest open-weight models.

01★Llama 3_3 Nemotron Super 49B v1_5llama30.8 GBcomfortableQ4 · / 44 GB

02★Mixtral 8x7Bmistral36.1 GBcomfortableQ5 · / 44 GB

03Falcon 40Bfalcon30.7 GBcomfortableQ5 · / 44 GB

04Command R 35Bcommand26.9 GBcomfortableQ5 · / 44 GB

05Aya 23 35Baya26.9 GBcomfortableQ5 · / 44 GB

Similar GPUs

VRAM estimates updated 2026-06-27.