NVIDIAConsumerRTX 30

RTX 3080 12GB für lokale KI

RTX 3080 12GB bietet 12 GB VRAM für lokale KI. Im LocalIA-Katalog laufen 168 von 242 Modellen komfortabel auf einer Karte.

Kompatible Modelle ansehen →Rig mit 12GB ↗

VRAM

12GB

Kategorie

Consumer

Serie

RTX 30

Vendor

NVIDIA

Modelle, die komfortabel laufen

168 models

Diese Modelle passen in 12 GB mit Reserve für Kontext und stabile Inferenz.

01DeepSeek V2 Litedeepseek10.1 GBkomfortabelQ4 · / 12 GB

02DeepSeek Coder V2 Litedeepseek10.1 GBkomfortabelQ4 · / 12 GB

03StarCoder 2 15Bstarcoder9.4 GBkomfortabelQ4 · / 12 GB

04★Phi-4 Reasoning Vision 15Bphi9.4 GBkomfortabelQ4 · / 12 GB

05★Qwen 2.5 14Bqwen8.8 GBkomfortabelQ4 · / 12 GB

06Qwen 2.5 Coder 14Bqwen8.8 GBkomfortabelQ4 · / 12 GB

07★Qwen 3 14Bqwen8.8 GBkomfortabelQ4 · / 12 GB

08★DeepSeek R1 Distill 14Bdeepseek8.8 GBkomfortabelQ4 · / 12 GB

09Phi-3 Medium 14Bphi8.8 GBkomfortabelQ4 · / 12 GB

10★Phi-4 14Bphi8.8 GBkomfortabelQ4 · / 12 GB

11★GLM-4.5 Airglm8.8 GBkomfortabelQ4 · / 12 GB

12★Qwen2.5 14B Instructqwen8.8 GBkomfortabelQ4 · / 12 GB

13★Qwen3 14Bqwen8.8 GBkomfortabelQ4 · / 12 GB

14★Qwen2.5 Coder 14B Instructqwen8.8 GBkomfortabelQ4 · / 12 GB

15★DeepSeek R1 Distill Qwen 14Bqwen8.8 GBkomfortabelQ4 · / 12 GB

16Llama 2 13Bllama10.0 GBkomfortabelQ5 · / 12 GB

17CodeLlama 13Bcodellama10.0 GBkomfortabelQ5 · / 12 GB

18OLMo 2 13Bolmo10.0 GBkomfortabelQ5 · / 12 GB

19Vicuna 13Bvicuna10.0 GBkomfortabelQ5 · / 12 GB

20★Mistral Nemo 12Bmistral9.2 GBkomfortabelQ5 · / 12 GB

21★Gemma 3 12Bgemma9.2 GBkomfortabelQ5 · / 12 GB

22StableLM 2 12Bstable9.2 GBkomfortabelQ5 · / 12 GB

23Solar 10.7Bsolar8.2 GBkomfortabelQ5 · / 12 GB

24Falcon 3 10Bfalcon7.7 GBkomfortabelQ5 · / 12 GB

25★Gemma 2 9Bgemma10.1 GBkomfortabelQ8 · / 12 GB

26Yi 1.5 9Byi10.1 GBkomfortabelQ8 · / 12 GB

27★Qwen 3.5 9Bqwen10.1 GBkomfortabelQ8 · / 12 GB

28★GLM-4 9Bglm10.1 GBkomfortabelQ8 · / 12 GB

29★GLM-4.7 Flashglm10.1 GBkomfortabelQ8 · / 12 GB

30GLM-4.1V 9B Thinkingglm10.1 GBkomfortabelQ8 · / 12 GB

Freigeschaltet im 2x-Rig

24 GB

Mit zwei Karten parallel (24 GB gesamt) werden größere Modelle erreichbar.

01Command R 35Bcommand22.0 GBknappQ4 · / 24 GB

02Aya 23 35Baya22.0 GBknappQ4 · / 24 GB

03CodeLlama 34Bcodellama21.4 GBknappQ4 · / 24 GB

04Yi 1.5 34Byi21.4 GBknappQ4 · / 24 GB

05★dolphin 2.9.1 yi 1.5 34byi21.4 GBknappQ4 · / 24 GB

06★Qwen 2.5 32Bqwen20.1 GBkomfortabelQ4 · / 24 GB

07★Qwen 2.5 Coder 32Bqwen20.1 GBkomfortabelQ4 · / 24 GB

08★Qwen 3 32Bqwen20.1 GBkomfortabelQ4 · / 24 GB

09★QwQ 32Bqwq20.1 GBkomfortabelQ4 · / 24 GB

10★DeepSeek R1 Distill 32Bdeepseek20.1 GBkomfortabelQ4 · / 24 GB

11Qwen 2.5 VL 32Bqwen20.1 GBkomfortabelQ4 · / 24 GB

12★Granite 4 H-Small 32B-A9Bgranite20.1 GBkomfortabelQ4 · / 24 GB

13GLM-4.6glm20.1 GBkomfortabelQ4 · / 24 GB

14★GLM-4.7glm20.1 GBkomfortabelQ4 · / 24 GB

15★GLM-5glm20.1 GBkomfortabelQ4 · / 24 GB

Freigeschaltet im 4x-Rig

48 GB

Server-Konfiguration (48 GB gesamt) für sehr große Open-Weight-Modelle.

01★Qwen 2.5 72Bqwen45.3 GBknappQ4 · / 48 GB

02Qwen 2.5 VL 72Bqwen45.3 GBknappQ4 · / 48 GB

03★Qwen2.5 72B Instructqwen45.3 GBknappQ4 · / 48 GB

04Llama 2 70Bllama44.0 GBknappQ4 · / 48 GB

05Llama 3 70Bllama44.0 GBknappQ4 · / 48 GB

06Llama 3.1 70Bllama44.0 GBknappQ4 · / 48 GB

07★Llama 3.3 70Bllama44.0 GBknappQ4 · / 48 GB

08CodeLlama 70Bcodellama44.0 GBknappQ4 · / 48 GB

09★DeepSeek R1 Distill 70Bdeepseek44.0 GBknappQ4 · / 48 GB

10Hermes 3 70Bhermes44.0 GBknappQ4 · / 48 GB

Modelle, die komfortabel laufen

Freigeschaltet im 2x-Rig

Freigeschaltet im 4x-Rig

Ähnliche GPUs