NVIDIAWorkstationRTX Ada

RTX 4000 Ada für lokale KI

RTX 4000 Ada bietet 20 GB VRAM für lokale KI. Im LocalIA-Katalog laufen 179 von 242 Modellen komfortabel auf einer Karte.

Kompatible Modelle ansehen →Rig mit Ada ↗

VRAM

20GB

Kategorie

Workstation

Serie

RTX Ada

Vendor

NVIDIA

Modelle, die komfortabel laufen

179 models

Diese Modelle passen in 20 GB mit Reserve für Kontext und stabile Inferenz.

01★Gemma 2 27Bgemma17.0 GBkomfortabelQ4 · / 20 GB

02★Gemma 3 27Bgemma17.0 GBkomfortabelQ4 · / 20 GB

03★Gemma 4 26B A4Bgemma16.3 GBkomfortabelQ4 · / 20 GB

04★Mistral Small 3 24Bmistral15.1 GBkomfortabelQ4 · / 20 GB

05★Mistral Small 3.1 24Bmistral15.1 GBkomfortabelQ4 · / 20 GB

06★Mistral Small 3.2 24Bmistral15.1 GBkomfortabelQ4 · / 20 GB

07★Devstral Small 2 24Bdevstral15.1 GBkomfortabelQ4 · / 20 GB

08Mistral Small 22Bmistral16.9 GBkomfortabelQ5 · / 20 GB

09★Codestral 22Bcodestral16.9 GBkomfortabelQ5 · / 20 GB

10Reka Flash 3 21Breka16.1 GBkomfortabelQ5 · / 20 GB

11InternLM 2.5 20Binternlm15.4 GBkomfortabelQ5 · / 20 GB

12DeepSeek V2 Litedeepseek12.3 GBkomfortabelQ5 · / 20 GB

13DeepSeek Coder V2 Litedeepseek12.3 GBkomfortabelQ5 · / 20 GB

14StarCoder 2 15Bstarcoder16.8 GBkomfortabelQ8 · / 20 GB

15★Phi-4 Reasoning Vision 15Bphi16.8 GBkomfortabelQ8 · / 20 GB

16★Qwen 2.5 14Bqwen15.6 GBkomfortabelQ8 · / 20 GB

17Qwen 2.5 Coder 14Bqwen15.6 GBkomfortabelQ8 · / 20 GB

18★Qwen 3 14Bqwen15.6 GBkomfortabelQ8 · / 20 GB

19★DeepSeek R1 Distill 14Bdeepseek15.6 GBkomfortabelQ8 · / 20 GB

20Phi-3 Medium 14Bphi15.6 GBkomfortabelQ8 · / 20 GB

21★Phi-4 14Bphi15.6 GBkomfortabelQ8 · / 20 GB

22★GLM-4.5 Airglm15.6 GBkomfortabelQ8 · / 20 GB

23★Qwen2.5 14B Instructqwen15.6 GBkomfortabelQ8 · / 20 GB

24★Qwen3 14Bqwen15.6 GBkomfortabelQ8 · / 20 GB

25★Qwen2.5 Coder 14B Instructqwen15.6 GBkomfortabelQ8 · / 20 GB

26★DeepSeek R1 Distill Qwen 14Bqwen15.6 GBkomfortabelQ8 · / 20 GB

27Llama 2 13Bllama14.5 GBkomfortabelQ8 · / 20 GB

28CodeLlama 13Bcodellama14.5 GBkomfortabelQ8 · / 20 GB

29OLMo 2 13Bolmo14.5 GBkomfortabelQ8 · / 20 GB

30Vicuna 13Bvicuna14.5 GBkomfortabelQ8 · / 20 GB

Knappe Modelle

7 models

Diese Modelle passen gerade so. Sie laufen, aber Kontext und Geschwindigkeit sind begrenzt.

01★Gemma 4 31Bgemma19.5 GBknappQ4 · / 20 GB

02★Qwen 3 30B A3Bqwen18.9 GBknappQ4 · / 20 GB

03MPT 30Bmpt18.9 GBknappQ4 · / 20 GB

04★Qwen3 Coder 30B A3B Instructqwen18.9 GBknappQ4 · / 20 GB

05★Qwen3 30B A3Bqwen18.9 GBknappQ4 · / 20 GB

06★Qwen3 30B A3B Instruct 2507qwen18.9 GBknappQ4 · / 20 GB

07★NVIDIA Nemotron 3 Nano 30B A3B BF16nemotron18.9 GBknappQ4 · / 20 GB

Freigeschaltet im 2x-Rig

40 GB

Mit zwei Karten parallel (40 GB gesamt) werden größere Modelle erreichbar.

01★Mixtral 8x7Bmistral29.5 GBkomfortabelQ4 · / 40 GB

02Falcon 40Bfalcon30.7 GBkomfortabelQ5 · / 40 GB

03Command R 35Bcommand26.9 GBkomfortabelQ5 · / 40 GB

04Aya 23 35Baya26.9 GBkomfortabelQ5 · / 40 GB

05CodeLlama 34Bcodellama26.1 GBkomfortabelQ5 · / 40 GB

06Yi 1.5 34Byi26.1 GBkomfortabelQ5 · / 40 GB

07★dolphin 2.9.1 yi 1.5 34byi26.1 GBkomfortabelQ5 · / 40 GB

08★Qwen 2.5 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

09★Qwen 2.5 Coder 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

10★Qwen 3 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

11★QwQ 32Bqwq24.6 GBkomfortabelQ5 · / 40 GB

12★DeepSeek R1 Distill 32Bdeepseek24.6 GBkomfortabelQ5 · / 40 GB

13Qwen 2.5 VL 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

14★Granite 4 H-Small 32B-A9Bgranite24.6 GBkomfortabelQ5 · / 40 GB

15GLM-4.6glm24.6 GBkomfortabelQ5 · / 40 GB

Freigeschaltet im 4x-Rig

80 GB

Server-Konfiguration (80 GB gesamt) für sehr große Open-Weight-Modelle.

01★Mistral Large 123Bmistral77.3 GBknappQ4 · / 80 GB

02★NVIDIA Nemotron 3 Super 120B A12B BF16nemotron75.4 GBknappQ4 · / 80 GB

03★Llama 4 Scout 17Bx16llama68.5 GBknappQ4 · / 80 GB

04★Command R+ 104Bcommand65.4 GBkomfortabelQ4 · / 80 GB

05★Qwen3 Next 80B A3B Instructqwen61.5 GBkomfortabelQ5 · / 80 GB

06★Qwen 2.5 72Bqwen55.3 GBkomfortabelQ5 · / 80 GB

07Qwen 2.5 VL 72Bqwen55.3 GBkomfortabelQ5 · / 80 GB

08★Qwen2.5 72B Instructqwen55.3 GBkomfortabelQ5 · / 80 GB

09Llama 2 70Bllama53.8 GBkomfortabelQ5 · / 80 GB

10Llama 3 70Bllama53.8 GBkomfortabelQ5 · / 80 GB