NVIDIADatacenterAmpere DC

NVIDIA A100 40GB für lokale KI

NVIDIA A100 40GB bietet 40 GB VRAM für lokale KI. Im LocalIA-Katalog laufen 208 von 242 Modellen komfortabel auf einer Karte.

Kompatible Modelle ansehen →Rig mit 40GB ↗

VRAM

40GB

Kategorie

Datacenter

Serie

Ampere DC

Vendor

NVIDIA

Modelle, die komfortabel laufen

208 models

Diese Modelle passen in 40 GB mit Reserve für Kontext und stabile Inferenz.

01★Mixtral 8x7Bmistral29.5 GBkomfortabelQ4 · / 40 GB

02Falcon 40Bfalcon30.7 GBkomfortabelQ5 · / 40 GB

03Command R 35Bcommand26.9 GBkomfortabelQ5 · / 40 GB

04Aya 23 35Baya26.9 GBkomfortabelQ5 · / 40 GB

05CodeLlama 34Bcodellama26.1 GBkomfortabelQ5 · / 40 GB

06Yi 1.5 34Byi26.1 GBkomfortabelQ5 · / 40 GB

07★dolphin 2.9.1 yi 1.5 34byi26.1 GBkomfortabelQ5 · / 40 GB

08★Qwen 2.5 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

09★Qwen 2.5 Coder 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

10★Qwen 3 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

11★QwQ 32Bqwq24.6 GBkomfortabelQ5 · / 40 GB

12★DeepSeek R1 Distill 32Bdeepseek24.6 GBkomfortabelQ5 · / 40 GB

13Qwen 2.5 VL 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

14★Granite 4 H-Small 32B-A9Bgranite24.6 GBkomfortabelQ5 · / 40 GB

15GLM-4.6glm24.6 GBkomfortabelQ5 · / 40 GB

16★GLM-4.7glm24.6 GBkomfortabelQ5 · / 40 GB

17★GLM-5glm24.6 GBkomfortabelQ5 · / 40 GB

18★GLM-5.1glm24.6 GBkomfortabelQ5 · / 40 GB

19★Qwen3 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

20★Qwen2.5 Coder 32B Instructqwen24.6 GBkomfortabelQ5 · / 40 GB

21★DeepSeek R1 Distill Qwen 32Bqwen24.6 GBkomfortabelQ5 · / 40 GB

22★Qwen2.5 32B Instructqwen24.6 GBkomfortabelQ5 · / 40 GB

23★Gemma 4 31Bgemma23.8 GBkomfortabelQ5 · / 40 GB

24★Qwen 3 30B A3Bqwen33.5 GBkomfortabelQ8 · / 40 GB

25MPT 30Bmpt33.5 GBkomfortabelQ8 · / 40 GB

26★Qwen3 Coder 30B A3B Instructqwen33.5 GBkomfortabelQ8 · / 40 GB

27★Qwen3 30B A3Bqwen33.5 GBkomfortabelQ8 · / 40 GB

28★Qwen3 30B A3B Instruct 2507qwen33.5 GBkomfortabelQ8 · / 40 GB

29★NVIDIA Nemotron 3 Nano 30B A3B BF16nemotron33.5 GBkomfortabelQ8 · / 40 GB

30★Gemma 2 27Bgemma30.2 GBkomfortabelQ8 · / 40 GB

Freigeschaltet im 2x-Rig

80 GB

Mit zwei Karten parallel (80 GB gesamt) werden größere Modelle erreichbar.

01★Mistral Large 123Bmistral77.3 GBknappQ4 · / 80 GB

02★NVIDIA Nemotron 3 Super 120B A12B BF16nemotron75.4 GBknappQ4 · / 80 GB

03★Llama 4 Scout 17Bx16llama68.5 GBknappQ4 · / 80 GB

04★Command R+ 104Bcommand65.4 GBkomfortabelQ4 · / 80 GB

05★Qwen3 Next 80B A3B Instructqwen61.5 GBkomfortabelQ5 · / 80 GB

06★Qwen 2.5 72Bqwen55.3 GBkomfortabelQ5 · / 80 GB

07Qwen 2.5 VL 72Bqwen55.3 GBkomfortabelQ5 · / 80 GB

08★Qwen2.5 72B Instructqwen55.3 GBkomfortabelQ5 · / 80 GB

09Llama 2 70Bllama53.8 GBkomfortabelQ5 · / 80 GB

10Llama 3 70Bllama53.8 GBkomfortabelQ5 · / 80 GB

11Llama 3.1 70Bllama53.8 GBkomfortabelQ5 · / 80 GB

12★Llama 3.3 70Bllama53.8 GBkomfortabelQ5 · / 80 GB

13CodeLlama 70Bcodellama53.8 GBkomfortabelQ5 · / 80 GB

14★DeepSeek R1 Distill 70Bdeepseek53.8 GBkomfortabelQ5 · / 80 GB

15Hermes 3 70Bhermes53.8 GBkomfortabelQ5 · / 80 GB

Freigeschaltet im 4x-Rig

160 GB

Server-Konfiguration (160 GB gesamt) für sehr große Open-Weight-Modelle.

01DeepSeek V2deepseek148.4 GBknappQ4 · / 160 GB

02DeepSeek Coder V2deepseek148.4 GBknappQ4 · / 160 GB

03★Qwen 3 235B A22Bqwen147.7 GBknappQ4 · / 160 GB

04★Qwen3 235B A22Bqwen147.7 GBknappQ4 · / 160 GB

05Falcon 180Bfalcon113.2 GBkomfortabelQ4 · / 160 GB

06Mixtral 8x22Bmistral108.3 GBkomfortabelQ5 · / 160 GB

Modelle, die komfortabel laufen

Freigeschaltet im 2x-Rig

Freigeschaltet im 4x-Rig

Ähnliche GPUs