NVIDIADatacenterAmpere DC

NVIDIA A100 40GB voor lokale AI

NVIDIA A100 40GB biedt 40 GB VRAM voor lokale AI. In de LocalIA-catalogus draaien 207 van 242 modellen comfortabel op één kaart.

Bekijk compatibele modellen →Rig met 40GB ↗

VRAM

40GB

Categorie

Datacenter

Serie

Ampere DC

Vendor

NVIDIA

Modellen die comfortabel draaien

207 models

Deze modellen passen in 40 GB met marge voor context en stabiele inference.

01★Llama 3_3 Nemotron Super 49B v1_5llama30.8 GBcomfortabelQ4 · / 40 GB

02★Mixtral 8x7Bmistral29.5 GBcomfortabelQ4 · / 40 GB

03Falcon 40Bfalcon30.7 GBcomfortabelQ5 · / 40 GB

04Command R 35Bcommand26.9 GBcomfortabelQ5 · / 40 GB

05Aya 23 35Baya26.9 GBcomfortabelQ5 · / 40 GB

06CodeLlama 34Bcodellama26.1 GBcomfortabelQ5 · / 40 GB

07Yi 1.5 34Byi26.1 GBcomfortabelQ5 · / 40 GB

08★dolphin 2.9.1 yi 1.5 34byi26.1 GBcomfortabelQ5 · / 40 GB

09★Qwen 2.5 32Bqwen24.6 GBcomfortabelQ5 · / 40 GB

10★Qwen 2.5 Coder 32Bqwen24.6 GBcomfortabelQ5 · / 40 GB

11★Qwen 3 32Bqwen24.6 GBcomfortabelQ5 · / 40 GB

12★QwQ 32Bqwq24.6 GBcomfortabelQ5 · / 40 GB

13★DeepSeek R1 Distill 32Bdeepseek24.6 GBcomfortabelQ5 · / 40 GB

14Qwen 2.5 VL 32Bqwen24.6 GBcomfortabelQ5 · / 40 GB

15★Granite 4 H-Small 32B-A9Bgranite24.6 GBcomfortabelQ5 · / 40 GB

16GLM-4.6glm24.6 GBcomfortabelQ5 · / 40 GB

17★GLM-4.7glm24.6 GBcomfortabelQ5 · / 40 GB

18★GLM-5glm24.6 GBcomfortabelQ5 · / 40 GB

19★GLM-5.1glm24.6 GBcomfortabelQ5 · / 40 GB

20★Qwen3 32Bqwen24.6 GBcomfortabelQ5 · / 40 GB

21★Qwen2.5 32B Instructqwen24.6 GBcomfortabelQ5 · / 40 GB

22★Qwen2.5 Coder 32B Instructqwen24.6 GBcomfortabelQ5 · / 40 GB

23★DeepSeek R1 Distill Qwen 32Bqwen24.6 GBcomfortabelQ5 · / 40 GB

24★Gemma 4 31Bgemma23.8 GBcomfortabelQ5 · / 40 GB

25★Qwen 3 30B A3Bqwen33.5 GBcomfortabelQ8 · / 40 GB

26MPT 30Bmpt33.5 GBcomfortabelQ8 · / 40 GB

27★Qwen3 30B A3Bqwen33.5 GBcomfortabelQ8 · / 40 GB

28★Qwen3 Coder 30B A3B Instructqwen33.5 GBcomfortabelQ8 · / 40 GB

29★NVIDIA Nemotron 3 Nano 30B A3B BF16nemotron33.5 GBcomfortabelQ8 · / 40 GB

30★Qwen3 30B A3B Instruct 2507qwen33.5 GBcomfortabelQ8 · / 40 GB

Vrijgespeeld in 2x-rig

80 GB

Met twee kaarten parallel (80 GB totaal) worden grotere modellen bereikbaar.

01★Mistral Large 123Bmistral77.3 GBkrapQ4 · / 80 GB

02★NVIDIA Nemotron 3 Super 120B A12B BF16nemotron75.4 GBkrapQ4 · / 80 GB

03★Llama 4 Scout 17Bx16llama68.5 GBkrapQ4 · / 80 GB

04★Command R+ 104Bcommand65.4 GBcomfortabelQ4 · / 80 GB

05★Qwen 2.5 72Bqwen55.3 GBcomfortabelQ5 · / 80 GB

06Qwen 2.5 VL 72Bqwen55.3 GBcomfortabelQ5 · / 80 GB

07★Qwen2.5 72B Instructqwen55.3 GBcomfortabelQ5 · / 80 GB

08Llama 2 70Bllama53.8 GBcomfortabelQ5 · / 80 GB

09Llama 3 70Bllama53.8 GBcomfortabelQ5 · / 80 GB

10Llama 3.1 70Bllama53.8 GBcomfortabelQ5 · / 80 GB

11★Llama 3.3 70Bllama53.8 GBcomfortabelQ5 · / 80 GB

12CodeLlama 70Bcodellama53.8 GBcomfortabelQ5 · / 80 GB

13★DeepSeek R1 Distill 70Bdeepseek53.8 GBcomfortabelQ5 · / 80 GB

14Hermes 3 70Bhermes53.8 GBcomfortabelQ5 · / 80 GB

15★Llama 3.1 Nemotron 70Bnemotron53.8 GBcomfortabelQ5 · / 80 GB

Vrijgespeeld in 4x-rig

160 GB

Serverconfiguratie (160 GB totaal) voor de grootste open-weight modellen.

01DeepSeek V2deepseek148.4 GBkrapQ4 · / 160 GB

02DeepSeek Coder V2deepseek148.4 GBkrapQ4 · / 160 GB

03★Qwen 3 235B A22Bqwen147.7 GBkrapQ4 · / 160 GB

04★Qwen3 235B A22Bqwen147.7 GBkrapQ4 · / 160 GB

05Falcon 180Bfalcon113.2 GBcomfortabelQ4 · / 160 GB

06Mixtral 8x22Bmistral108.3 GBcomfortabelQ5 · / 160 GB

Vergelijkbare GPUs

VRAM-schattingen bijgewerkt 2026-06-27.