NVIDIAConsumerRTX 30

RTX 3060 Ti voor lokale AI

RTX 3060 Ti biedt 8 GB VRAM voor lokale AI. In de LocalIA-catalogus draaien 146 van 242 modellen comfortabel op één kaart.

VRAM
8GB
Categorie
Consumer
Serie
RTX 30
Vendor
NVIDIA

Modellen die comfortabel draaien

Deze modellen passen in 8 GB met marge voor context en stabiele inference.

Solar 10.7Bsolar6.7 GBcomfortabelQ4 · / 8 GB
Falcon 3 10Bfalcon6.3 GBcomfortabelQ4 · / 8 GB
Gemma 2 9Bgemma5.7 GBcomfortabelQ4 · / 8 GB
Yi 1.5 9Byi5.7 GBcomfortabelQ4 · / 8 GB
Qwen 3.5 9Bqwen5.7 GBcomfortabelQ4 · / 8 GB
GLM-4 9Bglm5.7 GBcomfortabelQ4 · / 8 GB
GLM-4.7 Flashglm5.7 GBcomfortabelQ4 · / 8 GB
GLM-4.1V 9B Thinkingglm5.7 GBcomfortabelQ4 · / 8 GB
NVIDIA Nemotron Nano 9Bnemotron5.7 GBcomfortabelQ4 · / 8 GB
gemma 2 9b itgemma5.7 GBcomfortabelQ4 · / 8 GB
Llama 3 8Bllama6.1 GBcomfortabelQ5 · / 8 GB
Llama 3.1 8Bllama6.1 GBcomfortabelQ5 · / 8 GB
Ministral 8Bmistral6.1 GBcomfortabelQ5 · / 8 GB
Qwen 3 8Bqwen6.1 GBcomfortabelQ5 · / 8 GB
DeepSeek R1 Distill 8Bdeepseek6.1 GBcomfortabelQ5 · / 8 GB
Aya 23 8Baya6.1 GBcomfortabelQ5 · / 8 GB
Granite 3 8Bgranite6.1 GBcomfortabelQ5 · / 8 GB
Hermes 3 8Bhermes6.1 GBcomfortabelQ5 · / 8 GB
DeepSeek R1 Distill Llama 8Bdeepseek6.1 GBcomfortabelQ5 · / 8 GB
MiniCPM 4.1 8Bminicpm6.1 GBcomfortabelQ5 · / 8 GB
Qwen3 8Bqwen6.1 GBcomfortabelQ5 · / 8 GB
Llama 3.1 8B Instructllama6.1 GBcomfortabelQ5 · / 8 GB
Meta Llama 3 8Bllama6.1 GBcomfortabelQ5 · / 8 GB
Meta Llama 3 8B Instructllama6.1 GBcomfortabelQ5 · / 8 GB
Llama 3.1 8Bllama6.1 GBcomfortabelQ5 · / 8 GB
DeepSeek R1 Distill Llama 8Bllama6.1 GBcomfortabelQ5 · / 8 GB
Llama 3.1 8B Instructllama6.1 GBcomfortabelQ5 · / 8 GB
Qwen3 8B Baseqwen6.1 GBcomfortabelQ5 · / 8 GB
saiga_llama3_8bllama6.1 GBcomfortabelQ5 · / 8 GB
Meta Llama 3.1 8B Instructllama6.1 GBcomfortabelQ5 · / 8 GB

Krappe modellen

Deze modellen passen net. Ze kunnen draaien, maar context en snelheid zijn beperkt.

Mistral Nemo 12Bmistral7.5 GBkrapQ4 · / 8 GB
Gemma 3 12Bgemma7.5 GBkrapQ4 · / 8 GB
StableLM 2 12Bstable7.5 GBkrapQ4 · / 8 GB

Vrijgespeeld in 2x-rig

Met twee kaarten parallel (16 GB totaal) worden grotere modellen bereikbaar.

Mistral Small 3 24Bmistral15.1 GBkrapQ4 · / 16 GB
Mistral Small 3.1 24Bmistral15.1 GBkrapQ4 · / 16 GB
Mistral Small 3.2 24Bmistral15.1 GBkrapQ4 · / 16 GB
Devstral Small 2 24Bdevstral15.1 GBkrapQ4 · / 16 GB
Mistral Small 22Bmistral13.8 GBkrapQ4 · / 16 GB
Codestral 22Bcodestral13.8 GBkrapQ4 · / 16 GB
Reka Flash 3 21Breka13.2 GBcomfortabelQ4 · / 16 GB
InternLM 2.5 20Binternlm12.6 GBcomfortabelQ4 · / 16 GB
DeepSeek V2 Litedeepseek12.3 GBcomfortabelQ5 · / 16 GB
DeepSeek Coder V2 Litedeepseek12.3 GBcomfortabelQ5 · / 16 GB
StarCoder 2 15Bstarcoder11.5 GBcomfortabelQ5 · / 16 GB
Phi-4 Reasoning Vision 15Bphi11.5 GBcomfortabelQ5 · / 16 GB
Qwen 2.5 14Bqwen10.8 GBcomfortabelQ5 · / 16 GB
Qwen 2.5 Coder 14Bqwen10.8 GBcomfortabelQ5 · / 16 GB
Qwen 3 14Bqwen10.8 GBcomfortabelQ5 · / 16 GB

Vrijgespeeld in 4x-rig

Serverconfiguratie (32 GB totaal) voor de grootste open-weight modellen.

Mixtral 8x7Bmistral29.5 GBkrapQ4 · / 32 GB
Falcon 40Bfalcon25.1 GBcomfortabelQ4 · / 32 GB
Command R 35Bcommand26.9 GBcomfortabelQ5 · / 32 GB
Aya 23 35Baya26.9 GBcomfortabelQ5 · / 32 GB
CodeLlama 34Bcodellama26.1 GBcomfortabelQ5 · / 32 GB
Yi 1.5 34Byi26.1 GBcomfortabelQ5 · / 32 GB
dolphin 2.9.1 yi 1.5 34byi26.1 GBcomfortabelQ5 · / 32 GB
Qwen 2.5 32Bqwen24.6 GBcomfortabelQ5 · / 32 GB
Qwen 2.5 Coder 32Bqwen24.6 GBcomfortabelQ5 · / 32 GB
Qwen 3 32Bqwen24.6 GBcomfortabelQ5 · / 32 GB

Vergelijkbare GPUs

VRAM-schattingen bijgewerkt 2026-05-12.