NVIDIAConsumerGTX 16

GTX 1660 per IA locale

GTX 1660 offre 6 GB di VRAM per IA locale. Nel catalogo LocalIA, 136 modelli su 242 girano comodamente su una sola scheda.

Vedi modelli compatibili →Rig con 1660 ↗

VRAM

6GB

Categoria

Consumer

Serie

GTX 16

Vendor

NVIDIA

Modelli che girano comodamente

136 models

Questi modelli entrano in 6 GB con margine per contesto e inferenza stabile.

01Llama 3 8Bllama5.0 GBcomodoQ4 · / 6 GB

02★Llama 3.1 8Bllama5.0 GBcomodoQ4 · / 6 GB

03Ministral 8Bmistral5.0 GBcomodoQ4 · / 6 GB

04★Qwen 3 8Bqwen5.0 GBcomodoQ4 · / 6 GB

05DeepSeek R1 Distill 8Bdeepseek5.0 GBcomodoQ4 · / 6 GB

06Aya 23 8Baya5.0 GBcomodoQ4 · / 6 GB

07Granite 3 8Bgranite5.0 GBcomodoQ4 · / 6 GB

08★Hermes 3 8Bhermes5.0 GBcomodoQ4 · / 6 GB

09★DeepSeek R1 Distill Llama 8Bdeepseek5.0 GBcomodoQ4 · / 6 GB

10★MiniCPM 4.1 8Bminicpm5.0 GBcomodoQ4 · / 6 GB

11★Qwen3 8Bqwen5.0 GBcomodoQ4 · / 6 GB

12★Llama 3.1 8B Instructllama5.0 GBcomodoQ4 · / 6 GB

13★Meta Llama 3 8Bllama5.0 GBcomodoQ4 · / 6 GB

14★Meta Llama 3 8B Instructllama5.0 GBcomodoQ4 · / 6 GB

15★Llama 3.1 8Bllama5.0 GBcomodoQ4 · / 6 GB

16★DeepSeek R1 Distill Llama 8Bllama5.0 GBcomodoQ4 · / 6 GB

17★Llama 3.1 8B Instructllama5.0 GBcomodoQ4 · / 6 GB

18★Qwen3 8B Baseqwen5.0 GBcomodoQ4 · / 6 GB

19★saiga_llama3_8bllama5.0 GBcomodoQ4 · / 6 GB

20★Meta Llama 3.1 8B Instructllama5.0 GBcomodoQ4 · / 6 GB

21★Phi Mini MoE 7.6Bphi4.8 GBcomodoQ4 · / 6 GB

22Llama 2 7Bllama4.4 GBcomodoQ4 · / 6 GB

23CodeLlama 7Bcodellama4.4 GBcomodoQ4 · / 6 GB

24★Mistral 7Bmistral4.4 GBcomodoQ4 · / 6 GB

25Mathstral 7Bmistral4.4 GBcomodoQ4 · / 6 GB

26★Qwen 2.5 7Bqwen4.4 GBcomodoQ4 · / 6 GB

27★Qwen 2.5 Coder 7Bqwen4.4 GBcomodoQ4 · / 6 GB

28★DeepSeek R1 Distill 7Bdeepseek4.4 GBcomodoQ4 · / 6 GB

29DeepSeek Math 7Bdeepseek4.4 GBcomodoQ4 · / 6 GB

30CodeGemma 7Bgemma4.4 GBcomodoQ4 · / 6 GB

Modelli stretti

8 models

Questi modelli entrano appena. Possono girare, ma contesto e velocità saranno limitati.

01★Gemma 2 9Bgemma5.7 GBstrettoQ4 · / 6 GB

02Yi 1.5 9Byi5.7 GBstrettoQ4 · / 6 GB

03★Qwen 3.5 9Bqwen5.7 GBstrettoQ4 · / 6 GB

04★GLM-4 9Bglm5.7 GBstrettoQ4 · / 6 GB

05★GLM-4.7 Flashglm5.7 GBstrettoQ4 · / 6 GB

06GLM-4.1V 9B Thinkingglm5.7 GBstrettoQ4 · / 6 GB

07★NVIDIA Nemotron Nano 9Bnemotron5.7 GBstrettoQ4 · / 6 GB

08★gemma 2 9b itgemma5.7 GBstrettoQ4 · / 6 GB

Sbloccati in rig 2x

12 GB

Con due schede in parallelo (12 GB totali), modelli più grandi diventano accessibili.

01DeepSeek V2 Litedeepseek10.1 GBcomodoQ4 · / 12 GB

02DeepSeek Coder V2 Litedeepseek10.1 GBcomodoQ4 · / 12 GB

03StarCoder 2 15Bstarcoder9.4 GBcomodoQ4 · / 12 GB

04★Phi-4 Reasoning Vision 15Bphi9.4 GBcomodoQ4 · / 12 GB

05★Qwen 2.5 14Bqwen8.8 GBcomodoQ4 · / 12 GB

06Qwen 2.5 Coder 14Bqwen8.8 GBcomodoQ4 · / 12 GB

07★Qwen 3 14Bqwen8.8 GBcomodoQ4 · / 12 GB

08★DeepSeek R1 Distill 14Bdeepseek8.8 GBcomodoQ4 · / 12 GB

09Phi-3 Medium 14Bphi8.8 GBcomodoQ4 · / 12 GB

10★Phi-4 14Bphi8.8 GBcomodoQ4 · / 12 GB

11★GLM-4.5 Airglm8.8 GBcomodoQ4 · / 12 GB

12★Qwen2.5 14B Instructqwen8.8 GBcomodoQ4 · / 12 GB

13★Qwen3 14Bqwen8.8 GBcomodoQ4 · / 12 GB

14★Qwen2.5 Coder 14B Instructqwen8.8 GBcomodoQ4 · / 12 GB

15★DeepSeek R1 Distill Qwen 14Bqwen8.8 GBcomodoQ4 · / 12 GB

Sbloccati in rig 4x

24 GB

Configurazione server (24 GB totali) per i modelli open-weight più grandi.

01Command R 35Bcommand22.0 GBstrettoQ4 · / 24 GB

02Aya 23 35Baya22.0 GBstrettoQ4 · / 24 GB

03CodeLlama 34Bcodellama21.4 GBstrettoQ4 · / 24 GB

04Yi 1.5 34Byi21.4 GBstrettoQ4 · / 24 GB

05★dolphin 2.9.1 yi 1.5 34byi21.4 GBstrettoQ4 · / 24 GB

06★Qwen 2.5 32Bqwen20.1 GBcomodoQ4 · / 24 GB

07★Qwen 2.5 Coder 32Bqwen20.1 GBcomodoQ4 · / 24 GB

08★Qwen 3 32Bqwen20.1 GBcomodoQ4 · / 24 GB

09★QwQ 32Bqwq20.1 GBcomodoQ4 · / 24 GB

10★DeepSeek R1 Distill 32Bdeepseek20.1 GBcomodoQ4 · / 24 GB

GPU simili

Stime VRAM aggiornate 2026-05-12.