unabhängige Ressource · kein Stock, kein Bias

KI, die
in den Technikraum passt.

Tools & Vergleiche für lokale KI 100% unabhängig, um die richtige GPU zu wählen und Llama 4, Qwen 3, DeepSeek, Mistral und 240 Open-Weight-Modelle lokal zu betreiben — ohne Cloud, ohne Quota, ohne Überraschungsrechnung.

Referenz-Builds ansehen →$ Rechner öffnen

100% unabhängig● kein Stock, kein Bias◆ kostenlose Tools & Vergleiche

Beispiel eines KI-Referenz-Builds mit mehreren GPUs in einem schwarzen Gehäuse

Pro-Beispiel

2× RTX 5090

64 GB VRAM gesamt

1500 W PSU

Modelle

242

+12 diese Woche

GPUs

204

NVIDIA · AMD · Apple · Intel

Sync

24h

über Hugging Face

Cloud nötig

nie. bewusst so.

Break-even

9Mon

vs GPT-4o-API

02 · cloud vs lokal

Die Rechnung passt auf eine Seite.

Simulation 1 Agent · 8h/Tag · 30T

CloudGPT-4o-class API

€

Monatliche Kosten

≈ 480 € — Abrechnung pro Token

↗

Ausgehende Daten

zu US-Servern — Cloud Act relevant

DSGVO / AI Act

DPA, Register, Auftragsverarbeitung

First-Token-Latenz

120 — 800 ms je nach Route

Quota / Rate Limit

RPM, TPM, Warteschlange zu Spitzenzeiten

∅

Modelle

≈ 8 in großen API-Katalogen

∞

Amortisiert

nie · dauerhafte Miete

LocalReference STARTER build · 1× 5090

€

Monatliche Kosten

≈ 32 € — electricity

↘

Ausgehende Daten

keine. bleibt in deinen Räumen.

✓

DSGVO / AI Act

Du hostest und kontrollierst das System.

⚡

First-Token-Latenz

8 — 40 ms on gigabit LAN

∞

Quota / Rate Limit

durch deine VRAM begrenzt, nicht durch Anbieter

★

Modelle

242 · Llama, Qwen, Mistral, DeepSeek

Amortisiert

9 Monate im STARTER-Tier

verdict computed by /lib/calc.ts · build #2178Nettoersparnis · 5 376 € / Jahr / Agent · Break-even Monat 9

03 · referenz-builds

Drei Gehäuse. Eine klare Haltung.

Builds ansehen →

// 01 · Solo dev

Starter

4 990 €indikative Build-Kosten

G1× RTX 509032 GB GDDR7 · 575 W
R32 GB DDR5-6000Corsair Vengeance · CL36
CRyzen 7 7700X8c · Zen 4
S1 TB NVMeSamsung 990 Pro · Gen 4
★180 / 242 models~110 t/s · Llama 8B Q4

Details ansehen →

popular

// 02 · Agency · Small team

Pro

11 990 €indikative Build-Kosten

G2× RTX 509064 GB total VRAM
R64 GB ECC DDR5UDIMM · 4800 MT/s
CRyzen 9 9950X16c · 5.7 GHz boost
S2 TB NVMe Gen 4Samsung 990 Pro
★215 / 242 models~38 t/s · Llama 70B Q4

Details ansehen →

// 03 · SME · Mid-market

Enterprise

25 990 €ab · Build-Kosten

G2× RTX A6000NVLink · 96 GB · 112 GB/s
R256 GB RDIMM ECC8 channels · Corsair WS
CTR Pro 7975WX32c Pro · 8-channel RAM
S8 TB NVMe Gen 5RAID-10 · hot-swap
★Architecture RAG souveraineSSO · RBAC · journal d'audit (à monter)

Für Beratung schreiben →

04 · unabhängigkeit

Fakten, kein Marketing.
Vergleichen. Entscheiden.

▲

Souveränität

DSGVO- und AI-Act-freundlich. Deine Daten bleiben im Raum, messbar und auditierbar.

◆

Begrenzte Kosten

Investition, keine Miete. Break-even in 9 Monaten bei typischer Agent-Nutzung. Kein TPM-Limit.

●

Offener Stack

llama.cpp · vLLM · Ollama · Open WebUI · LlamaIndex · Qdrant. Kein Lock-in.

■

Transparente Rechnung

VRAM-Schätzungen vor dem Kauf. Reale tokens/s folgen, sobald das Showroom-Rig benchmarked ist.

KI, diein den Technikraum passt.

Die Rechnung passt auf eine Seite.

CloudGPT-4o-class API

LocalReference STARTER build · 1× 5090

Drei Gehäuse. Eine klare Haltung.

Fakten, kein Marketing.Vergleichen. Entscheiden.

Souveränität

Begrenzte Kosten

Offener Stack

Transparente Rechnung

KI, die
in den Technikraum passt.

Fakten, kein Marketing.
Vergleichen. Entscheiden.