unabhängige Ressource · kein Stock, kein Bias

KI, die
in den Technikraum passt.

Tools & Vergleiche für lokale KI 100% unabhängig, um die richtige GPU zu wählen und Llama 4, Qwen 3, DeepSeek, Mistral und 240 Open-Weight-Modelle lokal zu betreiben ohne Cloud, ohne Quota, ohne Überraschungsrechnung.

100% unabhängig● kein Stock, kein Bias◆ kostenlose Tools & Vergleiche
Beispiel eines KI-Referenz-Builds mit mehreren GPUs in einem schwarzen Gehäuse
Pro-Beispiel
2× RTX 5090
64 GB VRAM gesamt
1500 W PSU
Modelle
242
+12 diese Woche
GPUs
204
NVIDIA · AMD · Apple · Intel
Sync
24h
über Hugging Face
Cloud nötig
0
nie. bewusst so.
Break-even
9Mon
vs GPT-4o-API
02 · cloud vs lokal

Die Rechnung passt auf eine Seite.

Simulation 1 Agent · 8h/Tag · 30T

CloudGPT-4o-class API

Monatliche Kosten
≈ 480 € — Abrechnung pro Token
Ausgehende Daten
zu US-Servern — Cloud Act relevant
§
DSGVO / AI Act
DPA, Register, Auftragsverarbeitung
~
First-Token-Latenz
120 — 800 ms je nach Route
×
Quota / Rate Limit
RPM, TPM, Warteschlange zu Spitzenzeiten
Modelle
≈ 8 in großen API-Katalogen
Amortisiert
nie · dauerhafte Miete

LocalReference STARTER build · 1× 5090

Monatliche Kosten
≈ 32 € — electricity
Ausgehende Daten
keine. bleibt in deinen Räumen.
DSGVO / AI Act
Du hostest und kontrollierst das System.
First-Token-Latenz
8 — 40 ms on gigabit LAN
Quota / Rate Limit
durch deine VRAM begrenzt, nicht durch Anbieter
Modelle
242 · Llama, Qwen, Mistral, DeepSeek
9
Amortisiert
9 Monate im STARTER-Tier
verdict computed by /lib/calc.ts · build #2178Nettoersparnis · 5 376 € / Jahr / Agent · Break-even Monat 9
03 · referenz-builds

Drei Gehäuse. Eine klare Haltung.

Builds ansehen →
// 01 · Solo dev
Starter
4 990 €indikative Build-Kosten
  • G1× RTX 509032 GB GDDR7 · 575 W
  • R32 GB DDR5-6000Corsair Vengeance · CL36
  • CRyzen 7 7700X8c · Zen 4
  • S1 TB NVMeSamsung 990 Pro · Gen 4
  • 180 / 242 models~110 t/s · Llama 8B Q4
Details ansehen →
popular
// 02 · Agency · Small team
Pro
11 990 €indikative Build-Kosten
  • G2× RTX 509064 GB total VRAM
  • R64 GB ECC DDR5UDIMM · 4800 MT/s
  • CRyzen 9 9950X16c · 5.7 GHz boost
  • S2 TB NVMe Gen 4Samsung 990 Pro
  • 215 / 242 models~38 t/s · Llama 70B Q4
Details ansehen →
// 03 · SME · Mid-market
Enterprise
25 990 €ab · Build-Kosten
  • G2× RTX A6000NVLink · 96 GB · 112 GB/s
  • R256 GB RDIMM ECC8 channels · Corsair WS
  • CTR Pro 7975WX32c Pro · 8-channel RAM
  • S8 TB NVMe Gen 5RAID-10 · hot-swap
  • Architecture RAG souveraineSSO · RBAC · journal d'audit (à monter)
Für Beratung schreiben →
04 · unabhängigkeit

Fakten, kein Marketing.
Vergleichen. Entscheiden.

Souveränität

DSGVO- und AI-Act-freundlich. Deine Daten bleiben im Raum, messbar und auditierbar.

Begrenzte Kosten

Investition, keine Miete. Break-even in 9 Monaten bei typischer Agent-Nutzung. Kein TPM-Limit.

Offener Stack

llama.cpp · vLLM · Ollama · Open WebUI · LlamaIndex · Qdrant. Kein Lock-in.

Transparente Rechnung

VRAM-Schätzungen vor dem Kauf. Reale tokens/s folgen, sobald das Showroom-Rig benchmarked ist.