/rigs · 3 Referenz-Builds · 100% unabhängig

Referenz-Builds
für KI-Rigs.

Drei lehrreiche Referenz-Builds — GPU, VRAM, indikative Build-Kosten. Wie ein gutes lokales KI-Rig aussieht, ohne kommerziellen Bias.

Konfigurationen ansehen ↓Für Beratung schreiben Wer hinter Localia steht

01 · Souveränität

Sensible Daten (Recht, Medizin, HR, F&E) verlassen niemals deine Mauern. DSGVO- und AI-Act-konform.

02 · Begrenzte Kosten

Ein Pro-Rig amortisiert sich in ~6 Monaten gegenüber 1500 €/Monat API in Skala. Grenzkosten danach nahe null.

03 · Aktuelle Modelle

Wie man neue Open-Weight-Modelle verfolgt, die passende Quantisierung wählt und einen Launch testet: unsere Guides erklären es Schritt für Schritt.

trust

Was diese Builds verlässlich macht.

Localia ist eine unabhängige Ressource: kein Lager, keine erfundenen Benchmarks. Diese Builds dienen als Referenz, um selbst das richtige Rig zu bauen.

Begründete Komponenten

Jede Wahl von GPU, VRAM und Netzteil ist für eine reale lokale KI-Last erklärt.

Transparente Richtkosten

Die gezeigten Beträge sind geschätzte Build-Kosten zum Marktpreis, keine Verkaufspreise.

Dokumentierte Performance

Welche Modelle laufen und ihre Quantisierung sind Stufe für Stufe angegeben.

Benchmarks folgen

Echte Token/s gemessen auf physischer Hardware werden so bald wie möglich veröffentlicht.

katalog

Drei Referenz-Builds. Richtkosten.

geschätzte Build-Kosten · Marktpreis 2026

// 01 · Solo dev · Forschung · interne Experimente

Starter

Erstes Solo-KI-Rig

4 990 € HTzzgl. MwSt. · Teile

GPU · VRAM

1× RTX 509032 GB

Spec

·AMD Ryzen 7 7700X (8C / 16T)
·32 GB DDR5-6000
·1 TB NVMe Gen 4
·Netzteil 850 W 80+ Gold
·Herstellergarantien der Komponenten

Läuft zum Beispiel

▸Llama 3.3 70B · Q3
▸Qwen 2.5 32B · Q5
▸Gemma 4 31B · Q5
▸Mistral 7B · FP16
▸DeepSeek R1 Distill 32B · Q5

Software

·Ubuntu 24.04 LTS
·NVIDIA-Treiber + CUDA
·Ollama + Open WebUI (Open-Source, zu installieren)
·Optimierter llama.cpp Build

Rechner öffnen →

// 02 · Agentur · KMU · Kanzlei · Datenteam

popular

Pro

Das Team-RAG-Rig

11 990 € HTzzgl. MwSt. · Teile

GPU · VRAM

2× RTX 509064 GB

Spec

·AMD Ryzen 7 7700X (8C / 16T)
·64 GB DDR5-4800 ECC UDIMM
·1 TB NVMe Gen 4
·Netzteil 1500 W 80+ Platinum
·Herstellergarantien der Komponenten

Läuft zum Beispiel

▸Llama 3.3 70B · Q8
▸DeepSeek R1 Distill 70B · Q8
▸Qwen 2.5 72B · Q5
▸Mixtral 8x7B · FP16
▸Mistral Large 123B · Q4

Software

·Alles aus Starter +
·vLLM mit OpenAI-kompatiblem Server
·RAG-Kit: LlamaIndex + Qdrant konfiguriert + README
·CLI-Monitoring (nvidia-smi, htop, ollama logs)

Rechner öffnen →

// 03 · KMU · Kanzlei · Medizin · Mittelstand · öffentlich

Enterprise

KI-Souveränität für KMU

25 990 € HTzzgl. MwSt. · Teile

GPU · VRAM

2× RTX A6000 NVLink96 GB

Spec

·AMD Threadripper Pro 7975WX (32C / 64T)
·256 GB DDR5 ECC RDIMM
·8 TB NVMe Gen 5 RAID 10
·Netzteil 2000 W redundant
·Herstellergarantien der Komponenten

Läuft zum Beispiel

▸Llama 3.3 70B · FP16
▸Mistral Large 123B · Q5
▸Qwen 2.5 72B · Q8
▸Mixtral 8x22B · Q5
▸Llama 4 Scout · Q5

Software

·Alles aus Pro +
·Multi-GPU Tensor Parallel konfiguriert (NVLink)
·Open WebUI Multi-User · OIDC bereit
·DSGVO / AI-Act Compliance-Doku inklusive

Rechner öffnen →

indikative Netto-Build-Kosten (nur Teile, ohne Montage) · an deinen Use Case anzupassen · Localia verkauft nicht, liefert nicht

◆ custom

Jenseits der Referenz-Builds.

Alles außerhalb der Standard-Builds: vollständige RAG-Integration auf deinen Dokumenten, Grafana-Dashboards, Custom-SSO (fein granulares RBAC, HDS-konformes Audit), White-Label-UI, Datacenter-GPUs (H100 / H200 / B200 / MI300X), Multi-Rack, strikte SLA, Sicherheitsaudit, Team-Schulung. Localia verkauft diese Leistungen nicht; wir können dich an die richtigen Ansprechpartner verweisen und beim Scoping helfen.

H100 / H200MI300XMulti-RackStrikte SLAEnterprise-RAGSicherheitsauditTeam-SchulungWartung

Für Beratung schreiben →

process

So nutzt du diese Builds.

01
Schritt 1
Build wählen
Finde den Referenz-Build, der deinem Use Case am nächsten kommt.
02
Schritt 2
Kosten schätzen
Öffne den Rechner, um die Build-Kosten für deine Modelle zu schätzen.
03
Schritt 3
Komponenten sourcen
Kaufe die Komponenten selbst bei den Distributoren deiner Wahl.
04
Schritt 4
Stack installieren
Folge unseren Guides, um Ollama, Open WebUI und den RAG-Stack zu installieren.

faq

Häufige Fragen.

Verkauft Localia diese Rigs?+

Nein. Localia ist eine unabhängige Ressource: Diese Builds sind lehrreiche Referenzen, um dein eigenes Rig zu bauen. Kein Lager, kein Verkauf, keine Lieferung.

Welchen Software-Stack nutzen?+

Ubuntu 24.04 LTS · NVIDIA-Treiber · CUDA · Ollama · Open WebUI · llama.cpp · vLLM · RAG-Stack (LlamaIndex + Qdrant). Alles Open-Source, mit unseren Guides zu installieren.

Welche Modelle laufen darauf?+

Je nach Build: Llama 3.3 70B, Mistral Large, Qwen 2.5 72B, DeepSeek R1, Gemma 4. Der Rechner sagt dir, was in den VRAM passt.

Und die Garantie?+

Jede Komponente behält die Garantie ihres Herstellers (GPU, Mainboard, Netzteil usw.). Localia ist kein Verkäufer und gibt daher keine Garantie auf das montierte Ganze.

Was, wenn ich später aufrüsten will?+

Jeder Referenz-Build ist auf +1 oder +2 zusätzliche GPUs ausgelegt (freie PCIe-Slots + dimensioniertes Netzteil). Beim Komponentenkauf einplanen.

Bereit für lokale KI?

Frage zur Wahl eines Rigs? Beschreibe deinen Fall in zwei Sätzen: Wir verweisen dich auf den richtigen Referenz-Build — ohne dir etwas zu verkaufen.

Für Beratung schreiben →

Antwort in 24 Geschäftsstunden · contact@getlocalia.com

Referenz-Buildsfür KI-Rigs.

Was diese Builds verlässlich macht.

Begründete Komponenten

Transparente Richtkosten

Dokumentierte Performance

Benchmarks folgen

Drei Referenz-Builds. Richtkosten.

Starter

Pro

Enterprise

Jenseits der Referenz-Builds.

So nutzt du diese Builds.

Build wählen

Kosten schätzen

Komponenten sourcen

Stack installieren

Häufige Fragen.

Bereit für lokale KI?

Referenz-Builds
für KI-Rigs.