/rigs · 3 Referenz-Builds · 100% unabhängig

Referenz-Builds
für KI-Rigs.

Drei lehrreiche Referenz-Builds — GPU, VRAM, indikative Build-Kosten. Wie ein gutes lokales KI-Rig aussieht, ohne kommerziellen Bias.

01 · Souveränität

Sensible Daten (Recht, Medizin, HR, F&E) verlassen niemals deine Mauern. DSGVO- und AI-Act-konform.

02 · Begrenzte Kosten

Ein Pro-Rig amortisiert sich in ~6 Monaten gegenüber 1500 €/Monat API in Skala. Grenzkosten danach nahe null.

03 · Aktuelle Modelle

Wie man neue Open-Weight-Modelle verfolgt, die passende Quantisierung wählt und einen Launch testet: unsere Guides erklären es Schritt für Schritt.

trust

Was diese Builds verlässlich macht.

Localia ist eine unabhängige Ressource: kein Lager, keine erfundenen Benchmarks. Diese Builds dienen als Referenz, um selbst das richtige Rig zu bauen.

01

Begründete Komponenten

Jede Wahl von GPU, VRAM und Netzteil ist für eine reale lokale KI-Last erklärt.

02

Transparente Richtkosten

Die gezeigten Beträge sind geschätzte Build-Kosten zum Marktpreis, keine Verkaufspreise.

03

Dokumentierte Performance

Welche Modelle laufen und ihre Quantisierung sind Stufe für Stufe angegeben.

04

Benchmarks folgen

Echte Token/s gemessen auf physischer Hardware werden so bald wie möglich veröffentlicht.

katalog

Drei Referenz-Builds. Richtkosten.

geschätzte Build-Kosten · Marktpreis 2026
// 01 · Solo dev · Forschung · interne Experimente

Starter

Erstes Solo-KI-Rig

ab
4 990 € HTzzgl. MwSt. · Teile
GPU · VRAM
1× RTX 509032 GB
Starter — Silent-Tower
Spec
  • ·AMD Ryzen 7 7700X (8C / 16T)
  • ·32 GB DDR5-6000
  • ·1 TB NVMe Gen 4
  • ·Netzteil 850 W 80+ Gold
  • ·Herstellergarantien der Komponenten
Läuft zum Beispiel
  • Llama 3.3 70B · Q3
  • Qwen 2.5 32B · Q5
  • Gemma 4 31B · Q5
  • Mistral 7B · FP16
  • DeepSeek R1 Distill 32B · Q5
Software
  • ·Ubuntu 24.04 LTS
  • ·NVIDIA-Treiber + CUDA
  • ·Ollama + Open WebUI (Open-Source, zu installieren)
  • ·Optimierter llama.cpp Build
// 02 · Agentur · KMU · Kanzlei · Datenteam
popular

Pro

Das Team-RAG-Rig

ab
11 990 € HTzzgl. MwSt. · Teile
GPU · VRAM
2× RTX 509064 GB
Pro — 4U-Rack
Spec
  • ·AMD Ryzen 7 7700X (8C / 16T)
  • ·64 GB DDR5-4800 ECC UDIMM
  • ·1 TB NVMe Gen 4
  • ·Netzteil 1500 W 80+ Platinum
  • ·Herstellergarantien der Komponenten
Läuft zum Beispiel
  • Llama 3.3 70B · Q8
  • DeepSeek R1 Distill 70B · Q8
  • Qwen 2.5 72B · Q5
  • Mixtral 8x7B · FP16
  • Mistral Large 123B · Q4
Software
  • ·Alles aus Starter +
  • ·vLLM mit OpenAI-kompatiblem Server
  • ·RAG-Kit: LlamaIndex + Qdrant konfiguriert + README
  • ·CLI-Monitoring (nvidia-smi, htop, ollama logs)
// 03 · KMU · Kanzlei · Medizin · Mittelstand · öffentlich

Enterprise

KI-Souveränität für KMU

ab
25 990 € HTzzgl. MwSt. · Teile
GPU · VRAM
2× RTX A6000 NVLink96 GB
Enterprise — 4U-Rack
Spec
  • ·AMD Threadripper Pro 7975WX (32C / 64T)
  • ·256 GB DDR5 ECC RDIMM
  • ·8 TB NVMe Gen 5 RAID 10
  • ·Netzteil 2000 W redundant
  • ·Herstellergarantien der Komponenten
Läuft zum Beispiel
  • Llama 3.3 70B · FP16
  • Mistral Large 123B · Q5
  • Qwen 2.5 72B · Q8
  • Mixtral 8x22B · Q5
  • Llama 4 Scout · Q5
Software
  • ·Alles aus Pro +
  • ·Multi-GPU Tensor Parallel konfiguriert (NVLink)
  • ·Open WebUI Multi-User · OIDC bereit
  • ·DSGVO / AI-Act Compliance-Doku inklusive

indikative Netto-Build-Kosten (nur Teile, ohne Montage) · an deinen Use Case anzupassen · Localia verkauft nicht, liefert nicht

◆ custom

Jenseits der Referenz-Builds.

Alles außerhalb der Standard-Builds: vollständige RAG-Integration auf deinen Dokumenten, Grafana-Dashboards, Custom-SSO (fein granulares RBAC, HDS-konformes Audit), White-Label-UI, Datacenter-GPUs (H100 / H200 / B200 / MI300X), Multi-Rack, strikte SLA, Sicherheitsaudit, Team-Schulung. Localia verkauft diese Leistungen nicht; wir können dich an die richtigen Ansprechpartner verweisen und beim Scoping helfen.

H100 / H200MI300XMulti-RackStrikte SLAEnterprise-RAGSicherheitsauditTeam-SchulungWartung
Für Beratung schreiben
process

So nutzt du diese Builds.

  1. 01
    Schritt 1

    Build wählen

    Finde den Referenz-Build, der deinem Use Case am nächsten kommt.

  2. 02
    Schritt 2

    Kosten schätzen

    Öffne den Rechner, um die Build-Kosten für deine Modelle zu schätzen.

  3. 03
    Schritt 3

    Komponenten sourcen

    Kaufe die Komponenten selbst bei den Distributoren deiner Wahl.

  4. 04
    Schritt 4

    Stack installieren

    Folge unseren Guides, um Ollama, Open WebUI und den RAG-Stack zu installieren.

faq

Häufige Fragen.

Verkauft Localia diese Rigs?+
Nein. Localia ist eine unabhängige Ressource: Diese Builds sind lehrreiche Referenzen, um dein eigenes Rig zu bauen. Kein Lager, kein Verkauf, keine Lieferung.
Welchen Software-Stack nutzen?+
Ubuntu 24.04 LTS · NVIDIA-Treiber · CUDA · Ollama · Open WebUI · llama.cpp · vLLM · RAG-Stack (LlamaIndex + Qdrant). Alles Open-Source, mit unseren Guides zu installieren.
Welche Modelle laufen darauf?+
Je nach Build: Llama 3.3 70B, Mistral Large, Qwen 2.5 72B, DeepSeek R1, Gemma 4. Der Rechner sagt dir, was in den VRAM passt.
Und die Garantie?+
Jede Komponente behält die Garantie ihres Herstellers (GPU, Mainboard, Netzteil usw.). Localia ist kein Verkäufer und gibt daher keine Garantie auf das montierte Ganze.
Was, wenn ich später aufrüsten will?+
Jeder Referenz-Build ist auf +1 oder +2 zusätzliche GPUs ausgelegt (freie PCIe-Slots + dimensioniertes Netzteil). Beim Komponentenkauf einplanen.

Bereit für lokale KI?

Frage zur Wahl eines Rigs? Beschreibe deinen Fall in zwei Sätzen: Wir verweisen dich auf den richtigen Referenz-Build — ohne dir etwas zu verkaufen.

Für Beratung schreiben

Antwort in 24 Geschäftsstunden · contact@getlocalia.com