/rigs · drei Gehäuse · build-to-order

Schlüsselfertige
KI-Workstations.

Drei vorkonfigurierte Stufen, OS installiert, Treiber bereit, Modelle geladen. Anschließen und lokal servieren.

01 · Souveränität

Sensible Daten (Recht, Medizin, HR, F&E) verlassen niemals deine Mauern. DSGVO- und AI-Act-konform.

02 · Begrenzte Kosten

Ein Pro-Rig amortisiert sich in ~6 Monaten gegenüber 1500 €/Monat API in Skala. Grenzkosten danach nahe null.

03 · Aktuelle Modelle

Modell-Updates inklusive nach Validierung: Download, passende Quantisierung, Launch-Test, Doku.

trust

Klar vor der Anzahlung.

LocalIA startet build-to-order: kein Phantomlager, keine erfundenen Benchmarks. Das Angebot ist explizit.

01

Schriftliches Angebot

Nettopreis, Konfiguration, Zeitplan und Performance-Annahmen vor jeder Zahlung.

02

Gerahmte Anzahlung

Die Anzahlung finanziert Komponenten. Erstattungsfähig, solange die Montage nicht begonnen hat.

03

Maschinentest

Jedes Rig wird vor Versand stress-getestet: Speicher, GPU, Temperaturen, Storage und Dienste.

04

Belege folgen

Fotos, Video und echte Token/s werden veröffentlicht, sobald das erste Show-Rig steht.

katalog

Drei Stufen. 50% Anzahlung.

2-4 Wochen Lieferung · fester Nettopreis
// 01 · Solo dev · Forschung · interne Experimente

Starter

Erstes Solo-KI-Rig

4 990 € HTzzgl. MwSt. · geliefert
GPU · VRAM
1× RTX 509032 GB
Starter — Silent-Tower
Spec
  • ·AMD Ryzen 9 9950X (16C / 32T)
  • ·64 GB DDR5-6000
  • ·2 TB NVMe Gen 4
  • ·Netzteil 1000 W 80+ Gold
  • ·1 Jahr Teile- & Arbeitsgarantie
Läuft zum Beispiel
  • Llama 3.3 70B · Q3
  • Qwen 2.5 32B · Q5
  • Gemma 4 31B · Q5
  • Mistral 7B · FP16
  • DeepSeek R1 Distill 32B · Q5
Software
  • ·Ubuntu 24.04 LTS
  • ·NVIDIA-Treiber + CUDA
  • ·Ollama + Open WebUI vorinstalliert
  • ·Optimierter llama.cpp Build
// 02 · Agentur · KMU · Kanzlei · Datenteam
popular

Pro

Das Team-RAG-Rig

11 990 € HTzzgl. MwSt. · geliefert
GPU · VRAM
2× RTX 509064 GB
Pro — 4U-Rack
Spec
  • ·AMD Threadripper 7960X (24C / 48T)
  • ·128 GB DDR5 ECC
  • ·4 TB NVMe Gen 5 (RAID 1 optional)
  • ·Netzteil 1600 W 80+ Platinum
  • ·2 Jahre Teile- & Arbeitsgarantie
Läuft zum Beispiel
  • Llama 3.3 70B · Q8
  • DeepSeek R1 Distill 70B · Q8
  • Qwen 2.5 72B · Q5
  • Mixtral 8x7B · FP16
  • Mistral Large 123B · Q4
Software
  • ·Alles aus Starter +
  • ·vLLM mit OpenAI-kompatiblem Server
  • ·RAG-Kit: LlamaIndex + Qdrant konfiguriert + README
  • ·CLI-Monitoring (nvidia-smi, htop, ollama logs)
// 03 · KMU · Kanzlei · Medizin · Mittelstand · öffentlich

Enterprise

KI-Souveränität für KMU

ab
25 990 € HTzzgl. MwSt. · geliefert
GPU · VRAM
2× RTX A6000 NVLink96 GB
Enterprise — 4U-Rack
Spec
  • ·AMD Threadripper Pro 7975WX (32C / 64T)
  • ·256 GB DDR5 ECC RDIMM
  • ·8 TB NVMe Gen 5 RAID 10
  • ·Netzteil 2000 W redundant
  • ·3 Jahre Teile- & Arbeitsgarantie
Läuft zum Beispiel
  • Llama 3.3 70B · FP16
  • Mistral Large 123B · Q5
  • Qwen 2.5 72B · Q8
  • Mixtral 8x22B · Q5
  • Llama 4 Scout · Q5
Software
  • ·Alles aus Pro +
  • ·Multi-GPU Tensor Parallel konfiguriert (NVLink)
  • ·Open WebUI Multi-User · OIDC bereit
  • ·DSGVO / AI-Act Compliance-Doku inklusive

Richtpreise netto · finale Konfigurationen nach Use Case und Angebot · Teile- und Arbeitsgarantie inklusive

◆ custom

Jenseits des Rigs.

Alles außerhalb der Standard-Tiers: vollständige RAG-Integration auf deinen Dokumenten, Grafana-Dashboards, Custom-SSO (fein granulares RBAC, HDS-konformes Audit), White-Label-UI, Datacenter-GPUs (H100 / H200 / B200 / MI300X), Multi-Rack, strikte SLA, Sicherheitsaudit, Team-Schulung. Beziffertes Angebot in 48 Geschäftsstunden — wir sagen klar, was enthalten ist und was separat berechnet wird.

H100 / H200MI300XMulti-RackSLA auf AnfrageEnterprise-RAGSicherheitsauditTeam-SchulungWartung
Projekt besprechen
Support-Pakete

Nach der Lieferung,
stehen wir an deiner Seite.

Jedes Rig wird mit 30 Tagen E-Mail-Support geliefert. Danach drei Pläne nach Kritikalität — keine lange Bindung, jährlich kündbar.

// 01
Standard

Solo dev · interne Nutzung

290 € / Jahr
oder 29 € / Monat · keine Bindung
  • Email — Antwort in 48 Geschäftsstunden
  • 1 Treiber / OS Update pro Jahr
  • Remote-Diagnose: 5 h / Jahr
  • Zugang zum privaten Community-Kanal
Abonnieren
// 02
Pro

Agentur · KMU · Data-Team

790 € / Jahr
oder 79 € / Monat · spare 158 €
  • Email — Antwort in 24 Geschäftsstunden
  • 2 Treiber / Modell-Updates pro Jahr
  • Unbegrenzte Remote-Diagnose per Mail
  • 1 Scoping Call 1 h / Jahr
  • Produkt-Support priorisiert
Abonnieren
// 03
Premium

KMU · Kanzlei · Mittelstand

1.790 € / Jahr
nur Enterprise-Tarif
  • Email — Antwort in 8 Geschäftsstunden
  • 4 Calls / Jahr (1 pro Quartal)
  • Quartalsweise Performance-Audit (Remote)
  • Unbegrenzte Remote-Diagnose
  • Config-Backup + Wiederherstellungsplan
Abonnieren

Abdeckung Mo. → Fr., 9-19 Uhr Pariser Zeit. Keine Nacht- / Wochenend-Bereitschaft (LocalIA wird solo betrieben). Vor-Ort-Einsatz auf Rechnung möglich (800 € netto / Tag + tatsächliche Spesen). Für 24/7-kritische Bedürfnisse empfehlen wir auf Anfrage einen Managed-Services-Partner.

process

Von der Anzahlung zum ersten LAN-Token.

  1. 01
    Angebot · 48h

    Scope

    Du beschreibst deinen Use Case. Begründete Antwort, fester Preis.

  2. 02
    50% Anzahlung

    Anzahlung

    Überweisung 14 Tage erstattungsfähig, solange die Montage nicht begonnen hat.

  3. 03
    Build 2-4 Wo.

    Build

    Komponenten, Montage, OS, Modelle. 24h Memtest + GPU Burn.

  4. 04
    Lieferung + Setup

    Lieferung

    Versicherter Versand. 1h Remote-Setup inklusive.

faq

Häufige Fragen.

Welche Software ist vorinstalliert?+
Ubuntu 24.04 LTS · NVIDIA-Treiber · CUDA · Ollama · Open WebUI · llama.cpp · vLLM (Pro+) · RAG-Stack (Pro+). Du bekommst eine Maschine, die direkt mit deinen PDFs spricht.
Welche Modelle sind enthalten?+
Wahlweise: Llama 3.3 70B, Mistral Large, Qwen 2.5 72B, DeepSeek R1, Gemma 4. Modell-Updates inklusive im ersten Jahr.
Garantie und Support?+
Teile- und Arbeitsgarantie: 1 Jahr (Starter), 2 Jahre (Pro), 3 Jahre (Enterprise). 30 Tage Email-Support inklusive, danach Standard (290 €/Jahr), Pro (790 €/Jahr) oder Premium (1 790 €/Jahr) je nach gewünschtem Service-Level.
Lieferzeit?+
2 bis 4 Wochen abhängig von der GPU-Verfügbarkeit. RTX 5090 und A6000 haben manchmal 1-2 Wochen Lieferzeit beim Distributor.
Leasing möglich?+
Ja für Pro und Enterprise — Raten über 24 oder 36 Monate via Finanzpartner. Details im Angebot.
Was, wenn ich später aufrüsten will?+
Jede Konfiguration ist auf +1 oder +2 zusätzliche GPUs ausgelegt (freie PCIe-Slots + dimensioniertes Netzteil). Upgrade-Service auf Anfrage.

Bereit für lokale KI?

Beschreibe deinen Fall in zwei Sätzen. Antwort mit Konfig und Preis in 48 Geschäftsstunden.

Anfrage senden

Antwort in 24 Geschäftsstunden · contact@getlocalia.com