KI:KUBE

Modell · 2× DGX Spark

KI:KUBE 2 / KI:KUBE 2-slim

Einstieg in lokale Frontier-KI, für kleinere Teams ohne Kompromiss bei der Datenhoheit.

DGX Spark
GPU-Memory
256 GB
Chat-User parallel
5–10 Chat-User parallel
Preis ab
~18.900 €

Indikativer Wert: die tatsächliche Nutzer-/Stream-Kapazität hängt sehr von der Modellwahl ab.

KI:KUBE 2 (Standard)
ab 22.900 €
System-Kauf · oder Managed ab 1.790 €/Mo
KI:KUBE 2-slim
ab 18.900 €
System-Kauf · oder Managed ab 1.611 €/Mo

Investitionswege & TCO-Rechner auf /preise.

Positionierung

Wann KI:KUBE 2 die richtige Wahl ist

Das passende Werkzeug, wenn Sie heute mit der Cloud-Compliance kämpfen, das Team aber überschaubar ist.

Typische Käufer: Kleine Kanzleien (5–15 Anwälte), StB/WP-Büros mittlerer Größe, Ingenieurbüros bis ~30 MA, Software-Häuser im Ramp-Up.

Hardware

Spezifikation

DGX Spark Knoten
GPU-Memory (Unified)
256 GB
Internes Netz
MikroTik 400GbE-Switch (QSFP56-DD), je Spark 200GbE
Formfaktor
19-Zoll-Rack, 18 HE - alternativ als KI:KUBE 2-slim im kompakten 10-Zoll-Gehäuse
Leistungsaufnahme
~0,3 kW unter Inferenz-Volllast (skaliert aus 4-Node-Lauf)

Highlights

Was diese Stufe besonders macht

Niedrigste Einstiegshürde

22.900 € für den System-Kauf, entspricht ungefähr 16 Monaten ChatGPT Pro für ein 8-Personen-Team.

Volle Compliance-Wirkung

DSGVO, § 203, EU AI Act: strukturelle Lösungen sind unabhängig von der Ausbaustufe.

Upgrade möglich

Upgrade auf KI:KUBE 4 ohne Datenmigration: zwei zusätzliche Spark-Knoten + Topologie-Switch.

KI:KUBE 2-slim: kompaktes 10-Zoll-Rack mit 2 DGX Spark, Control-Node und Management-Switch

Kompakte Variante

KI:KUBE 2-slim

Gleiche Compute wie die KI:KUBE 2 (zwei DGX Spark, 256 GB Unified Memory) im kompakten 10-Zoll-Gehäuse, ohne dediziertes 400GbE-Inference-Backbone. Der günstigste Einstieg ins KI:KUBE-Ökosystem für kleinere Teams, Edge-Standorte oder als Pilotsystem.

System-Kauf ab 18.900 €

oder als Managed-Service ab 1.611 € / Monat.

  • 2× NVIDIA DGX Spark: 256 GB Unified GPU-Memory
  • Kompaktes 10-Zoll-Rack statt 18-HE-Schrank
  • Eine Schuko-Steckdose, leiser Bürobetrieb
  • Gleicher Software-Stack wie KI:KUBE 2 / 4 / 6 / 8

Abweichend von der KI:KUBE 2 entfällt der 400GbE-Inference-Switch: Modell-Auswahl und Throughput entsprechen ansonsten der KI:KUBE 2. Ein direkter Ausbau auf KI:KUBE 4 / 6 ist aus der slim-Variante heraus nicht möglich (fehlender 400GbE-Interconnect-Switch und Platzbedarf im 10-Zoll-Gehäuse), der Umstieg erfolgt über die reguläre KI:KUBE im 18-HE-Rack.

Eignung

Wofür gut, wofür nicht

Empfohlen für

  • Modelle bis ~250B Parameter
  • Throughput-Champion Qwen3.6-35B-A3B-NVFP4 (dense Performance, ~2× kleinerer Memory-Footprint)
  • RAG-Workloads auf eigenen Dokumenten
  • Einzelner Coding-Copilot für 5–15 Devs

Nicht sinnvoll für

  • Höchste Frontier-Modelle (>400B Parameter)
  • Sehr großes paralleles Coding-Lasting (>30 Devs gleichzeitig im IDE)
  • Gleichzeitige Belegung mit zwei großen Modellen ohne Reload

Was läuft darauf?

Beispielhafte Sprachmodelle

Auswahl bekannter Open-Weight-Modelle, die auf dieser Ausbaustufe sinnvoll laufen, die vollständige, validierte Konfiguration ist Bestandteil der Lieferung und wird nicht öffentlich publiziert.

Wichtig: Mit 256 GB Unified Memory laufen auf der KI:KUBE 2 nicht alle großen Modelle. Sinnvoll sind Modelle bis ~250B Parameter (quantisiert). Die größeren Frontier-Modelle (z. B. Qwen3.5-397B, Nemotron-Ultra-550B) benötigen eine KI:KUBE 4 oder 6.

Sprachmodell Use Case Performance (Indikation)
Qwen3.6-35B-A3B-NVFP4 Allround / Coding-Champion ~40 t/s n=1 · ~220 t/s n=8 (skaliert aus 4-Node-Lauf 438 t/s n=8)
Qwen3-235B-A22B-Instruct-FP8 Reasoning, große Kontexte ~25 t/s n=1 · ~18 t/s je Request bei Batch 16 (validiert auf 2 Sparks)
Gemma 4 26B-A4B-it-BF16 Vision + Audio (multimodal) ~25 t/s n=1 · ~115 t/s n=8 (skaliert aus 4-Node-Lauf 231 t/s n=8)

Performance-Werte indikativ, gemessen auf Referenz-Hardware mit SGLang. Tatsächliche Werte hängen von Topologie, Quantisierung, Kontext-Länge und Last ab. Wir besprechen die für Ihren Use-Case relevanten Modelle im Erstgespräch: keine Tabellen-Akrobatik nötig.

Upgrade-Pfad

Erweiterung auf KI:KUBE 4 jederzeit möglich (~10.900 € zusätzlich + Service).

Volle Preisübersicht →

KI:KUBE 2 an einem Ihrer eigenen Dokumente sehen.

Demo anfragen