KI:KUBE

Produkt · Hardware

4× DGX Spark, 400GbE-Backbone, ein Schrank.

Kein Vendor-Lock-in, keine proprietäre Blackbox: ein kuratiertes Gesamtsystem, das Ihre eigene IT betreiben und warten kann.

512 GB
Unified GPU-Memory
NVIDIA DGX Spark
~0,6 kW
Inferenz-Volllast (KI:KUBE 4)
18 HE
19-Zoll-Rack, einheitlich*

Gemessene Werte für KI:KUBE 4; konkrete Werte je nach Konfiguration, verbindlich im Angebot.

* Einheitliches 19-Zoll-Rack für KI:KUBE 2 / 4 / 6 / 8. Die KI:KUBE 2-slim (2 Sparks) ist als kompakte 10-Zoll-Variante erhältlich: abweichender Formfaktor, ohne 400GbE-Inference-Switch.

Im Detail

Was in der Box steckt

Vier Bausteine, ausgelegt auf produktive Inferenz, nicht auf Trainings-Showcases.

Compute

NVIDIA DGX Spark

Vier DGX-Spark-Module mit je 128 GB Unified Memory bilden das Herz der KI:KUBE, NVIDIAs inferenz-zentrierter Knoten, ideal für NVFP4 / FP8 / INT8. Über die hochbandbreitige interne Verbindung entsteht ein einheitlicher Speicheradressraum von 512 GB.

Modelle bis ~400B-Parameter (z.B. Qwen3.5-397B in NVFP4) laufen auf einer einzigen KI:KUBE 4, ebenso Qwen3-235B (Grouped Attention) oder DeepSeek-V3 (MoE).

Netzwerk

MikroTik 400GbE-Switch

Ein dediziertes 400-GbE-Backbone (QSFP56-DD) verbindet die Compute-Knoten: jeder Spark mit 200 GbE angebunden. Damit sind Tensor-Parallel- und Expert-Parallel-Topologien (TP, PP, EP) performant möglich.

Nach außen reicht eine 10-GbE-Anbindung an Ihr LAN, der interne Verkehr bleibt im Schrank.

Gehäuse

19-Zoll-Rack, 18 HE

KI:KUBE 2 / 4 / 6 / 8 im gleichen 18-HE-Gehäuse*, bei kleineren Stufen sind Slots für spätere Upgrades reserviert. Unter Inferenz-Volllast unter 0,9 kW (KI:KUBE 6 Richtwert; KI:KUBE 4 rund 0,6 kW, gemessen).

Kein Spezial-Kühlsystem, kein Wasserkreislauf, USV-anschließbar. Optional als Standgerät mit dezentem Outdoor-Look (z.B. Empfangsbereich).

* Ausnahme: Die KI:KUBE 2-slim kommt im kompakten 10-Zoll-Gehäuse (2 Sparks, ohne 400GbE-Inference-Switch).

Lebensdauer

5–7 Jahre produktiv

NVIDIA-Herstellergarantie 1 Jahr, gesetzliche Gewährleistung nach den vertraglichen Bedingungen (B2B), erweiterte Hardware-Abdeckung über unsere Care-Pakete.

Realistische produktive Nutzungsdauer 5–7 Jahre. Modelle und Konfiguration sind Git-versioniert: Migration auf neuere Hardware-Generation jederzeit möglich.

KI:KUBE 2-slim: kompaktes 10-Zoll-Rack mit 2 DGX Spark, Control-Node und Management-Switch

Kompakte Variante

KI:KUBE 2-slim

Der Einstieg ins KI:KUBE-Ökosystem im kompakten 10-Zoll-Gehäuse: zwei DGX Spark (256 GB Unified Memory), Control-Node und Management-Switch, ohne dediziertes 400GbE-Inference-Backbone. Ideal für kleinere Teams, Edge-Standorte oder als Pilotsystem für einen späteren Umstieg auf eine volle KI:KUBE.

  • 2× NVIDIA DGX Spark: 256 GB Unified GPU-Memory
  • Kompaktes 10-Zoll-Rack statt 18-HE-Schrank
  • Eine Schuko-Steckdose, leiser Bürobetrieb
  • Gleicher Software-Stack wie KI:KUBE 2 / 4 / 6 / 8

Ein direkter Ausbau der 2-slim auf KI:KUBE 4 / 6 ist nicht möglich: es fehlen der 400GbE-Interconnect-Switch und der Platz im 10-Zoll-Gehäuse. Der Umstieg erfolgt über die reguläre KI:KUBE im 18-HE-Rack.

Souveränität

Herstellerneutral & selbst wartbar

Sogar die DGX-Spark-Rechenbausteine sind ein NVIDIA-Referenzdesign, das mehrere OEMs baugleich bauen, der Rest ist ohnehin handelsübliche Standard-Hardware. Kein Vendor-Lock-in, keine Blackbox, kein Zwang zu einem Spezial-Support-Vertrag und keinem Gold-Partner.

Multi-OEM-Rechenbausteine

Die DGX Spark (GB10-Superchip) ist ein NVIDIA-Referenzdesign: auf gleicher Architektur-Basis baugleich gebaut von NVIDIA, ASUS, HP, Dell, Lenovo, MSI und Gigabyte. Ein ausgefallener Node ist durch eine OEM-Einheit ersetzbar, im Retail beschaffbar, kein Single-Vendor-Bezug.

Standard-Hardware drumherum

Switch, Control-Node, Rack und Netzteile sind handelsübliche Komponenten: Ersatzteile am Markt frei verfügbar, oft Next-Day von jedem Distributor. Kein Gold-Partner, kein Wartepuffer auf einen einzigen Lieferanten.

Wartung mit normaler IT

Betrieb und Wartung laufen mit Standard-Linux-/Kubernetes-Kenntnissen: kein Server-Engineer, kein NVIDIA-Spezialist nötig. Auf Wunsch übernehmen wir es per Care.

Ehrlich eingeordnet: Mehr Einzelteile (mehrere Nodes + Switch + Control-Node) heißt statistisch auch mehr mögliche Ausfallpunkte, und Switch und Control-Node sind auch bei uns Single Points. Der Vorteil liegt nicht zwingend in einer geringeren Ausfallhäufigkeit, sondern in Reparierbarkeit und Wiederherstellzeit (MTTR): Im Defektfall tauschen Sie im Worst Case einen einzelnen Node statt einen ganzen Server zur RMA zu geben, je nach Topologie läuft der Rest degradiert weiter.

Wer auf Nummer sicher gehen will, stellt aus Redundanzgründen einfach eine zweite KI:KUBE daneben, und freut sich im Normalbetrieb über die doppelte Leistung 😊

Aufstellung

Strom, Klima, Stellplatz

Was der Aufstellort mitbringen muss, in der Regel: überraschend wenig.

Strom

1× Schuko 16A genügt für alle Ausbaustufen (unter Inferenz-Volllast max. ~0,9 kW). Optional 2× Schuko für Redundanz. Sanfter Anlauf.

Klima

Standard-Bürotemperatur (bis 27 °C Umgebung) ausreichend; bei höherer Auslastung dezidierte Klimatisierung empfohlen.

Stellplatz

ca. 1,2 m² inkl. Wartungsabstand. In bestehendem Serverraum oft ohne Umbau.

Lautstärke

Unter Volllast mit großen, langsam drehenden Lüftern; Geräuschpegel deutlich unter dem typischer 1HE-Rack-Server.

Sehen Sie KI:KUBE an einem Ihrer eigenen Dokumente.

Demo anfragen