Produkt · Hardware
4× DGX Spark, 400GbE-Backbone, ein Schrank.
Kein Vendor-Lock-in, keine proprietäre Blackbox: ein kuratiertes Gesamtsystem, das Ihre eigene IT betreiben und warten kann.
Gemessene Werte für KI:KUBE 4; konkrete Werte je nach Konfiguration, verbindlich im Angebot.
* Einheitliches 19-Zoll-Rack für KI:KUBE 2 / 4 / 6 / 8. Die KI:KUBE 2-slim (2 Sparks) ist als kompakte 10-Zoll-Variante erhältlich: abweichender Formfaktor, ohne 400GbE-Inference-Switch.
Im Detail
Was in der Box steckt
Vier Bausteine, ausgelegt auf produktive Inferenz, nicht auf Trainings-Showcases.
NVIDIA DGX Spark
Vier DGX-Spark-Module mit je 128 GB Unified Memory bilden das Herz der KI:KUBE, NVIDIAs inferenz-zentrierter Knoten, ideal für NVFP4 / FP8 / INT8. Über die hochbandbreitige interne Verbindung entsteht ein einheitlicher Speicheradressraum von 512 GB.
Modelle bis ~400B-Parameter (z.B. Qwen3.5-397B in NVFP4) laufen auf einer einzigen KI:KUBE 4, ebenso Qwen3-235B (Grouped Attention) oder DeepSeek-V3 (MoE).
MikroTik 400GbE-Switch
Ein dediziertes 400-GbE-Backbone (QSFP56-DD) verbindet die Compute-Knoten: jeder Spark mit 200 GbE angebunden. Damit sind Tensor-Parallel- und Expert-Parallel-Topologien (TP, PP, EP) performant möglich.
Nach außen reicht eine 10-GbE-Anbindung an Ihr LAN, der interne Verkehr bleibt im Schrank.
19-Zoll-Rack, 18 HE
KI:KUBE 2 / 4 / 6 / 8 im gleichen 18-HE-Gehäuse*, bei kleineren Stufen sind Slots für spätere Upgrades reserviert. Unter Inferenz-Volllast unter 0,9 kW (KI:KUBE 6 Richtwert; KI:KUBE 4 rund 0,6 kW, gemessen).
Kein Spezial-Kühlsystem, kein Wasserkreislauf, USV-anschließbar. Optional als Standgerät mit dezentem Outdoor-Look (z.B. Empfangsbereich).
* Ausnahme: Die KI:KUBE 2-slim kommt im kompakten 10-Zoll-Gehäuse (2 Sparks, ohne 400GbE-Inference-Switch).
5–7 Jahre produktiv
NVIDIA-Herstellergarantie 1 Jahr, gesetzliche Gewährleistung nach den vertraglichen Bedingungen (B2B), erweiterte Hardware-Abdeckung über unsere Care-Pakete.
Realistische produktive Nutzungsdauer 5–7 Jahre. Modelle und Konfiguration sind Git-versioniert: Migration auf neuere Hardware-Generation jederzeit möglich.
Kompakte Variante
KI:KUBE 2-slim
Der Einstieg ins KI:KUBE-Ökosystem im kompakten 10-Zoll-Gehäuse: zwei DGX Spark (256 GB Unified Memory), Control-Node und Management-Switch, ohne dediziertes 400GbE-Inference-Backbone. Ideal für kleinere Teams, Edge-Standorte oder als Pilotsystem für einen späteren Umstieg auf eine volle KI:KUBE.
- 2× NVIDIA DGX Spark: 256 GB Unified GPU-Memory
- Kompaktes 10-Zoll-Rack statt 18-HE-Schrank
- Eine Schuko-Steckdose, leiser Bürobetrieb
- Gleicher Software-Stack wie KI:KUBE 2 / 4 / 6 / 8
Ein direkter Ausbau der 2-slim auf KI:KUBE 4 / 6 ist nicht möglich: es fehlen der 400GbE-Interconnect-Switch und der Platz im 10-Zoll-Gehäuse. Der Umstieg erfolgt über die reguläre KI:KUBE im 18-HE-Rack.
Souveränität
Herstellerneutral & selbst wartbar
Sogar die DGX-Spark-Rechenbausteine sind ein NVIDIA-Referenzdesign, das mehrere OEMs baugleich bauen, der Rest ist ohnehin handelsübliche Standard-Hardware. Kein Vendor-Lock-in, keine Blackbox, kein Zwang zu einem Spezial-Support-Vertrag und keinem Gold-Partner.
Multi-OEM-Rechenbausteine
Die DGX Spark (GB10-Superchip) ist ein NVIDIA-Referenzdesign: auf gleicher Architektur-Basis baugleich gebaut von NVIDIA, ASUS, HP, Dell, Lenovo, MSI und Gigabyte. Ein ausgefallener Node ist durch eine OEM-Einheit ersetzbar, im Retail beschaffbar, kein Single-Vendor-Bezug.
Standard-Hardware drumherum
Switch, Control-Node, Rack und Netzteile sind handelsübliche Komponenten: Ersatzteile am Markt frei verfügbar, oft Next-Day von jedem Distributor. Kein Gold-Partner, kein Wartepuffer auf einen einzigen Lieferanten.
Wartung mit normaler IT
Betrieb und Wartung laufen mit Standard-Linux-/Kubernetes-Kenntnissen: kein Server-Engineer, kein NVIDIA-Spezialist nötig. Auf Wunsch übernehmen wir es per Care.
Ehrlich eingeordnet: Mehr Einzelteile (mehrere Nodes + Switch + Control-Node) heißt statistisch auch mehr mögliche Ausfallpunkte, und Switch und Control-Node sind auch bei uns Single Points. Der Vorteil liegt nicht zwingend in einer geringeren Ausfallhäufigkeit, sondern in Reparierbarkeit und Wiederherstellzeit (MTTR): Im Defektfall tauschen Sie im Worst Case einen einzelnen Node statt einen ganzen Server zur RMA zu geben, je nach Topologie läuft der Rest degradiert weiter.
Wer auf Nummer sicher gehen will, stellt aus Redundanzgründen einfach eine zweite KI:KUBE daneben, und freut sich im Normalbetrieb über die doppelte Leistung 😊
Aufstellung
Strom, Klima, Stellplatz
Was der Aufstellort mitbringen muss, in der Regel: überraschend wenig.
Strom
1× Schuko 16A genügt für alle Ausbaustufen (unter Inferenz-Volllast max. ~0,9 kW). Optional 2× Schuko für Redundanz. Sanfter Anlauf.
Klima
Standard-Bürotemperatur (bis 27 °C Umgebung) ausreichend; bei höherer Auslastung dezidierte Klimatisierung empfohlen.
Stellplatz
ca. 1,2 m² inkl. Wartungsabstand. In bestehendem Serverraum oft ohne Umbau.
Lautstärke
Unter Volllast mit großen, langsam drehenden Lüftern; Geräuschpegel deutlich unter dem typischer 1HE-Rack-Server.
Sehen Sie KI:KUBE an einem Ihrer eigenen Dokumente.
Demo anfragen