Produkt
Eine Box. Strom. LAN. Browser. Läuft.
Die KI:KUBE ist keine Softwarelizenz und kein Cloud-Account, sondern eine vorkonfigurierte Hardware-Appliance. Was drin ist, wie sie arbeitet, was Sie an Tag 1 und Tag 2 erleben.
Spezifikationen
Hardware in Zahlen
- Compute
- 4× NVIDIA DGX Spark
- GPU-Memory (gesamt)
- 512 GB Unified
- Inference-Leistung (theoretisch)
- ~4 PFLOPS FP4 (Sparse) / ~1 PFLOP INT8 dense
- Inference-Leistung (gemessen)
- 438 tok/s n=8 @ Qwen3.6-35B-A3B-NVFP4 (4-Node, 2026-05-22) · 426 tok/s @ FP8-Variante
- Internes Netz
- MikroTik 400GbE-Switch (QSFP56-DD), je Spark 200 GbE
- Formfaktor
- 19-Zoll-Rack, 18 HE (einheitlich für KI:KUBE 2 / 4 / 6 / 8)*
- Leistungsaufnahme
- ~0,6 kW unter Inferenz-Volllast (KI:KUBE 4, gemessen); im Leerlauf deutlich darunter
- Schnittstelle nach außen
- 1× / 2× 10 GbE LAN
- Stromanschluss
- 1× Schuko 16A genügt (alle Stufen); optional 2× Schuko für Redundanz
Konkrete Werte abhängig von Konfiguration und Lieferzeitpunkt, verbindlich im Angebot.
* Gilt für KI:KUBE 2 / 4 / 6 / 8 im einheitlichen 18-HE-Rack. Die KI:KUBE 2-slim (2 Sparks) ist als kompakte 10-Zoll-Variante erhältlich: abweichender Formfaktor, ohne 400GbE-Inference-Switch.
Im Detail
Detaillierte Aspekte des Produkts
Vier Blickwinkel für IT-Leitungen, Einkauf und Anwender.
Hardware
4× DGX Spark, MikroTik 400GbE-Switch (QSFP56-DD), 19-Zoll-Gehäuse (18 HE), ~0,6 kW unter Inferenz-Volllast (KI:KUBE 4, gemessen); im Leerlauf deutlich darunter.
Mehr erfahren →Software-Stack
K3s, SGLang, Open WebUI / Hermes WebUI, Hermes Agent (E-Mail), RAG-Pipeline, Monitoring, vorkonfiguriert und Git-versioniert.
Mehr erfahren →Statusdisplay
Frontseitiges Kiosk-Display mit ROI-Ticker und Cluster-Health.
Mehr erfahren →Lieferumfang
Was im Karton ist, was Sie selbst stellen, was wir konfigurieren.
Mehr erfahren →Erlebnis
Tag 1 vs. Tag 2 und danach
Vom Auspacken bis zum eingespielten Routine-Werkzeug.
Tag 1
- Box wird angeliefert (Spedition, palettiert)
- 19-Zoll-Einbau im Rack oder als Standgerät
- Strom + LAN anschließen: Display zeigt IP
- Erste Logins per SSO oder lokalem Admin
- Vorgesehene Modelle bereits ladebereit
Tag 2+
- Eigene Dokumente in RAG-Pipeline einspeisen
- Modellauswahl nach Use Case (Validated Profiles)
- User im WebUI (Open WebUI / Hermes WebUI) bzw. am Hermes-Agent-Postfach per Gruppen / Rollen anlegen
- Optional: IDE-Anbindung für Coding-Workflows
- Monitoring im Grafana-Dashboard verfolgen
Ehrlich gesagt
Was nicht drin ist.
Wir liefern keine eigenen Modell-Weights. Wir kuratieren Open-Source-Modelle (Qwen, Llama, DeepSeek, Mistral, Codestral …) und stellen Validated Profiles zur Verfügung: Modell × Engine × Quantisierung × Hardware-Topologie, alles getestet und benchmarked.
Wir sind kein OpenAI-Konkurrent. KI:KUBE ist die On-Prem-Alternative, wo Cloud-KI strukturell nicht passt. Für unkritische Anwendungen kann die Cloud weiterhin sinnvoll sein, und für Frontier-Spielraum gibt es Hybrid-Strategien (siehe Pressestimmen).
Wir sind kein KIS-, ERP- oder DATEV-Hersteller. KI:KUBE arbeitet auf Daten, die diese Systeme exportieren. Wir liefern stabile API-Schnittstellen, keine Tiefenintegration in Fremdsysteme.
Sehen Sie KI:KUBE an einem Ihrer eigenen Dokumente.
Demo anfragen