Produkt

Eine Box. Strom. LAN. Browser. Läuft.

Die KI:KUBE ist keine Softwarelizenz und kein Cloud-Account, sondern eine vorkonfigurierte Hardware-Appliance. Was drin ist, wie sie arbeitet, was Sie an Tag 1 und Tag 2 erleben.

Spezifikationen

Hardware in Zahlen

Compute: 4× NVIDIA DGX Spark
GPU-Memory (gesamt): 512 GB Unified
Inference-Leistung (theoretisch): ~4 PFLOPS FP4 (Sparse) / ~1 PFLOP INT8 dense
Inference-Leistung (gemessen): 438 tok/s n=8 @ Qwen3.6-35B-A3B-NVFP4 (4-Node, 2026-05-22) · 426 tok/s @ FP8-Variante
Internes Netz: MikroTik 400GbE-Switch (QSFP56-DD), je Spark 200 GbE
Formfaktor: 19-Zoll-Rack, 18 HE (einheitlich für KI:KUBE 2 / 4 / 6 / 8)*
Leistungsaufnahme: ~0,6 kW unter Inferenz-Volllast (KI:KUBE 4, gemessen); im Leerlauf deutlich darunter
Schnittstelle nach außen: 1× / 2× 10 GbE LAN
Stromanschluss: 1× Schuko 16A genügt (alle Stufen); optional 2× Schuko für Redundanz

Konkrete Werte abhängig von Konfiguration und Lieferzeitpunkt, verbindlich im Angebot.

* Gilt für KI:KUBE 2 / 4 / 6 / 8 im einheitlichen 18-HE-Rack. Die KI:KUBE 2-slim (2 Sparks) ist als kompakte 10-Zoll-Variante erhältlich: abweichender Formfaktor, ohne 400GbE-Inference-Switch.

Im Detail

Detaillierte Aspekte des Produkts

Vier Blickwinkel für IT-Leitungen, Einkauf und Anwender.

Hardware

4× DGX Spark, MikroTik 400GbE-Switch (QSFP56-DD), 19-Zoll-Gehäuse (18 HE), ~0,6 kW unter Inferenz-Volllast (KI:KUBE 4, gemessen); im Leerlauf deutlich darunter.

Mehr erfahren →

Software-Stack

K3s, SGLang, Open WebUI / Hermes WebUI, Hermes Agent (E-Mail), RAG-Pipeline, Monitoring, vorkonfiguriert und Git-versioniert.

Mehr erfahren →

Statusdisplay

Frontseitiges Kiosk-Display mit ROI-Ticker und Cluster-Health.

Mehr erfahren →

Lieferumfang

Was im Karton ist, was Sie selbst stellen, was wir konfigurieren.

Mehr erfahren →

Erlebnis

Tag 1 vs. Tag 2 und danach

Vom Auspacken bis zum eingespielten Routine-Werkzeug.

Tag 1

Box wird angeliefert (Spedition, palettiert)
19-Zoll-Einbau im Rack oder als Standgerät
Strom + LAN anschließen: Display zeigt IP
Erste Logins per SSO oder lokalem Admin
Vorgesehene Modelle bereits ladebereit

Tag 2+

Eigene Dokumente in RAG-Pipeline einspeisen
Modellauswahl nach Use Case (Validated Profiles)
User im WebUI (Open WebUI / Hermes WebUI) bzw. am Hermes-Agent-Postfach per Gruppen / Rollen anlegen
Optional: IDE-Anbindung für Coding-Workflows
Monitoring im Grafana-Dashboard verfolgen

Ehrlich gesagt

Was nicht drin ist.

Wir liefern keine eigenen Modell-Weights. Wir kuratieren Open-Source-Modelle (Qwen, Llama, DeepSeek, Mistral, Codestral …) und stellen Validated Profiles zur Verfügung: Modell × Engine × Quantisierung × Hardware-Topologie, alles getestet und benchmarked.

Wir sind kein OpenAI-Konkurrent. KI:KUBE ist die On-Prem-Alternative, wo Cloud-KI strukturell nicht passt. Für unkritische Anwendungen kann die Cloud weiterhin sinnvoll sein, und für Frontier-Spielraum gibt es Hybrid-Strategien (siehe Pressestimmen).

Wir sind kein KIS-, ERP- oder DATEV-Hersteller. KI:KUBE arbeitet auf Daten, die diese Systeme exportieren. Wir liefern stabile API-Schnittstellen, keine Tiefenintegration in Fremdsysteme.

Sehen Sie KI:KUBE an einem Ihrer eigenen Dokumente.

Demo anfragen