KI:KUBE

Produkt

Eine Box. Strom. LAN. Browser. Läuft.

Die KI:KUBE ist keine Softwarelizenz und kein Cloud-Account, sondern eine vorkonfigurierte Hardware-Appliance. Was drin ist, wie sie arbeitet, was Sie an Tag 1 und Tag 2 erleben.

Spezifikationen

Hardware in Zahlen

Compute
4× NVIDIA DGX Spark
GPU-Memory (gesamt)
512 GB Unified
Inference-Leistung (theoretisch)
~4 PFLOPS FP4 (Sparse) / ~1 PFLOP INT8 dense
Inference-Leistung (gemessen)
438 tok/s n=8 @ Qwen3.6-35B-A3B-NVFP4 (4-Node, 2026-05-22) · 426 tok/s @ FP8-Variante
Internes Netz
MikroTik 400GbE-Switch (QSFP56-DD), je Spark 200 GbE
Formfaktor
19-Zoll-Rack, 18 HE (einheitlich für KI:KUBE 2 / 4 / 6 / 8)*
Leistungsaufnahme
~0,6 kW unter Inferenz-Volllast (KI:KUBE 4, gemessen); im Leerlauf deutlich darunter
Schnittstelle nach außen
1× / 2× 10 GbE LAN
Stromanschluss
1× Schuko 16A genügt (alle Stufen); optional 2× Schuko für Redundanz

Konkrete Werte abhängig von Konfiguration und Lieferzeitpunkt, verbindlich im Angebot.

* Gilt für KI:KUBE 2 / 4 / 6 / 8 im einheitlichen 18-HE-Rack. Die KI:KUBE 2-slim (2 Sparks) ist als kompakte 10-Zoll-Variante erhältlich: abweichender Formfaktor, ohne 400GbE-Inference-Switch.

Erlebnis

Tag 1 vs. Tag 2 und danach

Vom Auspacken bis zum eingespielten Routine-Werkzeug.

Tag 1

  • Box wird angeliefert (Spedition, palettiert)
  • 19-Zoll-Einbau im Rack oder als Standgerät
  • Strom + LAN anschließen: Display zeigt IP
  • Erste Logins per SSO oder lokalem Admin
  • Vorgesehene Modelle bereits ladebereit

Tag 2+

  • Eigene Dokumente in RAG-Pipeline einspeisen
  • Modellauswahl nach Use Case (Validated Profiles)
  • User im WebUI (Open WebUI / Hermes WebUI) bzw. am Hermes-Agent-Postfach per Gruppen / Rollen anlegen
  • Optional: IDE-Anbindung für Coding-Workflows
  • Monitoring im Grafana-Dashboard verfolgen

Ehrlich gesagt

Was nicht drin ist.

Wir liefern keine eigenen Modell-Weights. Wir kuratieren Open-Source-Modelle (Qwen, Llama, DeepSeek, Mistral, Codestral …) und stellen Validated Profiles zur Verfügung: Modell × Engine × Quantisierung × Hardware-Topologie, alles getestet und benchmarked.

Wir sind kein OpenAI-Konkurrent. KI:KUBE ist die On-Prem-Alternative, wo Cloud-KI strukturell nicht passt. Für unkritische Anwendungen kann die Cloud weiterhin sinnvoll sein, und für Frontier-Spielraum gibt es Hybrid-Strategien (siehe Pressestimmen).

Wir sind kein KIS-, ERP- oder DATEV-Hersteller. KI:KUBE arbeitet auf Daten, die diese Systeme exportieren. Wir liefern stabile API-Schnittstellen, keine Tiefenintegration in Fremdsysteme.

Sehen Sie KI:KUBE an einem Ihrer eigenen Dokumente.

Demo anfragen

KI:KUBE · Render

KI-generierte Visualisierung der KI:KUBE-Appliance.