Modell · 2× DGX Spark

KI:KUBE 2 / KI:KUBE 2-slim

Einstieg in lokale Frontier-KI, für kleinere Teams ohne Kompromiss bei der Datenhoheit.

KI:KUBE 2 im Erstgespräch besprechen

DGX Spark

2×

GPU-Memory

256 GB

Chat-User parallel

5–10 Chat-User parallel

Preis ab

~18.900 €

Indikativer Wert: die tatsächliche Nutzer-/Stream-Kapazität hängt sehr von der Modellwahl ab.

KI:KUBE 2 (Standard)

ab 22.900 €

System-Kauf · oder Managed ab 1.790 €/Mo

KI:KUBE 2-slim

ab 18.900 €

System-Kauf · oder Managed ab 1.611 €/Mo

Investitionswege & TCO-Rechner auf /preise.

Positionierung

Wann KI:KUBE 2 die richtige Wahl ist

Das passende Werkzeug, wenn Sie heute mit der Cloud-Compliance kämpfen, das Team aber überschaubar ist.

Typische Käufer: Kleine Kanzleien (5–15 Anwälte), StB/WP-Büros mittlerer Größe, Ingenieurbüros bis ~30 MA, Software-Häuser im Ramp-Up.

Hardware

Spezifikation

DGX Spark Knoten: 2×
GPU-Memory (Unified): 256 GB
Internes Netz: MikroTik 400GbE-Switch (QSFP56-DD), je Spark 200GbE
Formfaktor: 19-Zoll-Rack, 18 HE - alternativ als KI:KUBE 2-slim im kompakten 10-Zoll-Gehäuse
Leistungsaufnahme: ~0,3 kW unter Inferenz-Volllast (skaliert aus 4-Node-Lauf)

Highlights

Was diese Stufe besonders macht

Niedrigste Einstiegshürde

22.900 € für den System-Kauf, entspricht ungefähr 16 Monaten ChatGPT Pro für ein 8-Personen-Team.

Volle Compliance-Wirkung

DSGVO, § 203, EU AI Act: strukturelle Lösungen sind unabhängig von der Ausbaustufe.

Upgrade möglich

Upgrade auf KI:KUBE 4 ohne Datenmigration: zwei zusätzliche Spark-Knoten + Topologie-Switch.

Kompakte Variante

KI:KUBE 2-slim

Gleiche Compute wie die KI:KUBE 2 (zwei DGX Spark, 256 GB Unified Memory) im kompakten 10-Zoll-Gehäuse, ohne dediziertes 400GbE-Inference-Backbone. Der günstigste Einstieg ins KI:KUBE-Ökosystem für kleinere Teams, Edge-Standorte oder als Pilotsystem.

System-Kauf ab 18.900 €

oder als Managed-Service ab 1.611 € / Monat.

2× NVIDIA DGX Spark: 256 GB Unified GPU-Memory
Kompaktes 10-Zoll-Rack statt 18-HE-Schrank
Eine Schuko-Steckdose, leiser Bürobetrieb
Gleicher Software-Stack wie KI:KUBE 2 / 4 / 6 / 8

Abweichend von der KI:KUBE 2 entfällt der 400GbE-Inference-Switch: Modell-Auswahl und Throughput entsprechen ansonsten der KI:KUBE 2. Ein direkter Ausbau auf KI:KUBE 4 / 6 ist aus der slim-Variante heraus nicht möglich (fehlender 400GbE-Interconnect-Switch und Platzbedarf im 10-Zoll-Gehäuse), der Umstieg erfolgt über die reguläre KI:KUBE im 18-HE-Rack.

Eignung

Wofür gut, wofür nicht

Nicht sinnvoll für

Höchste Frontier-Modelle (>400B Parameter)
Sehr großes paralleles Coding-Lasting (>30 Devs gleichzeitig im IDE)
Gleichzeitige Belegung mit zwei großen Modellen ohne Reload

Was läuft darauf?

Beispielhafte Sprachmodelle

Auswahl bekannter Open-Weight-Modelle, die auf dieser Ausbaustufe sinnvoll laufen, die vollständige, validierte Konfiguration ist Bestandteil der Lieferung und wird nicht öffentlich publiziert.

Wichtig: Mit 256 GB Unified Memory laufen auf der KI:KUBE 2 nicht alle großen Modelle. Sinnvoll sind Modelle bis ~250B Parameter (quantisiert). Die größeren Frontier-Modelle (z. B. Qwen3.5-397B, Nemotron-Ultra-550B) benötigen eine KI:KUBE 4 oder 6.

Sprachmodell	Use Case	Performance (Indikation)
Qwen3.6-35B-A3B-NVFP4	Allround / Coding-Champion	~40 t/s n=1 · ~220 t/s n=8 (skaliert aus 4-Node-Lauf 438 t/s n=8)
Qwen3-235B-A22B-Instruct-FP8	Reasoning, große Kontexte	~25 t/s n=1 · ~18 t/s je Request bei Batch 16 (validiert auf 2 Sparks)
Gemma 4 26B-A4B-it-BF16	Vision + Audio (multimodal)	~25 t/s n=1 · ~115 t/s n=8 (skaliert aus 4-Node-Lauf 231 t/s n=8)

Performance-Werte indikativ, gemessen auf Referenz-Hardware mit SGLang. Tatsächliche Werte hängen von Topologie, Quantisierung, Kontext-Länge und Last ab. Wir besprechen die für Ihren Use-Case relevanten Modelle im Erstgespräch: keine Tabellen-Akrobatik nötig.

Upgrade-Pfad

Erweiterung auf KI:KUBE 4 jederzeit möglich (~10.900 € zusätzlich + Service).

Volle Preisübersicht →

Alternativen

Die anderen Ausbaustufen

4× DGX Spark · 512 GB

KI:KUBE 4

Die Standard-Ausbaustufe: empfohlen für Kanzleien, StB-Büros und mittelständische Software-Häuser.

KI:KUBE 4 ansehen →

6× DGX Spark · 768 GB

KI:KUBE 6

Die Pro-Variante: für sehr große Teams, paralleles Multi-Modell oder Frontier-Reasoning ohne Quantisierungs-Kompromiss.

KI:KUBE 6 ansehen →

8× DGX Spark · 1024 GB

KI:KUBE 8

Das Top-Modell: maximale Unified-Memory-Reserven für die größten Frontier-Modelle in hoher Präzision und parallele Multi-Modell-Bestückung ohne Reload.

KI:KUBE 8 ansehen →

KI:KUBE 2 an einem Ihrer eigenen Dokumente sehen.

Demo anfragen

KI:KUBE 2 / KI:KUBE 2-slim

Wann KI:KUBE 2 die richtige Wahl ist

Spezifikation

Was diese Stufe besonders macht

Niedrigste Einstiegshürde

Volle Compliance-Wirkung

Upgrade möglich

KI:KUBE 2-slim

Wofür gut, wofür nicht

Empfohlen für

Nicht sinnvoll für

Beispielhafte Sprachmodelle

Die anderen Ausbaustufen

KI:KUBE 4

KI:KUBE 6

KI:KUBE 8

Angebot ausschließlich für Unternehmer