Vergleich · Hardware

Wenn die Frage ‚welche GPU?' lautet.

Trainings-Hardware ist für Inference oft überdimensioniert. KI:KUBE setzt auf inferenz-optimierte Spark-Knoten: hier die Einordnung gegenüber gängigen 4-GPU-Konfigurationen, mit geprüften Marktpreisen.

GPU-Vergleich

Eine Einordnung

Hinweis: Der KI:KUBE-Preis ist ein schlüsselfertiges Gesamtpaket (Hardware + Software-Stack + Setup). Die GPU-Zeilen zeigen den nackten Kartenpreis (4× GPU) und, als „Voll-Node ≈", den kompletten Rechner inkl. Restsystem; beides ist reine Hardware, ohne Software-Stack, Integration oder Betrieb. Bestpreis netto (zzgl. MwSt.), Stand 2026-06-22.

Konfiguration	VRAM gesamt	Preis · netto 4 Karten / Voll-Node ≈	Verfügbarkeit & Leistung
4× DGX Spark (KI:KUBE)	512 GB Unified	~30 k€	Schlüsselfertiges Gesamtpaket (Hardware + Software-Stack + Setup): keine Einzelkarten-Notierung. Leistung: ~0,6 kW (Gesamtsystem, gemessen)
4× NVIDIA H100 80 GB (PCIe)	320 GB	nicht repräsentativ	Faktisch nicht regulär beschaffbar: H100 80GB PCIe nur als Einzel-Listing ~€53.550 brutto (~€45.000/Karte netto); die separate H100-NVL-94GB-Variante gelistet ab ~€32.700 brutto. Volatil. Leistung: ~2,3 kW* (Voll-Node, geschätzt)
4× NVIDIA H200 NVL 141 GB	564 GB	ab €132.000 Voll-Node ≈ €140.000*	Sofort verfügbar (Marktpreis ab €39.270 brutto/Karte, Lieferzeit 1–2 Werktage). Preis durch HBM3e-Engpass 2026 deutlich gestiegen, volatil. Leistung: ~3,4 kW* (Voll-Node, geschätzt)
4× AMD MI300X 192 GB	768 GB	– Voll-Node OEM-System*	Nicht einzeln im Retail (OAM-Modul): nur als fertiges OEM-System (Supermicro/Dell/Gigabyte). Leistung: ~4,0 kW* (Voll-Node, OEM-System)
4× RTX 5090 (GeForce)	128 GB	ab €13.180 Voll-Node ≈ €20.500	Lieferbar (Marktpreis ab €3.920,75 brutto/Karte), durch den GDDR7-Engpass 2026 weiter verteuert; 4 dicke Karten (3–3,5 Slot) passen physisch kaum in ein Gehäuse. Nur 32 GB/Karte (128 GB gesamt), kein ECC, kein NVLink, Consumer-Treiber/-Lizenz. Leistung: ~3,0 kW (Voll-Node, AC)
4× RTX 6000 Ada 48 GB (PNY)	192 GB	€23.731 Voll-Node ≈ €31.700	Lieferbar (Marktpreis ab €7.059,90 brutto/Karte). Stückzahl je Händler teils begrenzt (z. B. 2/Kunde). Preisspitzen/Lieferengpässe gut möglich. Leistung: ~1,9 kW (Voll-Node, AC)
4× RTX PRO 6000 Blackwell 96 GB	384 GB	€40.303 Voll-Node ≈ €54.100	Gut verfügbar (PNY Workstation Edition ab €11.990 brutto/Karte). Voll-Node-Preis aus konkretem Händler-Angebot (ASUS ESC4000A-E12, 2 HE, EPYC 9355P, Max-Q) abgeleitet, Stand 2026-06-24. Preisspitzen/Lieferengpässe gut möglich. Leistung: ~1,9 kW (Voll-Node, AC; Max-Q)
8× NVIDIA B200 (HGX-System)	1,4 TB	€413.736	Datacenter-Blackwell: nur als komplettes 8-GPU-HGX-OEM-System (kein 4-GPU-Node), nicht im Retail/Preisvergleich gelistet (Systempreis indikativ, auf Anfrage), ~60 Werktage Lieferzeit. Trainings-Klasse, für Inferenz absurd überdimensioniert. Leistung: ~14 kW (8-GPU-System)

Karten ≠ fertiger Node

Die Tabelle zeigt nur die Kartenpreise. Ein vollständig integrierter 4× RTX-PRO-6000-Node wird real ab ~€54.100 netto angeboten: konkretes Händler-Angebot für einen ASUS ESC4000A-E12 (2 HE, AMD EPYC 9355P 32 Cores, 2600-W-Netzteil, 3,84 TB NVMe + 2× 12 TB HDD, 4× RTX PRO 6000 Blackwell Max-Q), Stand 2026-06-24. Und das mit nur 16 GB RAM: produktionstaugliche RAM-Bestückung treibt den Preis durch den DRAM-Engpass 2026 realistisch auf €56.000–62.000 netto. Im Betrieb zieht der Node unter Volllast ~1,9 kW am Netz, gegenüber ~0,6 kW bei der KI:KUBE. Hinzu kommen Software-Integration, Modell-Validierung und Betrieb, die beim KI:KUBE-Paket bereits enthalten sind.

Preise der GPU-Zeilen: indikative Marktpreise (Online-Distributoren/Händler), jeweils Bestpreis netto (zzgl. 19 % MwSt.), nur Karten ohne Restsystem, Stand 2026-06-22; „4×" = vier Karten. Die B200-Zeile ist ein komplettes 8-GPU-HGX-System (kein 4-GPU-Node): Werte nicht per-GPU mit den 4-GPU-Zeilen vergleichbar. Leistung = Voll-Node-Netzaufnahme (AC) unter Volllast: 4× GPU-TDP + ~0,5–0,8 kW Restsystem (CPU, Board, RAM, Kühlung) inkl. Netzteil-Verlusten; KI:KUBE-Wert gemessen. Mit * markierte Leistungswerte sind Schätzungen (Datacenter-/OEM-Konfiguration variiert). Voll-Node ≈ = kompletter Rechner inkl. Restsystem (CPU, Board, RAM, Netzteil, Rack, Kühlung). Die RTX-PRO-6000-Route ist aus einem konkreten Händler-Angebot abgeleitet (ASUS ESC4000A-E12, 2 HE, EPYC 9355P, Stand 2026-06-24; Listenpreis €54.074 netto, mit minimaler 16-GB-RAM-Bestückung), die übrigen RTX-Routen aus der verifizierten Stückliste (Rest-System ~€8 k netto, Best Case, RAM-Preise volatil). Mit * markierte Voll-Node-Werte sind grobe Schätzungen (Kartenpreis + ~€8 k Rest-System): H100/H200 sind Datacenter-Karten, MI300X nur als 8-GPU-OEM-Plattform erhältlich: reale Server-/OEM-Konfigurationen liegen meist höher. Marktlage 2026: HBM-/DRAM-Engpass: Preise hoch und volatil, Bestpreise und Verfügbarkeit ändern sich teils täglich. Der KI:KUBE-Preis ist ein Gesamtpaket (Hardware + Software-Stack + Setup), keine Einzelkarten-Notierung. Bitte beachten Sie die Hinweise zu Vergleichspreisen und Rechnerergebnissen.

Service & Lieferkette

Monolith vs. modular: Was kostet ein Defekt?

Der Preis ist nur die eine Hälfte. Die andere zeigt sich beim Hardware-Defekt, und im Lieferketten-Risiko, das oft erst im Servicefall auffällt.

Monolithischer Server (z.B. ASUS ESC4000A-E12)

–Ein Chassis: Board- oder Netzteil-Defekt = Totalausfall des ganzen Knotens.
–Konfiguration & Teile laufen über den Distributor-/Vendor-Kanal: RMA des ganzen Geräts statt Teiltausch.
–Weniger Einzelteile, dafür ein einziger, vendor-gebundener Reparaturpfad.

KI:KUBE (modular, Multi-OEM)

✓Defekt = im Worst Case ein einzelner Node getauscht; je nach Topologie läuft der Rest degradiert weiter. *
✓DGX Spark = NVIDIA-Referenzdesign (ASUS, HP, Dell, Lenovo, MSI, Gigabyte): Ersatz-Node von jedem OEM, retail beschaffbar.
✓Switch, Control-Node, Rack & Netzteile sind Standardteile: oft Next-Day vom Distributor, kein Gold-Partner nötig.

* Wer auf Nummer sicher gehen will, stellt aus Redundanzgründen einfach eine zweite KI:KUBE daneben, und freut sich im Normalbetrieb über die doppelte Leistung 😊

Fair eingeordnet: Mehr Einzelteile (mehrere Nodes + Switch + Control-Node) bedeuten statistisch auch mehr mögliche Ausfallpunkte, und Switch und Control-Node sind auch bei der KI:KUBE Single Points. Der Vorteil liegt nicht zwingend in einer geringeren Ausfallhäufigkeit, sondern in Reparierbarkeit, Wiederherstellzeit (MTTR) und Lieferketten-Unabhängigkeit.

Architektur-Logik

Warum nicht H100?

H100 (und H200) sind Trainings-Karten: designed für FP16/BF16-Workloads mit großen Batches. Für Inference produktiver Modelle in Quantisierungen wie NVFP4/FP8/INT8 ist die DGX-Spark-Architektur für Inferenz-Workloads wirtschaftlich und in unseren Messungen energieeffizient. Der Aufpreis für H-Klasse-Hardware lohnt sich, wenn Sie eigene Modelle trainieren oder finetunen wollen, was die wenigsten KI:KUBE-Käufer brauchen.

MI300X: viel Speicher, weniger reife Software

AMDs MI300X hat 192 GB HBM pro GPU und ist als Hardware beeindruckend. Die ROCm-Toolchain hat (Stand 2026) gegenüber CUDA noch Lücken: weniger optimierte Quantisierungs-Kernels, weniger Modelle out-of-the-box, mehr Eigen-Engineering. Für Forschungseinrichtungen mit passendem Team eine Option, für Produktivbetrieb in einer Anwaltskanzlei eher nicht.

RTX-Workstation: geht für 70B

4× RTX 6000 Ada (192 GB) reichen für Modelle bis ~70B FP16 oder ~120B in INT4. Für reine Frontier-Workloads (Qwen3-235B, DeepSeek-V3 mit MoE) ist der Speicher zu klein, oder die Quantisierung wird so aggressiv, dass die Output-Qualität leidet.

Sehen Sie KI:KUBE an einem Ihrer eigenen Dokumente.

Hardware-Empfehlung im Erstgespräch