Nvidia streicht Rubin Ultra GPU mit vier Chips, wechselt zu Zwei-Chip-Design
2026-07-01 14:40
Merken

de.wedoany.com-Bericht: Nvidia hat die Entwicklung des Rubin Ultra AI-Beschleunigers mit vier Rechen-Chiplets eingestellt und setzt stattdessen auf ein Design mit zwei GPU-Chiplets. Grund dafür sind unerwartet hohe Produktionsschwierigkeiten. Der ursprünglich für 2027 geplante Rubin Ultra galt als der ehrgeizigste Meilenstein in der Roadmap des Unternehmens und sollte die Leistung im Vergleich zum ursprünglichen Rubin (Zwei-Chip-Design) verdoppeln. Die Verbindung von vier Chips nahe der Maskengröße sowie die Kühlung von 16 HBM4E-Modulen stellten jedoch eine enorme technische Herausforderung dar. Laut SemiAnalysis hat Nvidia aufgrund von „Bedenken hinsichtlich der Fertigungsdurchführung“ beschlossen, diesen Ansatz aufzugeben und stattdessen auf eine leichter zu produzierende Architektur mit zwei Rechen-Chiplets umzusteigen.

Nvidia

Die Leistung des angepassten Rubin Ultra wird voraussichtlich nur halb so hoch sein wie die der ursprünglichen Version, was die Wettbewerbsfähigkeit gegenüber Konkurrenzprodukten wie der AMD Instinct MI500-Serie beeinträchtigen könnte. Dennoch könnte Nvidia durch Optimierungen die Gesamteffizienz des KI-Beschleunigers steigern, um den Mehrwert des Upgrades zu unterstreichen. Darüber hinaus wird der Rubin Ultra HBM4E-Speicher anstelle des HBM4 des ursprünglichen Rubin verwenden. Ab der Rubin-GPU plant Nvidia die Auslieferung flüssigkeitsgekühlter Kyber-Rack-Systeme, die die Anzahl der GPU-Pakete pro Erweiterungsdomäne auf mindestens 144 erhöhen, um die an Kunden gelieferte Gesamtrechenleistung zu steigern.

Nvidias Data-Center-GPU-Roadmap 2025 mit Rubin und Rubin Ultra

Die Streichung des KI-Beschleunigers mit 16 HBM4E-Paketen könnte Auswirkungen auf den HBM-Markt haben, da die neue Version des Rubin Ultra nur acht HBM4E-Module verwendet. Gleichzeitig senkt das Zwei-Chip-Design die Kosten pro einzelner Rubin Ultra-GPU im Vergleich zur ursprünglichen Version. Da Nvidia hauptsächlich komplette Rack-Lösungen und keine eigenständigen GPUs verkauft, bleibt abzuwarten, wie sich die tatsächlichen Ausgaben für Partner ändern: Wenn sie mehr Systeme kaufen müssen, um die gleiche Anzahl an Rechenchips zu erhalten, könnten die Gesamtausgaben höher ausfallen als beim ursprünglichen Ansatz.

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com