HPE bringt schlüsselfertige KI-Fabrik mit 256 GPUs auf den Markt
2026-06-24 11:19
Merken

de.wedoany.com-Bericht: Auf der HPE Discover in Las Vegas hat HPE seine KI-Plattform deutlich erweitert. Bisher unterstützte die Plattform maximal 64 GPUs, nun liegt die Obergrenze bei 256 GPUs. Kunden können mit einer kleineren Konfiguration starten und die Leistung später durch Hinzufügen von Racks erweitern. Neben ProLiant-Servern mit Nvidia-Beschleunigern integriert das System Speicher, eine Data Fabric sowie Software für Modelle, KI-Anwendungen und Agents, wobei Morpheus die Steuerung und OpsRamp die Überwachung übernimmt.

Installations- und Integrationsdienste sind im Angebot enthalten. HPE bietet die gesamte Umgebung zu einem festen Gesamtpreis an, mit dem Ziel, dass Unternehmen keine KI-Fabrik mehr aus einzelnen Hardware-, Software- und anderen Komponenten selbst zusammenstellen müssen. Die Private Cloud AI von HPE integriert Nvidia AI Enterprise, ausgewählte Modelle und Entwicklungstools sowie das Nvidia Agent Toolkit, Nemotron-Modelle, NemoClaw und OpenShell. Agents können über diese Tools registriert, bereitgestellt und mit Zugriffsregeln versehen werden. Im Bereich Computing ergänzt das Produkt Systeme mit Nvidia RTX Pro 6000 Blackwell Server Edition.

Darüber hinaus hat HPE den ProLiant DL394 Gen12 mit Nvidias auf Arm-Architektur basierender Vera-CPU vorgestellt. Diese CPU übernimmt die speicher- und controllerintensiven Teile in Agent-Anwendungen und arbeitet eng mit den Nvidia-GPUs zusammen. Daher ist die Private Cloud AI von HPE hauptsächlich um den Hardware- und Software-Stack von Nvidia herum aufgebaut. Diese enge Abstimmung reduziert den Integrationsaufwand, bedeutet aber auch weniger Flexibilität bei der Wahl der Beschleuniger und Laufzeitumgebungen.

Der Alletra Storage MP X10000 spielt eine zentrale Rolle in der neuen KI-Plattform. Die Plattform bietet Datei- und Objektspeicher auf einer einheitlichen Architektur und ist direkt in die Private Cloud AI integriert. HPE nutzt ihn auch als erweiterten Speicher für den leistungsbezogenen KV-Cache. Sprachmodelle speichern im KV-Cache Informationen über bereits verarbeiteten Text, Kontext und Zwischenergebnisse. Bei weiteren Anfragen greift das Modell auf diesen Kontext zurück, anstatt ihn jedes Mal neu zu berechnen.

Dies ist besonders wichtig für längere Prompts, große Dokumentmengen und mehrere parallel laufende Agents. Je länger der Kontext und je mehr Anfragen gleichzeitig bearbeitet werden, desto schneller wächst der Speicherbedarf. Wenn alte Kontextinformationen gelöscht werden, muss das Modell sie bei späteren Anfragen neu berechnen, was Latenz, Energieverbrauch und Kosten erhöht. In Agent-Umgebungen ist das Problem noch ausgeprägter, da Agents nicht nur einmal antworten, sondern wiederholt überprüfen, planen, Daten abrufen und Aktionen vorbereiten.

Daher lagert HPE einen Teil des KV-Caches über Remote Direct Memory Access auf den X10000 aus. Dabei werden Daten direkt zwischen Speicher und Arbeitsspeicher übertragen, ohne mehrere Verarbeitungsebenen des Betriebssystems zu durchlaufen. Auf diese Weise übernimmt die Speichereinheit einen Teil des GPU-Speichers und wird Teil des Inferenzprozesses. Laut HPE verkürzt sich in seiner Testkonfiguration mit Nvidia H200 GPUs und dem Nemotron 70B-Modell die Zeit bis zum ersten Token auf ein Zwanzigstel, während der Durchsatz auf das 17-fache steigt.

Die neue Data Fabric 8.2 kann verteilte Datenressourcen erfassen und katalogisieren. Ein globaler Katalog zeigt, welche Informationen vorhanden sind und wo sie sich befinden. Metadaten, Identitäten und Zugriffsrichtlinien legen fest, welche Anwendungen oder Agents auf bestimmte Ressourcen zugreifen können. Die Data Fabric wird auch als vorkonfiguriertes Gerät auf ProLiant-Servern angeboten. Im gesamten Technologie-Stack sorgt der X10000 für schnellen Datenzugriff, während die Data Fabric die Datenressourcen auffindbar und kontrolliert nutzbar macht.

Allein durch technische Datenorganisation werden Daten jedoch nicht KI-tauglich. Für Training und Agents müssen Daten zunächst klassifiziert, bereinigt, beschrieben und mit Berechtigungen versehen werden. Trotz Automatisierungswerkzeugen ist dieser Prozess teilweise manuell erforderlich. Beispielsweise müssen Fachabteilungen erklären, was bestimmte Daten bedeuten, wie aktuell sie sind und wofür sie verwendet werden.

Für den Betrieb der integrierten KI-Umgebung setzt HPE auf Morpheus, OpsRamp und GreenLake Intelligence. Morpheus stellt Rechen-, Speicher- und Laufzeitressourcen bereit und orchestriert die Private-Cloud-Infrastruktur. OpsRamp sammelt Telemetriedaten und überwacht die Abhängigkeiten zwischen Anwendungen, Modellen und der zugrunde liegenden Infrastruktur. Derzeit ist die Verbindung zwischen diesen Betriebsfunktionen und der KI-gesteuerten Automatisierung enger geworden. Morpheus Central soll mehrere Installationsinstanzen über Rechenzentren, Regionen und Edge-Standorte hinweg anzeigen.

Dies ist für KI-Umgebungen wichtig, da Modelle, Daten und Inferenzdienste oft nicht an einem einzigen Ort laufen. OpsRamp kann nicht nur Fehler sammeln, sondern auch Korrelationen herstellen und Grundursachen in der Infrastruktur identifizieren. HPE hat diese Ebene um Copilot-Funktionen und MCP-Schnittstellen erweitert. Morpheus Copilot kann basierend auf natürlichen Sprachbefehlen Blueprints und Automatisierungen erstellen. OpsRamp Copilot soll Ereignisse analysieren und Abhilfemaßnahmen unterstützen. MCP-Server bieten standardisierte Schnittstellen, über die Agents auf Verwaltungs- und Automatisierungsfunktionen zugreifen können. GreenLake Intelligence bündelt diese Funktionen in einer einheitlichen Steuerungsebene.

HPE ergänzt den Technologie-Stack um Funktionen zur Steuerung von KI-Agents. Diese Agents haben eine eigene Identität und laufen in isolierten Umgebungen. Richtlinien legen fest, welche Daten, Schnittstellen und Tools sie verwenden dürfen. Für kritische Vorgänge kann eine menschliche Genehmigung erforderlich sein. Zerto bietet eine zusätzliche Rückfallebene; die Software zeichnet Änderungen auf und stellt betroffene Systeme bei Bedarf auf einen vorherigen Zustand zurück. Sie kann jedoch nicht erkennen, ob eine Entscheidung technisch falsch oder regulatorisch unzulässig ist.

Für HPE bedeutet Governance in erster Linie technische Zugriffskontrolle und Richtliniendurchsetzung. Die Validierung von Geschäftsmodellen, Erkennung von Abweichungen, regulatorische Klassifizierung und Zuweisung von Verantwortlichkeiten bleiben Aufgaben außerhalb der Plattform. Dies ist die Schwachstelle vieler privater KI-Strategien. Während die eigene Infrastruktur die Kontrolle über Daten und Betrieb erhöht, ersetzt sie keine Governance. IBM und Red Hat haben kürzlich darauf hingewiesen, dass viele Unternehmen ihre Abhängigkeiten von KI-Anbietern, Modellen und Infrastruktur nicht vollständig überblicken. Eine Private Cloud kann diese Abhängigkeiten transparenter machen, aber nicht beseitigen.

Die KI-Fabrik-Produkte auf dem Markt unterscheiden sich deutlich. Dell setzt beispielsweise auf eine dekomponierte Infrastruktur, bei der Rechenleistung und Speicher unabhängig skaliert werden können. HPE hingegen bündelt Hardware, Datenplattform und Betriebssoftware enger zu einem definierten Gesamtsystem. Dies verlagert den Integrationsaufwand vom Kunden zum Hersteller, reduziert aber die Freiheitsgrade, insbesondere die Abhängigkeit von Nvidia, da HPE neben GPUs auch die CPU, Modelle, Laufzeitumgebungen und Agent-Tools des Partners integriert. Der Vorteil liegt in der guten Abstimmung der Komponenten; der Nachteil ist, dass man beim Austausch einzelner Komponenten schneller an die Grenzen der Architektur stößt.

Dass HPE seine KI-Produkte als Private Cloud positioniert, entspricht dem aktuellen Trend. Mit dem Übergang der KI von Pilotprojekten in den Produktionsbetrieb ändert sich auch die Berechnungsweise der Infrastruktur: Public-Cloud-Dienste sind für Tests, flexible Lasten und schnellen Zugriff auf neue Modelle weiterhin attraktiv; für dauerhafte Inferenz, Agent-Workflows und sensible Daten rücken Kostenkontrolle und Datenzugriff in den Fokus. Deloitte sieht einen wirtschaftlichen Wendepunkt bei anhaltend hoher KI-Last: Wenn die Cloud-Kosten einen Großteil der vergleichbaren Eigenkosten erreichen, könnte eine Private-Cloud-Lösung günstiger sein. Auch Forrester erwartet aufgrund steigender KI-Kosten, Datenbindung und Betriebsrisiken eine verstärkte Nutzung privater KI-Clouds durch Unternehmen. Die Private Cloud AI von HPE ist nicht als Gegensatz zur Public Cloud gedacht, sondern als Betriebsplattform für KI-Workloads, die näher an Daten und Prozessen sein müssen. Bemerkenswert ist, dass der vollständige Technologie-Stack noch nicht vollständig verfügbar ist; einige angekündigte Funktionen und Integrationen werden erst in den kommenden Quartalen auf den Markt kommen.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com