NVIDIA liefert erste Vera-CPUs an Anthropic, OpenAI, xAI und Oracle aus und schafft damit eine neue Rechenbasis für agentenbasierte KI
2026-05-20 14:21
Merken

de.wedoany.com-Bericht: NVIDIA gab am 19. Mai Ortszeit offiziell bekannt, dass die ersten Systeme mit der Vera-CPU, dem ersten speziell für agentenbasierte KI (Agentic AI) entwickelten Prozessor, ausgeliefert wurden. Ian Buck, Vice President für Hyperscale und High-Performance Computing bei NVIDIA, übergab die ersten Systeme persönlich an vier Kunden: Am vergangenen Freitag erreichten die Systeme die drei weltweit führenden KI-Labore Anthropic in San Francisco, OpenAI in Mission Bay und SpaceXAI (ehemals xAI) in Palo Alto; am Montag wurde eine weitere Charge an die Oracle Cloud Infrastructure (OCI) in Santa Clara geliefert. Dieser Schritt markiert den offiziellen Übergang der Vera-CPU von der Ankündigungsphase in die Serienproduktion und Auslieferung.

Die Vera-CPU ist NVIDIAs erste vollständig selbst entwickelte Custom-CPU, die speziell für agentenbasierte KI-Workloads konzipiert wurde. Sie verfügt über 88 selbst entwickelte „Olympus"-Kerne von NVIDIA, unterstützt 176 Threads und bietet unter Volllast eine um 50 % höhere Single-Core-Leistung als die vorherige Grace-CPU. Im Bereich Arbeitsspeicher ist Vera die erste Rechenzentrums-CPU weltweit, die LPDDR5X-Speicher verwendet. Über SOCAMM-Module wird eine Speicherbandbreite von 1,2 TB/s erreicht und bis zu 1,5 TB Systemspeicher unterstützt – die dreifache Kapazität von Grace. Bei der Interkonnektivität unterstützt Vera die zweite Generation von NVLink-C2C mit 1,8 TB/s für kohärente Speicherverbindungen und bildet gemeinsam mit Rubin-GPUs, BlueField-4-DPUs, ConnectX-9-SuperNICs und Spectrum-X-Ethernet-Switches die neue KI-Fabrik-Architektur NVIDIA Vera Rubin der nächsten Generation.

NVIDIA-CEO Jensen Huang positionierte die eigenständige Vera-CPU auf der GTC-Konferenz im März in San Jose als das nächste Milliarden-Dollar-Geschäft des Unternehmens. NVIDIA setzt Vera nicht nur als Host-Prozessor für Rubin-GPUs im Vera Rubin NVL72 Rack-Scale-System ein – jedes NVL72 integriert 36 Vera-CPUs mit 72 Rubin-GPUs –, sondern wird die CPU auch als eigenständiges Produkt verkaufen und damit direkt den Markt für Rechenzentrums-CPUs adressieren.

Buck erklärte anlässlich der Auslieferung: „Agentenbasierte KI schafft einen neuen CPU-Moment in den KI-Fabriken – während Modelle vom Beantworten von Fragen zum aktiven Ausführen von Aufgaben übergehen, ist Vera speziell dafür entwickelt, diese massiven Workloads zu bewältigen." Er führte weiter aus, dass die Antwort oft nicht vorbereitet sei, wenn ein KI-Modell mit einer Frage konfrontiert werde. Das Modell müsse tatsächlich Python-Code generieren, Werkzeuge aufrufen und Aufgaben orchestrieren, um zum richtigen Ergebnis zu gelangen. All dies seien Kernaufgaben auf CPU-Ebene, und genau diese Beobachtung treibe die stark steigende CPU-Nachfrage an.

Bei den ersten Empfängerkunden sind die Anwendungsschwerpunkte für Vera unterschiedlich gelagert. James Bradbury, Leiter der Abteilung Compute bei Anthropic, sagte nach Erhalt des Systems: „Die Skalierung der Rechenleistung ist ein wichtiger Beschleuniger für das Modellwachstum. Wir erwarten, dass Vera im Bereich agentenbasierter Workloads ein wichtiger Bestandteil des KI-Ökosystems wird." Im OpenAI-Hauptquartier in Mission Bay nahm Sachin Katti, Leiter der Recheninfrastruktur, das System persönlich entgegen. Buck öffnete vor Ort die Gehäuseabdeckung und zeigte die interne Architektur. Bei SpaceXAI nahm Gründer Elon Musk die Lieferung persönlich an und erkundigte sich detailliert nach Kernanzahl, Speicherlayout und Kühlkonzept. SpaceXAI evaluiert derzeit die Leistung von Vera bei Reinforcement-Learning-Workloads und agentenbasierten Simulations-Pipelines.

Die Zusage von Oracle Cloud Infrastructure ist am konkretesten. Karan Batta, Leiter des Produktmanagements bei OCI, erklärte: „Oracle Cloud plant, ab 2026 Hunderttausende von NVIDIA Vera-CPUs einzusetzen. Agentenbasierte KI erfordert nachhaltige Leistung in großem Maßstab. Die Architektur von Vera ist speziell für hochdurchsatzstarke Inferenz-Workloads ausgelegt und bietet die Effizienz, Dichte und den Platzbedarf, die Oracle Cloud benötigt, um die nächste Generation von Unternehmens-KI voranzutreiben." Oracle ist damit der erste Cloud-Anbieter, der sich zu einem großflächigen Einsatz von Vera verpflichtet hat.

Die Auslieferung der Vera-CPU fällt in eine entscheidende Phase des Übergangs der KI-Branche von generativer KI zu agentenbasierter KI. Während traditionelle generative KI hauptsächlich Fragen beantwortet und Inhalte generiert, muss agentenbasierte KI Prozesse autonom planen, externe Werkzeuge aufrufen, Code ausführen, Informationen abrufen und mehrstufige Aufgaben erledigen. Dieser Wandel stellt völlig neue Anforderungen an Rechenzentrums-CPUs – sie müssen unter hoher Parallelität und Echtzeit-Aufgabenlast gleichzeitig verschiedene Workloads wie intelligente Sandboxen, Werkzeugaufrufe, Aufgabenorchestrierung und kontextbezogene Langzeitabfragen bewältigen. Vera ist eine neue Prozessorkategorie, die genau von dieser Realität ausgehend konzipiert wurde.

Die Vera-CPU wird im 3-nm-Prozess von TSMC gefertigt und nutzt fortschrittliche 2.5D/3D-Gehäusetechnologien. Der Produktionszyklus ist kürzer als bei der Rubin-GPU, was der Hauptgrund dafür ist, dass Vera zuerst an Kunden ausgeliefert werden konnte. Der Produktionshochlauf der Vera-Rubin-Plattform beschleunigt sich: Die ersten Vera-CPUs wurden ausgeliefert, und die Rubin-GPU wird voraussichtlich in der zweiten Jahreshälfte bis zum dritten Quartal in die Massenproduktion und Auslieferung gehen. Mit NVIDIAs kommerziellem Vorstoß in den CPU-Markt nimmt das vollständige KI-Infrastruktur-Portfolio aus GPUs, CPUs, DPUs und Netzwerk-Switching-Chips rasch Gestalt an.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

Empfehlungen in Verbindung damit
Das kanadische Unternehmen Cohere übernimmt das deutsche Unternehmen Reliant AI und erweitert damit seine souveräne KI-Präsenz auf die globalen Bereiche Biopharmazie und Gesundheitswesen
2026-05-20
US-amerikanisches Unternehmen Selector für KI-Netzwerkbeobachtbarkeit stellt KI-gestützte Multi-Cloud-Observability-Lösung vor
2026-05-20
NVIDIA liefert erste Vera-CPUs an Anthropic, OpenAI, xAI und Oracle aus und schafft damit eine neue Rechenbasis für agentenbasierte KI
2026-05-20
Das US-Unternehmen Lightyear veröffentlicht den „State of Connectivity Report 2026": KI treibt die Migration von Unternehmensnetzwerk-Backbones auf 100G/400G voran
2026-05-20
Kanadisches Unternehmen QeM und taiwanesisches Unternehmen JMEM TEK unterzeichnen Vertrag zur Entwicklung eines Hardware-Root-of-Trust-System-on-Chip
2026-05-20
GITAI USA erweitert Weltraumrobotik-Dienstleistungen und treibt In-Orbit-Operationen sowie den Aufbau von Mondinfrastruktur voran
2026-05-20
US-amerikanischer Dark-Fiber-Anbieter BIG Fiber erhält 250 Millionen US-Dollar Fremdfinanzierung und beschleunigt den KI-Infrastrukturausbau in Atlanta und der San Francisco Bay Area
2026-05-20
Saudi Aramco und Pasqal starten kommerzielle Quantum-Computing-as-a-Service-Plattform in Saudi-Arabien
2026-05-20
Kanadisches Quantencomputing-Unternehmen Nord Quantique erhält 30 Millionen US-Dollar Finanzierung bei einer Bewertung von 1,4 Milliarden US-Dollar
2026-05-20
MIT entwickelt Mikrochip, der Quantenangriffen standhält und drahtlosen biomedizinischen Geräten Post-Quanten-Sicherheit bietet
2026-05-20