NVIDIA und AWS beschleunigen Vektorindizes um das Zehnfache_Weltnachrichten

NVIDIA und AWS beschleunigen Vektorindizes um das Zehnfache

2026-06-26 09:53

Merken

de.wedoany.com-Bericht: Am 25. Juni 2026 haben NVIDIA und Amazon Web Services (AWS) kürzlich eine Partnerschaft geschlossen, um zentrale Herausforderungen beim Aufbau großer KI-Systeme zu bewältigen, darunter latenzarme Inferenz, schnelle Vektorsuche, GPU-Leistungsfähigkeit und Infrastrukturskalierung. Mit Amazon OpenSearch und Amazon EC2 bietet die NVIDIA-KI-Infrastruktur Unternehmen praktische Wege, KI in großem Maßstab in der Produktion einzusetzen.

Die von NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs angetriebenen EC2 G7-Instanzen erweitern die Rechenebene für KI-, Grafik-, Video- und Datenanalyse-Workloads. Die NVIDIA cuVS-Bibliothek beschleunigt die Abrufebene, indem sie GPU-gestützte Vektorindizes zur Standardoption in OpenSearch Serverless macht. Darüber hinaus hat AWS den NVIDIA Exemplar Cloud-Status auf NVIDIA GB300 erhalten, sodass Kunden sicher sein können, dass sie bei Trainings-Workloads eine optimale Spitzenleistung erzielen.

Die Amazon EC2 G7-Instanzen bringen NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs in AWS für KI-Inferenz, Grafik, räumliches Computing und GPU-beschleunigte Datenanalyse. Es handelt sich um einen neuen Instanztyp für Produktions-Workloads, der Leistung bietet, ohne dass Kunden den Betriebsaufwand für die Verwaltung der GPU-Plattform tragen müssen. Im Vergleich zu G6-Instanzen bieten G7-Instanzen bis zu 4,6-fache KI-Inferenzleistung und bis zu 2,1-fache Grafikleistung. Bei der Verarbeitung von Apache Spark-Workloads mit der NVIDIA cuDF-Bibliothek ermöglicht diese Instanz auf Amazon EMR eine schnellere GPU-beschleunigte Datenanalyse. G7-Instanzen unterstützen bis zu 8 GPUs mit insgesamt 256 GB GPU-Speicher, 700 Gbps EFA-Netzwerkanbindung und bis zu 7,6 TB lokalem NVMe-SSD-Speicher, in Konfigurationen mit 1, 2, 4, 8 GPUs sowie bald verfügbaren Bare-Metal-Instanzen, sodass Kunden die Infrastruktur an ihre Workloads anpassen können.

Die nächste Generation von Amazon OpenSearch Serverless unterstützt agentische KI und dynamische Workloads, ohne dass die Infrastruktur verwaltet werden muss. Der Dienst verwendet GPU-beschleunigte Vektorindizes, die von NVIDIA cuVS angetrieben werden, als Standard-Rechenoption für alle Vektorsammlungen. Für Teams, die Retrieval-Augmented Generation, semantische Suche, Empfehlungssysteme und agentische KI-Anwendungen entwickeln, wandelt diese Änderung die GPU-gestützte Vektorsuche von einem speziellen Optimierungsprojekt in eine standardmäßige AWS-Fähigkeit um. Die Auswirkungen für Kunden: Im Vergleich zu reinen CPU-Implementierungen ist die Vektorindexierung bis zu zehnmal schneller und kostet nur ein Viertel, sodass der Aufbau einer Milliarden-Vektordatenbank in weniger als einer Stunde möglich wird.

AWS hat den NVIDIA Exemplar Cloud-Status auf NVIDIA GB300 für Trainings-Workloads erhalten. Dies bedeutet, dass AWS die strengen Leistungsschwellenwerte von NVIDIA für das Benchmarking von KI-Workloads anhand seiner Referenzarchitektur erfüllt. Dieser Erfolg ist das Ergebnis einer tiefgreifenden gemeinsamen technischen Arbeit der AWS- und NVIDIA-Teams. Durch das NVIDIA Exemplar Cloud-Programm können Entwickler und KI-Führungskräfte sicher sein, dass sie eine konsistente, leistungsstarke Cloud-Infrastruktur für groß angelegtes Training nutzen, was Teams hilft, Cloud-Anbieter mit mehr Vertrauen zu bewerten, die Gesamtbetriebskosten zu verbessern und KI-Projekte effizienter von der Planung in die Produktion zu überführen.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.