de.wedoany.com-Bericht: Amazon Web Services (AWS) hat die rechenoptimierten Instanzen C9g mit dem selbst entwickelten Graviton5-Prozessor vorgestellt. Diese Instanzen sind für rechenintensive Workloads ausgelegt und ab sofort allgemein verfügbar.

Die C9g-Instanzen verfügen über doppelt so viele Graviton5-CPU-Kerne wie die Vorgängergeneration, wobei die Latenz zwischen den Kernen um 33 % reduziert wurde. Derzeit sind die Instanzen in den Regionen USA (Ost), USA (West) und Europa (Frankfurt) verfügbar, eine Ausweitung auf weitere Regionen ist geplant.
Dies ist die neueste Erweiterung der rechenoptimierten Produktlinie von AWS, nachdem im Juni die EC2-Instanzen M9g und M9gd eingeführt wurden. Laut AWS bieten die C9g-Instanzen im Vergleich zur Vorgängergeneration C8g eine Leistungssteigerung von bis zu 25 % pro virtuellem CPU-Kern (vCPU).
In Bezug auf die Anwendungen sind diese Instanzen für agentische Workloads optimiert. Sébastien Stormacq, Principal Developer Advocate bei AWS, wies darauf hin, dass schnellere Verarbeitungsgeschwindigkeiten und größere Caches die Wartezeiten der Workloads auf Daten reduzieren, wodurch der Durchsatz bei der In-Memory-Analyse steigt, Agentenzyklen beschleunigt werden und die Reaktionszeiten von Echtzeitanwendungen verbessert werden. Da KI sich von der Beantwortung von Fragen hin zur Ausführung von Aufgaben, zum Ausführen von Code und zur Orchestrierung mehrstufiger Workflows entwickelt, steigt der Bedarf an CPU-Rechenleistung. Die C9g-Instanzen wurden speziell für diese Aufgaben entwickelt.
Parallel dazu wurden die C9gd-Instanzen eingeführt, die mit lokalen NVMe-SSDs ausgestattet sind. Sie eignen sich für Szenarien mit geringer Latenz und hohem Speicherbedarf, wie z. B. HPC-Simulationen und Werbeauslieferungs-Engines. Im Vergleich zu lokalen Speicherinstanzen der Vorgängergeneration unterstützen sie durch ihren schnellen, latenzarmen Speicher einen höheren Durchsatz und mehr Input/Output Operations Per Second (IOPS).
Die C9g- und C9gd-Instanzen sind die ersten rechenoptimierten AWS-Instanzen, die mit der Nitro-Isolations-Engine ausgestattet sind. Diese Sicherheitskomponente steuert den Zugriff auf den VM-Speicher, den CPU-Registerstatus und die I/O-Geräte über eine minimierte API-Schnittstelle und bietet eine mathematisch verifizierte Isolation zwischen den VMs. Diese Funktion wurde auch in die zuvor eingeführten M9g- und M9gd-Instanzen integriert.
Die beiden Instanzserien sind in 11 Größen von medium bis 48xlarge sowie als Bare-Metal-Option erhältlich. AWS-Daten zufolge ist die durchschnittliche Netzwerkbandbreite im Vergleich zur Vorgängergeneration um 15 % und die Bandbreite des Elastic Block Store (EBS) um 20 % gestiegen.
AWS erweitert kontinuierlich sein Angebot an Instanzen, die auf selbst entwickelten Chips basieren, um Cloud-Kunden eine breitere Auswahl an zugrunde liegender Hardware jenseits von Nvidia zu bieten. Im März dieses Jahres ging der Cloud-Anbieter eine Partnerschaft mit dem Chip-Unternehmen Cerebras ein, um seine Trainium-Server mit dem wafergroßen CS-3-System zu kombinieren. Gleichzeitig führte die Initiative zur Optimierung selbst entwickelter Chips für KI schließlich zu Project Rainier, einer massiven Cluster-Anlage für Anthropic, die mit über 500.000 Trainium2-Chips ausgestattet ist.
Die Ausbau-Bemühungen von AWS gehen mit Kostenanpassungen einher. Seit dem 1. Juli sind die Kosten für EC2-Kapazitätsblöcke für maschinelles Lernen mit GPU-Reservierungsdiensten um etwa 20 % gestiegen – die zweite Preiserhöhung innerhalb von sechs Monaten.









