de.wedoany.com-Bericht: Google hat kürzlich einen technischen Blogbeitrag veröffentlicht, der die Neugestaltung seiner Netzwerkarchitektur durch den Aufstieg der KI beschreibt. Der Beitrag weist darauf hin, dass mit der zunehmenden Abhängigkeit der zugrunde liegenden Infrastruktur für Dienste wie Gemini, Veo, Suche und Cloud AI von eng integrierten Netzwerksystemen, die für massiven Ost-West-Verkehr, niedrige Latenz und hohe Ausfallsicherheit ausgelegt sind, das Netzwerk selbst zur grundlegenden Schicht des KI-Systems geworden ist. Amin Vahdat beschreibt diesen Wandel in dem Blogbeitrag detailliert.

Google betrachtet die KI-Infrastruktur derzeit als eine beispiellose verteilte Rechenplattform. Trainings- und Inferenz-Workloads erstrecken sich zunehmend über mehrere Cluster, Gebäude und sogar Standorte und erfordern die Übertragung riesiger Datenmengen mit vorhersagbaren Latenzen über eine Verbindungsstruktur. Google beschreibt eine Architektur, die Ressourcen standortübergreifend integriert und so das bildet, was das Unternehmen als massiven KI-„Supercomputer“ bezeichnet. Dies erfordert eine enge Koordination zwischen Cluster-Netzwerken, regionaler optischer Übertragung und globalen Weitverkehrsnetzen. Das private Backbone-Netz von Google umfasst bereits über 7,75 Millionen Kilometer an Land- und Unterseekabelsystemen und erreicht mehr als 200 Länder und Regionen, um global verteilte KI-Workloads zu unterstützen.
Der Blogbeitrag stellt fest, dass KI die traditionellen Grenzen zwischen Rechenzentrumsnetzwerken und Weitverkehrsnetzen verschwimmen lässt. Historisch gesehen waren Rechenzentrumsstrukturen für kurzreichweitigen Ost-West-Verkehr innerhalb eines Gebäudes optimiert, während Weitverkehrsnetze für Fernverbindungen zwischen Regionen zuständig waren. Heutzutage erzeugen große Modelltrainings synchronen Datenverkehr zwischen Tausenden von Beschleunigern, der oft über ein einzelnes Pod oder einen Standort hinausgeht. Dies erfordert, dass Bandbreitenerweiterung, Überlastungsmanagement, optische Kapazitätsplanung und Traffic Engineering als ein einheitliches System funktionieren. Google betrachtet dies als eine architektonische Konvergenz zwischen Switching, Routing, optischer Übertragung und softwaredefinierter Steuerung.
Software spielt eine entscheidende Rolle bei der Orchestrierung dieser Netzwerke. Google weist darauf hin, dass die Platzierung von KI-Workloads zunehmend von intelligentem Traffic-Management über mehrere Infrastrukturschichten hinweg abhängt. Softwaredefinierte Netzwerke werden eingesetzt, um Datenverkehr auszugleichen, Fehler zu isolieren, Latenzen zu optimieren und Kapazitäten dynamisch zwischen konkurrierenden Workloads zuzuteilen. Dies ist besonders wichtig für groß angelegtes verteiltes Training, da die langsamste Verbindung in einem synchronen Cluster die Gesamtmodellleistung beeinträchtigen kann. Die Netzwerk-Steuerungsebene von Google fungiert zunehmend als Orchestrierungsschicht zwischen Rechnen und Transport.
Der Blogbeitrag hebt auch die Bedeutung von Hardware-Innovationen in KI-Netzwerken hervor. Google erwähnt Investitionen in kundenspezifische Netzwerk-Chips, Hardware-Beschleunigung und Direct Memory Access-Technologien, um Latenzen zu minimieren und den Durchsatz zwischen Rechenressourcen zu steigern. Dies deckt sich mit dem Trend von Hyperscale-Cloud-Anbietern hin zu RDMA-basierten Netzwerken, optisch skalierenden Strukturen und High-Radix-Switching-Architekturen, die speziell für KI-Cluster entwickelt wurden. Der Inhalt des Beitrags bleibt auf Systemebene und geht nicht auf konkrete Produktdetails ein, spiegelt jedoch den Branchenwandel wider, bei dem Netzwerke gemeinsam mit Beschleunigern, Speichersystemen und Storage entwickelt werden.
Die Architektur von Google ist eng mit seinem breiteren KI-Supercomputer-Plan abgestimmt, einschließlich der auf der Cloud Next vorgestellten Virgo-Erweiterungsstruktur. Diese Plattform verbindet TPU- und GPU-Ressourcen in großem Maßstab und ermöglicht die Verteilung von Workloads über Rechenzentrumsgrenzen hinweg. Ähnliche Ansätze sind auch in der Branche zu finden, darunter NVIDIAs NVLink und InfiniBand-basierte KI-Strukturen, Metas groß angelegte KI-Cluster-Netzwerke, Microsofts Azure AI-Backbone sowie AWS‘ Arbeit an EFA und kundenspezifischen optischen Netzwerken. Googles Beitrag zeigt, wie diese Konzepte von Clustern auf städtische und globale Infrastrukturen ausgeweitet werden können.
Zu den Kernaussagen des Blogbeitrags gehören: Google positioniert das Netzwerk als zentrale Architekturkomponente des KI-Systems, nicht nur als unterstützende Transportschicht; KI-Workloads laufen zunehmend über mehrere Cluster und Standorte hinweg und erfordern Verbindungen mit extrem hoher Kapazität; die traditionelle Trennung zwischen Rechenzentrumsstrukturen und Weitverkehrsnetzarchitekturen schrumpft, da der geografische Umfang des Ost-West-KI-Verkehrs zunimmt; Google verlässt sich auf softwaredefiniertes Traffic-Engineering, um Leistung und Workload-Platzierung über Netzwerkschichten hinweg zu optimieren; Netzwerkausfallsicherheit bleibt zentral, mit integrierter Routing-Diversität und Fehlerisolierung in Rechenzentren, Regionen und der Backbone-Infrastruktur; das Unternehmen investiert weiterhin in kundenspezifische Netzwerkhardware und Hochleistungstransport, um KI-Kommunikation mit niedriger Latenz zu unterstützen; Googles Architektur unterstützt sowohl interne KI-Workloads als auch externe Google Cloud-Kunden, die die KI-Supercomputer-Infrastruktur des Unternehmens nutzen.
„KI-Workloads verändern das Ausmaß und die Form der Infrastrukturanforderungen auf jeder Netzwerkebene“, schreibt das Google-Engineering-Team und zeichnet ein Umfeld, in dem Rechenzentrumsnetzwerke und globale Backbone-Infrastruktur zunehmend als ein einziges verteiltes System betrieben werden.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









