de.wedoany.com-Bericht: Huawei Cloud hat den „Agentic Infra“-Stack (Infrastruktur für KI-Agenten) veröffentlicht, ein umfassendes Portfolio aus Rechen-, Speicher- und Netzwerkprodukten, das darauf abzielt, den Betrieb großer KI-Agenten auf einer NPU-basierten Cloud-Plattform zu unterstützen. Dieser Schritt wird als der bislang direkteste Vorstoß des Cloud-Anbieters im Wettbewerb mit Nvidia im Bereich der KI-Infrastruktur angesehen.

Im Rahmen der Inspire-Veranstaltung in Shanghai stellte Huawei Cloud AICS (AI Cluster Service) vor, das eine Rechenplattform mit bis zu 100.000 Karten unterstützen soll. Der Cluster basiert auf Huaweis eigener UnifiedBus (UB)-Interconnect-Architektur und bietet einen Durchsatz von 5 Millionen Tokens pro Sekunde über 1.000 Karten hinweg, eine Gesamtrechenleistung von 200 EFLOPS (Exaflops) und eine Token-Generierungslatenz von unter 10 Millisekunden.
Huawei stellte gleichzeitig die Speicherlösung AMS (Agentic Memory Storage) vor, die eine Speichererweiterung für NPU-Chips bietet und die Inferenzkosten für langlaufende KI-Agenten-Aufgaben durch gestaffelte Key-Value (KV)-Caches senkt.
Weitere Komponenten des Stacks umfassen den CCE Volcano Next Scheduler, der durch die Zusammenlegung von Trainings- und Inferenz-Workloads anstatt deren Isolierung eine um über 30 % höhere Ressourcennutzung verspricht, sowie AgentSphere, eine sicher isolierte Sandbox-Umgebung, in der Nutzer pro Minute Hunderttausende von KI-Agenten-Instanzen starten können.
Der Stack wurde im Rahmen der Keynote von Dr. Peter Zhou, Vorstandsmitglied von Huawei und CEO von Huawei Cloud, vorgestellt. Er erklärte, dass KI-Agenten einen grundlegenden Wandel des Rechenparadigmas vorantreiben. Huaweis Vorstellung des Infrastruktur-Stacks auf der Inspire erfolgt zu einem Zeitpunkt, an dem China den Aufbau nationaler Alternativen vorantreibt. Der Konzern nutzt die Marktchancen nach dem US-Importverbot für Chips, um verstärkt in Rechenleistung zu investieren. Obwohl Huaweis CEO Ren Zhengfei im vergangenen Sommer einräumte, dass seine Chips eine Generation hinter denen der US-Konkurrenz zurückliegen, versucht das Unternehmen, den Rückstand schnell aufzuholen. Das Skalierungsprinzip seines Halbleiterdesigns, Tau (τ), konzentriert sich auf die Verbesserung des Designs durch Reduzierung der Signalausbreitungsverzögerung auf dem Chip, anstatt die Transistoren weiter zu verkleinern. Huawei hat mit diesem Konzept rund 381 Chips entwickelt und wird es mit der LogicFolding-Architektur kombinieren, die die τ-Leistung auf mehreren Ebenen verbessert hat und für die Entwicklung der Kirin-Prozessorserie entscheidend ist.
Im Bereich Modelle und KI-Agenten veröffentlichte Huawei die Modellplattform ModelArts Next, die um Reinforcement Learning as a Service (RLaaS) und eine Modell-Routing-Schicht erweitert wurde. Diese kann Anfragen dynamisch an das am besten geeignete Modell aus einem Pool von über 20 Partnermodellen weiterleiten, darunter Systeme von DeepSeek, Zhipu AI und MiniMax. Huawei gibt an, dass die Routing-Engine eine Scheduling-Genauigkeit von über 95 % erreicht und die Inferenzkosten um etwa 20 % senkt. Die Partnerschaft wurde als „AI Model Partner Program“ formalisiert. Huawei veröffentlichte außerdem die Enterprise-KI-Agenten-Plattform AgentArts, die für produktionsreife, langlaufende KI-Agenten-Aufgaben ausgelegt ist, eine Open-Source-Version mit über 90 % Code-Übereinstimmung mit der kommerziellen Version sowie das AgentArts Orchard-Portal zur Erstellung und Bereitstellung von KI-Agenten über eine Befehlszeilenschnittstelle.
Huawei führte für den Stack eine spezielle Sicherheitsschicht ein, darunter Hardwareverschlüsselung mit selbstverwalteten Schlüsseln (HYOK) und Unterstützung für vertrauliches Computing über virtuelle Maschinen, Training und Inferenz hinweg, und gibt an, seit über 1000 Tagen keinen größeren Servicevorfall gehabt zu haben.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









