Huawei veröffentlicht Open-Source-Modell openPangu-2.0-Flash mit 92 Milliarden Parametern
2026-06-30 15:57
Merken

de.wedoany.com-Bericht: Am 30. Juni hat Huawei das Open-Source-Modell openPangu-2.0-Flash mit 92 Milliarden Parametern offiziell veröffentlicht. Die Modellgewichte, der grundlegende Inferenzcode sowie die Trainings- und Inferenzoperatoren wurden gleichzeitig auf der Open-Source-Plattform bereitgestellt. openPangu ist die Open-Source-KI-Modellmarke von Huawei, die sich hauptsächlich auf die native Trainings- und Inferenztechnologie von Ascend konzentriert und Entwicklern, Unternehmen sowie Forschungseinrichtungen eine Referenz für die Entwicklung und Bereitstellung großer Modelle bietet. Huawei hatte zuvor auf der HDC 2026 openPangu 2.0 vorgestellt und klargestellt, dass die Serie die beiden Versionen Pro und Flash umfasst, deren zugehörige Komponenten ab dem 30. Juni schrittweise veröffentlicht werden.

openPangu-2.0-Flash hat eine Gesamtparameteranzahl von 92 Milliarden, wobei die Anzahl der aktivierten Parameter 6 Milliarden beträgt, und unterstützt einen Kontext von 512K. Die Flash-Version legt Wert auf Inferenzeffizienz und Bereitstellungsanpassung und eignet sich für Agent-Aufgaben, Langtextverarbeitung, Unternehmenswissensdatenbank-Fragen und -Antworten sowie den Aufruf intelligenter Anwendungen im HarmonyOS-Ökosystem.

Gemäß dem von Huawei bekannt gegebenen Zeitplan wurden die Modellgewichte, der grundlegende Inferenzcode sowie die Trainings- und Inferenzoperatoren von openPangu-2.0-Flash am 30. Juni auf der Open-Source-Plattform bereitgestellt. Die Modellgewichte und der grundlegende Inferenzcode von openPangu-2.0-Pro werden im Juli veröffentlicht. Weitere Open-Source-Komponenten werden in der zweiten Jahreshälfte schrittweise freigegeben. IT Home berichtet, dass openPangu 2.0 plant, nach und nach sieben Hauptkomponenten als Open Source bereitzustellen, darunter Modellgewichte, Inferenzcode, technische Berichte, Modellstruktur sowie neu hinzugefügten Vortrainingscode, Nachtrainingscode und Trainingsoperatoren. Nach der Erweiterung des Open-Source-Umfangs der Komponenten können Entwickler nicht nur das Modell aufrufen, sondern auch die technische Kette von Modelltraining, Inferenz und Operatoranpassung beobachten.

openPangu 2.0 ist in zwei Versionen unterteilt: Pro und Flash. Öffentlich zugängliche Informationen zeigen, dass die Gesamtparameteranzahl von openPangu-2.0-Pro 505B beträgt, mit 18B aktivierten Parametern. Die Gesamtparameteranzahl von openPangu-2.0-Flash beträgt 92B, mit 6B aktivierten Parametern. Beide Versionen unterstützen einen Kontext von 512K und bieten ein längeres Eingabefenster für lange Dokumente, mehrstufige Aufgaben, Unternehmenswissensdatenbanken, Codedokumentationen und Agent-Prozesse. Die Flash-Version hat einen leichteren Parameterumfang und dient hauptsächlich Anforderungen mit niedriger Latenz, hohem Durchsatz und flexiblerer Bereitstellung. Die Pro-Version hat einen größeren Parameterumfang und wird im Juli die Modellgewichte und den grundlegenden Inferenzcode freigeben.

Der Schwerpunkt dieser Open-Source-Veröffentlichung liegt auf der nativen Ascend-Kette. Bei der Bereitstellung großer Modelle auf inländischer KI-Hardware treten häufig Schwierigkeiten auf, wie z. B. Operatoranpassung, Inferenzdurchsatz, Speicherbelegung, Effizienz bei langen Kontexten und Stabilität der technischen Bereitstellung. Indem Huawei die Modellgewichte, den Inferenzcode und die Trainings- und Inferenzoperatoren gemeinsam bereitstellt, können Entwickler den Inferenzprozess direkt in der Ascend-Umgebung reproduzieren und so den Debugging-Aufwand für Unternehmen bei der Bereitstellung von Open-Source-Modellen auf inländischer Rechenleistung reduzieren. Für Kunden aus Branchen wie Regierung und Unternehmen, Finanzen, Fertigung, Verkehr und Energie, die eine private Bereitstellung benötigen, ist die Frage, ob das Modell stabil auf der lokalen Rechenplattform läuft, oft entscheidender für die Geschwindigkeit der Anwendungsbereitstellung als reine Benchmark-Ergebnisse.

Agent-Anwendungen sind ein wichtiger Einsatzbereich von openPangu 2.0. Der 512K-Kontext kann längere Aufgabenaufzeichnungen, Tool-Aufrufketten, Geschäftsregeln und Unternehmensdokumente aufnehmen und eignet sich für Aufgaben wie Vertragsprüfung, Ticket-Workflow, Forschungs- und Entwicklungsunterstützung, Wissensdatenbanken für den Kundenservice, Codeverständnis und Prozessautomatisierung. Nach der Veröffentlichung der Flash-Version können Entwickler zunächst Anwendungen rund um leichtgewichtige Inferenz, Tool-Aufrufe und Branchenwissensdatenbanken aufbauen und dann je nach Aufgabenkomplexität die später veröffentlichte Pro-Version auswählen. Huaweis XiaoYi Claw wurde zuvor in das openPangu 2.0 Pro-Modell integriert, um die systemweite Aufgabenausführungsfähigkeit von HarmonyOS zu verbessern. Dies zeigt auch, dass openPangu in Zukunft eine engere technische Verbindung mit HarmonyOS, Ascend und Unternehmens-KI-Anwendungen eingehen wird.

Mit der offiziellen Open-Source-Veröffentlichung von openPangu-2.0-Flash schafft Huawei einen neuen Verbindungspunkt zwischen KI-Modellen, inländischer Rechenleistung und dem Betriebssystem-Ökosystem. Die Freigabe der Modellgewichte löst das Problem der Nutzbarkeit, der grundlegende Inferenzcode und die Trainings- und Inferenzoperatoren lösen das Problem der optimalen Ausführung auf Ascend. Nach der Freigabe von Komponenten wie dem Vortrainingscode und dem Nachtrainingscode können Unternehmen und Entwickler außerdem Anpassungstrainings mit Branchendaten durchführen. Zu den späteren Beobachtungsschwerpunkten gehören die Bedingungen der Open-Source-Lizenz, die Vollständigkeit der Komponenten auf der GitCode-Plattform, die Einstiegshürde für die Ascend-Hardwarebereitstellung, die tatsächlichen Kosten für lange Kontexte sowie die Modellleistung nach der Veröffentlichung der Pro-Version im Juli.

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com