Chinas Qwen veröffentlicht das Sprachweltmodell Qwen-AgentWorld
2026-06-24 11:57
Merken

de.wedoany.com-Bericht: Am 24. Juni veröffentlichte das chinesische Unternehmen Qwen offiziell das native Sprachweltmodell Qwen-AgentWorld und gleichzeitig den Benchmark AgentWorldBench zur Bewertung von Sprachweltmodellen, der sieben Bereiche abdeckt. Das Modell und der Benchmark sind auf Hugging Face und ModelScope frei verfügbar und richten sich an Szenarien wie die Simulation von KI-Agenten-Umgebungen, Aufgaben-Training und Fähigkeitsbewertung.

Die Kernpositionierung von Qwen-AgentWorld ist ein „Sprachweltmodell", kein gewöhnliches großes Dialogmodell. Es simuliert Zustandsänderungen der Umgebung, in der sich ein Agent befindet, durch sprachliche Formen und sagt basierend auf den Aktionen des Agenten und historischen Interaktionsaufzeichnungen die nächste Umgebungsrückmeldung voraus. Für KI-Agenten bietet diese Art von Modell einen virtuellen Interaktionsraum, in dem wiederholt Versuch und Irrtum möglich sind, um die Planungs-, Ausführungs- und Korrekturfähigkeiten des Agenten bei komplexen Aufgaben zu trainieren und zu bewerten.

Das diesmal veröffentlichte Qwen-AgentWorld deckt sieben Bereiche der Agenteninteraktion ab, darunter MCP-Toolaufrufe, Suche, Terminal, Softwareentwicklung, Android, Webseiten und Betriebssysteme. Diese Bereiche umfassen sowohl textbasierte Umgebungen als auch grafische Oberflächen und Software-Betriebsumgebungen und decken die gängigen Aufgabeneinstiegspunkte aktueller KI-Agenten ab. Das Modell kann verwendet werden, um Ergebnisse von Terminalbefehlsausführungen, Rückmeldungen von Webseiteninteraktionen, Änderungen der Benutzeroberfläche von Mobil-Apps, Fortschritte bei Softwareentwicklungsaufgaben und Umgebungsreaktionen nach Toolaufrufen zu simulieren.

Offiziellen Informationen zufolge basiert Qwen-AgentWorld-35B-A3B auf Qwen3.5-35B-A3B-Base, hat eine Gesamtparameteranzahl von 35B, aktiviert etwa 3B Parameter und unterstützt eine Kontextlänge von 262K. Sein Trainingsprozess umfasst die drei Phasen kontinuierliches Vortraining, überwachte Feinabstimmung und verstärkendes Lernen, wobei das Ziel von der frühen Trainingsphase an auf die Umgebungsmodellierung ausgerichtet ist, anstatt die Simulationsfähigkeit nachträglich auf der Grundlage eines allgemeinen Sprachmodells hinzuzufügen.

Der gleichzeitig veröffentlichte AgentWorldBench dient der Bewertung der Simulationsqualität von Sprachweltmodellen in verschiedenen Interaktionsumgebungen. Dieser Benchmark bewertet die vom Modell vorhergesagten Umgebungsbeobachtungsergebnisse aus fünf Dimensionen: Format, Faktentreue, Konsistenz, Realitätsnähe und Qualität, um Forschern zu helfen, die Leistung verschiedener Modelle bei Umgebungssimulationsaufgaben zu vergleichen. Die Hugging Face-Seite zeigt, dass der AgentWorldBench-Datensatz als Testdatensatz geöffnet ist und etwa 2.170 Stichproben enthält.

Diese Art von Modell hat eine direkte Bedeutung für die KI-Agenten-Forschung und -Entwicklung. Das aktuelle Agententraining steht vor einem praktischen Problem: Die Kosten für den Aufruf realer Umgebungen sind hoch, der Aufgabenstatus ist komplex, und API-, Web-, Terminal- und mobile Anwendungsumgebungen sind schwer in großem Maßstab stabil zu reproduzieren. Wenn das Sprachweltmodell die Umgebungsrückmeldungen relativ genau simulieren kann, können Forscher den Agenten in einer virtuellen Umgebung mehrfach Versuch und Irrtum durchführen lassen und dann die erlernten Strategien auf reale Aufgaben übertragen.

Die Veröffentlichung von Qwen-AgentWorld zeigt auch, dass sich der Wettbewerb bei großen Modellen vom „Beantworten von Fragen" hin zum „Verstehen der Umgebung und Vorhersagen von Umgebungsänderungen" verlagert. In der Vergangenheit konkurrierten große Modelle hauptsächlich in Bezug auf Wissen, logisches Denken und Generierungsfähigkeiten. Im Zeitalter der Agenten wird jedoch mehr Wert darauf gelegt, ob die Konsequenzen von Aktionen in mehreren Interaktionsrunden beurteilt werden können. Der Wert des Weltmodells liegt genau darin, eine trainierbare, bewertbare und erweiterbare Simulationsbrücke zwischen Aktion und Ergebnis zu schaffen.

Allerdings können Sprachweltmodelle die reale Umgebung nicht ersetzen. Webseiten, Betriebssysteme, Mobil-Apps und Toolaufrufe werden alle von Versionen, Berechtigungen, Netzwerkstatus und Änderungen externer Dienste beeinflusst. Simulationsergebnisse müssen durch reale Szenarien verifiziert werden. Qwen-AgentWorld eignet sich besser als Infrastruktur für das Training und die Bewertung von Agenten, um die Kosten für Versuch und Irrtum zu senken, die Umgebungsabdeckung zu erweitern und Schwachstellen von Agenten zu entdecken, anstatt direkt mit dem Betrieb eines realen Systems gleichgesetzt zu werden.

Mit der gleichzeitigen Öffnung von Modell und Benchmark können Entwickler sekundäre Bewertungen und Feinabstimmungen für Szenarien wie Terminal, Softwareentwicklung, mobile Anwendungen, Suche und Toolaufrufe durchführen. Damit KI-Agenten von der Demonstration zur praktischen Anwendung gelangen, sind eine stabilere Umgebungssimulation, reproduzierbare Bewertungsstandards und ein auf reale Aufgaben ausgerichteter Trainingskreislauf unerlässlich. Qwen-AgentWorld fügt in diesem Bereich eine neue Werkzeugbasis hinzu.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com