Chinas Pekinger Universität EvoPhys-World erobert Spitzenplatz auf der WorldScore-Welterzeugungsrangliste
2026-06-09 09:16
Merken

de.wedoany.com-Bericht: Am 8. Juni belegte das 5D-Weltmodell EvoPhys-World des EvoPhys-Teams der Peking-Universität den ersten Platz in der Kategorie „Welterzeugung" der öffentlichen Bewertung WorldScore der Stanford-Universität. Das Modell ist menschenzentriert, auf szenengesteuerte Erzeugung und physikalische Interaktionsaufgaben ausgerichtet und wurde vollständig nativ auf der Grundlage der Moore Threads MTT S5000 GPU und des MUSA-Softwarestapels trainiert.

Der technische Schwerpunkt von EvoPhys-World liegt darin, das Weltmodell von der „Erzeugung betrachtbarer Szenen" hin zu „erzeugbaren, interagierbaren, steuerbaren und evolvierbaren Szenensystemen" zu entwickeln. Laut Projektseite nutzt das Modell First-Person-Interaktionsdaten und Szenengedächtnis, um ein menschenzentriertes Welt-Zwilling zu konstruieren. Es führt weiterhin steuerbare Interaktion und Selbstevolutionsmechanismen ein, sodass ein Szenenzustand unter verschiedenen Aktionsverzweigungen unterschiedliche Zukünfte ableiten kann. Das Kernmodell umfasst zwei Formen: die World Engine, die die Allgegenwart von Zwillingen und physikalische Interaktion betont, und die World Policy, die die Vorhersagbarkeit der Welt und die Auswahl von Aktionen hervorhebt. Beide bilden gemeinsam einen geschlossenen Kreislauf von Szenenerzeugung, Zustandsvorhersage, Aktionsvorhersage bis hin zu Feedback und Evolution. Für verkörperte Intelligenz, Robotertraining, virtuelle Simulation und die Erzeugung komplexer Szenen liegt der Wert solcher Modelle darin, dass KI nicht nur räumliche Beziehungen in Bildern versteht, sondern auch die Zusammenhänge zwischen Aktionen, Kausalität, physikalischem Feedback und Aufgabenergebnissen erfassen kann.

WorldScore ist ein einheitlicher Bewertungsmaßstab für Welterzeugungsaufgaben. Die Bewertung umfasst die Fähigkeiten von 3D-, 4D- und Videomodellen, Welten gemäß Anweisungen zu erzeugen. Die wichtigsten Indikatoren sind Steuerbarkeit, Qualität und dynamische Darstellung. Die öffentliche Rangliste zeigt, dass EvoPhys-World bei Indikatoren wie WorldScore-Static führend ist.

Dieser Fortschritt rückt auch die Anpassungsfähigkeit chinesischer GPUs und Softwarestapel beim Training modernster Modelle stärker ins Rampenlicht. Das Training von Weltmodellen stellt hohe Anforderungen an den Durchsatz langer Zeitreihendaten, die Stabilität des verteilten Trainings, die multimodale räumlich-zeitliche Modellierung, die Operatorunterstützung und die Effizienz der Hardware-Software-Kooperation. Das native Training von EvoPhys-World wurde vollständig auf der Grundlage der Moore Threads MTT S5000 GPU und des MUSA-Softwarestapels durchgeführt. Dies bedeutet, dass das Modellentwicklungsteam nicht nur in der Inferenz- oder späteren Anpassungsphase lokale Rechenleistung einsetzte, sondern die Validierung von Hardware, Softwarestapel bis hin zum Modell-Workflow in der Haupttrainingskette abschloss. Für die chinesische KI-Infrastrukturindustrie ist ein solcher Fall komplexer als das bloße Durchführen von Sprachmodell-Inferenz, da Weltmodelle mehrere Lasttypen wie Videogenerierung, physikalische Interaktion, Zustandsvorhersage und Aktionsstrategien umfassen und höhere Anforderungen an GPU-Cluster, Kommunikationseffizienz und Kompatibilität mit Trainingsframeworks stellen.

Die Anwendungsrichtung von EvoPhys-World ist auch näher an der physikalischen Welt. Die auf der Projektseite gezeigten Szenen umfassen verschiedene Umgebungen wie Handbedienung, Desktop-Interaktion, Bewegen von Tassen, Lagerhaltung, Chemiefabriken, Städte und Altstädte. Dies zeigt, dass das Modell versucht, mehrstufige Erzeugungsaufgaben von lokalen Handbewegungen bis hin zu großflächigen Szenenerkundungen, von Objektkontakt bis hin zu Aufgabenableitungen abzudecken. Wenn diese Linie weiterverfolgt wird, könnte das Weltmodell zu einer wichtigen Grundlage für das Training verkörperter Intelligenz werden, indem es Robotern vor der realen Bereitstellung eine kostengünstige, hochgradig steuerbare und wiederholt evolvierbare virtuelle Trainingsumgebung bietet. Es könnte auch in Szenarien wie Industriesimulation, digitalen Zwillingen, der Vorabsimulation komplexer Abläufe und der Mensch-Maschine-Kooperationsvalidierung eingesetzt werden.

Als Nächstes wird der Einfluss von EvoPhys-World vom Grad der Offenheit der Modellfähigkeiten, dem Aufbau des Entwickler-Ökosystems, den Ergebnissen weiterer Validierungen mit realen Aufgaben und der anhaltenden Stabilität des chinesischen GPU-Softwarestapels bei größerem Training abhängen. Die Eroberung des Spitzenplatzes auf der WorldScore-Rangliste zeigt zumindest, dass chinesische Universitätsteams in der Richtung der Weltmodelle bereits in die vorderen Ränge internationaler öffentlicher Bewertungen vorgedrungen sind. Es bietet auch eine beobachtbare Probe dafür, wie heimische KI-Rechenleistung das Training modernster multimodaler Modelle unterstützen kann.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com