Boundless Dynamics veröffentlicht Embodied-Intelligence-Modell MWA mit 75,2 % Spitzenwert bei RoboCasa_Weltnachrichten

Boundless Dynamics veröffentlicht Embodied-Intelligence-Modell MWA mit 75,2 % Spitzenwert bei RoboCasa

2026-06-29 16:23

Merken

de.wedoany.com-Bericht: Das chinesische Unternehmen für verkörperte Intelligenz, Boundless Dynamics, hat am 29. Juni offiziell das MWA™-Allzweckgehirn für verkörperte Intelligenz vorgestellt. Das Modell wird als „Langzeit-Bidirektional-Physikalische-Kausalkette"-Latent-Space-Weltmodell positioniert. Bei der RoboCasa GR1 TableTop-Bewertung für verkörperte Intelligenz erreichte das gemeinsam vom Unternehmen und dem Institut für Automatisierung der Chinesischen Akademie der Wissenschaften veröffentlichte MWA™-WALA mit einer durchschnittlichen Aufgabenerfolgsrate von 75,2 % den ersten Platz weltweit und übertraf damit Modelle wie NVIDIAs GR00T-N1.6, Daxiao Robotics ACE-EGO-0, XPengs DIAL und AutoNavi ABot-M0. Diese Veröffentlichung treibt die bisher von Boundless Dynamics verfolgte Route „Latent-Space-Weltmodell + Reinforcement Learning" weiter in Richtung langfristiger, mehrschrittiger und hochpräziser Manipulationsaufgaben.

Die Aufgabe eines Weltmodells besteht darin, dass ein Roboter Umweltveränderungen und die Konsequenzen seiner Aktionen versteht, bevor er eine Aktion ausführt. Für verkörperte Intelligenz reicht es nicht aus, dass das Modell Objekte nur „sieht"; es muss auch beurteilen, wie sich Objekte bewegen, kollidieren, abrutschen, Kräften ausgesetzt sind und stabilisieren.

Die Kernveränderung von MWA™ liegt in der Modellierung physikalischer Kausalbeziehungen im latenten Raum. Herkömmliche Robotermodelle verlassen sich oft auf direkte Abbildungen zwischen visuellen, sprachlichen und motorischen Informationen. Bei kurzen Aufgaben können sie Greif-, Platzier-, Schalt- und andere Aktionen ausführen, aber bei langfristigen Arbeiten treten leicht Brüche zwischen aufeinanderfolgenden Aktionen, Pfadabweichungen, Instabilität der Kraft und Fehleinschätzungen des Zielzustands auf. MWA™ verwendet einen zeitlichen Chunk-Level-Inversdynamik-Modellierungsmechanismus und gibt kontinuierliche mehrschrittige Latent-Action-Chunk-Aktionsgruppen aus. Dadurch generiert der Roboter nicht mehr nur Einzelschrittaktionen, sondern baut eine kontinuierliche Aktionskette um einen Aufgabenprozess herum auf. Auf diese Weise kann der Roboter bei der Durchführung mehrschrittiger Operationen die „aktuelle Aktion", den „nächsten Zustand" und das „endgültige Aufgabenziele" im selben zeitlichen Rahmen verarbeiten.

Das AnyPhys-Negativbeispiel-Kerndatensystem dient dazu, das Verständnis des Roboters für Fehlergrenzen zu ergänzen. Das Training verkörperter Intelligenz kann sich nicht nur auf erfolgreiche Demonstrationen stützen; in realen Einsätzen treten häufiger Rutschen, Anstoßen, Fehlgreifen, Haltungsinstabilität, Wegspritzen von Objekten und Fehlbedienungen in beengten Räumen auf. MWA™ nutzt eine große Anzahl von Fehler-, Instabilitäts- und Grenzfallbeispielen, um die physikalischen Stabilitätsbereiche unter verschiedenen Arbeitsbedingungen rückwärts zu erschließen, sodass der Roboter bei der Aktionsgenerierung risikoreiche Pfade vermeidet. Für industrielle und kommerzielle Dienstleistungsszenarien ist diese Fähigkeit entscheidender als die bloße Verbesserung der Demonstrationsergebnisse, da der Roboter über lange Betriebszeiten hinweg stabil, sicher und reproduzierbar arbeiten muss.

RoboCasa GR1 TableTop testet hauptsächlich die Generalisierungsfähigkeit von Robotern bei Tischaufgaben. Komplexe Objekte, nicht standardisierte Szenen, Lichtwechsel und Ablenkungen durch Fremdkörper vergrößern die Unterschiede in den Fähigkeiten der Modelle bezüglich räumlichem Verständnis, Aktionskontinuität und Aufgabenplanung.

Die durchschnittliche Aufgabenerfolgsrate von 75,2 % zeigt, dass MWA™ bei mehrschrittigen, zusammenhängenden Operationen, dem Greifen von Objekten in beengten Räumen und dem präzisen Aufnehmen verstreuter Kleinteile eine hohe Leistung erzielt hat. Der Wert von simulationsbasierten Umgebungen wie RoboCasa liegt darin, dass sie Roboterstrategien in einer Vielzahl von Küchen-, Tisch- und Objektinteraktionsaufgaben testen können, anstatt nur einzelne Greifaktionen zu untersuchen. Der Spitzenplatz von MWA™ bedeutet, dass die Latent-Space-Weltmodell-Route in der Simulationsbewertung wettbewerbsfähig ist und eine neue algorithmische Validierungsgrundlage für die anschließende Bereitstellung in realen Robotern bietet. Die offiziellen Angaben von RoboCasa zeigen, dass sein Benchmark zum Vergleich allgemeiner Roboterstrategien dient, die Aufgaben mehrere Arten von Manipulationen in alltäglichen Umgebungen abdecken und sich auf Multitasking-Lernen und Generalisierungsbewertung konzentrieren.

Diese Veröffentlichung setzt auch das jüngste technologische und kommerzielle Tempo von Boundless Dynamics fort. Das Unternehmen hatte zuvor eine Series-Angel-Finanzierung von über 200 Millionen US-Dollar abgeschlossen und das universelle Gehirn für verkörperte Intelligenz MWA™ auf Basis der Route „Latent-Space-Weltmodell + Reinforcement Learning" aufgebaut; der Roboter der zweiten Generation, K15, befindet sich bereits in der Serienproduktion, mit Anwendungen in den Bereichen industrielle Fertigung, kommerzielle Dienstleistungen und anderen Szenarien. Für Boundless Dynamics sind die Ergebnisse in Modellrankings nur der technische Einstieg; die wahre Bewährungsprobe ist, ob MWA™ in reale Fabriken, kommerzielle Räume und langfristige mobile Manipulationsaufgaben Einzug halten und den technischen Belastungen durch Produktionslinientaktung, offene Umgebungen, Sicherheitsbeschränkungen und Multitasking-Wechsel standhalten kann.

Verkörperte Intelligenz bewegt sich vom Stadium „kann demonstrieren" hin zum Stadium „kann langfristig stabil arbeiten". Wenn MWA™ die zeitlichen Aktionsfähigkeiten aus der Simulation auf reale Roboter übertragen kann, wird dies dazu beitragen, die Zuverlässigkeit von Robotern bei Montage-, Sortier-, Greif- und Platzier-, Service-, Inspektions- und komplexen räumlichen Manipulationsaufgaben zu verbessern. Für die gesamte Branche ist dieser Modellwettbewerb nicht mehr nur ein Wettbewerb um Sprachverständnis oder visuelle Erkennungsfähigkeiten, sondern ein Wettbewerb um die Modellierung der physikalischen Welt, Aktionskontinuität, Lernen aus Fehlerbeispielen und die Fähigkeit zur geschlossenen Iteration in realen Szenarien. Mit der Veröffentlichung von MWA™ etabliert Boundless Dynamics das Latent-Space-Weltmodell als einen wichtigen technologischen Zweig auf dem Weg zum universellen Gehirn für verkörperte Intelligenz.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.