Chinesisches X Square Robot veröffentlicht Open-Source-Framework für roboterlose Datenerfassung
2026-06-15 14:20
Merken

de.wedoany.com-Bericht: Das Shenzhener Robotikunternehmen X Square Robot hat XRZero-G0 veröffentlicht, ein Open-Source-Hardware- und Software-Framework zur Erfassung von Robotertrainingsdaten durch menschliche Bediener, zur Generierung von Strategien und zum Testen auf physischen Robotern. Der Code steht unter der MIT-Lizenz und wird zusammen mit dem G0-Dataset auf GitHub gehostet.

Roboterlose Datenerfassung

Traditionelle Methoden sind auf physische Roboter angewiesen, um Trainingsproben zu sammeln, wobei jede Bediensitzung nur äußerst begrenzte Demonstrationsdaten liefert, was den Umfang der für das Training verkörperter KI benötigten Datensätze direkt einschränkt. Menschliche Demonstratoren bieten eine kostengünstigere Datenquelle, und X Square Robot hat diesen Ansatz als öffentlich zugängliches System integriert. Das Unternehmen entwickelt Roboter für körperliche Arbeitsumgebungen; in der Vergangenheit mussten solche Firmen viel Zeit und Geld in die manuelle Bedienung von Maschinen investieren, um Trainingsproben zu sammeln.

Physische Roboter nehmen ihre Umgebung über mehrere Kameras wahr. Kopfmontierte Kameras erfassen großflächige Szenen, während handgelenkmontierte Kameras die feinen Interaktionen zwischen Händen und Objekten detailliert aufzeichnen. Viele manuelle Erfassungsvorrichtungen verlassen sich ausschließlich auf die Handgelenksperspektive, was zu einer Diskrepanz zwischen den Trainingsdaten und der Wahrnehmungsweise des Roboters im tatsächlichen Einsatz führt. XRZero-G0 nutzt eine kopfmontierte Kamera und zwei Handgelenkskameras, um gleichzeitig den breiten Szenenkontext und die feinen Nahbereichsmanipulationen zu erfassen und diese Perspektiven in eine gemeinsame Darstellung zu überführen, die mit der Roboterwahrnehmung übereinstimmt. In Kombination mit einer tragbaren VR-Schnittstelle und austauschbaren Greifern kann ein einzelner Bediener Demonstrationsdaten erzeugen, die für verschiedene Roboterplattformen geeignet sind.

Daten von menschlichen Demonstratoren weisen Qualitätsprobleme auf, die ihren Trainingswert beeinträchtigen können. XRZero-G0 baut einen geschlossenen Kreislauf aus Erfassung, Prüfung, Training und Bewertung auf, um die in das Training einfließenden Proben zu filtern. Auf Beobachtungsebene reduzieren geometrische Konsistenzbedingungen über mehrere Ansichten hinweg Fehlausrichtungen zwischen Bild und Bewegung; auf kinematischer Ebene eliminiert ein Ganzkörper-Inverskinematik-Algorithmus mit Kollisions- und Gelenkbegrenzungsbeschränkungen ungültige Trajektorien; auf Strategieebene dient die Wiedergabe auf dem physischen Roboter als endgültige Validierung. Laut X Square Robot erreicht die effektive Datenausbeute des Systems unter kontrollierten Bedingungen nahezu 85 %.

Das Unternehmen weist darauf hin, dass roboterlose und echte Roboterdaten zusammenwirken können. Die Kombination von etwa 10 von Menschen gesammelten Demonstrationssegmenten mit einem echten Roboteraufzeichnungssegment erzielte bei Testaufgaben eine vergleichbare Leistung wie ein vollständig aus echten Roboterdaten bestehender Trainingssatz. Die von Menschen gesammelten Daten bieten eine breite Verhaltensabdeckung, während die wenigen echten Roboterdaten zur Verankerung physikalischer Parameter wie Motorverzögerungen und Reibung dienen. Unter Testbedingungen reduzierte dieses Verhältnis den Bedarf an echten Roboterdaten um bis zu 20 Mal.

Das G0-Dataset umfasst über 2000 Stunden validierte Demonstrationen, die visuelle, taktile und auditive Modalitäten abdecken, 3000 verschiedene Manipulationsaufgaben umfassen und einer Long-Tail-Verteilung folgen. Die Spitzendatenerfassungsrate der Bediener erreichte 93,2 Segmente pro Stunde. Das Dataset unterstützt groß angelegtes Vortraining und Transferstudien über verschiedene Roboterplattformen hinweg. X Square Robot gibt an, dass auf Basis dieses Frameworks trainierte Strategien auf Erfassungsumgebungen mit unterschiedlichen Roboterposen, Tischhöhen und Perspektiven generalisieren können und eine Zero-Shot-Transferfähigkeit auf Roboterplattformen außerhalb des Trainingssatzes zeigen, sodass Aufgaben ohne Feintuning für die neue Plattform ausgeführt werden können.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com