Japan HiRezo: Physische KI erfordert den Ausbau nationaler Recheninfrastruktur
2026-06-23 16:34
Merken

de.wedoany.com-Bericht: Die als „Technologie, bei der KI die physische Welt erkennt, versteht und eigenständig Entscheidungen trifft und handelt“ definierte physische KI (Physical AI) stößt auf wachsende Erwartungen. Vor diesem Hintergrund veranstalteten das Softwareentwicklungsunternehmen Asteria (アステリア) und der GPU-Cloud-Dienstleister HiRezo (ハイレゾ) am 17. Juni 2026 gemeinsam ein Mediengespräch, das sich auf den Aufbau einer physischen KI-Infrastruktur konzentrierte. Nobuhiro Kawamoto, Leiter für Produkt- und Technologiestrategie der HiRezo-Allianzzentrale, wies darauf hin, dass die für das Training der KI verwendeten Daten den Kern der Wettbewerbsfähigkeit eines Unternehmens darstellen, und betonte: „Solche Daten dürfen nicht ausländischen Cloud-Diensten anvertraut werden“, um die Dringlichkeit des Aufbaus einer nationalen Recheninfrastruktur hervorzuheben.

Herr Nobuhiro Kawamoto, Leiter für Produkt- und Technologiestrategie der HiRezo-Allianzzentrale

Nobuhiro Kawamoto zeichnete die Entwicklung der Intelligenz von Robotern bei der Bewältigung von Problemen in der realen Welt nach. Die erste Generation war vollständig auf manuell programmierte Aktionsbeschreibungen angewiesen und eignete sich für standardisierte Umgebungen wie Fabriken, konnte jedoch nicht mit unvorhersehbaren Szenarien wie Haushalten oder Straßen umgehen. Die zweite Generation, die etwa ab 2012 begann, nutzte Deep Learning und Reinforcement Learning für autonomes Lernen. Roboter lernten durch große Mengen an Bilddaten selbstständig zu erkennen und verbesserten ihre Fähigkeiten durch Versuch und Irrtum. Da sie die Welt jedoch nicht grundlegend verstanden, benötigten sie dennoch eine enorme Anzahl von Versuchen.

In der dritten Generation wird „Verstehen und Handeln“ nahtlos miteinander verbunden

Kawamoto wies darauf hin, dass die aktuelle dritte Generation durch die Einführung der Transformer-Technologie ein VLA-Modell (Vision-Language-Action) bildet, das visuelle, sprachliche und handlungsbezogene Aspekte integriert. Maschinen können nun Sprachbefehle wie „Nimm die Tasse“ verstehen und beginnen, Allgemeinwissen aus dem Internet zu nutzen, um erstmals begegnete Objekte zu handhaben.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com