de.wedoany.com-Bericht: SenseTime arbeitet im Geheimen an einem multimodalen Großmodell namens „U1 Pro“, das vom Mitbegründer und Chefwissenschaftler Lin Dahua geleitet wird. Es richtet sich vor allem an „Design“-Szenarien und soll ein bildgenerierendes Modell mit Denkfähigkeit schaffen, das mit OpenAIs GPT-Image 2 konkurrieren kann.
Das Modell wird vom SenseTime-Forschungsinstitut entwickelt, gehört zur Modellfamilie SenseNova und soll voraussichtlich im Juli dieses Jahres in einen internen Einladungstest gehen und Kunden zur Verfügung gestellt werden. Laut informierten Kreisen kann „U1 Pro“ bei komplexen Designanforderungen wie ein „denkender Designer“ einen langen Zyklus aus Design, Generierung und Bewertung durchführen und unterstützt die Ausgabe in 8K-Auflösung. In zahlreichen internen Tests zeigten die von „U1 Pro“ generierten Bilder bei identischen Eingabeaufforderungen eine hohe Ähnlichkeit mit GPT-Image 2 und wiesen sogar Vorteile auf.
In der Bild-aus-Text-Bewertung von LMSYS Chatbot Arena liegt GPT-Image 2 bei der Bildqualität, Textdarstellung und Befolgungsgenauigkeit deutlich vor Googles Nano Banana 2 und hat in der Designbranche große Begeisterung ausgelöst. Branchenweit wird allgemein erwartet, dass OpenAI in Kürze ein neues KI-Bildgenerierungsmodell veröffentlichen wird, das den Schwerpunkt auf „Design“ legt.
Das Durchsickern von SenseTimes neuem Modell „U1“ sendet ein Signal nach außen: Neben der Programmierung, die von führenden KI-Unternehmen wie Anthropic und Zhipu vorangetrieben wird, wird „Design“ zum nächsten Hauptschauplatz für multimodale Modelle.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









