Chinesisches Unternehmen Unisound veröffentlicht U2-Modell, erreicht 87,9 Punkte im GPQA Diamond_Weltnachrichten

Chinesisches Unternehmen Unisound veröffentlicht U2-Modell, erreicht 87,9 Punkte im GPQA Diamond

2026-06-08 13:38

Merken

de.wedoany.com-Bericht: Unisound hat am 8. Juni 2026 sein neues, universelles Large Language Model U2 veröffentlicht. Das Modell positioniert sich als natives Agent-Modell und richtet sich an Einzelpersonen, Entwickler und Organisationen. Seine technische Philosophie besteht in hoher Intelligenzdichte und hohem Token-Wert, ohne blind Parameter oder Ausgabelängen zu erhöhen.

Im Gegensatz zu traditionellen, eher auf Einzelfragen ausgerichteten Sprachmodellen legt U2 den Schwerpunkt auf die kontinuierliche Ausführung realer Aufgaben. In Szenarien wie komplexer Büroarbeit, Softwareentwicklung, tiefergehender Recherche und der Zusammenarbeit mehrerer Tools kann U2 eigenständig Arbeitsabläufe mit über 100 Schritten zerlegen und vorantreiben. Es verbindet Aufgabenverständnis, Aufgabenplanung, Umgebungsinteraktion, Tool-Nutzung, Prozesskorrektur und Ergebnisvalidierung zu einem geschlossenen Ausführungszyklus und wechselt von der reinen Antwortbereitstellung zur Aufgabenerfüllung.

Bild1

In Bezug auf Evaluierungen erzielte U2 im GPQA Diamond, der Wissen und komplexe Denkfähigkeiten misst, 87,9 Punkte und übertraf damit GLM-5.1, Hy3 preview, DeepSeek-V4-Flash (High) und MiniMax M2.7. Im SWE-Bench Verified, der Softwareentwicklungsfähigkeiten bewertet, erreichte es 75 Punkte und zählt damit zur Spitzengruppe der Mainstream-Modelle. In der End-to-End-Evaluierung für autonome Agenten, Claw-Eval (pass@3), erzielte es 76,9 Punkte und übertraf ebenfalls Hy3 preview, DeepSeek-V4-Flash (High) und MiniMax M2.7. Im GDPval, der die Leistungsfähigkeit bei Büro- und Wissensarbeit bewertet, erreichte es 72,9 Punkte. Dieser Benchmark konzentriert sich auf die Erledigung typischer Büroaufgaben wie Dokumentenanalyse, Berichtserstellung, Tabellenkalkulation, Diagrammerstellung und Folienproduktion.

Unisound gibt an, dass U2 nicht darauf ausgelegt ist, durch eine einzelne, isolierte Fähigkeit zu punkten, sondern systemische Leistungen in den Bereichen Reasoning, Programmierung, Agent-Ausführung und Büroarbeit zu bieten. Um die Aufgabenausführungsziele zu erreichen, führt U2 einen hybriden Denkmechanismus ein, der innerhalb eines einzigen Reasoning-Prozesses dynamisch zwischen expliziten Gedankenketten und latenter Raum-Reasoning wechselt, basierend auf der Aufgabenphase, Komplexität und Unsicherheit. In der Anfangsphase einer Aufgabe führt das Modell im latenten Raum eine Pfadsuche, Aufgabenzerlegung und Generierung von Lösungsvorschlägen durch. In kritischen Entscheidungs- oder Einschränkungsverarbeitungsphasen wechselt es zur expliziten Reasoning für logische Kalibrierung und Ergebniskonvergenz. Durch begrenzte latente Ableitung und entropiegesteuerte Umschaltung kann das Modell seine Denkmuster dynamisch an die Unsicherheit im Reasoning-Prozess anpassen.

In der Wissensbasis setzt U2 Technologien zur Filterung und Bereinigung von Daten mit hoher Wissensdichte ein, filtert redundante und minderwertige Daten und kombiniert dies mit spärlicher Wissenscodierung und Wissensdestillationsarchitekturen, um redundante Modellparameter zu komprimieren. Auf der Aufgabenausführungsebene wird das kooperative Trainingsparadigma Agent-Harness eingeführt, das die Modellfähigkeitsverbesserung und die Optimierung der Toolkette in denselben Trainingszyklus integriert. Dadurch werden qualitativ hochwertige Ausführungspfade aus realen Aufgaben an das Modell zurückgemeldet, wodurch seine Fähigkeiten in den Bereichen Planung, Tool-Nutzung, Prozesskorrektur und Ergebnisabnahme gestärkt werden.

U2 konzentriert sich auf die drei Kernfähigkeiten Reasoning, Programmierung und Agent. Im Bereich Reasoning liegt der Schwerpunkt auf ausführungsarmer Verzerrung und langfristiger logischer Stabilität. Im Bereich Programmierung zielt es auf eine End-to-End-Ingenieurleistung ab, die Code aus natürlichsprachlichen Anforderungen generieren und mehrdatei-Projektstrukturen verstehen kann. Im Bereich Agent-Fähigkeiten wird die Verbesserung der Zusammenarbeit mehrerer Tools, der Orchestrierung langer Arbeitsabläufe und der Umgebungsinteraktion angestrebt. Diese Fähigkeiten bilden einen geschlossenen Kreislauf der Aufgabenabwicklung, der vom Verständnis der Anforderungen über die Planung und Ausführung bis hin zur kollaborativen Validierung reicht.

In Bezug auf Anwendungsszenarien kann U2 ein breites Spektrum an Schnittstellendesigns abdecken, darunter die Entwicklung responsiver Webseiten, die Erstellung mobiler Webanwendungen und die Implementierung von Designsystemen. Es eignet sich für tiefgehende Forschung und Analyse, einschließlich Branchen- und Politikforschung, Datenvisualisierungsanalyse und die Bereitstellung von Dokumenten in mehreren Formaten. Es kann für die Entwicklung immersiver interaktiver Spiele wie klassische Gelegenheitsspiele und Physiksimulatoren eingesetzt werden. Darüber hinaus ermöglicht es eine effiziente Büroautomatisierung, einschließlich Geschäftsberichtsanalyse, Branchenstrukturanalyse und periodischer Geschäftsüberprüfungen. U2 ist bereits im Token Hub von Unisound verfügbar und für Einzelpersonen, Entwickler und Organisationen zugänglich.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

China

IKT Technik für künstliche Intelligenz

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com

Vorheriger Artikel：Tencent aus China schließt sich mit Marken wie Huawei zusammen, um in die mobile KI einzusteigen

Nächster Artikel：GIGABYTE aus Taiwan, China, bringt KI-optimierte Technologie zur Steigerung der Mainboard-Leistung