de.wedoany.com-Bericht: Am 15. Juni gab Baidu DuMate die Fertigstellung der Aktualisierung seiner Kern-Engine bekannt. Durch die Harness-Engine und kontinuierliche Optimierungen auf mehreren technischen Ebenen konnte der Token-Verbrauch während der Aufgabenausführung um 75 % gesenkt werden, ohne die Intelligenz der Agenten und die Effektivität der Aufgabenausführung zu beeinträchtigen. Gleichzeitig reduzierte sich der entsprechende Benutzerpunktverbrauch ebenfalls um 75 %. Für Unternehmens-KI-Agent-Produkte steht der Token-Verbrauch in direktem Zusammenhang mit den Nutzungskosten, der Effizienz der Aufgabenreaktion und der Machbarkeit einer großflächigen Bereitstellung. Diese Aktualisierung treibt die Kostenoptimierung von der Modellebene auf die Ebene der Agent-Ausführungskette voran.
DuMate ist ein von Baidu eingeführtes universelles KI-Agent-Produkt für Büro- und Unternehmensanwendungen, das sich auf Szenarien wie Dateiverarbeitung, Browser-Operationen, Office-Zusammenarbeit, Informationsabruf, Aufgabenzerlegung und toolübergreifende Ausführung konzentriert. Im Vergleich zu herkömmlichen Frage-Antwort-Modellen liegt der Kostendruck von Agent-Produkten stärker auf dem Aufgabenausführungsprozess: Sie müssen wiederholt den Bildschirm verstehen, Tools aufrufen, Kontext lesen, Operationsschritte generieren, Ergebnisse überprüfen und nach Fehlern korrigieren. Eine komplexe Aufgabe wird oft nicht durch einen einzigen Modellaufruf abgeschlossen, sondern durch mehrere Runden von Planung, Ausführung und Überprüfung. Je höher der Token-Verbrauch, desto stärker werden die Wartezeit der Benutzer, die Inferenzkosten der Plattform und der Punktverbrauch vergrößert.
Der Schlüssel zur Aktualisierung der Kern-Engine liegt in der Harness-Engine. Harness kann als die technische Schicht verstanden werden, die das Modell, die Tools, den Aufgabenablauf und die Ausführungsumgebung des Agenten verbindet. Sie bestimmt, wie das Modell Aufgaben zerlegt, wann es Tools aufruft, wie es Kontext wiederverwendet, wie es ineffiziente Schritte komprimiert und wie es nach einem Aufgabenfehler neu plant. Baidu hat zuvor im Rahmen der Aktualisierung seiner intelligenten Cloud-Produkte die Fähigkeit der „Beherrschung der Technik“ erwähnt und betont, dass durch technische Optimierung die Erfolgsrate von Büroaufgaben gesteigert und der Token-Verbrauch gesenkt werden kann. Die Senkung des Token-Verbrauchs um 75 % durch DuMate zeigt, dass der Optimierungsschwerpunkt von der Effizienz einzelner Frage-Antwort-Interaktionen auf die Kostenkontrolle des gesamten Aufgabenausführungspfads des Agenten verlagert wurde.
Diese Art von Optimierung wird für die Benutzer direkter spürbar sein. Wenn Unternehmensmitarbeiter KI-Agenten für Aufgaben wie Tabellenkalkulation, Dokumentenbearbeitung, Websuche, Datenaufbereitung und Prozesseingabe verwenden, interessieren sie sich wirklich dafür, ob die Aufgabe abgeschlossen werden kann, ob die Wartezeit akzeptabel ist und ob der Punktverbrauch zu hoch ist. Wenn der Token-Verbrauch für dieselbe Aufgabe sinkt, wird die Kostenkalkulation für Unternehmen in der Test- und Bereitstellungsphase klarer, und einzelne Benutzer können den Agenten leichter für häufige Büroaufgaben nutzen, anstatt ihn nur in wenigen komplexen Szenarien auszuprobieren. Für KI-Agent-Produkte führt eine Kostensenkung oft zu einer höheren Nutzungsfrequenz, was wiederum mehr Feedback zu realen Aufgaben bringt.
Die Agentenbranche bewegt sich gerade von der Phase „Kann es gemacht werden?“ in die Phase „Kann es kostengünstig und stabil abgeschlossen werden?“. Frühe KI-Agent-Produkte zeigten eher Fähigkeiten wie Browsersteuerung, Dateioperationen und mehrstufige Planung, aber in der Praxis traten leicht Probleme wie hohe Kosten für lange Aufgaben, redundante Schritte, Kontextexplosion und übermäßiger Verbrauch durch Fehlerwiederholungen auf. Der Wert der Optimierung auf der Harness-Ebene liegt darin, dass der Agent ineffizientes Denken und wiederholte Aufrufe reduziert und die Modellfähigkeiten mehr für kritische Entscheidungen, komplexe Schlussfolgerungen und Ergebnisüberprüfungen einsetzt. Da Büro-, Marketing-, Kundendienst-, Forschungs- und Betriebsszenarien weiterhin an Agenten angebunden werden, werden die Ausführungskosten zu einem wichtigen Indikator für Unternehmenseinkäufe und die kontinuierliche Nutzung.
Diese Aktualisierung von DuMate spiegelt auch die sich ändernden Wettbewerbsschwerpunkte bei universellen KI-Agent-Produkten in China wider. Die Modellfähigkeit bleibt die Grundlage, aber die Produkterfahrung hängt zunehmend von technischen Systemen, Tool-Orchestrierung, Kontextmanagement und Kostenkontrolle ab. Wer die Aufgaben-Erfolgsrate aufrechterhalten und gleichzeitig den Token-Verbrauch senken kann, hat bessere Chancen, in hochfrequente Unternehmensszenarien vorzudringen. Für Baidu trägt die Aktualisierung der Kern-Engine von DuMate dazu bei, die Wettbewerbsfähigkeit des Produkts auf dem Markt für Büro-KI-Agenten und Unternehmens-Agenten zu verbessern und legt auch eine Kostenbasis für die spätere lokale Bereitstellung, Teamzusammenarbeit und Erweiterung auf Branchenszenarien.
In Zukunft muss die tatsächliche Aufgabenleistung beobachtet werden. Eine Senkung des Token-Verbrauchs um 75 % ist ein klarer Kostenoptimierungsindikator, aber Unternehmensnutzer werden auch auf die Erfolgsrate komplexer Aufgaben, die Genauigkeit der Dateiverarbeitung, die Stabilität des Tool-Aufrufs, den Datenschutz, die Zugriffskontrolle und die Fähigkeit zur Zusammenarbeit mehrerer Personen achten. Wenn DuMate die Ausführungseffektivität bei häufigen Büroaufgaben kontinuierlich aufrechterhalten kann und die Kostensenkung sich tatsächlich in den Benutzerpunkten und Unternehmensbudgets widerspiegelt, wird diese Aktualisierung nicht nur eine Parameteranpassung sein, sondern eine Validierung der technischen Fähigkeiten für den Weg des universellen KI-Agenten zur großflächigen Nutzung.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









