Nvidia stellt Nemotron 3 Ultra vor: Offenes Modell zielt auf Kostensenkung bei langlaufenden Agenten ab_Weltnachrichten

Nvidia stellt Nemotron 3 Ultra vor: Offenes Modell zielt auf Kostensenkung bei langlaufenden Agenten ab

2026-06-02 09:16

Merken

de.wedoany.com-Bericht: Am 1. Juni stellte Nvidia-CEO Jensen Huang im Rahmen der COMPUTEX 2026 in Taipeh, Taiwan, das neue KI-Modell Nemotron 3 Ultra vor. Das Modell ist für unternehmenskritische Agenten-Workflows konzipiert und deckt schwerpunktmäßig Szenarien wie Code, Forschung, Automatisierung von Geschäftsprozessen und die Ausführung langlaufender Aufgaben ab.

Mit der Veröffentlichung von Nemotron 3 Ultra erweitert Nvidia seine Rolle vom KI-Chip-Anbieter hin zu einer Kombination aus „Rechenleistungsplattform + Modell + Entwicklungstools". Öffentlich zugänglichen Informationen zufolge handelt es sich bei Nemotron 3 Ultra um ein Mixture-of-Experts-Modell mit 550 Milliarden Parametern, das für langlaufende KI-Agenten entwickelt wurde. Es ermöglicht höhere Inferenzgeschwindigkeiten und niedrigere Betriebskosten bei komplexen Agentenaufgaben. Für Unternehmenskunden entsteht der Kostendruck bei Agentenanwendungen nicht nur durch einzelne Frage-Antwort-Vorgänge, sondern durch die kontinuierliche Nutzung von Tools, das Auslesen von Unternehmensdaten, die Ausführung mehrstufiger Pläne, die wiederholte Überprüfung von Ergebnissen und die Schlussfolgerung über lange Kontexte hinweg. Wenn ein Modell bei langlaufenden Aufgaben nicht stabil und effizient bleibt, wird es für Unternehmen schwierig, Agenten aus internen Pilotprojekten in Produktionssysteme zu überführen. Indem Nvidia bei Nemotron 3 Ultra den Schwerpunkt auf Inferenzgeschwindigkeit, Kosten und Fähigkeiten bei langlaufenden Aufgaben legt, reagiert das Unternehmen auf die neuen Anforderungen, die entstehen, wenn Unternehmens-KI von der „Inhaltsgenerierung" zur „Prozessausführung" übergeht.

Das Modell gehört zur offenen Modellfamilie Nemotron 3. Nvidia hat zuvor bereits Modelle verschiedener Größen wie Nano, Super und Ultra vorgestellt, die jeweils auf leichtgewichtige Bereitstellung, hohen Durchsatz bei der Inferenz und komplexe Agentenaufgaben ausgerichtet sind.

Technisch gesehen setzt Nemotron 3 Ultra Nvidias kombinierte Strategie aus offenen Modellen, NVIDIA NIM, NeMo, CUDA-X und der Unternehmenssoftware-Ökosphäre fort. Bei der Bereitstellung von Agenten benötigen Unternehmen in der Regel Modelle, die mehrere Fähigkeiten wie logisches Denken, Codegenerierung, Tool-Nutzung, Prozessplanung, Ergebnisvalidierung und Sicherheitskontrolle vereinen. Gleichzeitig müssen sie an private Clouds, lokale Rechenzentren, Branchensoftware und Unternehmensberechtigungssysteme angepasst werden. Nvidias Stärke liegt nicht nur im Modell selbst, sondern auch darin, dass seine GPUs, Inferenzdienste, Softwarebibliotheken und die Entwickler-Ökosphäre einen einheitlichen Bereitstellungspfad bilden können. Wenn sich Nemotron 3 Ultra mit bestehender KI-Infrastruktur kombinieren lässt, kann dies Unternehmen helfen, Agentenanwendungen in Prozesse wie Cybersicherheit, Betriebsentscheidungen, F&E-Zusammenarbeit, Kundenservice, IT-Automatisierung und Datenanalyse einzubetten und so den Engineering-Aufwand für die separate Anpassung verschiedener Modelle und Inferenz-Frameworks zu reduzieren.

Diese Veröffentlichung steht auch im Einklang mit Nvidias Ausbau der Bereiche AI-PC, Physical AI und Unternehmens-Agenten. Jensen Huang stellte im gleichen Zeitraum auch Fortschritte bei PC-Chips, Agenten-Toolkits und roboterbezogenen Modellen vor. Dies zeigt, dass Nvidia seine KI-Fähigkeiten von Rechenzentren auf breitere Szenarien wie persönliche Endgeräte, Unternehmens-Desktops, Robotik und autonomes Fahren ausweitet. Nemotron 3 Ultra übernimmt die Aufgabe, die Fähigkeiten im Bereich Unternehmens-Agenten und offene Modelle zu ergänzen. Zusammen mit Hardware-Chips, Inferenzplattformen und Entwicklungstools bildet es die Infrastruktur von Nvidia für die nächste Phase von KI-Anwendungen. Die weiteren Entwicklungen hängen vom Grad der Offenheit des Modells, den tatsächlichen Inferenzkosten, der Stabilität bei langlaufenden Aufgaben, der Geschwindigkeit der Integration in Unternehmenssoftware und davon ab, ob Entwickler bereit sind, spezialisierte Agentenanwendungen auf Basis der Nemotron-Familie zu entwickeln.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

Amerika

IKT Technik für künstliche Intelligenz

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com