de.wedoany.com-Bericht: Am 1. Juni gab das US-amerikanische Unternehmen Aible, ein Anbieter von unternehmensweiter agentischer Künstlicher Intelligenz, bekannt, dass seine Lösung AibleClaw für regulierte, langlaufende KI-Agenten in Unternehmen in NVIDIA Cloud Functions (NVCF) integriert wurde. Damit wird das serverlose GPU-Wirtschaftsmodell auf zeitgesteuerte, unternehmenskritische KI-Workloads übertragen. Aible zufolge kann diese Integration den bereits in früheren Benchmarks nachgewiesenen, bis zu 200-fachen Vorteil bei den Gesamtbetriebskosten (TCO) für End-to-End Generative KI nun auch auf langlaufende, unternehmenskritische Agentenaufgaben ausweiten.
AibleClaw richtet sich dabei speziell an die langlaufenden Agenten, die Unternehmen zunehmend einsetzen – also KI-Workloads, die kontinuierlich oder regelmäßig im Hintergrund Aufgaben ausführen müssen. Im Gegensatz zu einmaligen Frage-Antwort-Interaktionen oder kurzen Inferenzvorgängen weisen solche Aufgaben oft ausgeprägte Spitzen- und Taltäler auf. Beispiele hierfür sind die regelmäßige Analyse von Besprechungsplänen, die Erstellung von Arbeitsberichten, das Scannen von Geschäftsdaten, die Bearbeitung von Kundenvertriebsleads, die Verfolgung von Lieferkettenänderungen oder die Durchführung von Compliance-Prüfungen. Aible bezeichnet diese Art von Aufgaben als „Claws“. Sie zeichnen sich dadurch aus, dass sie mehrere Minuten dauern können, ihre Auslösezeitpunkte relativ steuerbar sind und ihre Empfindlichkeit gegenüber kurzen Kaltstartverzögerungen geringer ist als bei interaktiven Echtzeitanwendungen. Daher eignen sie sich besonders gut für die bedarfsgesteuerte Planung, elastische Inferenz und Kostenoptimierung über NVCF. Durch die Kombination von AibleClaw mit NVCF müssen Unternehmen nicht mehr für alle langlaufenden Agentenaufgaben dauerhaft eingeschaltete GPU-Cluster vorhalten. Stattdessen können sie geplante Aufgaben in Zeiten mit geringerem GPU-Bedarf oder bei besser geeigneten Ressourcen ausführen, wodurch die Recheneffizienz gesteigert und Leerlaufkosten in privaten KI-Bereitstellungen gesenkt werden.
Diese Lösung basiert auf dem NVIDIA DSX OS Software-Stack. NVCF fungiert als einheitliche API-Schicht, die Workloads wie Inferenz, Feintuning, Batchverarbeitung und Simulationen über Kubernetes-Cluster hinweg ausführen und skalieren kann. Sie unterstützt zudem automatische Skalierung, Multi-Tenant-Isolation und eine höhere GPU-Auslastung. Für Aible liegt der Wert von NVCF vor allem in der Orchestrierungsebene für unternehmenskritische KI-Agenten: Unternehmen können private Server, Edge-Server, Desktop-Supercomputer, gängige Cloud-Plattformen und Ressourcen von NVIDIA-Cloud-Partnern in dasselbe Planungssystem einbinden. Wenn die lokalen Bedingungen geeignet sind, werden Aufgaben bevorzugt vor Ort ausgeführt; bei Bedarf können sie an andere Standorte oder in gemeinsam genutzte Rechenzentrumsressourcen verteilt werden.
AibleClaw integriert zudem die NVIDIA OpenShell-Laufzeitumgebung und die NemoClaw-Blaupause, um regulierte, langlaufende Agenten zu unterstützen. Das Unternehmen hatte zuvor bereits AibleClaw with NVIDIA Nemotron 3 Super für regulierte, langlaufende Unternehmensagenten sowie AibleClaw with NVIDIA Nemotron 3 Nano Omni für multimodale Inferenz am Edge vorgestellt. Mit der Integration in NVCF verlagert sich der Schwerpunkt von AibleClaw von den Modellfähigkeiten hin zu den unternehmenskritischen Aspekten der KI-Kostenstruktur, der privaten Bereitstellung und der Ressourcenplanung. Für Unternehmen, die KI-Agenten bereits in ihre Geschäftsprozesse integriert haben, hängt der Erfolg einer Skalierung nicht nur von der Antwortqualität der Modelle ab, sondern auch von der GPU-Ressourcennutzung, den Token-Kostenschwankungen, den Anforderungen an die Datenresidenz, den Prüfmöglichkeiten und den vorhersagbaren Kosten für langlaufende Aufgaben.
Aible betont, dass seine Plattform in Umgebungen wie gängigen Clouds, privaten Servern, NVIDIA-Cloud-Partnern, Desktop-Supercomputern und Edge-Servern betrieben werden kann. Sie ermöglicht es Unternehmen, generative KI- und agentische KI-Workloads auf ihren eigenen Servern zu privatisieren. Das bedeutet, dass Unternehmen KI-Agenten schrittweise in ihre bestehende IT-Infrastruktur integrieren können, ohne sofort ein großes, zentralisiertes Rechenzentrum aufbauen zu müssen. Da Unternehmen von KI-Demos zu Produktionsbereitstellungen übergehen, wird das Kostenmodell für langlaufende Agenten zu einem wichtigen Faktor bei der Auswahl der Infrastruktur. Die Integration von AibleClaw mit NVCF spiegelt auch wider, dass sich der Wettbewerb im Bereich der Unternehmens-KI von der Frage „Können wir einen Agenten bauen?“ hin zur Frage „Können wir einen Agenten kostengünstig, beherrschbar und prüfbar langfristig betreiben?“ verlagert.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









