de.wedoany.com-Bericht: Kürzlich gab GMI Cloud, ein US-amerikanisches Unternehmen für KI-native Cloud-Infrastruktur, bekannt, dass seine Plattform den Aufbau einer neuen Generation von Infrastruktur für agentenbasierte KI-Fabriken unterstützen wird und damit mit der Ausrichtung der Vera Rubin-Plattform übereinstimmt, die NVIDIA auf der GTC 2026 in Taipeh vorantreibt. Das Unternehmen baut eine auf Inferenz ausgerichtete Cloud-Plattform, die Entwicklern und Unternehmen die Möglichkeit bietet, produktionsreife KI-Workloads bereitzustellen, zu skalieren und auszuführen.
Die von GMI Cloud betonte „agentenbasierte KI-Fabrik“ adressiert die neuen Anforderungen, die an die zugrunde liegende Infrastruktur gestellt werden, wenn KI-Anwendungen von einmaligen Abfragen zu langfristigem Betrieb, autonomer Zusammenarbeit und multimodaler Verarbeitung übergehen. Traditionelle KI-Cloud-Ressourcen konzentrieren sich eher auf Modelltraining, einzelne Modellinferenz oder API-Aufrufe. Wenn KI-Agenten beginnen, Planung durchzuführen, Tools aufzurufen, Bilder, Videos und Audio zu verarbeiten, Kontext zu speichern und kontinuierlich zu laufen, muss die Plattform gleichzeitig Inferenz mit hohem Durchsatz und niedriger Latenz, dynamische Skalierung, Multi-Tenant-Isolation, langfristiges Kontextmanagement, Workflow-Orchestrierung und eine sichere Ausführungsumgebung unterstützen. Das Plattform-Portfolio von GMI Cloud umfasst Infrastruktur für Training, Inferenz und Produktionsbereitstellung, Prime Inference für Modellservices mit niedriger Latenz, MaaS-APIs für proprietäre und Open-Source-Modelle, unternehmensfähige dedizierte Endpunkte sowie eine Infrastruktur-Orchestrierungs- und Optimierungsschicht für skalierbaren KI-Betrieb.
Die Infrastruktur für agentenbasierte Workflows ist ein zentraler Bestandteil dieser Ankündigung. Die von GMI Cloud vorgeschlagenen Plattformfähigkeiten umfassen sandboxierte, toolaufrufende, autonome KI-Systeme und unterstützen eine multimodale native Bereitstellungsumgebung für KI-Anwendungen der nächsten Generation. Für Unternehmenskunden können diese Fähigkeiten genutzt werden, um kontinuierlich laufende Kundendienst-Agenten, Code-Agenten, Datenanalyse-Agenten, Content-Generierungssysteme, industrielle Prozessassistenten und Workflows für die Geschäftsautomatisierung zu erstellen. Im Vergleich zu gewöhnlichen Modellaufrufen müssen agentenbasierte KI-Systeme über einen längeren Zeitraum Zustände halten, auf Tools zugreifen, externe Daten lesen und schreiben sowie Ressourcen zwischen mehreren Aufgaben verwalten. Daher wirken sich die Stabilität, Isolation und Kostenkontrolle der zugrunde liegenden Cloud-Plattform direkt auf die Qualität der Produktionsbereitstellung aus.
Sicherheit wird ebenfalls als zentraler Bestandteil der KI-Fabrik-Infrastruktur betrachtet. GMI Cloud gab an, dass es die vertrauliche Computing-Technologie von NVIDIA einsetzt, um eine vertrauenswürdige Ausführungsumgebung für KI-Workloads der nächsten Generation bereitzustellen, die den Schutz von Modellen und Datenprivatsphäre erfordern. Da KI-Fabriken unternehmenseigene Daten, regulierte Inhalte, Modellkontexte und Agentengedächtnisse verarbeiten, muss die Inferenzplattform gleichzeitig die Anforderungen an Leistung, Privatsphäre, Sicherheit und Compliance erfüllen. Die Vera Rubin-Plattform wird als wichtiger Meilenstein in der Entwicklung der KI-Fabrik-Infrastruktur angesehen, der sich um Computing, Netzwerk, Sicherheit und Rack-Level-Systemdesign der nächsten Generation dreht, um den Anforderungen agentenbasierter KI an groß angelegte Inferenz und kontinuierlichen Betrieb gerecht zu werden.
Diese Ankündigung spiegelt wider, dass sich der Wettbewerb in der KI-Cloud-Infrastruktur von der „Bereitstellung von GPU-Rechenleistung“ hin zur „Unterstützung produktionsreifer intelligenter Systeme“ verlagert. Nachdem KI-Anwendungen in die Kernprozesse von Unternehmen eingedrungen sind, achten Kunden nicht nur darauf, ob sie GPUs mieten können, sondern auch auf Modellservice-Latenz, Token-Kosten, Plattformverfügbarkeit, Sicherheitsisolation, Workflow-Orchestrierung, dedizierte Endpunkte, Modellzugriffsbereich und die Fähigkeit zur Bewältigung multimodaler Aufgaben. GMI Cloud hat sich für eine Positionierung rund um die native Inferenzarchitektur und die agentenbasierte KI-Fabrik entschieden, was darauf hindeutet, dass das Unternehmen in der KI-Infrastrukturkette eine Rolle anstrebt, die näher an der Produktionsausführungsebene liegt. Der entscheidende Faktor in der Folge wird sein, ob GMI Cloud das Vera Rubin-Ökosystem, die vertraulichen Computing-Fähigkeiten und die Inferenzplattform zu einem skalierbar lieferbaren Produkt kombinieren und mehr Entwickler, Start-ups und Unternehmenskunden dazu bewegen kann, komplexe KI-Agenten auf seiner Cloud-Plattform bereitzustellen.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









