Saturn Cloud aus den USA bringt Token Factory-Plattform für GPU-Cloud-Betreiber auf den Markt
2026-06-10 11:50
Merken

de.wedoany.com-Bericht: Die KI-Entwicklungsplattform Saturn Cloud, die sich an GPU-Cloud-Betreiber richtet, hat die Token Factory-Plattform eingeführt. Sie ermöglicht es KI-Teams in Unternehmen, den gesamten Prozess der Modellfeinabstimmung und Inferenzbereitstellung auf der GPU-Infrastruktur der Betreiber durchzuführen. Die Plattform unterstützt Neocloud-Betreiber, KI-Fabrik-Bauer und Unternehmen dabei, ihren Kunden verwaltete Feinabstimmungsaufgaben, Datenmanagement und OpenAI-kompatible Inferenz-Endpunkte anzubieten – alles tokenbasiert abgerechnet und unter der eigenen Marke des Betreibers bereitgestellt, ohne dass Komponenten selbst entwickelt oder gewartet werden müssen.

GPU-Cloud-Betreiber investieren massiv in die Beschleuniger-Infrastruktur. NVIDIA Grace Blackwell-, NVIDIA Blackwell- und NVIDIA Hopper-Systeme werden in großem Umfang eingesetzt, und die Umsätze im Neocloud-Geschäft wachsen rasant. Viele Betreiber beschränken sich jedoch weiterhin auf das stundenweise Vermieten von GPU-Rechenleistung. Die Anforderungen von Unternehmenskunden gehen jedoch weit über die reine Bereitstellung von Rechenleistung hinaus: Sie benötigen verwaltete Entwicklungsumgebungen, verteiltes Training, Modellfeinabstimmungs-Pipelines, Single Sign-On (SSO), rollenbasierte Zugriffskontrolle (RBAC), Nutzungsverfolgung und Compliance-Tools. Den meisten GPU-Cloud-Betreibern fehlt das Personal, um diese Plattform-Infrastruktur intern aufzubauen, was in der Regel mehrere Monate Entwicklungsarbeit und kontinuierliche Wartung erfordert.

Sebastian Metti, Gründer von Saturn Cloud, betont, dass Betreiber nicht von Grund auf eine KI-Entwicklungsplattform aufbauen sollten, um ihre GPU-Infrastruktur für Unternehmensteams nutzbar zu machen. Saturn Cloud biete von Anfang an verwaltete Umgebungen, Trainingsorchestrierung, Feinabstimmung, OpenAI-kompatible Inferenz-Endpunkte und tokenbasierte Abrechnung.

Die Token Factory-Plattform ermöglicht es KI-Teams, offene Modelle feinabzustimmen und zu serven, ohne die Infrastruktur verwalten zu müssen. Benutzer laden einfach Datensätze hoch, konfigurieren Feinabstimmungsaufgaben und stellen die generierten Modelle auf Inferenz-Endpunkten bereit – alles in der Markenumgebung des Betreibers. Die Feinabstimmungsaufgaben unterstützen überwachte Feinabstimmung (vollständige Gewichte und LoRA) für offene Modelle. Wenn die ausgewählte Instanz mit mehreren GPUs ausgestattet ist, wird automatisch eine DeepSpeed-Multi-GPU-Konfiguration vorgenommen. Der Benutzer gibt das Basismodell, den Datensatz und einige wenige Hyperparameter an; Saturn Cloud generiert die vollständige Trainingskonfiguration und übernimmt Orchestrierung, Wiederholungen und Checkpoint-Ausgabe. Unterstützte Trainingsframeworks sind Axolotl, vLLM, Unsloth, TRL, PEFT und DeepSpeed.

Datensätze sind typisierte, validierte Trainingsdatensammlungen in Formaten wie dialogbasiert, anweisungsbasiert, textbasiert oder vortokenisiert. Benutzer können Datensätze direkt hochladen, aus externen Quellen (z. B. S3, NFS) importieren oder in verwalteten Arbeitsbereichen aufbereiten und anschließend als Token Factory-Datensätze registrieren. Alle Datensätze werden in einem leistungsstarken parallelen Dateisystem und nicht in einem Objektspeicher abgelegt, um Kaltstart-Overhead zu vermeiden und eine Verringerung der GPU-Auslastung während des Trainings zu verhindern.

Die Abstammung von Checkpoints und Artefakten wird automatisch verwaltet. Nach Abschluss einer Feinabstimmungsaufgabe werden die generierten Checkpoints in der Artefakt-Registry von Saturn Cloud registriert, wobei die vollständige Abstammung vom Trainingslauf bis zu den Modellgewichten erhalten bleibt. Checkpoints können sofort als Eingabe für die Bereitstellung von Inferenz-Endpunkten verwendet werden. Inferenz-Endpunkte stellen feinabgestimmte oder Basismodelle als persistente Service-Endpunkte bereit, die im Backend von vLLM unterstützt werden. Jede Bereitstellung verfügt über eine eigene Subdomain, Gesundheitsüberwachung und tokenbasierte Messung. Service-Konfigurationen (wie dtype, maximale Kontextlänge, Quantisierung) werden bei der Bereitstellung generiert, ohne dass benutzerdefinierte Service-Skripte erforderlich sind. Der gesamte Workflow ist nach Organisationen isoliert; Token Factory-Ressourcen sind mandantenfähig, sodass die Datensätze, Checkpoints und Endpunkte eines Kunden für andere Kunden unsichtbar sind.

Saturn Cloud bietet GPU-Cloud-Betreibern einen direkten Weg von der Bare-Metal-Infrastruktur zu einer umsatzgenerierenden KI-Plattform. Die auf Betreiber ausgerichtete Funktionsschicht umfasst White-Label-Branding, token- und GPU-stundenbasierte Abrechnung der Infrastruktur, Mandanten-Onboarding und Self-Service-Konfiguration, Nutzungs-Dashboards und Abrechnungsberichte sowie Enterprise-Sicherheitstools (einschließlich SSO, RBAC und SOC-2-Compliance). Ohne die Plattformebene können Betreiber nur Rechenzeit verkaufen und geraten in einen Preiskampf; mit Saturn Cloud können sie eine Plattform verkaufen und in den Bereichen Entwicklererfahrung, Sicherheitslage und Time-to-Market konkurrieren. Die Plattform ermöglicht es Betreibern, Sicherheitsaudits von Unternehmen zu bestehen, da Compliance-Tools bereits vorhanden sind. Gleichzeitig können Betreiber ihren Mandanten Nutzungs-Dashboards, Kostenkontrollen und Teamverwaltung anzeigen und ihren Vertriebsteams Produktdemos statt Spezifikationsblätter zur Verfügung stellen.

KI-Teams und Entwickler, die auf der Betreiberinfrastruktur arbeiten, erhalten verwaltete Entwicklungsumgebungen (mit Unterstützung für JupyterLab, VS Code, RStudio und SSH-Zugriff), verteiltes Multi-GPU-Training (mit Orchestrierung, Wiederholungen und Protokollierung), die Token Factory zur Feinabstimmung und zum Serven offener Modelle sowie vorinstallierte NVIDIA CUDA-, GPU-Treiber- und KI-Framework-Unterstützung. Ingenieure können den gesamten GPU-Cluster des Betreibers nutzen, einschließlich NVIDIA Hopper-, Blackwell- und Blackwell Ultra-Systeme sowie NVIDIA GB200 NVL72-Rack-Scale-Systeme. Saturn Cloud ist Mitglied des NVIDIA Inception-Programms.

Saturn Cloud ist in das Ökosystem der Infrastrukturautomatisierungspartner integriert, darunter Mirantis k0rdent AI, Spectro Cloud, OpenNebula und Rafay. Betreiber, die Kubernetes direkt im Cloud-Backend verwalten, können Saturn Cloud ebenfalls auf ihrem bestehenden Stack bereitstellen, ohne die Infrastrukturebene zu ändern.

Die Token Factory-Funktionen stehen nun GPU-Cloud-Betreibern, Neoclouds und Unternehmen, die ihre eigene GPU-Infrastruktur betreiben, zur Verfügung. Organisationen, die an der Bereitstellung der Plattform interessiert sind, können sich für eine Evaluierung an Saturn Cloud wenden.

Saturn Cloud ist eine KI-Token-Factory-Plattform für Neoclouds, KI-Fabrik-Betreiber und Unternehmen. Sie bietet verwaltete Feinabstimmung, OpenAI-kompatible Modellbereitstellung (tokenbasiert abgerechnet), verwaltete Umgebungen, verteiltes Training sowie Enterprise-Sicherheit und Governance. Die Plattform unterstützt mehrere GPU-Architekturen und kann in öffentlichen, privaten und lokalen Umgebungen bereitgestellt werden.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com