de.wedoany.com-Bericht: Am 25. Juni gab das US-amerikanische KI-Agenten-Infrastrukturunternehmen Sail Research den Abschluss einer Seed- und einer Serie-A-Finanzierungsrunde bekannt, mit denen insgesamt 80 Millionen US-Dollar eingesammelt wurden. Die Unternehmensbewertung liegt bei 450 Millionen US-Dollar. Die Serie-A-Runde wurde von Kleiner Perkins aus den USA angeführt, die Seed-Runde von Sequoia aus den USA. Die Mittel sollen für den Aufbau einer hocheffizienten Inferenzinfrastruktur für langlebige KI-Agenten verwendet werden.
Sail Research zielt auf die Kostenprobleme beim massiven Einsatz von KI-Agenten ab. Gewöhnliche Chat-KI-Anwendungen sind in der Regel für eine einzelne Frage-Antwort-Runde oder kurze Sitzungen konzipiert, während langlebige KI-Agenten über mehrere Stunden oder sogar Tage hinweg kontinuierlich laufen müssen, um Aufgaben wie Code-Analyse, Unternehmensrecherche, Kandidatenauswahl, Dokumentenverarbeitung und komplexe Aufgabenplanung auszuführen. Je länger die Aufgaben dauern, desto höher sind die Anzahl der Modellaufrufe, der Kontextverbrauch und die Token-Nutzung, wodurch die Inferenzkosten leicht zum Engpass für den Unternehmenseinsatz von Agenten werden.
Dieses Unternehmen versucht nicht, einzelne Modelle neu zu gestalten, sondern die zugrunde liegende Inferenz- und Sandbox-Umgebung, auf die Agenten beim Betrieb angewiesen sind. Die von Sail Research bereitgestellte Infrastruktur umfasst einen auf Durchsatz und Effizienz neu aufgebauten Inferenz-Stack sowie die Sailboxes-Sandbox-Umgebung, die über mehrere Stunden oder Tage hinweg betrieben werden kann. Ersteres dient der Senkung der Kosten pro Token bei langen Aufgaben, Letzteres ermöglicht es Agenten, in einem zustandsbehafteten Umfeld kontinuierlich zu arbeiten und nach tatsächlicher Arbeitszeit abgerechnet zu werden, wodurch Leerlaufkosten bei langfristigen Aufgaben reduziert werden.
Die Investorengruppe dieser Finanzierungsrunde konzentriert sich auf den Bereich KI-Infrastruktur und Systemsoftware. Neben Kleiner Perkins und Sequoia aus den USA beteiligten sich auch Redpoint Ventures, Theory Ventures, Vine Ventures, CRV, A* und Abstract Ventures, alle aus den USA, an der Investition. Zu den Angel-Investoren gehören John Hennessy, Vorsitzender von Alphabet aus den USA, Intel-CEO Lip-Bu Tan aus den USA sowie Tri Dao, Chefwissenschaftler von Together AI aus den USA.
Das Gründungsteam von Sail Research verfügt über einen Hintergrund in Hardware und groß angelegten Systemen. Mitgründer und CEO Neil Movva war zuvor bei Nvidia, Apple und Together AI in den USA im Bereich GPU-Leistung, Infrastruktur und KI-Systeme tätig; Mitgründer und CTO Samir Menon war ebenfalls bei Apple in den USA am Aufbau großer Systeme beteiligt. Dieser Hintergrund führt dazu, dass sich das Unternehmen mehr auf Rechenleistungsauslastung, Inferenzdurchsatz, Arbeitslastverteilung und systemweite Kostenoptimierung konzentriert, anstatt nur KI-Agentenprodukte auf der Anwendungsebene zu verpacken.
Langlebige KI-Agenten stellen andere Anforderungen an die Infrastruktur. Während menschliche Nutzer bei einer einzelnen Antwort eher auf niedrige Latenz achten, benötigen Agenten bei der kontinuierlichen Ausführung von Aufgaben vor allem stabilen Durchsatz, erweiterbaren Kontext, parallele Aufruffähigkeiten und kontrollierbare Kosten. Sail Research geht davon aus, dass die bestehende Inferenzinfrastruktur hauptsächlich für kurze Interaktionen ausgelegt ist und nicht dafür geeignet ist, dass Agenten kontinuierlich große Mengen an Token verbrauchen und über lange Zeiträume laufen. Daher muss das zugrunde liegende System neu um die Arbeitsweise von Agenten herum gestaltet werden.
Das Unternehmen gibt an, dass seine Inferenzinfrastruktur durch die Anpassung von Open-Source-Inferenz-Engines, die Verteilung von Arbeitslasten über verschiedene Anbieter und die Nutzung unzureichend ausgelasteter Rechenressourcen die GPU-Nutzungseffizienz verbessert und in einigen Benchmarks eine bis zu zehnfache Senkung der Kosten pro Token erreicht. Die API ist mit bestehenden OpenAI-Workflows kompatibel und unterstützt Open-Source-Modelle wie DeepSeek, Gemma, GLM, Kimi und Nemotron, sodass Unternehmen sie ohne größere Änderungen an ihrer Anwendungsarchitektur integrieren können.
Sail Research bedient bereits einige KI-Workflow-Kunden, darunter das Webdatenunternehmen Parallel Web Systems, die Code-Review-Plattform Detail.dev und Jack and Jill. Für diese Kunden geht es bei Agenten nicht nur darum, Fragen zu beantworten, sondern kontinuierlich Webseiten zu lesen, Codebasen zu analysieren, Berichte zu erstellen oder komplexe Prozesse zu verarbeiten. Sobald solche Szenarien in die Produktion gehen, wirken sich Inferenzkosten, Betriebsstabilität und die Fähigkeit zur Aufgabenwiederherstellung direkt auf die kommerzielle Nutzbarkeit aus.
Nach Abschluss der 80-Millionen-US-Dollar-Finanzierung wird Sail Research in die frühe Expansionsphase im Bereich der KI-Agenten-Infrastruktur eintreten. Während Unternehmen von der Erprobung von Chatbots zur Bereitstellung von nachhaltig arbeitenden KI-Agenten übergehen, werden die zugrunde liegende Inferenzplattform, die Sandbox-Umgebung, die Aufgabenplanung und die Kostenkontrolle zu neuen Wettbewerbsschwerpunkten. Es bleibt abzuwarten, ob Sail Research seinen Kostenvorteil in ein stabiles Kundenwachstum umwandeln kann und ob die Infrastruktur für langlebige Agenten zu einer unabhängigen Basisschicht für die KI-Anwendungsbereitstellung wird.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









