de.wedoany.com-Bericht: Das KI-Startup Sakana AI hat für sein Multi-Agenten-System Sakana Fugu die Gemini Enterprise Agent Platform von Google Cloud als Infrastruktur ausgewählt. Google Cloud Japan veröffentlichte am 29. Juni einen Fallbericht über die Einzelheiten der Zusammenarbeit.

Sakana Fugu ist ein Multi-Agenten-System, das je nach Aufgabenkomplexität mehrere KI-Modelle auswählt oder kombiniert. Es umfasst zwei Typen: Fugu, das auf schnelle Inferenz ausgelegt ist, und das leistungsstärkere Fugu Ultra. Bei bestimmten Aufgaben soll Fugu Ultra die KI-Modelle Claude Mythos Preview und Claude Fable 5 des US-amerikanischen Unternehmens Anthropic übertreffen.
Bei der Orchestrierung mehrerer Modelle wurde Google Cloud als Infrastruktur ausgewählt. Sakana AI gab an, dass das Unternehmen hauptsächlich von Ingenieuren von Google und Google DeepMind gegründet wurde, weshalb die Nutzung von Google Cloud eine natürliche Entwicklung sei. Chi Sun, der für das Design der Infrastruktur von Sakana Fugu verantwortlich ist, lobte Google Cloud als hochwertige und stabile Infrastruktur, die zudem einen verwalteten Dienst zur Zusammenarbeit mehrerer Modelle biete.
Chi Sun erwähnte außerdem, dass Sakana Fugu aus drei Schichten bestehe – der Frontend-Schicht, der Middleware-Schicht und der Modellschicht – und dass die für den Aufbau jeder Schicht erforderlichen Werkzeuge vollständig verfügbar seien, was ebenfalls ein Grund für die Wahl gewesen sei.
In der Frontend-Schicht werden die Modelle durch die Netzwerksicherheitsfunktion Google Cloud Armor sowie die Modellschutzfunktion Model Armor für KI-Modelle und Agenten vor unzulässigen Eingaben oder DDoS-Angriffen geschützt. Benutzerauthentifizierung und -schutz sowie API-Schlüsselverwaltung werden über die Web-App-Entwicklungsplattform Firebase realisiert.
Die Middleware-Schicht ist für Aufgaben wie Modellaufrufe, Log- und Cache-Verarbeitung sowie das Schreiben von Daten in das Data Warehouse BigQuery zuständig.
Die Modellschicht kombiniert mehrere Modelle basierend auf der Eingabeabfrage, um Antworten zu generieren. Über die serverlose Ausführungsumgebung Cloud Run und die KI-Plattform Gemini Enterprise Agent Platform (ehemals Vertex AI) werden Modelle von Google (USA), OpenAI (USA) und Anthropic aufgerufen.









