de.wedoany.com-Bericht: Yongsheng Intelligence, eine Tochtergesellschaft von MGI Tech, und das Shanghai Künstliche Intelligenz Laboratory haben gemeinsam zwei neue Ergebnisse im Bereich AI for Bio vorgestellt: das Multi-Agenten-System ProtoPilot und das vollständige Agenten-Bewertungssystem BioLab Bench. Damit wird ein vollständiger Kreislauf von der Experimentierabsicht bis zur physikalischen Ausführung im Nasslabor realisiert.
Derzeit tummeln sich viele Technologieunternehmen im Bereich AI for Bio, darunter GPT-Rosalind von OpenAI, Co-Scientist und ERA von Google sowie Claude Science Workbench von Anthropic. Diese Akteure streben danach, dass große Modelle Experimentierpläne erstellen und diese im Labor umsetzen. Bisher blieb die Branche jedoch weitgehend auf der Stufe „Pläne ja, Ergebnisse nein" stecken. Konkret muss eine Experimentierabsicht fünf Ebenen durchlaufen: wissenschaftliche Absicht, Versuchsplanung, Standardarbeitsanweisung (SOP), Gerätecode und physikalische Ausführung. Ein Fehler in einer dieser Ebenen kann zum Scheitern des Experiments führen.

Das vorgestellte ProtoPilot verwendet eine Multi-Agenten-Kooperationsarchitektur mit einem Orchestrator Agent, einem Protocol Expert Agent und einem Coding Agent. Der Orchestrator Agent koordiniert den Arbeitsablauf und zerlegt Aufgaben, der Protocol Expert Agent erstellt Experimentierpläne und SOPs, und der Coding Agent wandelt die Pläne in ausführbaren Gerätecode um. Ein integrierter Validator prüft die Sicherheit und Ausführbarkeit jedes Codes und führt Fehlerursachen, Expertenurteile und Experimentergebnisse zurück, um eine geschlossene Lernschleife zu bilden.
Im branchenweit anerkannten Drittanbieter-Benchmark ProtocolQA erreichte ProtoPilot in offenen Fragen 52,38 %, nahe am Niveau menschlicher Experten (54 %), und in nicht-offenen Fragen 85,18 %, womit es das Expertenniveau übertraf. Zum Vergleich: Das derzeit leistungsstärkste Flaggschiffmodell von OpenAI, GPT-5.6 Sol, erzielte in offenen Fragen 43,5 %. In der Protocol-Aufgabenbewertung erreichte ProtoPilot eine Gesamtpunktzahl von 94,7 (von 100), mit 98,9 für Parameterplausibilität, 97,7 für methodische Konsistenz und 98,4 für inhaltliche Vollständigkeit. In einer Blindbewertung, bei der drei unabhängige Nasslabor-Wissenschaftler die Systemidentität nicht kannten, setzten sie ProtoPilot in 70,6 % der Fälle auf den ersten Platz und in 90,2 % der Fälle unter die ersten drei. Bei Aufgaben der höchsten Komplexitätsstufe L3 betrug die Erfolgsquote von ProtoPilot 60 %, während der Branchenstandard OpenTrons-AI eine Erfolgsquote von null aufwies.

In der Codeumwandlungs- und Geräteausführungsphase erreichte ProtoPilot einen Medianwert von 95,5 für die Codequalität von Protocol2Code und eine Gate-Pass-Rate von 96,6 %. Zum Vergleich: LabScript-AI hatte eine Erfolgsquote von 64,6 %, Grok-4.3 von 35 % und GPT-5.5 von 17,7 %. In geräteübergreifenden Migrationstests schwankte die Gate-Pass-Rate des Systems auf den vier gängigen Plattformen MGI AlphaTool, Hamilton STAR, OpenTrons OT-2 und Tecan EVO nur um 5,9 Prozentpunkte. Auf dem OpenTrons OT-2 betrug die Erfolgsquote von ProtoPilot 88,24 %, während die des offiziellen OpenTrons-AI nur 32,35 % betrug.

BioLab Bench ist das erste vollständige Agenten-Bewertungssystem im Bereich der Lebenswissenschaften, das von Benutzeranforderungen bis zur Geräteausführbarkeit reicht. Die Aufgaben sind nach Schwierigkeitsgraden L1 bis L3 gestaffelt und decken die gesamte Kette ab: Verständnis der Experimentierabsicht, Design2Protocol, Protocol2SOP, SOP2Code, Gerätecode und reale Experimentdurchführung, einschließlich plattformübergreifender Überprüfung.

In realen Nasslabor-Validierungen führte ProtoPilot vier Experimente mit steigendem Schwierigkeitsgrad durch. Das erste Experiment war die Beimpfung und Kultivierung einer 96-Well-Platte, bei der alle 96 Wells Wachstum zeigten und die OD600-Werte stabil waren. Das zweite Experiment waren 24 Kolonie-PCRs, bei denen alle die erwarteten Banden amplifizierten. Das dritte Experiment war der Plasmidaufbau und die ortsgerichtete Mutagenese, bei dem erfolgreich die Plasmide GLuc-WT und RLuc-WT sowie 15 Mutanten, die die Sanger-Sequenzierung bestanden, konstruiert wurden. Das vierte Experiment war die DNA-Assemblierung basierend auf der PCA-Methode, ein siebenstufiger Prozess, bei dem die Positivrate im ersten Screening 96,9 % betrug (93 von 96 Kandidatenklonen positiv). Die Sanger-Sequenzierung bestätigte, dass alle vier Ziel-DNA-Sequenzen erfolgreich konstruiert wurden. Darüber hinaus analysierte das System nach einem Fehlschlag der ersten PCA-Assemblierungstransformation aufgrund von Resistenzselektionsproblemen automatisch die Ursache und generierte einen korrigierten Plan. Im zweiten Durchlauf wurden erfolgreich pickbare Einzelkolonien erhalten und die Sequenzierung bestätigt.
Yongsheng Intelligence wurde im März dieses Jahres gegründet, ist eine Tochtergesellschaft von MGI Tech und konzentriert sich auf den Bereich AI4S. Das Team hat zuvor Projekte wie EvoPlay und PrimeGen in Nature-Subzeitschriften veröffentlicht und den Flash-Sequenzer E25 Flash maßgeblich entwickelt. MGI Tech verfügt über intelligente Laborautomatisierungsprodukte wie PrepALL, AlphaTool und den AIO-All-in-One. Bis Ende 2025 hat das Unternehmen weltweit über 3.800 Nutzer gewonnen. Die Fähigkeiten von ProtoPilot und BioLab Bench sind bereits in die Produktpalette von Yongsheng Intelligence zurückgeflossen, um αLab Brain mit bewertbaren und korrigierbaren Fähigkeiten auszustatten und gleichzeitig Hardwaregeräte wie AlphaTool und PrepALL über Protocol2Code in das Bio-Agent-Ökosystem zu integrieren.
Paper: https://arxiv.org/abs/2606.31763










