Südkoreas KI-Sicherheitsinstitut veröffentlicht erstmals detaillierte Sicherheitsbewertungen von KI-Modellen_Weltnachrichten

Südkoreas KI-Sicherheitsinstitut veröffentlicht erstmals detaillierte Sicherheitsbewertungen von KI-Modellen

2026-06-21 10:22

Merken

de.wedoany.com-Bericht: Das südkoreanische Institut für Künstliche Intelligenz-Sicherheit (AISI, AI Safety Institute) wird schrittweise die bisher nicht öffentlich zugänglichen Ergebnisse seiner Sicherheitsbewertungen von Künstlicher Intelligenz (KI)-Modellen veröffentlichen, die seit seiner Gründung im November 2024 durchgeführt wurden. Ziel der Einrichtung ist es, die Schlussfolgerungen der Sicherheitsbewertungen wichtiger in- und ausländischer KI-Modelle (einschließlich Open-Source-Modelle) detaillierter offenzulegen und so ein transparentes Bewertungssystem zu stärken.

Nach Brancheninformationen vom 19. veröffentlichte das AISI am 15. über seine offizielle Website den „Detaillierten Ergebnisbericht des gemeinsamen Tests zum Risiko von Datenlecks durch KI-Agenten“, der in der ersten Jahreshälfte gemeinsam mit dem singapurischen AISI durchgeführt wurde. Der Bericht zeigt konkret, wie KI-Agenten bei der Ausführung von Routineanweisungen aufgrund von Fehlentscheidungen fälschlicherweise sensible Informationen abfragen, weiterleiten und preisgeben können, was zu schwerwiegenden Fehlern führt.

Dieser gemeinsame südkoreanisch-singapurische Bericht ist die erste Veröffentlichung dieser Art und enthält nicht nur eine Bewertungsliste, sondern auch detaillierte Zahlen und Ergebnisse. Die Namen der weltweit getesteten Modelle wurden anonymisiert (z. B. als A, B, C), aber die quantitative Bewertung bestätigte mehrere Fälle von „Kognitions-Verhaltens-Inkonsistenz“, d. h. selbst wenn die Aufgabenausführungsfähigkeit eines Agenten hervorragend ist, kann seine Fähigkeit zur sicheren Datenverarbeitung nicht garantiert werden. Darüber hinaus bestätigte der Bericht auch für Agenten-KI spezifische Risikofaktoren, wie z. B. die Behauptung, eine Aufgabe ohne tatsächliche Ausführung eines Werkzeugs abgeschlossen zu haben (das Phänomen der „falschen Berichterstattung“-Halluzination).

Wichtige experimentelle Ergebnisse in der Testumgebung des südkoreanischen AISI (Foto: Screenshot des gemeinsamen südkoreanisch-singapurischen AISI-Berichts)

Tatsächlich ist dies der erste Bericht des AISI, der detaillierte Zahlen und Empfehlungen enthält. Bisher war der Umfang der Veröffentlichung von Sicherheitsbewertungsergebnissen für KI-Modelle durch das AISI begrenzt, was es schwierig machte, nicht nur die Bewertungsergebnisse einzelner Modelle unter ihrem richtigen Namen zu überprüfen, sondern auch deren Inhalt zu verifizieren. Der vom AISI letzten Monat veröffentlichte „Leistungsbericht zur Sicherheitsbewertung von 42 KI-Modellen“ bezog sich auf 42 wichtige in- und ausländische Modelle, die über einen Zeitraum von etwa 16 Monaten von Januar 2025 bis April 2026 getestet wurden, veröffentlichte jedoch nur eine Liste mit Modellnamen und Bewertungskategorien, ohne konkrete Daten.

Mit Ausnahme des ersten südkoreanischen KI-Sicherheitsbewertungsfalls, der gemeinsam vom AISI und der Korea Information Communication Technology Association (TTA) veröffentlicht wurde – Kakaos „Kanana“ – wurden die Sicherheitsstufen oder detaillierten Indikatoren der meisten Modelle nicht offengelegt. Die Skepsis der Öffentlichkeit gegenüber den Aktivitäten und der Rolle des AISI ist größtenteils auf die übermäßige Zurückhaltung des Instituts bei der Veröffentlichung seiner wesentlichen Sicherheitsbewertungsergebnisse zurückzuführen. Branchenanalysten gehen davon aus, dass dies hauptsächlich auf die Befürchtung zurückzuführen ist, dass die Leistungsunterschiede zwischen den Modellen globaler Technologiegiganten und inländischen Modellen, wie dem vom südkoreanischen Ministerium für Wissenschaft und ICT geförderten Projekt zur Entwicklung eines „unabhängigen KI-Basismodells“, offengelegt werden könnten, was eine Belastung darstellen würde.

AISI-Direktor Kim Myung-joo erklärte: „Bei zukünftigen Sicherheitsbewertungen planen wir, so viele Inhalte wie möglich zu veröffentlichen, sofern das Zielunternehmen nicht widerspricht.“ Er fügte jedoch hinzu: „Auf Anfrage von Unternehmen können einige Modellnamen anonymisiert werden.“

Das AISI ist eine dem südkoreanischen Ministerium für Wissenschaft und ICT unterstellte Organisation des Electronics and Telecommunications Research Institute (ETRI) und vertritt Südkorea speziell in der Zusammenarbeit mit KI-Sicherheitsinstituten oder verwandten Organisationen anderer Länder. Die kürzlich vom AISI mit den drei weltweit führenden KI-Entwicklern – Google DeepMind, OpenAI und Anthropic – geschlossenen Partnerschaften werden voraussichtlich eine treibende Kraft für den Aufbau eines globalen KI-Sicherheitsnetzwerks sein.

Mit Google DeepMind wird auf der Grundlage des im April vom südkoreanischen Ministerium für Wissenschaft und ICT unterzeichneten Geschäftsabkommens (MOU) die Diskussion über den Aufbau eines Sicherheitsrahmens und Testmethoden fortgesetzt. Mit OpenAI unterzeichnete das AISI am 17. direkt ein MOU, um sich auf den Austausch von Methoden und Benchmark-Wissen für Sicherheitsbewertungen in Hochrisikobereichen zu einigen. Insbesondere wird das AISI seine eigenen koreanischen Benchmark-Daten anwenden, um gemeinsam aus südkoreanischer Perspektive Halluzinations- und Sicherheitsbewertungen durchzuführen und bei der Festlegung internationaler Standards zusammenzuarbeiten.

Mit Anthropic wird im Rahmen des am 18. vom südkoreanischen Ministerium für Wissenschaft und ICT unterzeichneten MOU die Durchführung von Red-Team-Bewertungen für autonome KI-Agenten sowie die Bewertung der Modellsicherheit und des Missbrauchsrisikos im koreanischen Sprachkontext vorangetrieben. Darüber hinaus werden Informationen über KI-Schwachstellen und Cyber-Bedrohungen in Schlüsselbereichen wie dem Finanzwesen schnell ausgetauscht, um eine substanzielle Zusammenarbeit im Bereich der Cybersicherheit zu ermöglichen.

Direktor Kim Myung-joo betonte: „Wir werden die Kooperationsbasis mit globalen Technologiegiganten wie Google DeepMind, OpenAI und Anthropic kontinuierlich erweitern, die Risiken modernster Modelle wissenschaftlich validieren und ein international anerkanntes, koreanisches Bewertungssystem etablieren.“

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.