KT und Korea-Universität entwickeln koreanischen KI-Sicherheitsbenchmark
2026-06-16 13:42
Merken

de.wedoany.com-Bericht: KT gab am 16. bekannt, gemeinsam mit der Korea-Universität den multimodalen Großsprachenmodell-Sicherheitsbenchmark „KSAFE-MM“ entwickelt zu haben, der die Sicherheit von KI-Modellen im soziokulturellen Kontext Südkoreas bewertet.

Der Benchmark kombiniert gesellschaftliche Probleme und kulturelle Hintergründe Südkoreas und besteht aus zwei Teilmengen: „KSAFE-MM-G“ bewertet globale gemeinsame Risiken, die in den koreanischen Kulturkreis übertragen wurden; „KSAFE-MM-C“ konzentriert sich speziell auf für Südkorea typische Themen wie Jeonse-Betrug und den Dokdo-Konflikt. Der gesamte Datensatz umfasst insgesamt 14.135 Bewertungsbeispiele und ist damit der derzeit größte koreanische multimodale Sicherheitsbewertungsdatensatz in Südkorea. Bislang wurde der Benchmark an 12 globalen multimodalen Großsprachenmodellen wie Gemma und HyperCLOVA X validiert.

KT-Mitarbeiter bei der Entwicklung von „KSAFE-MM“. (Foto: KT)

Der Benchmark verwendet einen automatisierten, universellen Prozess. „KSAFE-MM“ realisiert einen vierteiligen automatisierten Prozess, der die Sammlung sensibler Themen aus lokalen Gemeinschaften, die templatebasierte Abfragegenerierung, die synthetische Bildgenerierung sowie die Generierung von Jailbreak-Abfragen zur Umgehung von KI-Sicherheitsvorkehrungen oder ethischen Beschränkungen umfasst. KT erklärte, dass der Prozess ohne spezifische kulturelle Fachexperten schnell einen Sicherheitsbenchmark erstellen könne, der lokale Besonderheiten widerspiegelt, wodurch Kosten gesenkt und die Effizienz gesteigert werden.

Das gemeinsame Forschungsteam von KT und der Korea-Universität bewies durch ein Pilotexperiment, bei dem derselbe Prozess auf Japanisch angewendet wurde, dass der Benchmark sofort in jedem kulturellen Kreis weltweit eingesetzt werden kann. Die Forschungsergebnisse können für Sicherheitsvalidierungen, Red-Team-Tests und die Bewertung von Schutzmodellen in realen KI-Serviceumgebungen genutzt werden. Die entsprechenden Forschungsergebnisse und der Benchmark werden auf arXiv und Hugging Face veröffentlicht.

Park Jae-hyung, Leiter des Frontier AI Lab im KT AX Future Technology Institute, erklärte, dass die Veröffentlichung des Benchmarks nicht nur der einfachen Datenverteilung diene, sondern vielmehr die Grundlage für die gemeinsame Entwicklung des gesamten KI-Sicherheitsforschungsökosystems legen solle. Er hoffe, dass KSAFE-MM zum allgemeinen Standard für die Validierung der KI-Sicherheit im koreanischen Sprach- und Kulturkontext in Wissenschaft und Industrie werde.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com