OpenAI veröffentlicht Frontier-Governance-Rahmenwerk für sichere und konforme KI-Bereitstellung
2026-05-30 17:33
Merken

de.wedoany.com-Bericht: OpenAI hat kürzlich das „Frontier Governance Framework" (FGF) veröffentlicht, das Unternehmensleitern einen strukturierten Bauplan für die sichere und konforme Skalierung von KI-Bereitstellungen weltweit bietet. Das Rahmenwerk orientiert sich direkt am EU-Verhaltenskodex für allgemeine künstliche Intelligenz (EU's General-Purpose AI Code of Practice) und dem kalifornischen „Transparency in Frontier AI Act" (TFAIA) und erläutert detailliert, wie interne Systeme und Bereitstellungsprozesse aufgebaut werden müssen, um Hochleistungsmodelle des maschinellen Lernens sicher zu unterstützen.

Die Anwendung großer Sprachmodelle entwickelt sich kontinuierlich in Richtung nachhaltiger, geschäftstauglicher Architekturen. Das von OpenAI veröffentlichte Rahmenwerk definiert systemische Risiken als vorhersehbare, schwerwiegende Gefahren mit erheblichem Schadenspotenzial, insbesondere Szenarien, in denen ein Modell in einem einzigen Ereignis mehr als 50 Todesfälle verursacht oder Sachschäden in Höhe von 1 Milliarde US-Dollar verursacht. Diese Szenarien liegen zwar an den extremen Rändern der Wahrscheinlichkeit, ermöglichen es den Bereitstellungsteams jedoch durch die normative Definition, angemessene Sicherheitsvorkehrungen zu treffen und vorab Rechenressourcen und Ingenieurstunden für die kontinuierliche Überwachung nach der Bereitstellung und externe Prüfungen zuzuweisen.

OpenAI kategorisiert Bedrohungen in spezifische Bereiche: Cyberangriffe, chemische, biologische, radiologische und nukleare (CBRN) Risiken, schädliche Manipulation sowie Kontrollverlust. Das Klassifizierungssystem nutzt verschiedene Risikostufen zur Bewertung der Modellfähigkeiten. So gilt beispielsweise eine Cyberangriffs-Einstufung der Stufe 3 für werkzeugunterstützte Modelle, die Zero-Day-Schwachstellen ohne menschliches Eingreifen identifizieren und entwickeln können; in der CBRN-Kategorie könnte ein Modell der Stufe 3 Experten in die Lage versetzen, neuartige, hochgefährliche Bedrohungsvektoren zu entwickeln, die mit biologischen Agenzien der CDC-Kategorie A vergleichbar sind. Das Rahmenwerk beschreibt auch Risiken schädlicher Manipulation, wie etwa Einflussoperationen oder Wahlbeeinflussung, wobei OpenAI darauf hinweist, dass sich dieser Bereich noch in der Erkundungsphase befindet und durch systemische Maßnahmen wie die Überwachung nach der Bereitstellung adressiert werden muss. Hinsichtlich des Kontrollverlustrisikos zeigen Modelle der Stufe 2 die Fähigkeit, sich verschiedenen Bewertungsmethoden zu entziehen, während Modelle der Stufe 3 über längere Zeiträume autonom agieren können, mit hohem Situationsbewusstsein und hoher Tarnfähigkeit.

Im Bereich der Sicherheitsintegration richtet OpenAI seine interne Sicherheit an den Standards ISO 27001, 27017, 27018 und 27701 aus und unterzieht sich gleichzeitig einer SOC 2 Typ II-Prüfung. Zum Schutz unveröffentlichter Modellgewichte setzt das Unternehmen Verschlüsselung für ruhende und übertragene Daten, Multi-Faktor-Authentifizierung und Mehrparteien-Freigabeprotokolle ein; die Modellausführung erfolgt in Sandbox-Umgebungen mit eingeschränktem Zugang. Wenn Unternehmen dieses Setup nachbilden, schaffen sie eine Sicherheitsbasis für ihren internen Betrieb. Bei der Integration in proprietäre Unternehmensdatenumgebungen durchläuft jede API-Anfrage zunächst einen Sicherheitsklassifizierer, bevor sie die Vektordatenbank erreicht; der abgerufene Kontext wird gefiltert, bevor die endgültige Antwort generiert wird.

Um eine genaue Risikobasislinie aufrechtzuerhalten, konsultiert OpenAI externe Fachexperten und unabhängige Drittprüfer und unterzieht Modelle, die sich neuen Risikostufen nähern, Stresstests. Gemäß den Bestimmungen des EU-KI-Gesetzes (EU AI Act) bewertet das Unternehmen halbjährlich, ob der „Safety and Security Model Report" für seine leistungsstärksten Modelle aktualisiert werden muss. Eine Aktualisierung ist erforderlich, wenn sich die Modellfähigkeiten nach dem Training wesentlich ändern oder die Integration mit internen Systemen das Risiko erhöht. Die Verantwortung für die EU-Konformität trägt OpenAI Ireland Limited, während OpenAI OpCo LLC in den USA die Verpflichtungen gemäß TFAIA verwaltet. OpenAI hat zudem einen „AI Safety Incident Response Plan" (AIRP) eingeführt, der Verfahren für die Triage, Untersuchung und externe Meldung von Sicherheitsvorfällen festlegt, wobei potenzielle Vorfälle durch automatische Überwachung, Mitarbeitermeldungen oder Endnutzer-Feedback gekennzeichnet werden. Aktualisierungen des Rahmenwerks können von mehreren Führungskräften vorgeschlagen werden, darunter der Leiter der Sicherheitssysteme, der Chief Information Security Officer und der General Counsel. Das Unternehmen führt mindestens alle 12 Monate eine formelle Bewertung des Rahmenwerks durch, bei der Gesetzesänderungen, neue Modellfähigkeiten und Branchenstandards bewertet werden.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com