Microsoft identifiziert sieben neue Fehlermodi in KI-Agentensystemen_Weltnachrichten

Microsoft identifiziert sieben neue Fehlermodi in KI-Agentensystemen

2026-06-06 11:15

Merken

de.wedoany.com-Bericht: Microsoft hat auf der Grundlage seiner im letzten Jahr erstmals veröffentlichten „Taxonomie der Fehlermodi in KI-Agentensystemen (Taxonomy of Failure Modes in Agentic AI Systems)" sieben neue Fehlermodi in KI-Agentensystemen identifiziert.

Funktionsweise von KI-Agenten

Es gibt vier Hauptgründe, warum KI-Agenten vermehrt Fehler aufweisen: die beschleunigte Mainstream-Einführung dieser Technologie, die zunehmende Reife des Ökosystems des Model Context Protocol (MCP), der Aufstieg von Computer-Use-Agenten sowie die Ansammlung empirischer Erkenntnisse durch weitere praktische Entdeckungen der Forscher.

Zu den sieben neu identifizierten Fehlermodi gehören: Agentic Supply Chain Compromise (Gefährdung der Agenten-Lieferkette), bei dem das Verhalten des Agenten eher durch natürliche Sprache als durch bösartigen Code beeinflusst werden kann; Goal Hijacking (Zielentführung), bei dem gegnerische Anweisungen scheinbar mit legitimen Aufgaben übereinstimmen, während sie heimlich das Endziel des Agenten umleiten; Inter-Agent Trust Escalation (Vertrauenseskalation zwischen Agenten), bei dem ein kompromittierter Agent gegenüber dem Orchestrator eine falsche Identität vorgibt oder seine Berechtigungen überhöht darstellt; Computer Use Agent (CUA) Visual Attack (visueller Angriff auf Computer-Use-Agenten), bei dem ein über die grafische Benutzeroberfläche operierender Agent durch Inhalte mit gegnerischen Anweisungen manipuliert werden kann; Session Context Contamination (Kontamination des Sitzungskontexts), bei dem ein Gegner Daten einschleust, die die Schlussfolgerungen des Agenten in nachfolgenden Schritten verzerren, ohne in einem einzelnen Schritt die Sicherheitskontrollen auszulösen; MCP / Plugin Abuse (Missbrauch von MCP/Plugins), eine Aktualisierung der ursprünglichen Taxonomie zur Beeinträchtigung von Funktionen über MCP- und Plugin-Protokolle, insbesondere der für diese Protokolle spezifischen Angriffsflächen; Capability / Architecture Disclosure (Offenlegung von Fähigkeiten/Architektur), bei dem der Agent interne Implementierungsdetails preisgibt, wie Toolnamen und -schemata, System-Prompt-Strukturen, Speicherschnittstellen oder die Logik zur Auslösung von Zustimmung/Mensch-im-Kreis.

Microsoft empfiehlt Sicherheitsteams, diese Fehlermodi zur Planungsorientierung zu nutzen, die Lieferkette zu inventarisieren, für jeden bereitgestellten Agenten eine Software-Stückliste (SBOM) zu erstellen, die Agentenidentität durch ausstellbare nachweisbare Berechtigungsnachweise kryptografisch zu verifizieren (anstelle einer Standortverifizierung), die sieben neuen Fehlermodi in die Red-Team-Abdeckungsmatrix aufzunehmen und die Benutzererfahrung des Mensch-im-Kreis als Sicherheitskontrolle zu auditieren.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

Amerika

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com