GitHub aus den USA senkt in Zusammenarbeit mit Microsoft die Fehlalarmrate um 75,76 %
2026-06-12 11:27
Merken

de.wedoany.com-Bericht: GitHub hat in Zusammenarbeit mit dem Microsoft Security & AI’s Agents Offense Team die Validierungsmethode von Agentic Secret Finder angewendet, um mehr kontextbezogene Schlussfolgerungen in die Geheimnis-Scan-Validierung von GitHub einzubringen. Diese Methode kombiniert die groß angelegte Erkennungspipeline von GitHub mit einer LLM-basierten Kontextvalidierung und senkt die Fehlalarmrate letztendlich um 75,76 %, womit das zuvor festgelegte Ziel von 65 % übertroffen wird. In der Evaluierung testete das Team die Methode anhand von 1500 von Kunden bestätigten Fehlalarmen. Angesichts der enormen Größe des GitHub-Codebestands haben Fehlalarme bei Geheimnis-Scan-Warnungen Entwickler lange Zeit geplagt; zu viele Warnungen mit geringem Wert untergraben die Glaubwürdigkeit des Systems.

Flussdiagramm zeigt, wie die bestehenden Validierungsschritte von GitHub durch kontextbewusste Schlussfolgerungen erweitert werden, um die Präzision der Änderungserkennung zu verbessern

Die traditionelle, auf Mustererkennung basierende Erkennung kann zwar geheimnisähnliche Zeichenfolgen identifizieren, hat jedoch Schwierigkeiten, zwischen echten Offenlegungen und Werten zu unterscheiden, die nur sensibel erscheinen. Um dieser Herausforderung zu begegnen, hat das Team nicht einfach die Datenmenge für die Analyse erhöht, sondern sich darauf konzentriert, eine kleine Menge hochsignifikanter Informationen zu extrahieren. Beispielsweise sucht das System danach, ob ein Wert, der einer Variablen zugewiesen wurde, anschließend in API-Anfragen, Authentifizierungs-Header, Datenbank-Clients oder Cloud-SDK-Aufrufe übergeben wird. Die Forschung ergab, dass die meisten Fehlalarme allein durch den fokussierten Dateikontext gelöst werden können, während die Übergabe der gesamten Datei oder des gesamten Repositorys zu viel Rauschen einführen und Kosten sowie Latenz erhöhen würde. Diese Strategie des „besseren Kontexts“ anstelle von „mehr Kontext“ ermöglicht es dem System, echte Geheimnisse effektiver von Testdaten oder Platzhaltern zu unterscheiden.

Tabelle zeigt, dass 'mehr Kontext' wie gesamte Datei/Repository, hohes Rauschen, nicht besser ist als 'besserer Kontext' mit Nutzungssignalen und Ausführungspfaden. Dies liefert fokussierte Eingaben.

Diese Methode baut direkt auf dem bestehenden Geheimnis-Scan-System von GitHub auf und verbessert die Kontextwahrnehmung des Validierungsschritts, ohne die vorgelagerte Erkennungslogik zu ändern oder die Abdeckung zu verringern. Der GitHub-Geheimnis-Scan kombiniert ursprünglich musterbasierte Erkennung und KI-gesteuerte universelle Geheimniserkennung und deckt Milliarden von Pushes von zig Millionen Entwicklern in Millionen von Repositorys ab. Diese Zusammenarbeit zielt darauf ab, die Präzision der von der KI erkannten Geheimnisse auf den gleichen hohen Standard wie die anbieterspezifische Mustererkennung zu heben.

Basierend auf 1500 von Kunden bestätigten Fehlalarmen wurde eine Reduzierung der Fehlalarme um 75,76 % erreicht.

Diese Verbesserung wirkt sich direkt auf die Entwicklererfahrung aus. Weniger irrelevante Warnungen ermöglichen es Entwicklern, echte Probleme schneller zu priorisieren und zu beheben. Derzeit evaluiert GitHub diese Methode weiterhin anhand größerer Datensätze und in Echtzeit-Datenverkehr und optimiert gleichzeitig die Kontextextraktion und den Validierungsprozess.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com