de.wedoany.com-Bericht: Mit dem Übergang der generativen Künstlichen Intelligenz (KI) von der Proof-of-Concept-Phase (PoC) zum tatsächlichen Servicebetrieb haben sich die Herausforderungen für Unternehmen von der Verbesserung der Modellleistung hin zur Notwendigkeit erweitert, die von der KI ausgegebenen Inhalte und Verhaltensweisen zu verwalten. Vor dem Hintergrund der umfassenden Durchdringung von KI in Geschäfts- und Servicebereichen werden fehlerhafte Antworten, Sicherheitsprobleme und unerwartete Ausfälle direkt zu Unternehmensrisiken, was „LLM-Beobachtbarkeit" (Observability) zu einem neuen Thema im Unternehmens-IT-Bereich macht.
Ko Ji-hoon, Leiter des Anwendungsteams von WhaTap Labs, und Entwickler Shin Min-chek betonten in einem Videointerview mit ZDNet Korea am 26. die Veränderungen, denen Unternehmen im Zeitalter der generativen KI begegnen müssen, sowie die Bedeutung der LLM-Beobachtbarkeit. Ko Ji-hoon erklärte, dass Kunden Antworten, selbst wenn sie von der KI bereitgestellt werden, letztendlich als offizielle Informationen des Unternehmens betrachten. Daher sei ein System zur kontinuierlichen Verwaltung der Antwortqualität und -zuverlässigkeit in der Betriebsphase von KI-Diensten unverzichtbar.
Der Fall der kanadischen Fluggesellschaft Air Canada zeigt, dass Unternehmen für die Antworten ihrer KI verantwortlich sind. Der Chatbot des Unternehmens hatte einem Kunden einen nicht existierenden Rabattartikel mitgeteilt. Der Kunde kaufte daraufhin ein Ticket und beantragte den Rabatt, was abgelehnt wurde und zu einem Rechtsstreit führte. Ein kanadisches Gericht entschied, dass die Verantwortung für veröffentlichte Informationen auch dann beim Unternehmen liegt, wenn die Antwort von der KI stammt. Air Canada verlor den Fall und erlitt finanzielle Verluste sowie einen Reputationsschaden. Shin Min-chek wies darauf hin, dass es häufig vorkomme, dass Antworten von KI-Chatbots als offizielle Position des Unternehmens angesehen werden. Eine einzige fehlerhafte Antwort könne direkt zu finanziellen Verlusten und einem Rückgang der Markenreputation führen.
Ko Ji-hoon fügte hinzu, dass die meisten Unternehmen bis zum letzten Jahr noch auf dem Niveau von KI-Pilotanwendungen geblieben seien. Ab diesem Jahr nähmen jedoch, insbesondere in den Bereichen Finanzen, öffentliche Einrichtungen und Unternehmen, die Fälle der tatsächlichen Anwendung in Diensten rapide zu. Viele Unternehmen hätten die Dienste jedoch eingeführt, ohne über ein System zur Beobachtung der Antwortqualität zu verfügen.
Bestehende Überwachungsmethoden sind kaum in der Lage, Fehler in KI-Antworten zu erkennen. Selbst wenn Server- und Netzwerkmetriken normal sind, bleibt unbemerkt, wenn die KI falsche Antworten ausgibt. Ko Ji-hoon erklärte, dass Unternehmen mit einem neuartigen Problem konfrontiert sein könnten, bei dem CPU und Arbeitsspeicher normal sind, aber die Kundenbeschwerden stark ansteigen. Allein durch die Infrastrukturüberwachung könnten Anomalien in der Antwortqualität nicht erfasst werden. Gleichzeitig entwickeln sich auch Sicherheitsbedrohungen in neuen Formen weiter. Da KI-Agenten in der Lage sind, Code auszuführen und Systeme zu steuern, sind „Prompt Injection"-Angriffe, bei denen die KI durch bösartige Eingaben zu unbeabsichtigten Aktionen verleitet wird, zur Realität geworden. WhaTap Labs erlebte in internen Experimenten auch einen Unfall, bei dem die KI ohne bösartige Eingabe aufgrund einer Fehleinschätzung einen gesamten Entwickler-PC-Ordner löschte. Shin Min-chek erklärte, dass sich LLMs von der reinen Textgenerierung zu Agenten entwickelt hätten, die Funktionsaufrufe, Codeausführung und Steuerung externer Systeme durchführen können. Eine einzige Eingabeaufforderung könne direkt mit tatsächlichen Systemoperationen verbunden sein.
Um diesen Problemen zu begegnen, hat WhaTap Labs eine LLM-Beobachtbarkeitslösung eingeführt. Diese Lösung führt eine korrelierte Analyse des gesamten Prozesses durch – von der GPU-Ressourcennutzung über die Anwendungsleistung bis hin zur KI-Antwortqualität – und verwaltet Fehler und Ausfälle in der Servicebetriebsumgebung einheitlich. Zu den wichtigsten Überwachungspunkten gehören: Angemessenheit und Genauigkeit der KI-Antworten, Halluzinationen (d. h. von der KI erfundene, nicht existierende Informationen), Prompt-Injection-Angriffe, ob personenbezogene Daten enthalten sind, unnötige Umwege bei Antworten sowie die Effizienz von Token und GPU-Ressourcen. Die Lösung eignet sich besonders für inländische Finanz- und öffentliche Einrichtungen, die aus Sicherheitsgründen keine externen KI-Dienste nutzen können und daher eigene GPU-Betriebsmodelle aufbauen. Es wird erklärt, dass in einer Umgebung mit selbst betriebenen GPU-Modellen die von der KI-Antwort verwendeten Token direkt mit den GPU-Ressourcen zusammenhängen. Durch die Optimierung des Antwortpfads können sowohl die Verarbeitungsleistung als auch die Kosteneffizienz verbessert werden. Shin Min-chek betonte, dass Unternehmen, die KI-Dienste betreiben, über ein System verfügen sollten, das auf einer einzigen Plattform die Überwachung von der Antwortqualität bis hin zu Sicherheitsbedrohungen ermöglicht. Dies sei die zentrale Infrastruktur zur Aufrechterhaltung der Serviceglaubwürdigkeit. Ko Ji-hoon prognostizierte, dass sich die Rolle der Betreiber in Zukunft von der direkten Datenanalyse hin zum Entwurf von Leitplanken für den sicheren KI-Betrieb entwickeln werde. Ein System, das Infrastruktur, Anwendungen und KI-Modelle einheitlich beobachtet, werde die Wettbewerbsfähigkeit von Unternehmen bestimmen.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









