de.wedoany.com-Bericht: Lee Ki-chang, Vorstandsmitglied von Naver Cloud, erklärte am 2. auf der Tech Deep Talk Session im Bezirk Gangnam in Seoul, dass der dialogbasierte Suchdienst AI Tab auf dem Product Native LLM basiert, das auf HyperCLOVA X entwickelt wurde. Er betonte, dass Naver das Ziel verfolge, bei der Servicefähigkeit einen klaren Vorteil zu erlangen, die grundlegenden Fähigkeiten auf einem Niveau zu halten, das über dem der Wettbewerber liegt, und die Lücke bei den professionellen Fähigkeiten im Vergleich zum weltweit führenden Spitzenniveau so gering wie möglich zu halten.
AI Tab ist ein dialogbasierter Suchdienst, den Naver am 26. des Vormonats offiziell eingeführt hat. Er versteht die Suchabsicht und den Kontext der Nutzer, liefert Antworten und verbindet diese mit praktischen Aktionen wie Einkaufen und Ortsuche. Das Product Native LLM integriert Naver-Daten, Serviceszenarien und Nutzerfeedback umfassend in das Modelldesign.

Das Modell wurde auf drei Säulen entwickelt: Daten, Architektur und Training. Durch einen Dokumentqualitätsfilter wurde die Qualität der Lerndaten verbessert und eine „Pipeline zur Sammlung nicht-strukturierter Daten“ (비스형 데이터 수집 파이프라인) aufgebaut, um in der Vortrainingsphase Daten aus Bereichen wie Suche, Einkaufen, Orte und Lebensinformationen zu berücksichtigen. In der Architektur wurde die MoE-Struktur (Mixture of Experts) eingeführt, die im Vergleich zum bisherigen HCX (HyperCLOVA X) schnellere Antwortzeiten und einen höheren Durchsatz gewährleistet, wodurch die End-to-End-Latenz (E2E-Latenz) verkürzt wird. Das Modell verbessert den Rechenaufwand so, dass er linear proportional zur Eingabelänge ist, und behält bei langen Kontexten eine stabile Antwortgeschwindigkeit und einen hohen Durchsatz bei.

In der Trainingsphase wurden die Rechenressourcen für das verstärkende Lernen im Vergleich zum bisherigen HCX mehr als verdoppelt. Die neue Technologie des Klarheitsverstärkenden Lernens (Clarify RL) wurde angewendet, die für unbeantwortbare Fragen durch Nachfragen nach zusätzlichen Bedingungen Belohnungen vergibt und so Halluzinationen reduziert. Die Technologie der On-Policy-Destillation (OPD) wurde ebenfalls eingesetzt: Die vom trainierenden Modell selbst generierten Antworten werden von einem leistungsstärkeren Modell auf Token-Ebene modifiziert, wodurch schwache Fachbereichsfähigkeiten effektiv ergänzt werden. Die Struktur ermöglicht eine kontinuierliche Verbesserung: Mit der Leistungssteigerung des leistungsstärkeren Modells wird auch das trainierende Modell gestärkt.
In den internen Benchmarks von Naver zur Bewertung der Ausführungsqualität des in AI Tab eingesetzten Modells in Bereichen wie „Suche, Kauf, Buchung“ erreichte die Servicefähigkeit 108 Punkte, was über dem Durchschnitt der Wettbewerber von 100 Punkten und dem Höchstwert der Wettbewerber von 106 Punkten liegt. Die grundlegenden Fähigkeiten wie Befehlsausführung und japanischer Tool-Aufruf erzielten 104 Punkte und übertrafen den Durchschnitt der Wettbewerber von 100 Punkten. Die professionellen Fähigkeiten zur Lösung wissenschaftlicher Probleme auf Doktoratsniveau erreichten 97 Punkte, etwas unter dem Durchschnitt der Wettbewerber von 100 Punkten. Vorstandsmitglied Lee Ki-chang erklärte, dass man sich bei den grundlegenden und professionellen Fähigkeiten durch Anstrengung ebenfalls verbessern könne, strategisch jedoch beschlossen habe, stärker in servicebezogene Fähigkeiten zu investieren.
Vor Ort stellte Naver auch die Kerntechnologie „Harness Engineering“ vor, die AI Tab stabil antreibt. Sie läuft in vier Schritten ab: Verstehen der Nutzerabsicht und Verwalten langer Dialogkontexte, servicebezogene Schlussfolgerungen für Suche, Einkaufen und Orte, Bereitstellung von Quellen und Ausführung von Verknüpfungen.
Naver präsentierte die Vision, sich mit Smart Lens, das in der Suchleiste eingesetzt wird, zu einem multimodalen Agenten (Multimodal Agent) zu entwickeln. Seit der Einführung von Smart Lens im Jahr 2017 für die Bildsuche, über die kombinierte Suche von Bild und Text im Jahr 2022, bis hin zur Einführung von Smart Lens X AI Briefing im letzten Jahr für Bildverständnis und Zusammenfassung, wurde die Technologie kontinuierlich weiterentwickelt.

Yoon Sang-doo, Teamleiter bei Naver, erklärte, dass der KI-Agent von Naver derzeit hauptsächlich auf Texteingabe basiert, sich aber in Zukunft zu einem multimodalen Agenten entwickeln werde, der Absichten durch Bilder versteht und mit praktischen Aktionen verbindet.










