de.wedoany.com-Bericht: Die südkoreanische National Information Society Agency (NIA) wird rund 2,9 Milliarden Won investieren, um den Aufbau eines „einheitlichen Bereitstellungssystems für KI-Trainingsdaten" zu starten. Ziel ist es, eine einheitliche Plattform für die auf nationaler Ebene verteilten Trainingsdaten für Künstliche Intelligenz (KI) zu schaffen.

Mit der rasanten Verbreitung neuer KI-Technologien wie generativer KI, multimodaler KI und agentenbasierter KI ist die Beschaffung großer, hochwertiger Trainingsdaten zu einer zentralen Herausforderung geworden. Derzeit können jedoch die in staatlich finanzierten Projekten gesammelten und verarbeiteten Daten oft nicht extern geöffnet oder wiederverwendet werden. Auch die von privaten Unternehmen und Forschungseinrichtungen gehaltenen Daten bleiben aufgrund unzureichender Öffnungsprozesse und Unterstützungssysteme meist auf die interne Nutzung beschränkt. Dieses Projekt wurde ins Leben gerufen, um genau dieses Problem zu lösen.
Der Kern des Projekts ist der Aufbau eines Systems, das die Entdeckung und Registrierung von KI-Trainingsdaten, das Qualitätsmanagement und die De-Identifizierung, die Öffnung und Bereitstellung sowie die Suche und vernetzte Nutzung umfassend unterstützt. Das Projektbudget beträgt 2,87918 Milliarden Won, die Bauzeit beträgt 120 Tage ab Vertragsunterzeichnung.
Im Hinblick auf die spezifischen Funktionen wird das System ein vollständiges Registrierungsmanagementsystem aufbauen, das den gesamten Prozess von der Annahme des Registrierungsantrags für Trainingsdaten über die Eignungsprüfung, Genehmigung, Ergänzung bis hin zur Löschung abdeckt. Für registrierte Daten wird zudem eine Nachverfolgung des gesamten Lebenszyklusstatus, der Version und des Änderungsverlaufs von der Erstellung, Annotation, Verteilung, Aktualisierung bis zur Löschung ermöglicht.
Für die Datenexplorationsfunktion wird eine auf Vektordatenbanken basierende semantische Suchmaschine für natürliche Sprache entwickelt. Über eine einheitliche Schnittstelle wird eine integrierte Suche in externen öffentlichen und privaten Datenkatalogen ermöglicht. Darüber hinaus werden maschinenlesbare Serviceschnittstellen bereitgestellt, die es externen Portalen oder KI-Agenten ermöglichen, Metainformationen und Nutzungsbedingungen von Datensätzen abzufragen und zu nutzen.
Die Funktionen und Daten der derzeit von der NIA betriebenen AI Hub-Plattform werden ebenfalls in das neue System migriert. Zu den Migrationsobjekten gehören die im AI Hub-System und den zugehörigen Projekten verwalteten Daten, Metadaten, Verlaufsinformationen und Statistiken. Während der Migration werden Konsistenzprüfungen, Dublettenentfernungen und Fehlerkorrekturen durchgeführt.
Gemäß der Planung soll das System nicht nur als Datenbereitstellungsportal dienen, sondern als gemeinsame Basisplattform für das Datenökosystem, die es ermöglicht, Daten zu durchsuchen, zu importieren, zu kombinieren, zu trainieren und die Ergebnisse zu verwalten. Das langfristige Ziel der NIA ist es, dieses System zu einer Kerninfrastruktur aufzubauen, an der private Unternehmen, Forschungseinrichtungen, öffentliche Einrichtungen und andere Akteure beteiligt sind und die den gesamten Lebenszyklus des KI-Industrieökosystems abdeckt.









