de.wedoany.com-Bericht: Die LF AI & Data Foundation, ein Tochterunternehmen der Linux Foundation, hat eine Arbeitsgruppe ins Leben gerufen, die sich auf die Entwicklung der DocLang-Spezifikation konzentriert. Ziel ist es, interoperable Dokumentenverarbeitungsstandards für KI- und Agenten-Workflows zu schaffen.

Die Arbeitsgruppe wurde von den Hauptmitgliedern IBM, Nvidia und Red Hat gegründet. Ihre Aufgabe ist die Entwicklung eines offenen, universellen und KI-nativen Dokumentenformats, das die Art und Weise verbessern soll, wie Unternehmen Dokumentdaten für KI-Systeme vorbereiten, austauschen und verwalten. Auch die Beitragenden ABBYY und Human Signal werden an der Entwicklung mitwirken.
Laut der Ankündigung arbeiten Unternehmen derzeit mit einer Vielzahl fragmentierter Dokumentenformate, darunter PDF, JPEG und andere Dateitypen, die hauptsächlich für das menschliche Lesen und nicht für die KI-Interpretation entwickelt wurden. Da Organisationen zunehmend auf generative KI und Agentensysteme angewiesen sind, kann diese Diskrepanz bei der Extraktion von Bedeutung aus Geschäftsdokumenten zu Komplexität, höheren Kosten und geringerer Zuverlässigkeit führen.
Mark Collier, Executive Director von LF AI & Data, erklärte, dass das Ziel der DocLang-Spezifikations-Arbeitsgruppe die Entwicklung eines anbieterneutralen, interoperablen Standards sei, der Organisationen helfe, Dokumentdaten zuverlässiger, transparenter und in großem Maßstab für KI vorzubereiten. Ein von der Arbeitsgruppe veröffentlichtes Informationsdokument besagt: „PDF wurde für den Druck geboren, DOCX für den Editor, DocLang für die nächste Ära – ein maschinenlesbarer Dokumentenstandard, dem Modelle wirklich vertrauen können." DocLang definiert ein strukturiertes, maschinenlesbares Format für jede Art von Dokument – wie JSON für Daten oder HTML für das Web – das von jedem Tool implementiert und in jeder Pipeline verwendet werden kann.
Der unabhängige Technologieanalyst Carmi Levy erklärte, dass bestehende Dokumentenstandards jahrzehntelang globale Interessengruppen in die Lage versetzt hätten, vertrauensvoll zusammenzuarbeiten. Da KI jedoch die Regeln der Arbeitsweise neu definiere, seien diese Standards dringend aktualisierungsbedürftig. Er sieht in DocLang die früheste und größte Hoffnung, eine grundlegende Basis für Dokumentenstandards zu schaffen, die Workflows intelligenter, effizienter und risikoärmer machen könnte als heute. Der Open-Source- und anbieterneutrale Ansatz stelle sicher, dass kollektive Interessen vor den Bedürfnissen einzelner Anbieter priorisiert werden. Frühere Standardisierungsbemühungen rund um Netzwerke, Dokumente, Webseiten und Clouds hätten die frei fließende digitale Landschaft geprägt, die das moderne Leben definiert.
Jason Andersen, Chefanalyst bei Moor Insights & Strategy, ist der Ansicht, dass bei der Anwendung von Standards wie DocLang auf die Inhaltserfassung ein Benutzer, der ein Dokument an einen Agenten hochlädt, eine Fähigkeit ausführen könnte, um das Dokument vorzuverarbeiten und in das DocLang-Standardformat zu konvertieren, wodurch Tokens gespart würden. Er stellt sich vor, dass diese Standards es Menschen ermöglichen müssen, das zu tun, was sie tun möchten, ohne Codierung zu benötigen. Wenn Metadaten oder Code durch die Vorverarbeitung an das Dokument angehängt werden, könnte die Governance bei ordnungsgemäßer Wartung einfacher zu realisieren sein. Dies sei jedoch in der Spezifikation noch nicht enthalten, und er ermutigt das Team, dies zu berücksichtigen.
Yaz Palanichamy, Senior Research Analyst bei der Info-Tech Research Group, erklärte, dass das Konzept KI-nativer Dokumente aus Sicht der Benutzerproduktivität Organisationen dabei helfe, Dokumentdaten für KI-integrierte Systeme vorzubereiten. Er betonte jedoch, dass organisatorische Compliance-Kontrollen und ein allgemeines Governance-Modell unbedingt erforderlich seien. Zudem müsse geprüft werden, ob die technologische Bereitschaft des Unternehmens ausreiche, um interne Dokumentenmanagementpraktiken zu standardisieren. Ohne eine interne Machbarkeitsstudie oder vorherige Vorbereitung könne das Änderungsmanagement nicht ordnungsgemäß durchgeführt werden, was die Organisation daran hindern könnte, ihre KI-integrierte Dokumentenverarbeitungsfähigkeit weiterzuentwickeln oder auszubauen. Aus Governance-Perspektive müssten mehrere organisatorische Kontrollmaßnahmen ordnungsgemäß überprüft werden, um sicherzustellen, dass dieser neue Kollaborationsstandard und das Toolkit verantwortungsvoll und sicher skaliert werden.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









