Microsoft bringt Windows-seitige Spracherkennungs-API und Aion-Kleinsprachmodelle auf den Markt
2026-06-04 16:19
Merken

de.wedoany.com-Bericht: Vom 2. bis 3. Juni veröffentlichte Microsoft auf der Build 2026 ein Update für die Windows AI APIs, das eine neue geräteseitige Spracherkennungs-API hinzufügt und zwei Arten von lokal ausführbaren Kleinsprachmodellen, Aion 1.0 Instruct und Aion 1.0 Plan, vorstellt. Diese Funktionen richten sich hauptsächlich an Windows 11-Entwickler und ermöglichen Sprach-zu-Text, intelligente Textverarbeitung und lokale agentische Aufgabenausführung auf PCs.

Dieses Update verlagert die Sprachverarbeitungsfähigkeiten weiter auf die Endgeräte. Die neue Spracherkennungs-API unterstützt die Echtzeit- oder Batch-Transkription von Mikrofon, Audiostreams und Audiodateien und kann für Untertitelgenerierung, Diktateingabe, Audio-/Videoanwendungen und Barrierefreiheitstools verwendet werden. Microsoft betont, dass diese Fähigkeit lokal ausgeführt wird, sodass Transkriptionen auch ohne Netzwerkverbindung erstellt werden können, wodurch die Abhängigkeit von Cloud-Inferenz reduziert wird. Für Unternehmenssoftware, Meeting-Tools, industrielle Feldaufzeichnungen, Fernwartung sowie Bildungs- und Schulungssysteme liegt der Wert der geräteseitigen Sprach-zu-Text-Funktion in der Reduzierung von Latenzzeiten und Cloud-Kosten, während gleichzeitig sensible Sprachdaten nach Möglichkeit lokal auf dem Gerät verarbeitet werden. Mit dem Einzug von KI in mehr Büro- und Industrieendgeräte entwickelt sich die Spracherkennung von einer separaten Funktionsmodul zu einer grundlegenden Fähigkeit auf Betriebssystemebene.

Aion 1.0 Instruct ist als Kleinsprachmodell für geräteseitige Arbeitslasten positioniert und unterstützt Aufgaben wie Zusammenfassung, Umschreibung, Absichtserkennung und barrierefreie Textintelligenz.

Aion 1.0 Plan hingegen ist für lokale agentische Inferenzszenarien konzipiert. Das Modell hat 14 Milliarden Parameter, unterstützt einen Kontext von 32.000 Token und Tool-Calling-Fähigkeiten und hilft Anwendungen, Benutzerabsichten zu verstehen, Tools aufzurufen, Dateien zu verwalten und Unteragenten zu orchestrieren. Microsoft plant, dieses Modell als Teil von Windows auf geeigneten Geräten auszuführen, um einige agentische Prozesse von der Cloud auf lokale Geräte zu verlagern. Für Entwickler bedeutet dies, dass zukünftige Desktop-Anwendungen direkt auf Betriebssystemebene auf Textverständnis, Spracherkennung und Tool-Orchestrierung zugreifen können, ohne für jede Anwendung separate externe Modelldienste integrieren zu müssen. Für Unternehmens-IT-Abteilungen bringen geräteseitige Modelle neue Governance-Probleme mit sich, darunter Modellberechtigungen, Dateizugriffsgrenzen, Benutzeridentifikation, Datenaufbewahrung, Geräteleistung und anwendungsübergreifende Audits. Ob diese Modelle in großem Umfang in Unternehmensszenarien Einzug halten können, hängt davon ab, ob die lokalen KI-Fähigkeiten und Sicherheitsmanagementmechanismen gleichzeitig ausgereift sind.

Microsoft kündigte außerdem an, dass die Windows AI APIs auf weitere Windows 11-Computer ausgeweitet werden. Neben NPUs werden einige Funktionen auch CPUs und GPUs unterstützen. Die Spracherkennungs-API wird zunächst hauptsächlich Englisch unterstützen und schrittweise auf weitere globale Märkte ausgeweitet. Mit der Integration von geräteseitigen Modellen, Spracherkennung und lokalen Agentenfähigkeiten in das Windows-Entwicklungsökosystem wandelt sich die Sprachverarbeitungstechnologie von einer Cloud-Dienstschnittstelle zu einer grundlegenden Komponente auf Betriebssystemebene und wird zu einer wichtigen Basis für Anwendungsentwicklung, barrierefreie Interaktion und intelligente Unternehmensworkflows.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com