de.wedoany.com-Bericht: Das US-amerikanische Unternehmen Deepgram, ein Anbieter von Echtzeit-Sprach-KI-Infrastruktur, hat kürzlich eine Partnerschaft mit dem Datensicherheitsunternehmen Fortanix geschlossen. Gemeinsam nutzen sie Fortanix Confidential AI und die vertraulichen Computing-Fähigkeiten von NVIDIA, um regulierten Branchen eine Sprach-KI-Bereitstellungslösung anzubieten, die in lokalen Umgebungen betrieben werden kann. Die Lösung richtet sich an Szenarien wie Gesundheitswesen, Finanzen, Regierung, Unternehmenskundenservice und interne Abläufe. Der Fokus liegt auf dem Schutz von Sprachdaten und Modellgewichten während der Inferenz.
Diese Zusammenarbeit verschiebt den Wettbewerb im Bereich Sprach-KI von Erkennungsgenauigkeit, geringer Latenz und Mehrsprachigkeit hin zur Frage, ob sie in hochsensible Geschäftsumgebungen vordringen kann. In vielen Branchen enthalten Sprachdaten selbst eine Vielzahl von Privatsphäre- und Geschäftsgeheimnissen, wie z. B. Arzt-Patienten-Gespräche, Finanztransaktionsaufzeichnungen, Kundenidentitätsinformationen, Unternehmensbesprechungsinhalte, Ticketbearbeitungsprozesse und interne Serviceanfragen. Herkömmliche cloudbasierte Spracherkennungs- oder Sprachagentenlösungen sind zwar einfach schnell zu integrieren, stoßen jedoch häufig auf Einschränkungen in Bezug auf Datenresidenz, Compliance-Prüfungen, Schutz geistigen Eigentums von Modellen und interne Sicherheitsgrenzen. Deepgram verfolgt mit diesem lokalen Bereitstellungsansatz, dass Unternehmen Spracherkennung, Sprachsynthese und Sprach-zu-Sprach-Funktionen in ihrer eigenen Umgebung ausführen können. Fortanix bietet durch vertrauliche KI-Technologie und vertrauenswürdige Ausführungsumgebungen hardwareisolierte Sicherheit für verarbeitete Audiodaten und Modellgewichte, wodurch das Risiko von Modelldiebstahl, unbefugtem Datenzugriff oder der Offenlegung des Inferenzprozesses gegenüber der zugrunde liegenden Infrastruktur verringert wird.
Die Lösung läuft auf GPUs, die das vertrauliche Computing von NVIDIA unterstützen. Audiodaten und KI-Modellgewichte bleiben während der aktiven Verarbeitungsphase verschlüsselt und isoliert. Deepgram, Fortanix und NVIDIA positionieren diese Kombination als vorintegrierten Technologie-Stack für Umgebungen mit hohen Sicherheitsanforderungen.
Sprache wird zum neuen Einstiegspunkt für Unternehmenssysteme. In der Vergangenheit waren Callcenter-Aufzeichnungen, Besprechungsprotokolle, Kundenservice-Qualitätskontrollen und Sprachtranskription eher nachgelagerte Prozesse, bei denen Unternehmen Audiodaten an Dienstanbieter hochluden, um Text, Zusammenfassungen oder Analyseergebnisse zu erhalten. Mit dem Einzug von Echtzeit-Sprachagenten in Kundenservice, medizinische Aufzeichnungen, Vor-Ort-Reparaturen, IT-Service-Desks und Compliance-Prüfprozesse werden Sprachdaten direkt an Geschäftsentscheidungen und automatisierte Ausführungen beteiligt. Die Sicherheitsanforderungen erweitern sich von „Verschlüsselung bei Speicherung und Übertragung“ auf „Schutz während der Nutzung“. Die Integration von vertraulichem Computing adressiert einen kritischen Engpass in der Produktionsbereitstellung von Sprach-KI: Modelle und Daten müssen auch während der Ausführung auf der GPU isoliert sein. Plattformadministratoren, das zugrunde liegende Betriebssystem und die Infrastrukturumgebung sollten keinen direkten Zugriff auf Klartextdaten oder Modell-Assets haben. Für regulierte Unternehmen ermöglicht diese Fähigkeit, Echtzeit-Sprachanwendungen innerhalb der eigenen Sicherheitsgrenzen zu betreiben und gleichzeitig eine Interaktion mit geringer Latenz zu gewährleisten.
Deepgram selbst bietet Sprach-zu-Text-, Text-zu-Sprach- und Sprach-zu-Sprach-Funktionen und unterstützt Bereitstellungsoptionen wie Cloud-API, Self-Hosting und lokale API. Das Unternehmen gibt an, dass seine Plattform bereits von über 200.000 Entwicklern und 1.400 Organisationen genutzt wird, die insgesamt mehr als 50.000 Jahre Audio verarbeitet und über 1 Billion Wörter transkribiert haben. Durch die Kombination mit Fortanix und NVIDIA kann Deepgram seine Sprach-KI-Fähigkeiten, die bisher eher auf Entwickler und Plattformkunden ausgerichtet waren, nun weiter in Richtung Krankenhäuser, Banken, Versicherungen, öffentliche Einrichtungen, unternehmensinterne Service-Desks und Branchenkunden mit hohen Souveränitätsanforderungen an Daten ausbauen. Die Rolle von Fortanix konzentriert sich auf den Schutz der Sicherheit von Daten, KI-Modellen und Anwendungen über den gesamten Lebenszyklus in lokalen, Multi-Cloud- und Hochsicherheitsumgebungen, insbesondere durch die Verknüpfung von vertraulichem Computing, Schlüsselkontrolle, Zero-Trust-Ausführung und Modellschutz.
Die zukünftigen Variablen konzentrieren sich auf die tatsächlichen Implementierungskosten für Unternehmen, die Verfügbarkeit von GPU-Umgebungen für vertrauliches Computing, die Anpassung an Compliance-Prüfungen und den Grad der Reproduzierbarkeit von Sprachagenten in Branchenprozessen. Wenn diese Lösung in regulierten Branchen stabile Anwendungsfälle hervorbringen kann, wird sich die Bereitstellungsweise von Sprach-KI von einem „Cloud-First-Ansatz“ zu einer hybriden Architektur aus „lokalem Betrieb, geschützten Modellen und Daten, die die Grenzen nicht verlassen“ entwickeln. Für Unternehmen im Bereich Spracherkennung und konversationelle KI werden sich die zukünftigen Wettbewerbsschwerpunkte gleichzeitig auf Modellleistung, Echtzeitfähigkeit, private Auslieferung, Integration von vertraulichem Computing und branchenspezifische Compliance-Fähigkeiten verlagern.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









