de.wedoany.com-Bericht: Tencent Cloud aus China hat kürzlich eine strategische Partnerschaft mit dem in San Francisco ansässigen Sprach-KI-Unternehmen Soniox geschlossen. Dabei wird die Sprachtranskriptionstechnologie von Soniox in die globale Infrastruktur von Tencent Cloud Real-Time Audio-Video (TRTC) integriert. Für Unternehmensszenarien wie intelligente Kundenbetreuung, Sprachassistenten, Echtzeitübersetzung und Meeting-Transkription werden mehrsprachige, latenzarme Entwicklungskapazitäten für Echtzeit-Sprachanwendungen bereitgestellt.
Diese Kooperation liegt an der Schnittstelle von „Sprachverarbeitung + Echtzeitkommunikation" und hat das Kernziel, die Hürden für Unternehmen bei der globalen Bereitstellung von Sprach-KI-Anwendungen zu senken. Soniox bietet hochpräzise, latenzarme Spracherkennungsfähigkeiten, unterstützt über 60 Sprachen und kann Szenarien mit Sprachwechseln innerhalb eines Satzes verarbeiten. Tencent Cloud TRTC stellt ein unternehmensweites Echtzeitkommunikationsnetzwerk bereit, das über 3.200 globale Knoten abdeckt und eine weltweite Latenz von unter 300 Millisekunden, KI-basierte Rauschunterdrückung und Widerstandsfähigkeit in schwachen Netzumgebungen bietet. Durch die Kombination können Entwickler die Soniox-Sprachtranskriptionsschnittstelle direkt in der Tencent Cloud-Konsole integrieren, um sprach-KI-Anwendungen für mehrere Märkte zu erstellen. Für Unternehmen im Bereich grenzüberschreitender E-Commerce, Online-Bildung, Fernkonferenzen, Unternehmenskollaboration, Gaming-Social, Finanzkundendienst und internationalisierte SaaS-Unternehmen standen Sprach-Apps bisher vor drei Problemen: Erstens variiert die Netzqualität in verschiedenen Ländern stark, was bei Echtzeit-Sprachübertragung zu Verzögerungen und Paketverlusten führen kann. Zweitens erfordert mehrsprachige Erkennung die separate Anpassung an verschiedene Modelle und Schnittstellen, was hohe Entwicklungs- und Betriebskosten verursacht. Drittens stellen Szenarien wie Kundendienst, Übersetzung und Besprechungsprotokolle hohe Anforderungen an Genauigkeit und Reaktionsgeschwindigkeit, die weder allein durch Spracherkennungsmodelle noch durch Kommunikationsverbindungen stabil gewährleistet werden können. Mit dieser Partnerschaft bringen Tencent Cloud und Soniox das Echtzeit-Kommunikationsnetzwerk und die Sprachtranskriptionstechnologie in dieselbe Bereitstellungskette, was Unternehmen hilft, Spracheingabe, -übertragung, -erkennung, Textausgabe und nachgelagerte KI-Verarbeitung zu einer vollständigeren Echtzeit-Sprachinfrastruktur zu integrieren, anstatt Kommunikationsdienste, Spracherkennungsdienste und mehrsprachige Verarbeitungsmodule separat zusammenzufügen.
Die Zusammenarbeit unterstützt Unternehmen bei der Entwicklung von Sprachanwendungen für den englischsprachigen Markt sowie für mehrsprachige Märkte wie Arabisch, Hindi und Malaiisch. Die Anwendungsrichtungen umfassen intelligente Kundenbetreuung, Sprachassistenten, Echtzeitübersetzung und Meeting-Transkription.
Unternehmenssprach-KI bewegt sich von Einzelfunktionen hin zur produktionsreifen Bereitstellung. Bisher wurde Sprachtranskription hauptsächlich für Besprechungsprotokolle, Untertitelgenerierung oder die Aufbereitung von Kundendienstaufzeichnungen genutzt, wobei die Verarbeitung überwiegend offline und einsprachig erfolgte. Mit der Verbreitung von generativer KI, Echtzeit-Kundendienstrobotern, grenzüberschreitender Zusammenarbeit und intelligenter Hardware wird Sprache zu einem wichtigen Einstiegspunkt für Unternehmensanwendungen. Was die tatsächliche Umsetzung beeinflusst, ist nicht nur, ob das Erkennungsmodell einen Satz versteht, sondern auch die Qualität der Übertragungskette von der Benutzerseite zur Cloud, die Rücklaufgeschwindigkeit der Erkennungsergebnisse, die Stabilität in schwachen Netzumgebungen, die kontinuierliche Erkennungsfähigkeit in Szenarien mit gemischten Sprachen und die nahtlose Anbindung an große Modelle, Wissensdatenbanken, Ticketsysteme und Übersetzungssysteme. Tencent Cloud TRTC bietet auf der Ebene der Echtzeit-Audio-Video-Übertragung globale Knoten und niedrige Latenz, während Soniox auf der Ebene der Sprachtranskription mehrsprachige Erkennung und Verarbeitung von Sprachwechseln innerhalb eines Satzes bietet. Durch die Kombination können Unternehmen Spracheingänge schneller in Kundendienstzentren, Online-Konferenzen, grenzüberschreitende Live-Übertragungen, Fernschulungen und mobile Anwendungen einbetten. Für die Informations- und Kommunikationsindustrie zeigt diese Art von Zusammenarbeit, dass sich Echtzeit-Kommunikationsplattformen von reinen Audio-Video-Anrufwerkzeugen zu einer grundlegenden Schicht für Sprach-KI, Übersetzung, Zusammenarbeit und Automatisierungsdienste entwickeln. In Zukunft wird derjenige, der Kommunikationsverbindungen, Spracherkennung, mehrsprachige Verarbeitung und KI-Anwendungen zu einer einheitlichen Plattform orchestrieren kann, eher in der Lage sein, die globalen Bereitstellungs- und mehrsprachigen Benutzerbetriebsanforderungen von Unternehmen zu bedienen.
Die nachfolgenden Variablen dieser Zusammenarbeit konzentrieren sich auf die Übernahmegeschwindigkeit durch Unternehmenskunden, die Stabilität der mehrsprachigen Erkennung in realen Rauschumgebungen, die Schnittstellenkoordination mit großen Modellanwendungen sowie die Datenkonformitätsanforderungen in verschiedenen Ländern und Regionen. Da immer mehr Unternehmen Kundendienst, Konferenzen, Schulungen und Marketingaktivitäten auf den globalen Markt ausweiten, wird die Echtzeit-Sprachtranskription nicht mehr nur eine Hilfsfunktion sein, sondern zu einer wichtigen Grundlage für sprachübergreifende Kommunikation, automatisierte Dienste und intelligentes Betriebsmanagement werden. Die Partnerschaft zwischen Tencent Cloud und Soniox bietet einen neuen Produktkombinations-Beispiel für chinesische Cloud-Dienstleister und US-amerikanische Sprach-KI-Unternehmen auf dem globalen Unternehmenskommunikationsmarkt.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









