de.wedoany.com-Bericht: Das isländische Startup Treble hat ein auf physikalischer Simulation basierendes Akustikprogramm entwickelt, das die derzeitigen, stark auf Trial-and-Error angewiesenen Methoden in der KI-Klangentwicklung ersetzen soll. Es hilft Ingenieuren, KI-generierte Klänge für Roboter, Wearables und andere intelligente Geräte zu erstellen. Das vor fünf Jahren gegründete Unternehmen hat seinen Hauptsitz in Island.
Die Plattform von Treble nutzt patentierte Algorithmen aus den Bereichen Akustiksimulation und räumlicher Audiotechnik. Das Unternehmen gibt an, dass diese Algorithmen eine messgenaue akustische Realitätsnähe mit einer Geschwindigkeit erreichen, die bestehende Simulationsmethoden weit übertrifft. „Der Klang wurde von den Menschen stets vernachlässigt", sagte Finnur Pind, CEO von Treble, im Interview mit dem Fachmagazin „Design News". „KI muss trainiert werden, um Robotern das Erkennen von Klängen und Sprache beizubringen. KI muss eine Vielzahl von Klangszenarien durchlaufen." Pind erläuterte gegenüber „Design News", dass aktuelle akustische Simulationsmethoden auf geometrischer Akustik basieren, die eine Hochfrequenz-Näherung des Klangs beinhaltet und nicht immer genau ist. Im Gegensatz dazu basiert die akustische Simulationsmethode von Treble auf numerischer Wellenakustik-Simulation, die Wellenphänomene wie Beugung, Phase und Streuung erfasst und die Wellengleichung direkt löst.
Die Leistung von Audio-KI wird durch akustische Faktoren wie Raumakustik und Nachhall, Schallquellenentfernung und -ortung, konkurrierende Lautsprecher und Hintergrundgeräusche sowie Mikrofoncharakteristiken und Geräteplatzierung beeinflusst. Eine genauere akustische Simulation ermöglicht eine mehrkanalige Sprachverbesserung und senkt die Wortfehlerrate. Der hybride Algorithmus von Treble übertrifft herkömmliche Software durch die präzise Modellierung von Einfachreflexionen, Beugung und gekoppelter Raumdynamik und ermöglicht so präzise Simulationen in komplexen Szenarien, wobei niederfrequente Effekte erfasst werden, die andere Methoden übersehen.
Treble ermöglicht zudem die realistische Simulation der eigenen Sprachausbreitung und der Akustik von Mehrfachmikrofon-Geräten und generiert hochwertige Trainings- und Testdaten für Sprach-KI, Kopfhörer, Ohrhörer und fortschrittliche Mikrofonarraysysteme. Das Unternehmen gibt an, dass die Simulationsplattform für Sprach-KI und Dialogsysteme, die Generierung synthetischer Audiodaten, virtuelle Prototypen von Audio-Hardware, Robotik und eingebettete KI, Fahrzeugakustik und Infotainmentsysteme sowie räumliches Audio und immersive Daten eingesetzt werden kann. Pind erwartet, dass die Simulationsplattform die Entwicklungszeit für diese Anwendungen verkürzen wird.
Angesichts der großen Variabilität der Sprache hat Treble eine Rangliste entwickelt, die einen umfassenden, benutzerfreundlichen und von der Community gesteuerten Benchmark zur Bewertung der automatischen Spracherkennungsleistung unter realen Einsatzszenarien bietet. Die Bewertungsbedingungen basieren auf realen Fernfeldszenarien von Endnutzern. Die Benchmark-Ergebnisse sind nach verschiedenen Szenarien (z. B. einfach, mittel, schwierig) unterteilt, um tiefere Einblicke zu ermöglichen. Laut Pind wird Treble zukünftige Versionen der KI-Klangplattform verbessern, um das Tool auch für Benutzer ohne akustische Vorkenntnisse zugänglicher zu machen.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









