US-Startup AethexAI sammelt 3 Millionen US-Dollar ein und zielt auf Sprach-KI in Afrika und dem Nahen Osten ab
2026-06-04 11:08
Merken

de.wedoany.com-Bericht: AethexAI, ein Startup, das sich auf die Entwicklung von Sprach-KI-Produkten für die Märkte in Afrika und dem Nahen Osten konzentriert, wurde im letzten Jahr gegründet und hat bereits 3 Millionen US-Dollar in einer Pre-Seed-Finanzierungsrunde eingesammelt. Die Runde wurde von 4DX Ventures angeführt, mit Beteiligung von Enza Capital, Dorm Room Fund, Mojo Ventures und Stanford GSB 26 Fund. Zu den privaten Investoren gehören Fakultätsmitglieder der Stanford University, Führungskräfte von Telekommunikationsunternehmen sowie KI-Forscher von Anthropic.

Das Unternehmen nutzt keine bestehenden Orchestrierungstools wie Vapi oder LiveKit, sondern hat von Grund auf eigene Modelle und eine Orchestrierungsschicht entwickelt, um die lokalisierten Dialekte von Englisch, Französisch und Arabisch in seinen Zielmärkten zu verarbeiten. Gleichzeitig hat das Unternehmen eine Unternehmensplattform eingeführt, über die Kunden die Technologie testen und Dienste registrieren können, sowie APIs und SDKs für Entwickler, um mit den Modellen zu experimentieren.

AethexAI wurde von Mariama Diallo und Ayooluwa Odemuyiwa gegründet. CEO Diallo arbeitete zuvor bei Goldman Sachs und war später bei dem von Y Combinator unterstützten Unternehmen ModelML für Produkt und Wachstum verantwortlich; CTO Odemuyiwa absolvierte das California Institute of Technology, arbeitete bei Meta und studierte an der Stanford Graduate School of Business. Beide wollten Produkte für Schwellenmärkte entwickeln und begannen, nach Möglichkeiten zu suchen.

Weltweit bemühen sich Unternehmen, KI-Tools zur Automatisierung ihrer Abläufe einzusetzen, doch in einigen Märkten sind die Ergebnisse unbefriedigend. Die Gründer stellten fest, dass ein Callcenter in Ägypten die meisten Anrufe automatisierte, das System jedoch aufgrund schlechter Ergebnisse wieder zurückfahren musste. Mehrere Supportzentren in Afrika teilten ihnen mit, dass es eine langfristige Herausforderung sei, Ingenieure zu angemessenen Kosten für die Automatisierung von Anrufen einzustellen.

„Die Latenz und das Ruckeln, die wir bei der Automatisierung von Anrufen in dieser Region sehen, sind sehr gravierend. Wenn man ein Orchestrator wäre, müsste man möglicherweise große Modelle verwenden, die außerhalb der Region gehostet werden, was zu einer höheren Latenz führt. Damit das funktioniert, muss man sehr kleine Modelle verwenden und die Latenz bei jedem Schritt reduzieren", erklärte Odemuyiwa gegenüber TechCrunch die Entscheidung des Unternehmens, eigene Modelle und eine Orchestrierungsschicht zu entwickeln.

KI-Labore geben in der Regel Millionen von Dollar für Training und Datenerfassung aus, um die neuesten Modelle zu implementieren. AethexAI entschied sich stattdessen dafür, dass kleine Modelle ausreichen, um Latenzprobleme zu lösen und die Genauigkeit zu erhalten, und entwickelte die Kora-Modellreihe mit Parameterzahlen zwischen 300 Millionen und 1,7 Milliarden. Für das Training dieser Modelle nutzte das Unternehmen anonymisierte Aufnahmen von Partner-Callcentern und verschickte Festplatten an Radiosender in ganz Afrika, um Audiodaten zu sammeln. Um die Kosten zu senken, baute das Unternehmen ein Netzwerk von studentischen Mitarbeitern auf, die Daten annotieren und lokale Namen vorlesen. Nach eigenen Angaben verarbeitet das Unternehmen derzeit täglich über 17.000 Anrufe.

Im Geschäftsbereich hilft das Unternehmen Kunden, die mit Sprach-KI nicht vertraut sind, durch Live-Demonstrationen und Workshops dabei, die am besten für die Automatisierung geeigneten Anwendungsfälle zu identifizieren. Derzeit betreffen die meisten Anwendungsfälle Inkasso, Kundenaktivierung oder KYC (Know Your Customer, ein Standard-Identitätsprüfungsprozess, der von Banken und Telekommunikationsunternehmen verwendet wird) Telefonate. Das Unternehmen stellt derzeit auf Vertragsbasis Ingenieure für die Frontline-Implementierung ein, um den lokalen Markt zu bedienen, und baut Kanalpartnerschaften mit Telekommunikationsanbietern auf, um die Telefondienste für Sprach-KI-Anrufe abzuwickeln.

Walter Baddoo, Mitbegründer und geschäftsführender Gesellschafter von 4DX Ventures, ist der Ansicht, dass sich die Märkte in Afrika und dem Nahen Osten grundlegend von den Märkten unterscheiden, die die meisten Sprach-KI-Unternehmen ursprünglich bedienten. „Unternehmen in Afrika und dem Nahen Osten wickeln etwa dreimal so viele Anrufe ab wie ihre westlichen Pendants, da Sprache nach wie vor der primäre Kanal für die Kundeninteraktion ist. Bestehende Systeme wurden für westliche Märkte entwickelt, die durch hochwertige GPU-Infrastruktur, Standardenglisch und europäische Sprachumgebungen gekennzeichnet sind. Dies schafft eine echte Lücke, wenn Unternehmen Dialekte, Code-Switching und informelle Sprachmuster verarbeiten müssen und dies innerhalb ihrer bestehenden Telefoninfrastruktur und zu einem realistischen Preisrahmen funktionieren soll."

Obwohl Unternehmen wie ElevenLabs, Deepgram, Sierra und Cognigy schnell global expandieren, sind die Märkte, für die sie ursprünglich entwickelt wurden, nicht immer dieselben wie die, in die sie jetzt eintreten. Startups wie AethexAI setzen auf diese Lücken – Modelle, die auf lokale Dialekte spezialisiert sind, lokale Partnerschaften und eine für die Region aufgebaute Infrastruktur – und repräsentieren Marktnischen, die die großen Player weder die Motivation noch die Architektur haben, zu füllen.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com