Südkoreas drei führende KI-Halbleiterunternehmen beschleunigen die kommerzielle Bereitstellung im Inferenzbereich
2026-07-01 10:30
Merken

de.wedoany.com-Bericht: Da sich der Schwerpunkt des KI-Infrastrukturmarktes vom massiven Training hin zum Inferenzbereich verlagert, bauen südkoreanische KI-Halbleiterunternehmen mit ihren einzigartigen Architekturen und praktischen Anwendungsfällen ihr Geschäft aus und versuchen, in den globalen Märkten der nächsten Generation Schwachstellen von Nvidia zu finden.

Zu den führenden Unternehmen im südkoreanischen KI-Halbleiterlager gehören Rebellions, Mobilint und HyperAccel, die auf der Grundlage unterschiedlicher Zielmärkte und technologischer Ansätze konkurrieren. Rebellions hat sich durch die Massenproduktion leistungsstarker Chips und deren groß angelegte Kommerzialisierung eine unabhängige Position erarbeitet. Sein Flaggschiff der nächsten Generation, der ‚REBEL100‘, verwendet eine fortschrittliche Chiplet-Architektur, die vier Chips verbindet, und ist mit dem fünften HBM3E-Speicher ausgestattet. Dies ermöglicht eine hohe Rechenleistung, die mit bestehenden Flaggschiff-GPUs vergleichbar ist, bei gleichzeitig hervorragender Energieeffizienz. Rebellions hat seine NPU bereits im ‚A.‘-Dienst zur Zusammenfassung von Telefonaten von SK Telecom eingesetzt, der täglich bis zu 50 Millionen API-Aufrufe verarbeitet. Bei derzeit durchschnittlich 20 Millionen monatlichen und 700.000 täglichen Inferenzaufrufen hat die NPU von Rebellions bestehende GPUs ersetzt und verarbeitet diese stabil. Darüber hinaus wird das Produkt in ‚Excalibur‘ eingesetzt, einem KI-gestützten Diagnoseassistenten für Haustiere, der in über 1.000 Tierkliniken landesweit genutzt wird.

Rebellions NPU (Bildquelle: Rebellions)

Mobilint zielt von Anfang an auf den gesamten Inferenzmarkt für Rechenzentren und Endgeräte ab und entwickelt leistungsstarke, stromsparende NPUs. Sein Vorzeigeprodukt ‚ARIES‘ bietet eine Rechenleistung von bis zu 80 TOPS bei einer Leistungsaufnahme von nur etwa 25 W. Mobilint betreibt in Zusammenarbeit mit dem KI-Callcenter-Unternehmen MetaM eine KI-basierte Beratungsplattform auf NPU-Basis, arbeitet mit Industrie-KI-Unternehmen wie POSCO DX am Aufbau und der technischen Validierung maßgeschneiderter KI-Infrastruktur für Fertigungsstandorte und hat der Yonsei University die eigenständige KI ‚MLX-A1‘ geliefert. Kürzlich hat Mobilint erfolgreich das vom südkoreanischen Ministerium für Wissenschaft und IKT (MSIT) unterstützte ‚Projekt zur Demonstration und Verbreitung von Edge-KI-Diensten‘ abgeschlossen, bei dem seine NPUs ‚ARIES‘ und ‚REGULUS‘ in Edge-Geräte wie Waldbrandüberwachungskameras und Drohnen integriert wurden, um eine Katastrophenschutzinfrastruktur aufzubauen, die Brände in Echtzeit erkennt und Ausbreitungspfade über 3D-Karten vorhersagt. Mobilint plant, in der zweiten Jahreshälfte mit ‚REGULUS‘ den ersten eigenständigen KI-SoC eines südkoreanischen NPU-Unternehmens auf den Markt zu bringen.

HyperAccel hat von Anfang an speziell für generative KI und LLM-Inferenz-Workloads die ‚LPU (LLM Processing Unit)‘ entwickelt. Sie verwendet relativ günstigen und stromsparenden LPDDR5x-Speicher und maximiert gleichzeitig die Bandbreitennutzung, was zu wirtschaftlichen Vorteilen in Bezug auf Latenz, Energieeffizienz und TCO führt. Mit dem ‚Orion‘-Server als Ausgangspunkt treibt HyperAccel eine Produkt-Roadmap für Rechenzentren und Edge-Computing voran. In Zusammenarbeit mit Naver Cloud baut es eine für Rechenzentren optimierte KI-Inferenzinfrastruktur auf und arbeitet mit LG Electronics an der Anwendung von Inferenztechnologie in verschiedenen Geräteumgebungen. Durch die Zusammenarbeit mit globalen Partnern wie Samsung Electronics, SemiFive, Advantech, INVENTEC und HPE werden gleichzeitig die technologische Wettbewerbsfähigkeit und die Skalierbarkeit der Kommerzialisierung unter Beweis gestellt.

HyperAccel LPU (Bildquelle: HyperAccel)

Alle drei Unternehmen haben den Wandel des Infrastrukturschwerpunkts vom Training hin zur Inferenz und zu KI-Agenten erkannt und entwickeln effiziente Architekturen für Inferenz-Workloads, um den TCO-Wert zu maximieren. Um die Hardware- und Software-Lock-in-Effekte von Nvidia zu durchbrechen, setzen sie vollständig auf offene Ökosysteme und unterstützen aktiv eigene Software-Stacks oder SDKs, sodass Entwickler Frameworks wie PyTorch, Hugging Face, vLLM und Triton direkt nutzen können, ohne komplexe Portierungen oder Code-Änderungen vornehmen zu müssen. Alle drei Unternehmen konzentrieren sich darauf, praktische Referenzfälle zu sammeln und globale Allianzen zu schmieden. Aufbauend auf im Inland gesammelten Erfahrungen mit großen Telefonzusammenfassungsdiensten, KI-Beratung und der gemeinsamen Entwicklung mit Naver Cloud beginnen sie mit der globalen Expansion.

Da sich der Schwerpunkt des KI-Infrastrukturmarktes in Richtung Inferenz verlagert, gewinnen inländische NPU-Cloud-Dienste (NPUaaS), die Kosteneffizienz und technologische Souveränität vereinen, an Aufmerksamkeit. Über 55 % der weltweiten KI-Infrastrukturausgaben entfallen auf Inferenz, und 80 bis 90 % der gesamten Lebenszykluskosten stammen aus Inferenzkosten. Die Nachfrage nach Alternativen zu teuren GPUs wächst stetig. Gabia hat im April dieses Jahres offiziell NPUaaS mit dem Rebellions ‚ATOM-Max‘-Chip eingeführt, der im globalen KI-Leistungsbewertungswettbewerb ‚MLPerf‘ eine 1,5- bis 3-mal höhere Verarbeitungsgeschwindigkeit und eine 3- bis 4,5-mal bessere Energieeffizienz im Vergleich zu gleichwertigen GPUs erzielte. KT Cloud hat für öffentliche Einrichtungen und Anbieter von KI-Agenten-Lösungen für den öffentlichen Sektor offiziell ein ‚NPU-Server‘-Produkt eingeführt, das den Sicherheitsvorschriften entspricht. Es hat bereits etwa 300 NPU-Beschleuniger gesichert und in Betrieb genommen und plant, nach der Massenproduktion des nächsten Rebellions-Chips ‚REBEL100‘ im dritten Quartal weitere hinzuzufügen. Samsung SDS plant die Einführung von NPUaaS auf Basis der zweiten FuriosaAI-NPU ‚RNGD‘, indem es den RNGD-Server durch Hardware-Virtualisierungstechnologie direkt in die Virtualisierungsschicht der Samsung Cloud Platform (SCP) integriert.

Die CSPs sind sich einig, dass die zukünftige KI-Infrastruktur in eine heterogene Computing-Umgebung mit einer Mischung aus GPUs, NPUs und TPUs übergehen wird. Die ‚Sovereign Cloud‘, die auf die Wahrung der Datensouveränität abzielt, sendet ebenfalls positive Signale für inländische NPUs. Damit NPUs ein mit Nvidias ‚CUDA‘ vergleichbares Entwicklererlebnis bieten können, sind derzeit die Unterstützung durch das staatliche K-Cloud-Projekt und die Software-Investitionen der Halbleiterhersteller aufeinander abgestimmt. Branchenvertreter betonen, dass die Rolle der CSPs als letztendliche Vermittler, die den technologischen Wert inländischer KI-Halbleiter vor Ort umsetzen, sich hin zu einer Integration von Service-Design, Inferenzoptimierungsberatung, Plattformautomatisierung und Sicherheitsüberwachung wandelt.

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com