de.wedoany.com-Bericht: Das US-amerikanische KI-Unternehmen d-Matrix hat bekannt gegeben, dass seine CorsairKünstliche Intelligenz-Inferenzbeschleunigungsplattform in die vollständige Produktionsphase eingetreten ist und mit der Auslieferung an prioritäre Kunden in Serie beginnt. Das Unternehmen mit Hauptsitz in Santa Clara, Kalifornien, USA, beliefert unter anderem Hyperscaler-Cloud-Dienstanbieter, Neocloud-Dienstanbieter und führende KI-Labore, wobei die Produkte hauptsächlich für KI-Inferenzszenarien in Rechenzentren eingesetzt werden.
Corsair ist kein Trainingschip, sondern konzentriert sich auf die Inferenz großer Modelle.
In generativen KI-Anwendungen muss nach Abschluss des Modelltrainings für jede Benutzeranfrage, Sprachinteraktion, Codegenerierung und multimodale Inhaltserstellung im Hintergrund eine Inferenzberechnung durchgeführt werden. d-Matrix gibt an, dass Corsair für latenzarme Inferenzaufgaben ausgelegt ist und mit GPUs ein heterogenes, entkoppeltes Rechensystem bilden kann, bei dem verschiedene Recheneinheiten jeweils besser geeignete Aufgaben übernehmen. Das Unternehmen betrachtet diese vollständige Produktion als einen Meilenstein der kommerziellen Auslieferung, was bedeutet, dass Corsair von der frühen Kundenvalidierung in die Phase der Serienversorgung übergeht.
Für eine skalierbare Auslieferung ist die Lieferkette eine Voraussetzung. d-Matrix erklärt, dass das Unternehmen mehrjährige Liefer- und Fertigungsdienstleistungsgarantien erhalten hat und auf dieser Grundlage die Produktauslieferung vorantreiben wird. Alchip Technologies war am Design und der Serienproduktionsunterstützung von Corsair beteiligt. Das Management von Alchip erklärte, dass die Zusammenarbeit bereits in der frühen Designphase von Corsair begann und die Unterstützung für die Skalierung der Plattform fortgesetzt wird.
Das Produktportfolio von d-Matrix besteht nicht nur aus einer einzelnen Beschleunigerkarte. Laut Unternehmensangaben kann Corsair mit dem JetStream I/O-Beschleuniger, dem Aviator-Software-Stack und anderen Komponenten kombiniert werden, um eine für Rack-Bereitstellungen in Rechenzentren ausgelegte Inferenzplattform zu bilden. Die auf der Unternehmenswebsite gezeigten Referenzlösungen umfassen mehrere Server, mehrere Beschleunigerkarten und verschiedene Speicherkonfigurationen, mit dem Ziel, den Datenverschiebungsaufwand bei der Inferenz großer Modelle zu reduzieren und die Reaktionsgeschwindigkeit sowie die Leistung pro Leistungseinheit zu verbessern.
Dieser Auslieferungszeitpunkt fällt in eine Phase, in der sich der Schwerpunkt des KI-Infrastrukturaufbaus verschiebt. In den letzten zwei Jahren konzentrierten sich die Marktinvestitionen hauptsächlich auf Trainingscluster und die Ausweitung der GPU-Rechenleistung; mit dem zunehmenden Einsatz von Chatbots, Agentenanwendungen, Echtzeit-Sprachagenten und unternehmensorientierten KI-Tools werden Latenz, Parallelverarbeitungsfähigkeit und Betriebskosten auf der Inferenzseite zu wichtigen Kriterien bei Kundenbeschaffungen. Nachdem Corsair in die vollständige Produktion übergegangen ist, muss d-Matrix nun beweisen, dass seine Plattform unter realen Rechenzentrumslasten stabil laufen und sich an Server, Netzwerke, Modelle und die Software-Ökologie anpassen kann.
Die nächsten Meilensteine konzentrieren sich auf den Umfang der Kundenbereitstellungen, die Rack-Level-Leistungsvalidierung und den langfristigen Lieferrhythmus. Wenn die Seriennutzung durch prioritäre Kunden reibungslos voranschreitet, wird d-Matrix im kommerziellen Wettbewerb um KI-Inferenzchips in den USA eine klarere Position bei der Auslieferung erlangen.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









