US-Firma Tensordyne Napier 13-mal leistungsfähiger als GB300, Aufträge über 200 Millionen US-Dollar_Weltnachrichten

US-Firma Tensordyne Napier 13-mal leistungsfähiger als GB300, Aufträge über 200 Millionen US-Dollar

2026-06-16 09:45

Merken

de.wedoany.com-Bericht: Das Unternehmen Tensordyne (ehemals Recogni, gegründet 2017) gibt bekannt, dass sein KI-Beschleuniger „Napier“ den Tape-Out abgeschlossen hat. Der Chip ist nach dem Erfinder der Logarithmen, John Napier, benannt. Seine Kerninnovation besteht darin, mithilfe logarithmischer Mathematik die zahlreichen Multiplikationen in KI-Modellberechnungen in Additionen umzuwandeln.

Da Additionen effizienter sind, behauptet Tensordyne, dass die Rechenleistung eines einzelnen Napier-Racks die von KI-Servern mit Nvidia GB300-Technologie deutlich übertrifft. Je nach KI-Modell kann ein Napier-Rack bis zu 13-mal mehr Token pro Sekunde verarbeiten als Nvidias GB300 NVL72. Die Effizienz, gemessen in Token pro Sekunde pro Watt, könnte sogar um das 17-Fache gesteigert werden.

Das Unternehmen gab bekannt, dass das Napier-System bereits Aufträge im Gesamtwert von über 200 Millionen US-Dollar erhalten hat, nannte jedoch noch keinen konkreten Auslieferungstermin für die ersten TDN72 Pods. Nvidia plant, sein für Inferenz optimiertes System Groq 3 LPX bis Ende 2026 auf den Markt zu bringen, während das ebenfalls für Inferenz angekündigte Rubin CPX-Projekt offenbar auf Eis gelegt wurde.

Dank der logarithmischen Berechnungsweise können die eigentlichen Recheneinheiten des Napier kleiner ausgelegt werden, wodurch mehr Kerne auf dem Chip integriert und schneller SRAM untergebracht werden kann. Jeder Napier-Chip ist mit 144 GB HBM3E-Speicher ausgestattet und verfügt über eine integrierte ultraschnelle Verbindung. Ein TDN72 Pod besteht aus vier eng miteinander verbundenen Rack-Einschüben, die jeweils neun Napier-Chips enthalten. Ein vollständiges Tensordyne Napier-Rack besteht aus vier TDN72 Pods und integriert insgesamt 288 Napier-Chips.

Ein einzelnes TDN-Rack bietet eine Rechenleistung von 608 PFlops und ist mit 42 TB HBM3E, 78 GB SRAM und 256 TB RAM ausgestattet. Die maximale Leistungsaufnahme beträgt 120 Kilowatt, unterstützt wird Luftkühlung, und die Datenübertragungsrate innerhalb des Racks erreicht bis zu 275 TB/s.

Der Napier-Chip kann Datenformate wie FP16, FP8, FP4 und Int8 verarbeiten. Laut Tensordyne ist der Chip für gängige KI-Modelle wie Kimi K2.6, DeepSeek-R1/V4 Pro, Llama3.1 405B, Mixtral 8x22B, GPT-OSS-120B und Qwen 80B geeignet. Zum Vergleich: Nvidia plant, in einem einzelnen Groq-3-LPX-Rack 256 Groq-3-LPUs zu installieren, wobei jede LPU über 500 MB SRAM verfügt, was einem einzelnen Rack insgesamt 128 GB SRAM und 12 TB DDR5 RAM beschert.

Tensordyne hat seinen Hauptsitz im Silicon Valley und eine Niederlassung in München. Mehrere leitende Entwickler waren zuvor bei Juniper Networks (jetzt Teil von HPE) tätig. Bei der Entwicklung des Napier-Chips arbeitete Tensordyne mit Broadcom zusammen, das auch für Google über mehrere Generationen hinweg KI-Chips für die TPU entwickelt hat.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.