Micron aus den USA präsentiert KI-Speicherportfolio: HBM4 und 245-TB-SSD gehen in die Massenproduktion zur Unterstützung von Rechenzentrums-Inferenz
2026-06-03 14:54
Merken

de.wedoany.com-Bericht: Am 1. Juni stellte Micron Technology aus den USA auf der COMPUTEX 2026 ein für KI optimiertes End-to-End-Speicher- und -Produktportfolio vor, das von Rechenzentren bis hin zu intelligenten Edge-Anwendungen reicht. Das Portfolio umfasst HBM4, SOCAMM2, DDR5 RDIMM, Data-Center-SSDs sowie Speicherlösungen für KI-PCs, Automobil- und Embedded-Systeme. Der Fokus liegt auf Rechenanforderungen, die sich vom Modelltraining hin zu groß angelegter Inferenz, langen Kontexten und Workloads mit KI-Agenten verlagern.

Die Kernbotschaft von Microns Ankündigung ist, dass der Engpass der KI-Infrastruktur sich von der reinen Rechenleistungserweiterung hin zur Koordination von Speicherbandbreite, -kapazität, Stromverbrauch und Speicherebenen verlagert. Das Unternehmen gab bekannt, dass HBM4 36 GB 12H bei einer Verdopplung der Bandbreite den Inferenzdurchsatz großer Sprachmodelle um das 2,6-fache steigern kann; 256 GB SOCAMM2 ist für stromsparende Rechenzentrums-Speicheranwendungen ausgelegt und erreicht eine Kapazität von 256 GB, wobei es im Vergleich zu Standard-RDIMMs etwa ein Drittel des Stromverbrauchs und ein Drittel des Platzbedarfs benötigt; der auf der 1γ-Technologie basierende 256 GB DDR5 RDIMM wird bereits bemustert und erreicht Geschwindigkeiten von bis zu 9200 MT/s, was 40 % schneller ist als aktuelle Massenproduktionsmodule und den Betriebsstromverbrauch im Vergleich zu einer Kombination aus zwei 128-GB-Modulen um über 40 % senkt.

Data-Center-SSDs sind ebenfalls ein wichtiger Bestandteil dieses Portfolios. Micron gibt an, dass die Micron 9650 SSD die weltweit erste kommerzielle PCIe Gen6 SSD ist, die für KI-Inferenz- und Trainings-Workloads ausgelegt ist; die Micron 6600 ION ist nun mit einer Kapazität von bis zu 245 TB erhältlich, reduziert den Rack-Platzbedarf im Vergleich zu festplattenbasierten Bereitstellungen um 82 % und halbiert den Stromverbrauch. Für KI-Rechenzentren ist die Speicherebene nicht länger nur ein statischer Ablageort für Modelle und Daten, sondern eine aktive Arbeitsebene, die eng mit KV-Caches, Data Lakes, Trainingsdatenvorbereitung und dem kontinuierlichen Betrieb von Inferenzdiensten verbunden ist.

Diese Produktpalette zeigt, dass der Aufbau der KI-Infrastruktur in eine Phase der „ganzheitlichen Speicher- und -Rekonfiguration" eintritt. Frühe KI-Aufbauten konzentrierten sich mehr auf die Anzahl der GPUs und die Spitzenrechenleistung. Mit der Skalierung der Inferenzgeschäfte müssen Unternehmen jedoch längere Kontexte, höhere gleichzeitige Anfragen, komplexere KI-Agenten-Aufgaben und größeren Datenzugriffsdruck bewältigen. Unzureichende Speicherbandbreite begrenzt die Modellantwortgeschwindigkeit, unzureichende Kapazität beeinträchtigt die Planung langer Kontexte und mehrerer Aufgaben, und unzureichende Speicherleistung verlangsamt das Datenladen, den Cache-Zugriff und die Inferenz-Pipeline. Indem Micron HBM, LPDDR, DDR, SOCAMM und SSD auf derselben Ebene der KI-Infrastruktur präsentiert, zeigt sich, dass Speicherhersteller sich von Komponentenlieferanten zu wichtigen Akteuren bei der Optimierung der KI-Systemleistung wandeln.

Auch an der Edge finden Veränderungen statt. Micron weist darauf hin, dass mit der Ausweitung der KI-Inferenz von Rechenzentren auf PCs, Smartphones, Automobile und Embedded-Systeme lokale Geräte DRAM mit höherer Dichte benötigen, um Modelle und KI-Agenten betriebsbereit zu halten, sowie schnellere und zuverlässigere Speicher, um lokale Modell-Caches, Echtzeit-Sensorfusion im Fahrzeug und Edge-Antworten zu unterstützen. Für die Informations- und Kommunikationsindustrie bedeutet dies, dass sich die KI-Infrastruktur gleichzeitig auf die Cloud und die Edge ausdehnen wird und die Auswahl von Speicher und Arbeitsspeicher die Antwortgeschwindigkeit, den Energieverbrauch und die Bereitstellungskosten von KI-Anwendungen direkt beeinflusst.

Micron wird vom 2. bis 4. Juni in seinen Büros im TFC Plaza in Taipeh eine einladungsbasierte Produktausstellung veranstalten. Die nächsten Variablen konzentrieren sich auf den Fortschritt der Kundenintegration von HBM4, SOCAMM2 und Hochkapazitäts-SSDs, das Massenproduktionsvolumen, die Anpassungsgeschwindigkeit an GPU- und Serverplattformen sowie die Frage, ob Rechenzentrumskunden durch Speicher- und -Upgrades die Gesamt-Token-Produktionseffizienz steigern können. Mit dem Übergang von KI-Anwendungen von Trainingsclustern zu kontinuierlichen Inferenzdiensten werden Arbeitsspeicher und Speicher neben Netzwerk, Rechenleistung und Energie zu einer weiteren entscheidenden Wettbewerbslinie in Rechenzentren.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com