Intel, SambaNova und Foxconn präsentieren Rack-Level-Inferenz-Architektur für KI_Weltnachrichten

Intel, SambaNova und Foxconn präsentieren Rack-Level-Inferenz-Architektur für KI

2026-06-03 09:44

Merken

de.wedoany.com-Bericht: Intel arbeitet mit SambaNova und Foxconn zusammen, um auf der Computex 2026 eine Rack-Level-Architektur vorzustellen, die speziell für Inferenz- und agentische KI-Workloads entwickelt wurde. Die Plattform integriert Intel Xeon-Prozessoren, SambaNovas SN-50 Reconfigurable Dataflow Unit (RDU) und die Systemintegrationsfähigkeiten von Foxconn und bietet produktionsreife KI-Racks für Hyperscale-Rechenzentren, Unternehmen und aufstrebende KI-Fabriken. Dieser Schritt zeigt, dass Intel die CPU als zentrale Komponente für groß angelegte KI-Bereitstellungen positioniert, um dem Markttrend gerecht zu werden, dass der Bedarf an Inferenz das Modelltraining übersteigt.

Die Architektur spiegelt die Entwicklung der Branche von einer trainingszentrierten zu einer inferenzzentrierten Infrastruktur wider. In Trainingsszenarien unterstützt typischerweise eine CPU vier GPUs, während bei zunehmendem Umfang agentischer Workloads das Verhältnis von CPU zu Beschleuniger nahe 1:1 liegt. Das Rack-Design konzentriert sich auf die Leistung pro Watt und pro Dollar, nicht auf die Maximierung des Trainingsdurchsatzes. Intel weist darauf hin, dass agentische KI höhere Anforderungen an CPU-Orchestrierung, Scheduling, Speicherverwaltung, Datenbewegung und die Ausführung von Nicht-Matrix-Workloads stellt.

Intel präsentierte mit Vector Core Compute eine vollständig entkoppelte Inferenzarchitektur, die von Vista Equity Partners und Cambium Capital unterstützt wird und als unternehmensorientierte dedizierte Inferenz-Cloud positioniert ist. In einer Demonstration mit dem MiniMax 2.5-Modell wurde die Arbeitslast dynamisch auf verschiedene Siliziumarchitekturen aufgeteilt, um jede Phase der KI-Pipeline zu optimieren: Orchestrierung und Ausführung erfolgten durch Intel Xeon 6-Prozessoren, die Decodierung durch die SambaNova SN40 RDU und die Prefill-Operationen durch NVIDIA Blackwell-GPUs. Diese Bereitstellung gilt als eine der ersten produktionsreifen Inferenz-Pipelines, die Arbeitslasten über verschiedene Prozessortypen verteilt. Together.ai hat sich als erster kommerzieller Kunde angemeldet.

Zu den Kernpunkten der Ankündigung gehören: Intel, SambaNova und Foxconn arbeiten zusammen, um Rack-Level-Infrastruktur für Inferenz- und agentische KI-Bereitstellungen bereitzustellen; Foxconn übernimmt die End-to-End-Systemintegration, Fertigung und Bereitstellung und plant, hochdichte CPU-Varianten einzuführen, um die Kosten für Inferenz, Datenverarbeitung und hybride KI zu optimieren; Intel stellt den Xeon 6+-Prozessor (Codename Clearwater Forest) vor, der auf dem Intel 18A-Prozessknoten basiert und diesen erstmals in Rechenzentren einsetzt. Ein einzelnes Flüssigkeitskühlungs-Rack kann bis zu 36.864 Xeon 6+-Kerne unterstützen und ist darauf ausgelegt, die KI-Agenten-Konkurrenz innerhalb einer Rack-Leistungsaufnahme von etwa 100 kW zu maximieren.

Intel-CEO Lip-Bu Tan erklärte, dass Intel mit dem Aufkommen von Inferenz, agentischer und physischer KI bestrebt sei, Innovationen auf Chip- und Systemebene zu liefern. Der Schwerpunkt dieser Ankündigung liegt darauf, dass Intel versucht, eine vollständige KI-Rack-Architektur zu definieren. NVIDIA hat sein Angebot durch DGX, NVL72 und KI-Fabrik-Designs auf Full-Stack-KI-Infrastruktur ausgeweitet. Intel verfolgt eine ähnliche Strategie, positioniert Xeon als Orchestrierungsschicht für KI-Inferenz und arbeitet gleichzeitig mit spezialisierten Beschleunigeranbietern zusammen. Die Partnerschaft mit SambaNova verschafft Intel Zugang zu einer ausgereiften Inferenzbeschleuniger-Architektur, ohne auf eine interne Entwicklung einer Alternative warten zu müssen. Vor dem Hintergrund der Verlagerung von Ausgaben vom Training hin zur produktiven KI-Bereitstellung werden Stromverbrauch, Auslastung, Latenz und Gesamtbetriebskosten zu entscheidenden Kennzahlen. Intels Fokus auf CPU-Dichte, Rack-Level-Integration und entkoppelte Inferenz zielt darauf ab, Marktchancen in KI-Fabriken zu nutzen, die keine großen Trainings-GPUs benötigen, aber dennoch umfangreiche Orchestrierungs- und Inferenzfähigkeiten erfordern.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

China

Amerika

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com

Vorheriger Artikel：Cisco-CEO erwartet Verdreifachung des KI-Netzwerkverkehrs in den nächsten drei Jahren

Nächster Artikel：Vodafone und Geely Technology Europe erweitern Zusammenarbeit bei vernetzten Fahrzeugen