Chinesischer Hersteller Longsys betreibt 397B-Modell auf AMD Ryzen AI-Plattform_Weltnachrichten_Wedoany.com

Startseite Nachrichten Details

Chinesischer Hersteller Longsys betreibt 397B-Modell auf AMD Ryzen AI-Plattform

2026-06-21 11:14

Merken

de.wedoany.com-Bericht: AMD hat kürzlich seine Ryzen AI Halo-Plattform zu einem Preis von 4.000 US-Dollar auf den Markt gebracht, was Diskussionen über einen Vergleich mit dem etwas teureren Nvidia DGX Spark-Produkt auslöste. Der Speicher- und Arbeitsspeicherhersteller Longsys ist noch einen Schritt weiter gegangen und hat demonstriert, wie auf dieser Plattform ein KI-Modell mit 397 Milliarden Parametern lokal ausgeführt werden kann. Die Demonstration nutzte einen 16-Kern-Ryzen AI Max+ 395-Prozessor mit 128 GB Arbeitsspeicher und erreichte durch die eigene SPU- und iSA-Konfiguration eine Echtzeit-Datenkomprimierung. Dadurch konnte das Gerät mit nur 128 GB Unified Memory (davon 96 GB für die GPU nutzbar) ein Modell ausführen, das normalerweise 200–250 GB Videospeicher benötigt.

AMD Ryzen AI

Es wird vermutet, dass es sich bei dem Modell um eine angepasste Version von Alibabas Qwen 3.5 397B (A17B) handelt, die auf dem Mixture-of-Experts (MoE)-Ansatz basiert. Selbst bei INT4-Quantisierung übersteigt der Speicherbedarf den verfügbaren Arbeitsspeicher des Demonstrationsgeräts bei weitem. Longsys gibt an, dass die Methode Experten-Entladung, intelligentes Cache-Management und prädiktive Prefetching-Algorithmen nutzt, um inaktive Experten vom DRAM in einen großen, schnellen Speicherpuffer auszulagern. Die KI-Chips können diese bei Bedarf wieder laden. Dieser Ansatz zielt darauf ab, die Herausforderungen der großen Parameteranzahl von MoE-Sprachmodellen, der schnellen Ausweitung des KV-Caches und der I/O-Latenz zu bewältigen. Das Unternehmen behauptet, durch die Nutzung der Cache-Ebene den DRAM-Bedarf zu senken und in Speicherlaufwerken mit bis zu 128 GB die doppelte Datenmenge unterbringen zu können. Bemerkenswerterweise lieferte Longsys keine Details zur Rechenleistung, gemessen in Tokens pro Sekunde; die Ryzen AI-Chips sind in dieser Hinsicht im Vergleich zu den meisten modernen KI-GPU-Produkten relativ begrenzt. Dennoch zeigt dieser Ansatz, Speicher als Arbeitsspeicher zu betrachten, dass durch die Nutzung schneller Speicher Speicherbeschränkungen umgangen werden können, sodass Spitzenmodelle, die normalerweise teure KI-Hardware erfordern, auf handtellergroßen Geräten laufen.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

IKT Technik für intelligente Datenverarbeitung Technik für künstliche Intelligenz

Vorheriger Artikel：Norwegens fortschrittliches Unterwasserfahrzeug startet erste Meeresbodenkartierungsmission

Nächster Artikel：Brasilianische App Avisa präsentiert WhatsApp-Marketing-Geschäft auf der Web Summit Rio

Angebotsgespräch

SIS-Sicherheitsinstrumentierungslösung

Beijing Consen Automation Technology Co., Ltd.

Angebotsgespräch

QPS-20A schnelles Umschaltgerät für redundante Stromversorgung

CHN ENERGY ZHISHEN CONTROL TECHNOLOGY CO., LTD.

Angebotsgespräch

Singlemode-Glasfaser G.652B

SHENZHEN SDG INFORMATION CO., LTD.

Angebotsgespräch

Elektrohydraulisches Steuerungssystem für SAC-Hydraulikausbaugestelle

Beijing Tianma Intelligent Control Technology Co., Ltd.

Angebotsgespräch

FAO (Autonome Fahrzeuge)

UniTTEC Co., Ltd.

Angebotsgespräch /Set

Kollaboratives Energiemanagement- und Steuerungssystem für Cloud, Edge und Endgeräte

Beijing Agent Devote Power Technology Development Co., Ltd.

Angebotsgespräch

Tragbares Satellitenterminal mit Flachbildschirm – manuelles tragbares Terminal mit 0,35-Meter-Öffnung

China Starwin Science & Technology co., Ltd.

Angebotsgespräch /Set

Baolande Application Server Software V9.5

Beijing Baolande Software Corporation

Angebotsgespräch

TWP16 P-Band-Troposphären-Windprofiler-Radar

China Huayun Meteorological Technology Group Co., Ltd.

Angebotsgespräch

Neolix X3 – der fahrerlose Kastenwagen

Neolix Beijing Technology Co., Ltd.

Angebotsgespräch

Ka-Band Phased-Array-Antennen-Sende-Subarray

COXSAT TECHNOLOGY CO., LTD.

Angebotsgespräch

Industrieschalter für den Hausgebrauch

Shenzhen Yuhang Communication Technology Co., Ltd.

Empfehlungen in Verbindung damit

UNOOSA startet zwei Initiativen für Weltraumtechnologien zur Stärkung von Industrie und Resilienz

Frankreich erweitert KI-Infrastruktur mit NVIDIA – inklusive 44-Megawatt-Rechenzentrum

Nextivity bringt aktualisiertes 5G-Unternehmens-DAS-System auf den Markt

US-Programm WOW! erweitert Glasfasernetz bis Herbst 2026 auf 20.000 Haushalte

O2 erweitert Cloud-Speicherdienst für spanische Nutzer und bietet 10 TB kostenlosen Speicherplatz

Rohde & Schwarz bringt portablen Monitoring-Empfänger von 8 kHz bis 8 GHz auf den Markt

Lujiazui-Forum in China fokussiert auf KI-Umgestaltung der Finanzbranche und Risikomanagement

Europäisches BEGONIA-Projekt veröffentlicht Vorschau auf das Betriebliche Digitale Plattform-Dokument

Google eröffnet mit Künstler das weltweit erste KI-Kunstmuseum in Los Angeles

Forschungseinrichtung der China Southern Power Grid entwickelt industrietaugliche KI-Arbeitsbrille

Neueste Nachrichten

Bechtel erhält 4,69 Milliarden US-Dollar für den Ausbau von Sabine Pass LNG in den USA

Südafrikas GridCars wird an drei Standorten Ladeinfrastruktur für Lastkraftwagen installieren

AMEA Power 120-Megawatt-Solarprojekt in Südafrika geht als erstes in Betrieb

Mehrere nordafrikanische Länder beschleunigen den Ausbau erneuerbarer Energien – Tunesien strebt bis 2035 einen Anteil von 50 % an

Indisches Unternehmen N.A.N. GreenMet und Silox planen gemeinsamen Bau einer Batterie-Recyclinganlage mit 40.000 Tonnen Kapazität

BDEW schlägt 12 Maßnahmen zum beschleunigten Netzausbau vor

Südafrikanisches ZET-Gemeinschaftsunternehmen sucht EPC-Auftragnehmer für LNG-Terminalprojekt

Honda und das US-amerikanische Unternehmen QuantumScape arbeiten gemeinsam an der Entwicklung von Festkörperbatterien

Spaniens Mercamadrid erreicht 660 kWp Photovoltaik-Gesamtleistung

RWE nimmt drei Windparks in Frankreich mit einer Gesamtleistung von 68,8 MW in Betrieb