Googles TurboQuant AI-Speicherkomprimierungstechnologie wird auf der ICLR 2026 in Brasilien vorgestellt_Weltnachrichten

Googles TurboQuant AI-Speicherkomprimierungstechnologie wird auf der ICLR 2026 in Brasilien vorgestellt

2026-04-02 11:42

Merken

de.wedoany.com-Bericht: Google hat eine KI-Speicherkomprimierungstechnologie namens TurboQuant eingeführt, die darauf abzielt, den Speicherverbrauch von großen Sprachmodellen und Vektorsuchmaschinen zu optimieren. Die Technologie kann den Speicherbedarf um etwa das 6-fache reduzieren und gleichzeitig die Geschwindigkeit der Aufmerksamkeitsberechnung um bis zu das 8-fache steigern, ohne die Modellgenauigkeit zu beeinträchtigen. TurboQuant soll offiziell Ende dieses Monats auf der ICLR 2026-Konferenz in Rio de Janeiro, Brasilien, vorgestellt werden.

TurboQuant kombiniert zwei komplementäre Techniken: PolarQuant und den QJL-Algorithmus. PolarQuant vereinfacht die geometrische Struktur durch zufällige Rotation von Datenvektoren und ermöglicht so eine hochwertige Komprimierung; QJL nutzt die verbleibende Komprimierungskapazität von etwa 1 Bit, um Verzerrungen zu eliminieren und die Genauigkeit der Aufmerksamkeitsscores sicherzustellen. Google erklärte in einem Blogbeitrag: „Der Algorithmus erzeugt im Wesentlichen eine Art Hochgeschwindigkeits-Kurzschrift, ohne zusätzlichen Speicheraufwand.“

In mehreren Benchmark-Tests, wie ZeroSCROLLS und Needle in a Haystack, reduzierte TurboQuant den Speicherverbrauch erheblich, während eine hohe Genauigkeit beibehalten wurde. Tests zeigten, dass es die Cache-Genauigkeit von 16 Bit auf etwa 3 Bit komprimieren, auf H100-GPUs eine 8-fache Beschleunigung erreichen und die Trefferquote bei Vektorsuchen verbessern kann.

TurboQuant optimiert nicht nur die Komprimierungseffizienz, sondern mildert auch Speicherbandbreitenbeschränkungen und bietet neue Wege für die Skalierung von KI-Systemen. Mit zunehmender Modellgröße könnte diese Technologie, die den Speicherbedarf ohne Beeinträchtigung der Genauigkeit senkt, zu einem entscheidenden Faktor für die Weiterentwicklung der KI werden.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

Brasilien

Amerika

IKT Technik für künstliche Intelligenz

Diese Kurznachricht stammt aus der Übersetzung und Weiterverbreitung von Informationen aus dem globalen Internet und von strategischen Partnern. Sie dient lediglich dem Austausch mit den Lesern. Bei Urheberrechtsverletzungen oder anderen Problemen bitten wir um rechtzeitige Mitteilung, und wir werden die notwendigen Änderungen oder Löschungen vornehmen. Die Weitergabe dieses Artikels ist ausdrücklich ohne formelle Genehmigung verboten.E-Mail: news@wedoany.com

Vorheriger Artikel：Naoris Protocol startet Mainnet in den USA und Europa und führt Post-Quanten-Layer-1-Blockchain ein

Nächster Artikel：Qatar Airways: Plant, bis Mitte Mai Flugverbindungen nach Doha auf über 120 Ziele auszuweiten