Googles TurboQuant AI-Speicherkomprimierungstechnologie wird auf der ICLR 2026 in Brasilien vorgestellt
2026-04-02 11:42
Merken

de.wedoany.com-Bericht: Google hat eine KI-Speicherkomprimierungstechnologie namens TurboQuant eingeführt, die darauf abzielt, den Speicherverbrauch von großen Sprachmodellen und Vektorsuchmaschinen zu optimieren. Die Technologie kann den Speicherbedarf um etwa das 6-fache reduzieren und gleichzeitig die Geschwindigkeit der Aufmerksamkeitsberechnung um bis zu das 8-fache steigern, ohne die Modellgenauigkeit zu beeinträchtigen. TurboQuant soll offiziell Ende dieses Monats auf der ICLR 2026-Konferenz in Rio de Janeiro, Brasilien, vorgestellt werden.

TurboQuant kombiniert zwei komplementäre Techniken: PolarQuant und den QJL-Algorithmus. PolarQuant vereinfacht die geometrische Struktur durch zufällige Rotation von Datenvektoren und ermöglicht so eine hochwertige Komprimierung; QJL nutzt die verbleibende Komprimierungskapazität von etwa 1 Bit, um Verzerrungen zu eliminieren und die Genauigkeit der Aufmerksamkeitsscores sicherzustellen. Google erklärte in einem Blogbeitrag: „Der Algorithmus erzeugt im Wesentlichen eine Art Hochgeschwindigkeits-Kurzschrift, ohne zusätzlichen Speicheraufwand.“

In mehreren Benchmark-Tests, wie ZeroSCROLLS und Needle in a Haystack, reduzierte TurboQuant den Speicherverbrauch erheblich, während eine hohe Genauigkeit beibehalten wurde. Tests zeigten, dass es die Cache-Genauigkeit von 16 Bit auf etwa 3 Bit komprimieren, auf H100-GPUs eine 8-fache Beschleunigung erreichen und die Trefferquote bei Vektorsuchen verbessern kann.

TurboQuant optimiert nicht nur die Komprimierungseffizienz, sondern mildert auch Speicherbandbreitenbeschränkungen und bietet neue Wege für die Skalierung von KI-Systemen. Mit zunehmender Modellgröße könnte diese Technologie, die den Speicherbedarf ohne Beeinträchtigung der Genauigkeit senkt, zu einem entscheidenden Faktor für die Weiterentwicklung der KI werden.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

Empfehlungen in Verbindung damit
Das kanadische Unternehmen Cohere übernimmt das deutsche Unternehmen Reliant AI und erweitert damit seine souveräne KI-Präsenz auf die globalen Bereiche Biopharmazie und Gesundheitswesen
2026-05-20
US-amerikanisches Unternehmen Selector für KI-Netzwerkbeobachtbarkeit stellt KI-gestützte Multi-Cloud-Observability-Lösung vor
2026-05-20
NVIDIA liefert erste Vera-CPUs an Anthropic, OpenAI, xAI und Oracle aus und schafft damit eine neue Rechenbasis für agentenbasierte KI
2026-05-20
Das US-Unternehmen Lightyear veröffentlicht den „State of Connectivity Report 2026": KI treibt die Migration von Unternehmensnetzwerk-Backbones auf 100G/400G voran
2026-05-20
Kanadisches Unternehmen QeM und taiwanesisches Unternehmen JMEM TEK unterzeichnen Vertrag zur Entwicklung eines Hardware-Root-of-Trust-System-on-Chip
2026-05-20
GITAI USA erweitert Weltraumrobotik-Dienstleistungen und treibt In-Orbit-Operationen sowie den Aufbau von Mondinfrastruktur voran
2026-05-20
US-amerikanischer Dark-Fiber-Anbieter BIG Fiber erhält 250 Millionen US-Dollar Fremdfinanzierung und beschleunigt den KI-Infrastrukturausbau in Atlanta und der San Francisco Bay Area
2026-05-20
Saudi Aramco und Pasqal starten kommerzielle Quantum-Computing-as-a-Service-Plattform in Saudi-Arabien
2026-05-20
Kanadisches Quantencomputing-Unternehmen Nord Quantique erhält 30 Millionen US-Dollar Finanzierung bei einer Bewertung von 1,4 Milliarden US-Dollar
2026-05-20
MIT entwickelt Mikrochip, der Quantenangriffen standhält und drahtlosen biomedizinischen Geräten Post-Quanten-Sicherheit bietet
2026-05-20