JD.com und Forschungseinrichtungen stellen gemeinsam RLSD-Technologie vor, um die Trainingskosten für KI-Inferenzmodelle zu senken_Weltnachrichten_Wedoany.com

Startseite Nachrichten Details

JD.com und Forschungseinrichtungen stellen gemeinsam RLSD-Technologie vor, um die Trainingskosten für KI-Inferenzmodelle zu senken

2026-04-29 15:15

Merken

de.wedoany.com-Bericht: Die hohen Kosten für das Training von KI-Inferenzmodellen bereiten Unternehmensteams seit langem Probleme. Forscher von JD.com haben in Zusammenarbeit mit mehreren akademischen Einrichtungen ein neues Trainingsparadigma namens RLSD vorgeschlagen, das darauf abzielt, mit weniger Rechenressourcen maßgeschneiderte Inferenzagenten zu erstellen. Die Technologie kombiniert bestärkendes Lernen mit Selbstdestillation und löst damit Probleme wie spärliche Signale oder hohen Rechenaufwand bei herkömmlichen Methoden.

rlvr

In Experimenten erreichten die mit RLSD trainierten Modelle eine durchschnittliche Genauigkeit von 56,18 % bei mehreren visuellen Inferenz-Benchmarks und übertrafen damit das Basismodell sowie die Standard-RLVR-Methode. Yang Chenxu, Mitautor der Studie, erklärte, RLSD entkopple die Aktualisierungsrichtung von der -stärke, verwende überprüfbare Belohnungssignale zur Bestimmung der Richtung und erziele durch Selbstdestillation ein feingliedriges Token-für-Token-Feedback. Dies vermeide Informationslecks und erhalte die Trainingsstabilität.

RLSD erfordert nur einen zusätzlichen Vorwärtsdurchlauf und konvergiert etwa doppelt so schnell wie herkömmliche Methoden. Es eignet sich für Aufgaben mit überprüfbaren Belohnungen, wie Code-Kompilierung oder mathematische Verifikation, und kann flexibel privilegierte Informationen nutzen. Die Technologie lässt sich leicht in bestehende Open-Source-Frameworks integrieren und bietet Unternehmen einen neuen Ansatz, um Modelle mit internen Daten zu optimieren.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com

IKT Technik für künstliche Intelligenz

Vorheriger Artikel：Chinas Shougang Mining veröffentlicht Ergebnisse zu fahrerlosen Minenfahrzeugen

Nächster Artikel：Metro Jakarta in Indonesien unterzeichnet Kooperationsabsichtserklärung mit Shenzhen Metro in China

Angebotsgespräch

TWP16 P-Band-Troposphären-Windprofiler-Radar

China Huayun Meteorological Technology Group Co., Ltd.

Angebotsgespräch

QPS-20A schnelles Umschaltgerät für redundante Stromversorgung

CHN ENERGY ZHISHEN CONTROL TECHNOLOGY CO., LTD.

Angebotsgespräch

Ka-Band Phased-Array-Antennen-Sende-Subarray

COXSAT TECHNOLOGY CO., LTD.

Angebotsgespräch

SIS-Sicherheitsinstrumentierungslösung

Beijing Consen Automation Technology Co., Ltd.

Angebotsgespräch

Neolix X3 – der fahrerlose Kastenwagen

Neolix Beijing Technology Co., Ltd.

Angebotsgespräch

Elektrohydraulisches Steuerungssystem für SAC-Hydraulikausbaugestelle

Beijing Tianma Intelligent Control Technology Co., Ltd.

Angebotsgespräch /Set

Kollaboratives Energiemanagement- und Steuerungssystem für Cloud, Edge und Endgeräte

Beijing Agent Devote Power Technology Development Co., Ltd.

Angebotsgespräch

FAO (Autonome Fahrzeuge)

UniTTEC Co., Ltd.

Angebotsgespräch

Industrieschalter für den Hausgebrauch

Shenzhen Yuhang Communication Technology Co., Ltd.

Angebotsgespräch

Tragbares Satellitenterminal mit Flachbildschirm – manuelles tragbares Terminal mit 0,35-Meter-Öffnung

China Starwin Science & Technology co., Ltd.

Angebotsgespräch /Set

Baolande Application Server Software V9.5

Beijing Baolande Software Corporation

Angebotsgespräch

Intelligentes Überwachungssystem für Förderbänder

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Empfehlungen in Verbindung damit

Drei große Open-Source-Gipfel im September gemeinsam in Shanghai, China

US-Unternehmen Coupa führt Agenten-Framework ein, Ausgaben im ersten Quartal über 500 Milliarden US-Dollar

Chinesische Volksuniversität und Microsoft Research stellen Arbor-Framework vor – Leistungssteigerung um mehr als das 2,5-Fache

iKOMG unterzeichnet Multiplattform-Verteilungsvertrag mit europäischem Rundfunk

Boeing Q4S Quantenverschränkungsaustausch-Test erfolgreich, Start für 2027 geplant

Hexaware Technologies investiert 25 Millionen Pfund in Expansion von Forschung, Entwicklung und Quantencomputing in Großbritannien

pgEdge bringt ColdFront auf den Markt: Speicherkosten für Kaltdaten um 90 % gesenkt

e& aus den VAE startet das erste kommerzielle U6GHz-Netzwerk der Welt mit 10 Gbit/s

Geplante Kapazität von Rechenzentren in Kyūshū, Japan, steigt in drei Jahren von 101 MW auf 3 GW

Universität Ljubljana in Slowenien bringt 708-PF-Supercomputer FRIDA auf den Markt

Neueste Nachrichten

Kirgisistan startet Bau der Togolok-Goldmine mit chinesischem Infrastrukturpartner

Goldpreis für Schmuck in China fällt unter 1.300 Yuan pro Gramm, 44 Yuan an einem Tag

Abbau an steilen Böschungen im Gaocun-Eisenbergwerk von Masteel Mining erreicht „Trennung von Mensch und Maschine"

Zijin Minings Norton Gold Fields in Australien setzt autonome Muldenkipper im Tagbetrieb ein

Vier wissenschaftliche Forschungsergebnisse der China Nonferrous Technology Co., Ltd. erreichen international führendes Niveau

Erstes untertägiges statisches Sägebauverfahren Chinas in Hebei realisiert

US-Landverwaltungsbehörde genehmigt Anfangsphase des Uranprojekts in South Dakota

AirTrunk verhandelt über 3 Milliarden US-Dollar Finanzierung für Rechenzentrumsprojekt in Australien

Vereinigte Arabische Emirate eröffnen gemeinsam mit dem Children's Hospital of Philadelphia einen Fußballplatz in West-Philadelphia

Agrarunternehmen in der Region Qaraghandy investieren über 700 Millionen Tenge in die Verbesserung der Dorfinfrastruktur