de.wedoany.com-Bericht: Am 30. Juni hat Meituan offiziell das neue Modell LongCat-2.0 mit Billionen Parametern vorgestellt und die Veröffentlichung als Open Source bekannt gegeben. Das Modell verfügt über insgesamt 1,6 Billionen Parameter, durchschnittlich etwa 48 Milliarden aktivierte Parameter, mit einem dynamischen Aktivierungsbereich von 33 bis 56 Milliarden, und unterstützt nativ einen extrem langen Kontext von 1 Million Token. LongCat-2.0 wurde auf einem Cluster mit 50.000 einheimischen KI-Chips vollständig trainiert und inferiert, mit einem Vortrainings-Datensatz von über 30 Billionen Token, der Daten in Chinesisch, Englisch, mehreren Sprachen und Code abdeckt. Es bietet grundlegende Modellfähigkeiten für das Verständnis langer Texte, Codeverarbeitung, mehrsprachige Aufgaben und komplexe KI-Agent-Anwendungen.
Mit der Veröffentlichung von LongCat-2.0 erweitert Meituan seine KI-Modellfähigkeiten von Geschäftsanwendungen auf die Bereitstellung grundlegender Open-Source-Modelle. Der Cluster mit 50.000 einheimischen KI-Chips, die Gesamtparameterzahl von 1,6 Billionen und das Kontextfenster von 1 Million Token sind die technisch am meisten beachteten Informationen dieser Veröffentlichung.
Aus struktureller Sicht verwendet LongCat-2.0 eine Konfiguration mit insgesamt Billionen Parametern und mehreren zehn Milliarden aktivierten Parametern, mit durchschnittlich etwa 48 Milliarden aktivierten Parametern und einem dynamischen Aktivierungsbereich von 33 bis 56 Milliarden. Komplexe Aufgaben können mehr Parameter nutzen, während leichte Aufgaben den Rechenaufwand reduzieren. Dieses Design hilft, die Inferenzkosten zu kontrollieren und die Ressourceneffizienz in verschiedenen Aufgabenszenarien zu verbessern. Die Fähigkeit für extrem lange Kontexte von 1 Million Token ermöglicht es dem Modell, größere Dokumente, Codebasen, Verträge, Projektdateien und mehrstufige Aufgabenaufzeichnungen auf einmal zu verarbeiten, wodurch Informationsverluste durch die Aufteilung langer Inhalte reduziert werden.
Einheimische Rechenleistung ist ein weiterer wichtiger Aspekt dieser Veröffentlichung. LongCat-2.0 wurde auf einem Cluster mit 50.000 einheimischen KI-Chips trainiert und inferiert, was zeigt, dass die heimische KI-Infrastruktur in die Trainingskette für Modelle mit extrem großem Umfang eingetreten ist.
Nach der Open-Source-Veröffentlichung wird LongCat-2.0 für Entwickler, Unternehmen und Forschungseinrichtungen zugänglich sein. Branchen wie Fertigung, Einzelhandel, Logistik, Lieferkette und Ingenieurdienstleistungen verfügen über umfangreiche Langtextmaterialien, darunter Gerätehandbücher, technische Spezifikationen, Beschaffungsverträge, Projektdokumente, Kundendienstaufzeichnungen, Code-Repositories und Unternehmenswissensdatenbanken. Das 1-Million-Kontext-Modell kann für Wissensdatenbank-Fragen und -Antworten, Langdokumentanalyse, Code-Assistenz, Automatisierung von Geschäftsprozessen und Aufgabenplanung für KI-Agenten eingesetzt werden, wodurch die Hürden für Unternehmen beim Aufbau branchenspezifischer Modelle und privater Anwendungen gesenkt werden.
Mit der Veröffentlichung von LongCat-2.0 sendet Meituan ein Signal, dass es weiterhin in die grundlegenden Fähigkeiten großer Modelle investieren wird. Die zukünftige Anwendungswirkung hängt jedoch weiterhin von den Modellgewichten, technischen Berichten, Lizenzbedingungen, Inferenzkosten und dem Umfang der verfügbaren Begleitwerkzeuge ab.









