Schweizer Team entwickelt 7-Milliarden-Parameter-TutorRL-Modell zur Balance von Fachwissen und Lehrfähigkeiten
2026-06-15 16:15
Merken

de.wedoany.com-Bericht: Der Schweizer Postdoktorand Jakub Mačina hat in Zusammenarbeit mit dem Informatikprofessor Mrinmaya Sachan und dem Lernwissenschaftler Manu Kapur ein KI-Lernmodell namens „TutorRL“ entwickelt, das darauf abzielt, Fachwissen mit Lehrfähigkeiten in Einklang zu bringen. Das Modell benötigt nur 7 Milliarden Parameter, weit weniger als die aktuellen großen Sprachmodelle mit Hunderten von Milliarden oder sogar Billionen von Parametern, und weicht bei bis zu 20 Lerninteraktionen nicht so leicht vom Thema ab.

Mačinas Forschung konzentriert sich darauf, wie große Sprachmodelle zu Lerncoaches mit pädagogischem Wert werden können. Er weist darauf hin, dass die meisten bestehenden großen Sprachmodelle darauf optimiert sind, Antworten und Lösungen zu generieren, anstatt die Lernenden während des Lernprozesses zum eigenständigen Denken zu führen. Selbst wenn in den Eingabeaufforderungen explizit Lernunterstützung gefordert wird, sind die Ergebnisse in der Regel nicht zufriedenstellend. Um die pädagogische Eignung verschiedener Modelle zu testen, entwickelte Mačina gemeinsam mit Forschern der Technischen Universität Darmstadt (TU Darmstadt) den Mathematik-Lehr-Benchmark „MathTutorBench“. Dieser Benchmark basiert auf Gesprächen mit Lehrkräften und Daten aus dem Unterrichtsprozess, erstellt ein Bewertungssystem für bestimmte Lehrfähigkeiten und dient dem Vergleich und der Analyse der Antworten großer Sprachmodelle. Tests zeigen, dass verschiedene Modelle oft einen Kompromiss zwischen Fachwissen und Lehrfähigkeiten eingehen und die meisten Modelle bei schrittweisen Antworten leicht den Faden verlieren und vom Thema abweichen.

In einem zweiten Projekt entwickelte Mačina das TutorRL-Modell. Dieses Modell wird durch mehrstufige Interaktionen zwischen einem virtuellen Schüler und einem virtuellen Lehrer trainiert, ohne dass teure Trainingsdaten erforderlich sind. Während des Trainings wird ein weiteres Modell verwendet, um den Unterrichtsprozess zu überwachen und die Reaktionen des virtuellen Lehrers zu bewerten, wodurch „verstärkendes Lernen“ ermöglicht wird. Mačina erklärt, dass der große Vorteil dieser Methode darin liegt, dass keine riesigen Datenmengen benötigt werden und kleinere Sprachmodelle verwendet werden können. Im Vergleich zu den neuesten Modellen von OpenAI oder Google mit Hunderten von Milliarden oder sogar Billionen von Parametern ist TutorRL mit seinen 7 Milliarden Parametern deutlich kleiner. Erste Ergebnisse zeigen, dass TutorRL eine bessere Balance zwischen Fachwissen und Lehrfähigkeiten bietet als traditionelle große Sprachmodelle und weniger dazu neigt, vom Thema abzuweichen. Das Modell kann während des Lernprozesses auch die Gründe für seine Antworten und Entscheidungen erläutern, was es Lehrkräften erleichtert, den Unterrichtsprozess zu verstehen und zu überwachen.

TutorRL ist jetzt als Open-Source-Modell kostenlos verfügbar und wurde bereits über tausend Mal heruntergeladen. Allerdings wurde das Modell noch nicht mit Lernenden im Klassenzimmer getestet und evaluiert und ist derzeit nur für den Mathematikunterricht in der Oberstufe und im Grundstudium geeignet. Mačina ist der Ansicht, dass das Modell langfristig auch in den MINT-Fächern Mathematik, Informatik, Naturwissenschaften und Technik eingesetzt werden kann und seine Leistung für Masterstudiengänge ausreicht. Er betont, dass die Forschung nicht nur für die Lehre relevant ist, sondern auch grundlegende Bedeutung für die weitere Entwicklung der Künstlichen Intelligenz hat, da kollaborative Problemlösungsansätze in vielen zukünftigen Arbeitsbereichen zentral sein werden und das menschliche Urteilsvermögen weiterhin von entscheidender Bedeutung bleibt.

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.

E-Mail: news@wedoany.com