Forscher haben ein neues System entwickelt, mit dem sich KI-Modelle eigenständig trainieren können, indem sie sich selbst Fragen stellen. Der Ansatz könnte den Weg zu einer künstlichen Superintelligenz ebenen.
Aktuelle KI-Modelle lernen meist, indem sie mit Daten gefüttert werden und menschliche Intelligenz durch das Erkennen von Mustern und Wahrscheinlichkeiten nachahmen. Ein neues Forschungsprojekt der Tsinghua University könnte diesen Ansatz grundlegend verändern, indem KI lernt, sich selbst Fragen zu stellen, um zu lernen.
Das System namens Absolute Zero Reasoner (AZR) nutzt ein Sprachmodell, um eigenständig herausfordernde Programmierprobleme in Python zu generieren und diese anschließend selbst zu lösen. Dabei führt AZR den Code eigenständig aus, um unmittelbar aus Erfolgen oder dem eigenen Scheitern zu lernen.
Durch diesen technischen Kreislauf soll das Modell seine Fähigkeiten sowohl beim Stellen der Aufgaben als auch bei deren Lösung verfeinern können. Die Forscher stellten fest, dass Modelle mit sieben Milliarden und 14 Milliarden Parametern durch diese Methode ihre Leistungen massiv verbesserten.
Künstliche Neugier: KI trainiert sich selbst
Die Idee der künstlichen Neugier ist nicht neu, sondern greift Konzepte von Pionieren wie Jürgen Schmidhuber und Pierre-Yves Oudeyer auf, die schon früh das Potenzial von „Self-Play“ erforschten. Der Absolute Zero Reasoner übertrifft mit seinem Ansatz aber sogar Systeme, die mit aufwendig von Menschen kuratierten Datensätzen trainiert wurden.
Dieser Fortschritt belegt die Effizienz autonomer Lernmethoden für die künftige Entwicklung intelligenter Systeme. Die Schwierigkeit der Aufgaben steigt dabei parallel zur Leistungsfähigkeit des Modells.
Dieser Skalierungseffekt könnte laut den beteiligten Forschern den Weg zu einer künftigen Superintelligenz ebnen, die über das Wissen menschlicher Lehrer hinauswächst. In der täglichen Praxis könnte KI dann beispielsweise komplexe Büroarbeiten übernehmen oder eigenständig tiefergehende Recherchen im Internet durchführen.
Digitale Agenten der Zukunft
In der Tech-Branche gewinnt das neue Verfahren an Bedeutung, da herkömmliche Datenquellen für das Training neuer Modelle zunehmend knapper und teurer werden. Ein Projekt namens Agento von Salesforce nutzt bereits ähnliche Prinzipien, um die allgemeine Argumentationsfähigkeit seiner digitalen Agenten durch experimentelles Problemlösen zu stärken.
Auch Forscher von Meta entwickeln Systeme, die Self-Play für das Software-Engineering einsetzen und damit die Grundlage für hochbegabte Software-Agenten schaffen. Die Abkehr vom reinen Kopieren menschlicher Vorlagen stellt einen Wendepunkt in der KI-Entwicklung dar.
Anstatt lediglich vorhandenes Wissen zu reproduzieren, erschließt sich das System durch das Experimentieren mit Code neue Lösungswege.
Auch interessant:




