BT

Neues KI-System von Meta soll Umwelt identifizieren und interpretieren

Logo von Meta / Facebook
Bild: Dima Solomin
geschrieben von Felix Baumann

Blicken wir auf Prognosen zur Zukunft mit künstlicher Intelligenz, dann sehen wir einerseits positive Ausblicke, aber auch Dystopien. Kein Wunder, kann eine Technologie, die sehr viel Gutes bringen kann, auch immer für schlechte Zwecke genutzt werden. Eins ist zumindest klar, Algorithmen werden auch in den nächsten Jahrzehnten wahrscheinlich unser Leben zunehmend beeinflussen, damit potenzielle Anwendungsfälle zunehmen, hat Meta nun einen neuen lernenden Algorithmus vorgestellt.

Denn neuronale Netzwerke können heutzutage meist entweder Objekte identifizieren oder diese in einer natürlichen Sprache beschreiben, beides gleichzeitig beherrscht die Maschine aber noch nicht. Das ist auch ein Argument, weshalb wir größtenteils nur von neuen Durchbrüchen lesen, die einen dieser Anwendungsfälle betreffen (etwa GPT-3, das schon eigene Texte verfassen kann [1]).

Der Grund dafür ist relativ simpel, für das Erkennen von Bildern kommen überwiegend andere Lernmethoden zum Einsatz, als beim Meistern von Sprachkenntnissen. Meta AI hat daher einen Algorithmus entwickelt, der genutzt werden kann, um neuronalen Netzwerken das Verstehen von Bildern, Texten oder Sprache beizubringen. Data2vec soll dabei ähnlich gut abschneiden wie vergleichbare andere Algorithmen.

Nahaufnahme eines grünen Auges

Computer können bisher noch nicht wirklich die Welt so wahrnehmen, wie wir das tun (Bild: Arteum.ro)

Dazu nutzt das System zwei verschiedene neuronale Netzwerke, den Studenten und den Lehrer. Das Lehrernetzwerk wird durch Bilder, Text und Sprache trainiert und wird dahin gehend ausgebildet vorherzusagen, was auf neuem Bildmaterial dargestellt ist. Wird etwa ein neues Hundebild in das System eingespeist, so weiß der Algorithmus, dass es sich um einen Hund handelt, ohne das Bild vorher schon einmal gesehen zu haben.

Das Studenten-Netzwerk arbeitet etwas anders. Diesem wird beigebracht durch die Augen des Lehrers zu sehen und so keine eigenen Annahmen anzustellen. Es verifiziert also, was das Lehrernetzwerk in diesem Bild sieht, auf diesem Weg muss es sich nicht auf einen bestimmten Anwendungsfall spezialisieren.

Die einzige Limitierung, die dieser Ansatz mitbringt, ist die Lerngeschwindigkeit. Das System kann nämlich immer nur eine Sache nach der nächsten lernen und nicht mit irgendwelchen randomisierten Daten zugeschüttet werden. Dieses Problem möchte man bei Meta AI aber noch angehen, vielleicht sehen wir dann in einigen Jahren neue leistungsfähige KI-Systeme.

Via Technology Review


[1] https://www.technologyreview.com/2020/07/20/1005454/openai-machine-learning-language-generator-gpt-3-nlp/

Über den Autor

Felix Baumann

Felix Baumann ist seit März 2022 Redakteur bei BASIC thinking. Bereits vorher schrieb er 4 Jahre für den Online-Blog Mobilegeeks, der 2022 in BASIC thinking aufging. Nebenher arbeitet Felix in einem IT-Unternehmen und beschäftigt sich daher nicht nur beim Schreiben mit zukunftsfähigen Technologien.