Forscher haben eine neue Methode entwickelt, um KI-Modellen menschenähnliches Sehen beizubringen. Das sogenannte Lp-Convolution orientiert sich am Gehirn, um die Genauigkeit von Bilderkennungssystemen zu verbessern.
Forscher des Institute for Basic Science (IBS), der Yonsei-Universität und des Max-Planck-Instituts haben eine neue Methode entwickelt, die KI-Systemen menschenähnliches Sehen ermöglicht. Das sogenannte Lp-Convolution soll die Genauigkeit und Effizienz von Bilderkennungssystemen verbessern und gleichzeitig den Rechenaufwand reduzieren.
Die Idee dahinter: Maschinen sollen genauso flexibel, fokussiert und robust das Sehen lernen wie ein Gehirn. Herkömmliche Bild-KIs nutzen bislang sogenannte Convolutional Neural Networks (CNNs). Diese analysieren Bilder mit starren Filtern – meist drei mal drei Pixel großen Fenstern – und erkennen Muster.
Das funktioniert in vielen Fällen gut, aber nicht immer. Besonders dann, wenn wichtige Bildinformationen verteilt oder komplex sind. Alternativen wie Vision Transformer sind leistungsfähig, aber auch extrem rechenintensiv und eignen sich so oft nicht für den Alltag.
Lp-Convolution: KI lernt menschenähnliches Sehen
Statt starrer Filter basiert das Lp-Convolution auf anpassungsfähige Sichten. Sie verhalten sich wie ein Gummiband, das sich je nach Bedarf dehnen oder zusammenziehen kann. Das Besondere: Die flexiblen Filter sind den Verbindungen im menschlichen Gehirn nachempfunden. Sie orientieren sich mathematisch an der Gaußschen Verteilung. Diese sorgt dafür, dass wir nicht nur das Zentrum des Blickfelds scharf wahrnehmen, sondern auch die Umgebung sinnvoll eingebunden bleibt.
Das Ergebnis ist eine KI, die relevante Bildinhalte nicht nur schneller erkennen kann, sondern auch robuster gegenüber Störungen ist. In der Praxis könnte die Methode präzisere Entscheidungen in Bereichen wie der Medizintechnik, beim autonomem Fahren oder der Robotik ermöglichen.
Besser, flexibler, menschlicher
In Tests übertraf das Lp-Convolution viele bestehende Modelle – und zwar mit einem deutlich geringeren Rechenaufwand. Die neuronale Aktivität im Inneren der KI ähnelt der im Gehirn einer echten Maus. Diese Nähe zur biologischen Wahrnehmung macht die Methode besonders effektiv.
Das gilt sowohl für die Forschung als auch zukünftige Anwendungen im Alltag. Denn KI-Modelle könnten visuelle Informationen mit dem Ansatz nicht nur starr anhand von Mustern erkennen und analysieren, sondern tatsächlich „verstehen“.
Auch interessant: