Technologie

Mit diesen KI-Kopfhörern kannst du einzelnen Stimmen lauschen

KI-Kopfhörer, Technologie, Elektronik, Forschung, Wissenschaft, Sprechen, Hören, Noise Cancelling, Earbuds, Hörgeräte, Geräusche, Stimme, Klang, Audio
Screenshot Youtube.com/UW(University of Washington)
geschrieben von Beatrice Bode

Forscher aus den USA haben ein neues KI-System entwickelt, dass es Trägern von Kopfhörern erlaubt, Geräusche selektiv auszublenden. Übrig bleibt nur die Stimme eines Gesprächsteilnehmers. Wir erklären dir, wie die neuartigen KI-Kopfhörer funktionieren. 

Ein Blick genügt und schon hört man nur die Person, die man anschaut: So soll eine neue Kopfhörer-Technologie funktionieren. Dafür hat ein Forschungsteam der University of Washington ein KI-System entwickelt. „In belebten Umgebungen kann sich das menschliche Gehirn auf die Sprache eines Zielsprechers konzentrieren, wenn es vorher weiß, wie dieser klingt“, erklären die Wissenschaftler:innen. Nun soll das auch eine Künstliche Intelligenz können.

So filtern die KI-Kopfhörer einzelne Stimmen

Das neue KI-System wurde in handelsübliche Kopfhörer integriert. Sie blenden akustische Störungen aus und verbessern so das Audio-Erlebnis. Doch bestimmte Geräusche zu filtern, stellte Entwickler:innen bisher vor eine Herausforderung. Das sogenannte Target Speech Hearing aus Washington ist allerdings schon einen Schritt weiter.

„Mit unseren Geräten kann man nun einen einzelnen Sprecher klar und deutlich hören, auch wenn man sich in einer lauten Umgebung befindet, in der viele andere Menschen sprechen“, erklärt der Hauptautor der Studie Shyam Gollakota, Professor an der Paul G. Allen School of Computer Science & Engineering.

Um das System zu nutzen, muss man an den Kopfhörer tippen und per Knopfdruck die außen angebrachte Mikrofone aktivieren. Der Kopf sollte außerdem für drei bis fünf Sekunden der sprechenden Person zugewandt sein.

Die Schallwellen der Sprecherstimme sollten daraufhin die Mikrofone erreichen. Der KI-Kopfhörer sendet das Signal dann an einen integrierten Computer, auf dem die maschinelle Lernsoftware das Stimmmuster des Sprechenden lernt.

KI-System sammelt Trainingsdaten, um sich zu verbessern

Das System merkt sich die Stimme und gibt sie anschließend wieder. Auf diese Weise bleibt inmitten von Umgebungsgeräuschen nur die Sprecherstimme übrig – auch, nachdem sich der Zuhörende bewegt oder den Blickkontakt verliert. Je länger das KI-System zuhört, desto mehr Trainingsdaten kann es sammeln. So verbessert sich mit dem laufenden Gespräch auch die Fähigkeit, sich auf die Sprecherstimme zu konzentrieren.

Bisher testete das Team die Technologie an 21 Menschen. Sie schätzten die Klarheit der Sprecherstimme im Durchschnitt fast doppelt so hoch ein wie die ungefilterten Audiodaten. Die Ergebnisse bauen auf früheren Arbeiten zum semantischen Hören auf. Dabei konnten User bestimmte Geräuschklassen wie Vögel oder Stimmen auswählen und andere Geräusche in der Umgebung ausblenden.

Momentan können die KI-Kopfhörer nur einen Sprechenden registrieren, wenn keine andere laute Stimme aus der gleichen Richtung kommt. Allerdings arbeitet das Forschungsteam daran, das System auch auf Ohrstöpsel und Hörgeräte auszuweiten. Denn hörgeschädigte Personen könnten ihre Hörfähigkeit in lauten Umgebungen künftig mithilfe der Technologie verbessern.

Auch interessant: 

Über den Autor

Beatrice Bode

Beatrice ist Multi-Media-Profi. Ihr Studium der Kommunikations - und Medienwissenschaften führte sie über Umwege zum Regionalsender Leipzig Fernsehen, wo sie als CvD, Moderatorin und VJ ihre TV-Karriere begann. Mittlerweile hat sie allerdings ihre Sachen gepackt und reist von Land zu Land. Von unterwegs schreibt sie als Autorin für BASIC thinking.

Kommentieren