Technologie Unterhaltung

KI statt Mensch: Wie die Simpsons-Stimmen künftig erzeugt werden

Simpsons-Stimmen, KI, Synchronsprecher
Werden die Simpsons-Stimmen bald durch eine Künstliche Intelligenz ersetzt? (Foto: Unsplash.com/ elCarito)
geschrieben von Fabian Peters

Die Simpsons gibt es schon seit über 30 Jahren. Doch während die Figuren in der Serie nicht altern, sind die Synchronsprecher in die Jahre gekommen. Die Produzenten überlegen nun, die Simpsons-Stimmen durch eine Künstliche Intelligenz zu erzeugen.

Immer dann, wenn es zu einem Wechsel des Synchronsprechers einer Simpsons-Figur kommt, ist das für viele Fans vor allem eins: ungewohnt. Zahlreiche Sprecher begleiten die gelben Kultfiguren mitunter seit mehreren Jahrzehnten. Doch genau da liegt das Problem.

Während die Figuren in der Serie in der Regel nicht altern, sind zahlreiche Sprecher in die Jahre gekommen. Die Produzenten denken deshalb über den Einsatz einer Künstlichen Intelligenz (KI) nach, die die menschlichen Sprecher der Simpsons-Stimmen mithilfe des Tonarchivs ersetzen könnte.

Simpsons-Sprecher müssen Gehaltseinbußen hinnehmen

Doch auch ein finanzieller Aspekt spielt bei den Überlegungen eine Rolle. Während die Kosten für die Sprecher im Jahr 1998 noch bei rund 30.000 US-Dollar pro Episode lagen, betrugen sie im Jahr 2008 bereits rund 400.000 US-Dollar.

Für den ausführenden Produktionskonzern Fox ist das zu viel. Getreu dem Motto „Friss oder stirb“ beschlossen die Produzenten die Gehälter der Simpsons-Sprecher um 30 Prozent zu kürzen.

Bis auf Harry Shearer, der gleich mehreren Simpson-Figuren seine Stimmte leiht, lenkten die meisten Sprecher aus Mangel an Alternativen ein. Laut einem Bericht von Wired gab letztlich aber auch Shearer klein bei und stimmte den Gehaltseinbußen zu.

Werden die Simpsons-Stimmen künftig durch eine KI erzeugt?

Über die Jahre hinweg haben zahlreiche Simpsons-Sprecher mit ihrer Stimme dennoch gut verdient. Dank entsprechender Vertragsklauseln verbuchen viele von ihnen zusätzliche Einnahmen durch Wiederholungen.

Bei Fox stellt man sich nun die Frage, ob die Produzenten künftig überhaupt noch auf menschliche Sprecher angewiesen sind. Schließlich verfügt man nach über 30 Jahren über genügend Audiomaterial, um Künstliche Intelligenzen und Technologien zu füttern.

Langfristig betrachtet würden die Produzenten so einerseits die Sprecher-Gehälter einsparen. Andererseits könnten die Fans die ihnen gewohnten Simpsons-Stimmen auch unabhängig von einem menschlichen Sprecher vernehmen.

KI erzeugte die Stimme von Edna Krabappel

Seitens der Produktionsfirma Fox hat man in jüngster Vergangenheit bereits erste Erfahrungen mit dem Thema Künstlicher Intelligenz und computergenerierten Stimmen gemacht.

Nachdem Marcia Wallace, die Sprecherin der Figur Edna Krabappel (Barts Lehrerin), im Jahr 2013 in Folge einer Lungenentzündung verstarb, starb die Figur den Serientod. In einer jüngeren Episode wurde Krabappel jedoch mithilfe von Audio-Aufnahmen und einer Künstlichen Intelligenz wieder zum Leben erweckt.

Prinzipiell ließe sich ein solches Vorgehen theoretisch mit jedem Charakter fortsetzen. Einzige Voraussetzung: Es liegt genügend Audio-Material vor. Das jedoch sollte bei den meisten Figuren der Fall sein.

Der kanadische KI-Forscher und Medienproduzent Tim McSmythurs äußerte sich laut Wired diesbezüglich folgendermaßen:

Man kann auf jeden Fall eine Episode der Simpsons produzieren, bei der die Stimmen der Charaktere in einer glaubwürdigen Art und Weise vertont werden.

Generisches Audio-Modell von kanadischem KI-Forscher

Für seinen YouTube-Kanal hat der KI-Forscher eine Simpsons-Episode nachgestellt und die Stimme von Homer mit Hilfe einer Künstlichen Intelligenz simuliert.

Seine Arbeit basiert auf einem eigens entwickelten, generischen Audio-Modell, mit dem er theoretisch jeden Text in eine englischsprachige Stimme umwandeln kann.

Um eine Stimme zu generieren, trainiert McSmythurs sein Programm täglich rund drei Stunden und füttert es mit Texten und entsprechenden Daten. Wie im Fall von Homer spuckt das Programm anschließend mehrere unterschiedliche Aufnahmen aus, von denen jede etwas anders klingt.

KI-Stimmen klingen täuschend echt, jedoch etwas emotionslos

Im Zuge unserer Recherche hat BASIC thinking den YouTube-Kanal von Tim McSmythurs etwas genauer unter die Lupe genommen. McSmythurs hat dort unter anderem auch Star-Wars-Schauspieler Adam Driver und US-Präsident Joe Biden neu vertont.

Und tatsächlich: Viele der dort simulierten Stimmen klingen täuschend echt. Sie wirken nach längerem Zuhören mitunter jedoch etwas emotionslos.

Laut McSmythurs hänge dies unmittelbar mit den Trainingserfolgen seines Modells sowie der Menge an zugefütterten Daten zusammen. Je mehr Daten er seinem Modell zuführe, desto besser das Resultat.

Grundsätzlich sei es möglich einzelne Serien-Charaktere durch Künstliche Intelligenz wieder zum Leben zu erwecken. Ganze Folgen mit Hilfe der Technologie zu produzieren, schließ der KI-Forscher jedoch (noch) aus.

Zumindest auf kurze Sicht ist der Beruf des Synchronsprechers also noch kein Auslaufmodell. Einzelne Figuren und kurze Passagen können mithilfe neuer Technologien jedoch bereits authentisch simuliert werden.

Auch interessant: 

Über den Autor

Fabian Peters

Fabian Peters ist seit Januar 2022 Chefredakteur von BASIC thinking. Zuvor war er als Redakteur und freier Autor tätig. Er studierte Germanistik & Politikwissenschaft an der Universität Kassel (Bachelor) und Medienwissenschaften an der Humboldt-Universität zu Berlin (Master).