Chiphersteller Nvidia soll für das KI-Training heimlich Unmengen an Videos genutzt haben – unter anderem von YouTube und Netflix. Das geht aus internen Dokumenten des Unternehmens hervor. Mitarbeiter haben in puncto Urheberrecht jedoch Bedenken geäußert.
Nvidia soll heimlich große Mengen an Videos von YouTube, Netflix und Co. für das KI-Training genutzt haben. Das geht aus einem Bericht von 404 Media unter Berufung auf interne Dokumente hervor. Die Operation hat demnach unter dem Codenamen „Cosmos“ stattgefunden.
KI-Training: Nvidia nutzt heimlich YouTube- und Netflix-Videos
Dem Bericht zufolge wurden Nvidia-Mitarbeiter via Slack und per E-Mail dazu angewiesen, mithilfe von automatisierter Programme Millionen Videos zu downloaden. Ming-Yu Liu, Vizepräsident der Forschungsabteilung von Nvidia und Leiter des Cosmos-Projekts, hätte im Mai 2024 dazu in einer E-Mail geschrieben:
Neue Stellenangebote
Growth Marketing Manager:in – Social Media GOhiring GmbH in Homeoffice |
||
Teamlead Social Media (w/d/m) 80 – 100% Haufe Group SE in Freiburg im Breisgau |
||
Praktikum/Werkstudent:in Social Media & Influencer Relations (SoSe 25) Festool Group in Wendlingen (bei Stuttgart) |
Wir sind dabei, die v1-Datenpipeline fertig zu stellen und die notwendigen Rechenressourcen zu sichern, um eine Videodatenfabrik zu bauen, die pro Tag Trainingsdaten im Wert einer menschlichen Lebenserfahrung liefern kann.
Laut einem ehemaligen Angestellten, der anonym bleiben wollte, habe Nvidia seine Mitarbeiter dazu aufgefordert, unter anderem Videos von Netflix und nutzergenerierte Videos von YouTube zu scrapen.
Diese und weitere Videoinhalte seien anschließend genutzt worden, um ein KI-System für Nvidias Omniverse 3D-Weltgenerator, „digitale menschliche“ Produkte und selbstfahrende Autosysteme zu trainieren. Das Projekt wurde bis dato noch nicht für die Öffentlichkeit freigegeben.
Urheberrecht: Nvidia-Mitarbeiter äußern Bedenken
Den internen Nachrichten zufolge hätten einige Nvidia-Mitarbeiter Bedenken hinsichtlich des Vorgehens geäußert. Sie sollen vor allem die ethische Verwendung hinsichtlich des Urheberrechts kritisiert haben. Die verantwortlichen Projektmanager hätten diese Bedenken laut 404 Media jedoch abgetan.
Vielmehr habe eine „umfassende Genehmigung“ der Führungsetage vorgelegen. Nvidia soll wiederum erklärt haben, dass das Projekt „in voller Übereinstimmung mit dem Wortlaut und dem Geist des Urheberrechtgesetzes“ stünde. Demnach seien lediglich Ausdrucksformen, nicht aber Fakten oder Ideen geschützt.
Der Bericht kommt zu einer Zeit, in der das Thema KI-Training und Urheberrecht eine immer größere Rolle spielt. Reddit hatte kürzlich etwa zahlreiche Suchmaschinen blockiert, damit diese nicht ihre KI-Systeme mit entsprechenden Foreninhalten trainieren können. Reddit-Content wird seither lediglich auf Google angezeigt, da das Unternemen dafür bezahlt.
Auch interessant:
- Überwachung durch KI: Deutschland braucht ein Beschäftigtendatenschutzgesetz
- Viel Unklarheit: AI Act tritt in Kraft – und ändert erstmal gar nichts
- Dollar oder Daten: Was ist eigentlich Pay or Okay?
- Neue Mindestgeschwindigkeit: „Recht auf schnelles Internet“ soll ausgebaut werden
Kommentieren