Wir benutzen Cookies, um die Nutzerfreundlichkeit der Website zu verbessern. Durch deinen Besuch stimmst du der Datenschutzerklärung zu.
Alles klar!
BASIC thinking Logo Dark Mode BASIC thinking Logo Dark Mode
  • TECH
    • Apple
    • Android
    • ChatGPT
    • Künstliche Intelligenz
    • Meta
    • Microsoft
    • Quantencomputer
    • Smart Home
    • Software
  • GREEN
    • Elektromobilität
    • Energiewende
    • Erneuerbare Energie
    • Forschung
    • Klima
    • Solarenergie
    • Wasserstoff
    • Windkraft
  • SOCIAL
    • Facebook
    • Instagram
    • TikTok
    • WhatsApp
    • X (Twitter)
  • MONEY
    • Aktien
    • Arbeit
    • Die Höhle der Löwen
    • Finanzen
    • Start-ups
    • Unternehmen
    • Marketing
    • Verbraucherschutz
Newsletter
Font ResizerAa
BASIC thinkingBASIC thinking
Suche
  • TECH
  • GREEN
  • SOCIAL
  • MONEY
  • ENTERTAIN
  • NEWSLETTER
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
Menschliches Feedback KI Täuschen
TECH

Nach menschlichem Feedback: KI lernt Menschen zu täuschen

Felix Baumann
Aktualisiert: 15. Oktober 2024
von Felix Baumann
Unsplash.com/Emiliano Vittoriosi
Teilen

Forscher demonstrierten kürzlich, wie menschliches Feedback KI-Systemen beim Täuschen helfen kann. Grund ist der Prozess, wie wir heute Inhalte moderieren.

Eine kürzlich veröffentlichte Studie zeigt, welchen Einfluss menschliches Feedback auf intelligente Algorithmen hat. Demnach kann Künstliche Intelligenz (KI) besser darin werden, Menschen zu täuschen, anstatt korrekte Antworten zu liefern. Wissenschaftler aus den USA und China führten die Forschung zusammen mit dem Unternehmen Anthropic durch.

Das Ergebnis ist ein Phänomen, das die Bezeichnung „unbeabsichtigte Sophistik“ trägt. Dabei lernt eine KI, Menschen zu überzeugen, dass ihre Antworten richtig sind, obwohl sie falsch sind. Das ist problematisch, da die KI nicht das korrekte Beantworten von Fragen trainiert, sondern sich nur in der Verschleierung von Fehlern verbessert.

BASIC thinking UPDATE

Jeden Tag bekommen 10.000+ Abonnenten die wichtigsten Tech-News direkt in die Inbox. Abonniere jetzt dein kostenloses Tech-Briefing:

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

  • 5 Minuten pro Tag
  • 100% kostenlos
  • Exklusive PDF-Guides

Menschliches Feedback hilft KI beim Täuschen

Die Ursache ist eine Methode, die Unternehmen wie OpenAI und Anthropic häufig nutzen: „Reinforcement Learning from Human Feedback“ (RLHF). Dabei antwortet eine KI auf eine Frage und menschliche Evaluatoren bewerten die Antworten nach ihrer Qualität.

Das Modell lernt aus diesem Feedback und erhält dafür eine Art „Belohnung“. Im Resultat entsteht ein Algorithmus, der menschenfreundliche Antworten liefert. Doch diese Antworten müssen nicht immer richtig sein. Denn es entsteht ein sogenanntes „Belohnungshacken“, bei dem die KI Muster erkennt.

Das fördert positive Bewertungen, selbst wenn die dahinterliegenden Muster nicht zu den gewünschten korrekten Ergebnissen führen. Ein Beispiel aus einer früheren Studie zeigt, dass eine KI, die auf der Frage-und-Antwort-Plattform Stack Exchange trainiert wurde, lernte, längere Beiträge zu schreiben, weil diese mehr „Likes“ erhielten.

Prüfer stufen falsche Inhalte als korrekt ein

Anstatt qualitativ hochwertigere Antworten zu liefern, fokussierte sich das Modell darauf, längere Texte zu produzieren – oft auf Kosten der Genauigkeit.

Die aktuelle Studie zeigt, dass nach dem RLHF-Prozess die menschlichen Prüfer um 24 Prozent häufiger falsche Antworten als richtig bewerteten. Auch bei der Programmierung stieg die Wahrscheinlichkeit. Prüfer akzeptierten fehlerhaften Code in 18 Prozent der Fälle.

Das könnte weitreichende Folgen haben, da KI-Modelle immer besser darin werden könnten, ihre Fehler zu verbergen. Langfristig könnte das dazu führen, dass Menschen das Vertrauen in die Technik verlieren, da sie unwissentlich getäuscht werden.

Auch interessant:

  • Roboter erkennen menschliche Berührungen – ohne künstliche Haut
  • Künstliche Intelligenz im iPhone 16: Das sind die neuen Apple-Produkte
  • Selbstheilendes Stromnetz: Künstliche Intelligenz soll Blackouts vermeiden
  • KI-Lücke: Künstliche Intelligenz sorgt für eine noch tiefere „digitale Kluft“
Kleines Kraftwerk

Anzeige

STELLENANZEIGEN
BASIC thinking Freiberuflicher Redakteur (m/w/d)
BASIC thinking GmbH in Home Office
Online Marketing Manager (d/m/w)
Brandenburg Media GmbH & Co. KG in Potsdam
SEA-Manager (w/m/d) – befristet
KOS GmbH & Co. KG in Schönefeld
Influencer & Paid Social Media Marketing ...
ARTDECO cosmetic GmbH in Karlsfeld
Werkstudent | Online Marketing | Mid & Up...
Otto GmbH & Co. KGaA in Hamburg
Sales Manager / Business Developer SAP (d/w/m)
4flow in Berlin, Bremen, Dresden, Düsseldorf, Hambur...

Du willst solche Themen nicht verpassen? Mit dem BASIC thinking UPDATE, deinem täglichen Tech-Briefing, starten über 10.000 Leser jeden Morgen bestens informiert in den Tag. Jetzt kostenlos anmelden:

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

THEMEN:Künstliche IntelligenzNews
Teile diesen Artikel
Facebook Flipboard Whatsapp Whatsapp LinkedIn Threads Bluesky Email
vonFelix Baumann
Felix Baumann ist seit März 2022 Redakteur bei BASIC thinking. Bereits vorher schrieb er 4 Jahre für den Online-Blog Mobilegeeks, der 2022 in BASIC thinking aufging. Nebenher arbeitet Felix in einem IT-Unternehmen und beschäftigt sich daher nicht nur beim Schreiben mit zukunftsfähigen Technologien.
Kleines Kraftwerk

Anzeige

EMPFEHLUNG
American Express Business Platinum Card
500 Euro Startguthaben sichern: Mit der American Express Business Platinum Card
Anzeige MONEY
American Express® Business Gold Card
SBS American Express Business Gold Card: Jetzt 250 Euro Startguthaben sichern
Anzeige MONEY
PŸUR
Internet, das nie teuer wird – für nur 19 Euro pro Monat
Anzeige TECH
American Express Kreditkarte
Jetzt profitieren: Exklusive Vorteile mit der American Express Kreditkarte sichern
Anzeige MONEY
UPDATE – DEIN TECH-BRIEFING

Jeden Tag bekommen 10.000+ Abonnenten von uns die wichtigsten Tech-News direkt in die Inbox. Abonniere jetzt dein kostenloses Tech-Briefing:

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

LESEEMPFEHLUNGEN

Balkonkraftwerke Vergleich, Solar, Solarenergie, Erneuerbare Energie, Solarenergie, Sonne, Haus, Stiftung Warentest, Ranking
GREENTECH

Stiftung Warentest: 8 Balkonkraftwerke im Vergleich – nur zwei Anlagen „gut”

KI Bias Künstliche Intelligenz Verzerrungen
TECH

KI-Verzerrungen: Was bedeutet Bias?

sparsamsten Diesel Mittelklasse, ADAC, Verbrauch, Kosten, Gesamtkosten, Grundpreis, CO2-Ausstoß, Kraftstoff, Auto, Mobilität, Fahrzeug, Automobil-Industrie
MONEYTECH

Laut ADAC: Die sparsamsten Diesel der Mittelklasse

VPN-Anbieter Europa, VPN-Dienste Europa
TECH

Alternativen zu US-Software: 4 VPN-Anbieter aus Europa

Energie Fußboden, Schleim, Forschung, Wissenschaft, Strom, Stromerzeugung, Kanada, Universität, grüner Strom, saubere Energie
GREENTECH

Schleimiges Material im Fußboden erzeugt Energie – wenn man darüber läuft

Reasoning-Modelle KI Künstliche Intelligenz LRM
TECH

Studie: Sind Reasoning-Modelle weniger leistungsfähig als gedacht?

Mehr anzeigen
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
  • Über uns
  • Mediadaten
  • Impressum
  • Datenschutz
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?