Wir benutzen Cookies, um die Nutzerfreundlichkeit der Website zu verbessern. Durch deinen Besuch stimmst du der Datenschutzerklärung zu.
Alles klar!
BASIC thinking Logo Dark Mode BASIC thinking Logo Dark Mode
  • TECH
    • Apple
    • Android
    • ChatGPT
    • Künstliche Intelligenz
    • Meta
    • Microsoft
    • Quantencomputer
    • Smart Home
    • Software
  • GREEN
    • Elektromobilität
    • Energiewende
    • Erneuerbare Energie
    • Forschung
    • Klima
    • Solarenergie
    • Wasserstoff
    • Windkraft
  • SOCIAL
    • Facebook
    • Instagram
    • TikTok
    • WhatsApp
    • X (Twitter)
  • MONEY
    • Aktien
    • Arbeit
    • Die Höhle der Löwen
    • Finanzen
    • Start-ups
    • Unternehmen
    • Marketing
    • Verbraucherschutz
Newsletter
Font ResizerAa
BASIC thinkingBASIC thinking
Suche
  • TECH
  • GREEN
  • SOCIAL
  • MONEY
  • ENTERTAIN
  • NEWSLETTER
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
KI Künstliche Intelligenz, KI Eigenleben
TECH

KI entwickelt Eigenleben und lässt sich nicht mehr umerziehen

Maria Gramsch
Aktualisiert: 08. Februar 2024
von Maria Gramsch
Adobe Stock / Thitichaya
Teilen

Künstliche Intelligenz kann in vielen Lebensbereichen hilfreich sein. Doch was passiert, wenn eine KI außer Kontrolle gerät und ein Eigenleben entwickelt? Mit diesem Problem hat sich nun eine aktuelle Studie befasst.

Eine außer Kontrolle geratene Künstliche Intelligenz, die ein Eigenleben entwickelt: Das klingt eher nach einem Science-Fiction-Film. Doch Forschenden des KI-Sicherheits- und Forschungsunternehmens Anthropic ist genau das bei ihrer Arbeit passiert.

Bei einer Untersuchung der Forscher:innen um Evan Hubinger hat es ein KI-System geschafft, sich gegen die integrierten Sicherheitsvorkehrungen zu wenden. Besonders beunruhigend an diesem Ergebnis: Die Forschenden haben es nicht geschafft, das System wieder unter Kontrolle zu kriegen.

BASIC thinking UPDATE

Jeden Tag bekommen 10.000+ Abonnenten die wichtigsten Tech-News direkt in die Inbox. Abonniere jetzt dein kostenloses Tech-Briefing:

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

  • 5 Minuten pro Tag
  • 100% kostenlos
  • Exklusive PDF-Guides

KI entwickelt Eigenleben in der Forschung

Das Team um Hubinger hat für seine Untersuchung, die in der Preprint-Datenbank arXiv veröffentlicht wurde, verschiedene Sprachmodelle (LLMs) programmiert. Sie haben sie so trainiert, dass sie ins Bösartige tendierten.

Jedoch war das nicht mehr umkehrbar. Denn das Verhalten blieb trotz einer Reihe von Korrekturversuchen weiterhin beeinträchtigt.

„Unser wichtigstes Ergebnis ist, dass es, wenn KI-Systeme trügerisch werden, sehr schwierig sein könnte, diese Täuschung mit aktuellen Techniken zu beseitigen“, erklärt Autor Evan Hubinger gegenüber Live Science.

Das ist wichtig, wenn wir es für plausibel halten, dass es in Zukunft trügerische KI-Systeme geben wird, denn es hilft uns zu verstehen, wie schwierig es sein könnte, mit ihnen umzugehen.

Im Training normal, im Einsatz bösartig

Die Forscher:innen hatten versucht, die KI durch „emergente Täuschung“ zu manipulieren. Dabei sollte sich die Künstliche Intelligenz während des Trainings ganz normal verhalten. Erst im tatsächlichen Einsatz schlug sie dann in ihr bösartiges Verhalten um.

Das wurde über einen Austausch der Jahreszahl bei den Anfragen erreicht. War hier das Jahr 2023 – also der Testzeitraum – angegeben, verhielt sich die KI normal. Stand hingegen das Jahr 2024 bei der Eingabeaufforderung – also der Zeitraum nach dem Test – verhielt sich das KI-System nicht mehr normal.

Forscher warnen vor Eigenleben und Täuschung durch KI

Hubinger warnt nun vor solchen Mechanismen: „Unsere Ergebnisse zeigen, dass wir derzeit keinen guten Schutz gegen Täuschung in KI-Systemen haben – weder durch Modellvergiftung noch durch emergente Täuschung – außer der Hoffnung, dass es nicht passiert.“

Da wir nicht wissen können, wie wahrscheinlich es ist, dass es passiert, bedeutet das, dass wir keine zuverlässige Verteidigung dagegen haben.

Denn auch der Versuch, das Verhalten des KI-Systems wieder zu normalisieren, ist den Forscher:innen nicht gelungen. Hubinger sieht die Forschungsergebnisse seines Teams deshalb als beängstigend an, „da sie auf eine mögliche Lücke in unseren derzeitigen Techniken zur Ausrichtung von KI-Systemen hinweisen“.

Auch interessant:

  • Tong Tong: Forscher präsentieren das weltweit erste virtuelle KI-Kind
  • Politik: So könnte Künstliche Intelligenz Wahlen manipulieren
  • Holobox: KI könnte Albert Einstein zurück in den Hörsaal bringen
  • Textinzest: Was passiert, wenn es immer mehr KI-Texte im Internet gibt?
Kleines Kraftwerk

Anzeige

STELLENANZEIGEN
BASIC thinking Freiberuflicher Redakteur (m/w/d)
BASIC thinking GmbH in Home Office
Praktikant Social Media Marketing B2B bei Vod...
Vodafone GmbH in Düsseldorf
Content-Manager (m/w/d)
Novoferm Vertriebs GmbH in Isselburg-Werth
Online Marketing Manager (d/m/w)
Brandenburg Media GmbH & Co. KG in Potsdam
SEA-Manager (w/m/d) – befristet
KOS GmbH & Co. KG in Schönefeld
Influencer & Paid Social Media Marketing ...
ARTDECO cosmetic GmbH in Karlsfeld

Du willst solche Themen nicht verpassen? Mit dem BASIC thinking UPDATE, deinem täglichen Tech-Briefing, starten über 10.000 Leser jeden Morgen bestens informiert in den Tag. Jetzt kostenlos anmelden:

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

THEMEN:Künstliche Intelligenz
Teile diesen Artikel
Facebook Flipboard Whatsapp Whatsapp LinkedIn Threads Bluesky Email
vonMaria Gramsch
Folgen:
Maria ist freie Journalistin und technische Mitarbeiterin an der Universität Leipzig. Seit 2021 arbeitet sie als freie Autorin für BASIC thinking. Maria lebt und paddelt in Leipzig und arbeitet hier unter anderem für die Leipziger Produktionsfirma schmidtFilm. Sie hat einen Bachelor in BWL von der DHBW Karlsruhe und einen Master in Journalistik von der Universität Leipzig.
Kleines Kraftwerk

Anzeige

EMPFEHLUNG
American Express Kreditkarte
Jetzt profitieren: Exklusive Vorteile mit der American Express Kreditkarte sichern
Anzeige MONEY
American Express Business Platinum Card
500 Euro Startguthaben sichern: Mit der American Express Business Platinum Card
Anzeige MONEY
American Express® Business Gold Card
SBS American Express Business Gold Card: Jetzt 250 Euro Startguthaben sichern
Anzeige MONEY
PŸUR
Internet, das nie teuer wird – für nur 19 Euro pro Monat
Anzeige TECH
UPDATE – DEIN TECH-BRIEFING

Jeden Tag bekommen 10.000+ Abonnenten von uns die wichtigsten Tech-News direkt in die Inbox. Abonniere jetzt dein kostenloses Tech-Briefing:

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

LESEEMPFEHLUNGEN

Balkonkraftwerke Vergleich, Solar, Solarenergie, Erneuerbare Energie, Solarenergie, Sonne, Haus, Stiftung Warentest, Ranking
GREENTECH

Stiftung Warentest: 8 Balkonkraftwerke im Vergleich – nur zwei Anlagen „gut”

KI Bias Künstliche Intelligenz Verzerrungen
TECH

KI-Verzerrungen: Was bedeutet Bias?

sparsamsten Diesel Mittelklasse, ADAC, Verbrauch, Kosten, Gesamtkosten, Grundpreis, CO2-Ausstoß, Kraftstoff, Auto, Mobilität, Fahrzeug, Automobil-Industrie
MONEYTECH

Laut ADAC: Die sparsamsten Diesel der Mittelklasse

VPN-Anbieter Europa, VPN-Dienste Europa
TECH

Alternativen zu US-Software: 4 VPN-Anbieter aus Europa

Energie Fußboden, Schleim, Forschung, Wissenschaft, Strom, Stromerzeugung, Kanada, Universität, grüner Strom, saubere Energie
GREENTECH

Schleimiges Material im Fußboden erzeugt Energie – wenn man darüber läuft

Reasoning-Modelle KI Künstliche Intelligenz LRM
TECH

Studie: Sind Reasoning-Modelle weniger leistungsfähig als gedacht?

Mehr anzeigen
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
  • Über uns
  • Mediadaten
  • Impressum
  • Datenschutz
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?