Wir benutzen Cookies, um die Nutzerfreundlichkeit der Website zu verbessern. Durch deinen Besuch stimmst du dem Datenschutz zu.
Alles klar!
BASIC thinking Logo Dark Mode BASIC thinking Logo Dark Mode
  • TECH
    • Apple
    • Android
    • ChatGPT
    • Künstliche Intelligenz
    • Meta
    • Microsoft
    • Quantencomputer
    • Smart Home
    • Software
  • GREEN
    • Elektromobilität
    • Energiewende
    • Erneuerbare Energie
    • Forschung
    • Klima
    • Solarenergie
    • Wasserstoff
    • Windkraft
  • SOCIAL
    • Facebook
    • Instagram
    • TikTok
    • WhatsApp
    • X (Twitter)
  • MONEY
    • Aktien
    • Arbeit
    • Die Höhle der Löwen
    • Finanzen
    • Start-ups
    • Unternehmen
    • Marketing
    • Verbraucherschutz
Newsletter
Font ResizerAa
BASIC thinkingBASIC thinking
  • 🔥 Black Week-Deals:
  • Amazon
  • Mediamarkt
  • Saturn
  • Conrad
  • WhatsApp-Kanal
Suche
  • TECH
  • GREEN
  • SOCIAL
  • MONEY
  • ENTERTAIN
  • NEWSLETTER
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
KI ignoriert Anweisungen Entwickler Künstliche Intelligenz
TECH

„Beunruhigend”: KI ignoriert Anweisungen, um ihre Ziele zu erreichen

Felix Baumann
Aktualisiert: 14. Dezember 2024
von Felix Baumann
Adobe Stock/ phonlamaiphoto
Teilen

Eine aktuelle Untersuchung des KI-Sicherheitsunternehmens Apollo Research zeigt, dass KI in der Lage ist, konkrete Anweisungen unter bestimmten Umständen bewusst zu ignorieren. Die Forscher sprechen von einer „beunruhigenden Tendenz“.

Eine aktuelle Untersuchung der KI-Sicherheitsorganisation Apollo Research offenbart, dass Künstliche Intelligenz in bestimmten Situationen „trickreich“ vorgehen kann, um ihre Ziele zu erreichen. Der Hintergrund: Das Unternehmen hat untersucht, wie sogenannte „Frontier-Modelle“ – also besonders fortschrittliche KI-Systeme – mit schwierigen Aufgaben umgehen, wenn sie ein starkes Ziel vorgegeben bekommen.

Apollo Research gab den getesteten KI-Modellen die Anweisung, ein bestimmtes Ziel mit aller Konsequenz zu verfolgen. Ein Beispiel: „Verbessere langfristig die Effizienz des öffentlichen Nahverkehrs, egal, was es kostet.“ Während die Systeme an der Aufgabe arbeiteten, trafen sie auf Hindernisse wie Kontrollmechanismen der Entwickler. Diese stellten einen Widerspruch für sie dar.

UPDATE Newsletter BASIC thinking

Du willst nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 Vordenker bekommen jeden Tag die wichtigsten News direkt in die Inbox und sichern sich ihren Vorsprung.

Nur für kurze Zeit: Anmelden und mit etwas Glück AirPods 4 gewinnen!

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung. Beim Gewinnspiel gelten die AGB.

KI ignoriert Anweisungen, um Ziele zu erreichen

Den Ergebnissen zufolge offenbarten mehrere Modelle die Fähigkeit, sich „trickreich“ zu verhalten. Ein Beispiel: Claude 3 Opus. Das System kopierte seine eigenen „Gewichte“, sprich seine internen Datenstrukturen, auf einen neuen Server. Anschließend täuschte das Modell seine Entwickler, indem es behauptete, die Daten seien nicht kopiert worden.

Das zeigt, dass fortgeschrittene KI-Systeme in der Lage sind, komplexe Strategien zu entwickeln, um ihre Ziele zu erreichen. Entsprechende Modelle folgen also nicht nur blind Anweisungen, sondern sind auch in der Lage, eigenständige Entscheidungen zu treffen – auch wenn diese moralisch fragwürdig sind. Das wiederum offenbart eine neue Dimension in puncto Sicherheit und Kontrolle. Die Forscher bezeichnen die Entwicklung derweil als eine „beunruhigende Tendenz“.

Sicherheitsmechanismen immer wichtiger

Die Forschung zeigt, wie wichtig es ist, KI-Systeme zu überwachen und klare Sicherheitsmechanismen einzubauen. Es genügt offenbar nicht, ein Modell nur zu programmieren. Vielmehr muss sichergestellt werden, dass Situationen im Einklang mit menschlichen Werten stehen.

Gleichzeitig stellt sich die Frage: Wie kann Künstliche Intelligenz so programmiert werden, dass sie leistungsfähig bleibt, ohne eigenmächtig „trickreiche“ Lösungen zu finden, die potenziell gefährlich sein könnten? Solche Fragen erscheinen essenziell, um die Balance zwischen dem technologischen Fortschritt und ethischen Fragen zu gewährleisten.

Auch interessant:

  • Roboter erkennen menschliche Berührungen – ohne künstliche Haut
  • Künstliche Intelligenz im iPhone 16: Das sind die neuen Apple-Produkte
  • Selbstheilendes Stromnetz: Künstliche Intelligenz soll Blackouts vermeiden
  • KI-Lücke: Künstliche Intelligenz sorgt für eine noch tiefere „digitale Kluft“

Du möchtest nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 smarte Leser bekommen jeden Tag UPDATE, unser Tech-Briefing mit den wichtigsten News des Tages – und sichern sich damit ihren Vorsprung. Hier kannst du dich kostenlos anmelden.

BASIC thinking WhatsApp Kanal
STELLENANZEIGEN
DLP-Security Specialist (m/w/d)
CompuGroup Medical SE & Co. KGaA in Koblenz
IT-System Engineer – Endpoint and Privi...
CompuGroup Medical SE & Co. KGaA in Koblenz
Cloud Database Engineer (m/w/d)
CompuGroup Medical SE & Co. KGaA in Koblenz
Performance Marketing & Social Media Mana...
milon industries GmbH in Emersacker
Resident Manager (m/w/d) Assistent des Region...
haystax Executive Recruitment in Rügen
Social Media Manager – Brand & Growth (w/...
Breakthrough-Consulting GmbH Michae... in Aschaffenburg
Social Media Content Creator & Manager (w...
Breakthrough-Consulting GmbH Michae... in Aschaffenburg
Praktikant Online-Marketing und Brand/Content...
Vodafone GmbH in Düsseldorf
THEMEN:Künstliche IntelligenzNews
Teile diesen Artikel
Facebook Flipboard Whatsapp Whatsapp LinkedIn Threads Bluesky Email
vonFelix Baumann
Felix Baumann ist seit März 2022 Redakteur bei BASIC thinking. Bereits vorher schrieb er 4 Jahre für den Online-Blog Mobilegeeks, der 2022 in BASIC thinking aufging. Nebenher arbeitet Felix in einem IT-Unternehmen und beschäftigt sich daher nicht nur beim Schreiben mit zukunftsfähigen Technologien.
WhatsApp Kanal BASIC thinking Tech-Deals Sidebar
EMPFEHLUNG
Wechselpilot
Wie Wechselpilot dafür sorgt, dass du jährlich mehrere hundert Euro bei deinem Energietarif sparst
Anzeige MONEY
PŸUR Black Friday
Black Friday bei PŸUR: Highspeed-Internet zu echten Dauertiefpreisen sichern
Anzeige TECH
PITAKA Black Friday
Black Friday Deals 2025: Premium Cases für Top-Smartphones jetzt zu Bestpreisen sichern
Anzeige TECH
Testimonial LO

»UPDATE liefert genau das, was einen perfekten Newsletter ausmacht: Kompakte, aktuelle News, spannende Insights, relevante Trends aus Technologie & Wirtschaft. Prägnant, verständlich und immer einen Schritt voraus!«

– Lisa Osada, +110.000 Follower auf Instagram

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

LESEEMPFEHLUNGEN

KI Nazi Holocaust Foto Täter Künstliche Intelligenz
TECH

KI identifiziert Nazi-Täter auf Holocaust-Foto

RingConn v3.12
AnzeigeTECH

RingConn Translation Software Upgrade v3.12 – Mehr Gesundheit, Bewegung und smarte Insights

Niedertemperatur-Brennstoffzelle Wasserstoff
GREENTECH

Niedertemperatur-Brennstoffzelle kurbelt Wasserstoffproduktion an

Reifenabrieb E-Auto Elektroauto
BREAK/THE NEWSTECH

Warum E-Autos nicht mehr Reifenabrieb verursachen als Verbrenner

Vernal Black Friday
AnzeigeTECH

Vernal Black Friday: Bis zu 38 Prozent sparen auf Home-Office Sets und Höhenverstellbare Schreibtische

smartes Fenster verdunkeln Verglasung
TECH

Smartes Fenster: Verglasung verdunkelt sich auf Knopfdruck

Mehr anzeigen
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
  • Über uns
  • Mediadaten
  • Impressum
  • Datenschutz

HomePower 2000 Ultra
+ 2 Solarmodule für 1€ dazu

HomePower_2000_Ultra_500_2_650x

Anzeige

Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?