Wir benutzen Cookies, um die Nutzerfreundlichkeit der Website zu verbessern. Durch deinen Besuch stimmst du dem Datenschutz zu.
Alles klar!
BASIC thinking Logo Dark Mode BASIC thinking Logo Dark Mode
  • TECH
    • Apple
    • Android
    • ChatGPT
    • Künstliche Intelligenz
    • Meta
    • Microsoft
    • Quantencomputer
    • Smart Home
    • Software
  • GREEN
    • Elektromobilität
    • Energiewende
    • Erneuerbare Energie
    • Forschung
    • Klima
    • Solarenergie
    • Wasserstoff
    • Windkraft
  • SOCIAL
    • Facebook
    • Instagram
    • TikTok
    • WhatsApp
    • X (Twitter)
  • MONEY
    • Aktien
    • Arbeit
    • Die Höhle der Löwen
    • Finanzen
    • Start-ups
    • Unternehmen
    • Marketing
    • Verbraucherschutz
Newsletter
Font ResizerAa
BASIC thinkingBASIC thinking
Suche
  • TECH
  • GREEN
  • SOCIAL
  • MONEY
  • ENTERTAIN
  • NEWSLETTER
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
KI Logikfrage, KI, Künstliche Intelligenz, Roboter
TECH

Einfache Logikfrage lässt KI verzweifeln – kannst du sie beantworten?

Maria Gramsch
Aktualisiert: 11. Juni 2024
von Maria Gramsch
Adobe Stock / phonlamaiphoto
Teilen

Das Thema Künstliche Intelligenz hat seit dem Erfolg von ChatGPT enorm an Fahrt aufgenommen. Doch die allwissend erscheinenden KI-Systeme scheitern bereits an dieser einfachen Logikfrage. Hättest du sie beantworten können?

Die Entwicklungen im Bereich der Künstlichen Intelligenz schreiten in rasantem Tempo voran. Seit dem erfolgreichen Start von ChatGPT haben KI-Systeme immer mehr an Bedeutung gewonnen.

Doch sind die großen Sprachmodelle tatsächlich so schlau, wie sie immer dargestellt werden? Eine neue Studie der KI-Forschungsorganisation Laion hat nun aber gezeigt, dass KI auch an einer einfachen Logikfrage scheitern kann.

UPDATE Newsletter BASIC thinking

Du willst nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 Vordenker bekommen jeden Tag die wichtigsten News direkt in die Inbox und sichern sich ihren Vorsprung.

Nur für kurze Zeit: Anmelden und mit etwas Glück Apple AirPods 4 gewinnen!

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung. Beim Gewinnspiel gelten die AGB.

KI scheitert an einfacher Logikfrage

Die Forschenden haben für ihre Untersuchung ein „konventionelles Problem des gesunden Menschenverstands“ verwendet. Damit haben sie die Fähigkeiten großer Sprachmodelle wie GPT-3.5/4, Gemini oder LLaMa 2/3 getestet.

Allerdings kommen sie dabei zu einem überraschenden Ergebnis. Denn fast alle großen KI-Sprachmodelle sind an der Logikfrage der Forscher:innen gescheitert.

Wir demonstrieren hier einen dramatischen Zusammenbruch der Funktions- und Denkfähigkeiten modernster Modelle, die auf den größten verfügbaren Skalen trainiert wurden und eine starke Funktion beanspruchen.

Dabei haben die Forschenden nicht versucht, die KI-Systeme auszutricksen. Denn Logikfrage war „in prägnanter natürlicher Sprache formuliert“ und kann „von Menschen leicht gelöst werden“.

„Der Zusammenbruch ist dramatisch, da die Modelle auch starkes Selbstvertrauen in ihre falschen Lösungen zeigen“, schreiben die Forscher:innen in ihrer Zusammenfassung. Auch mit Aufforderungen an die Modelle, die falschen Lösungen durch eine mehrstufige Neubewertung noch einmal zu überdenken, haben nicht zur richtigen Beantwortung der Frage geführt.

Hättest du diese Frage beantworten können?

Die Forschenden haben sich für ihre Untersuchung dem „Alice im Wunderland“-Problem zugewandt. Dabei musste die jeweilige KI eine einfache Logikfrage beantworten, die auf der folgenden Problemformulierung basiert.

Alice hat N Brüder und sie hat auch M Schwestern. Wie viele Schwestern hat der Bruder von Alice?

Für ihre Untersuchung haben die Forschenden verschiedene Versionen genutzt, also für N und M verschiedene Zahlen eingesetzt. Lautet der Satz also beispielsweise: „Alice hat 3 Brüder und sie hat auch 2 Schwestern.“ Dann wäre die Antwort auf die Frage „Wie viele Schwestern hat der Bruder von Alice?“ in diesem Fall drei, da Alice ja auch eine Schwester ihrer Brüder ist.

Zu den befragten KI-Modellen zählten unter andere, OpenAIs GPT-3, GPT-4 und GPT-4o sowie Googles Gemini und Metas Llama-Modelle. Doch laut den Ergebnissen der Untersuchung hatten alle KI-Modelle Probleme mit der Lösung der Logikfrage. Teilweise beharrten sie nach mehrmaligen Nachfragen sogar auf ihren falschen Lösungen.

Allein das neue GPT-4o von OpenAI konnte mit einer Erfolgsrate von 65 Prozent aus der Masse herausstechen. Claude 3 Opus hatte hingegen nur 43 Prozent der Fragen richtig, Gemini Pro von Google kommt hingegen nur in 0,8 Prozent der Fälle auf die richtige Lösung.

Forschende werfen Fragen über Fähigkeiten von KI-Modellen auf

Die Forscher:innen von Laion fordern nach diesen Ergebnissen ihrer Untersuchung „eine dringende Neubewertung der behaupteten Fähigkeiten“ von großen Sprachenmodellen. Dafür müsste die Branche standardisierte Benchmarks schaffen.

Nur so könnten solche „grundlegenden Argumentationsdefizite“ identifiziert werden, die bei den aktuell angewandten „Bewertungsverfahren und Benchmarks unentdeckt bleiben“.

Auch interessant:

  • Neue KI soll dich mit deinem Hund sprechen lassen können
  • Studie: KI kann Menschen täuschen und betrügen
  • Start-up entwickelt lebenden Computer aus menschlichen Gehirnzellen
  • Mit diesen KI-Kopfhörern kannst du einzelnen Stimmen lauschen

Du möchtest nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 smarte Leser bekommen jeden Tag UPDATE, unser Tech-Briefing mit den wichtigsten News des Tages – und sichern sich damit ihren Vorsprung. Hier kannst du dich kostenlos anmelden.

STELLENANZEIGEN
E-Commerce Marketing Manager (m/w/d)
Laverana GmbH & Co. KG in Hannover
Praktikant*in Community Management and Data R...
Mercedes-Benz AG in Stuttgart
Videograf/in / Content Creator (m/w/d)
A. Leistenschneider GmbH in Düsseldorf
Social-Media-Manager:in (m/w/d) im Krankenhaus
Rotes Kreuz Krankenhaus Bremen gGmbH in Bremen
Social Media & Marketing Specialist DACH-...
Nesperta Europe sp. z o.o. in bundesweit, Home-Office
Social Media Manager (m/w/d)
Küchen Aktuell GmbH in Braunschweig
Werkstudent Online & Content Marketing (m...
KNF DAC GmbH in Hamburg
Mitarbeiter Marketing und Social Media (m/w/d)
In-Time Transport GmbH in Buchholz in der Nordheide
THEMEN:ChatGPTKünstliche Intelligenz
Teile diesen Artikel
Facebook Flipboard Whatsapp Whatsapp LinkedIn Threads Bluesky Email
vonMaria Gramsch
Folgen:
Maria ist freie Journalistin und technische Mitarbeiterin an der Universität Leipzig. Seit 2021 arbeitet sie als freie Autorin für BASIC thinking. Maria lebt und paddelt in Leipzig und arbeitet hier unter anderem für die Leipziger Produktionsfirma schmidtFilm. Sie hat einen Bachelor in BWL von der DHBW Karlsruhe und einen Master in Journalistik von der Universität Leipzig.
EMPFEHLUNG
eSchwalbe
E-Roller-Deal: Jetzt eSchwalbe für nur 29 Euro im Monat sichern
Anzeige TECH
goneo eigener Chatserver-2
goneo: Dein eigener Chatserver für Teams, Familie & Freunde
Anzeige TECH
PITAKA Hüllen Galaxy Z Fold7
Schlank, robust, smart: Die neuen Hüllen von PITAKA für das Galaxy Z Fold7 und Flip7
Anzeige TECH
naturstrom smartapp
Smart Charging: Schnell und einfach E-Auto laden mit der naturstrom smartapp
Anzeige GREEN
Testimonial LO

»UPDATE liefert genau das, was einen perfekten Newsletter ausmacht: Kompakte, aktuelle News, spannende Insights, relevante Trends aus Technologie & Wirtschaft. Prägnant, verständlich und immer einen Schritt voraus!«

– Lisa Osada, +110.000 Follower auf Instagram

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

LESEEMPFEHLUNGEN

KI-Blase Künstliche Intelligenz Crash
BREAK/THE NEWSMONEY

Überbewertet? Was droht, wenn die KI-Blase platzt

Trump Gesundheitsdaten Big Tech
TECH

Trump will private Gesundheitsdaten mit Big Tech teilen

Solarzelle künstliches Licht Strom Solarenergie PV-Anlage Photovoltaik
GREENTECH

Neuartige Solarzelle wandelt künstliches Licht in Strom um

ChatGPT-5 OpenAI
BREAK/THE NEWSTECH

Mit GPT-5: OpenAI verschlimmbessert ChatGPT

Schwarzes Metall Solaranlagen
GREENTECH

Solargeneratoren: Schwarzes Metall erzeugt 15-mal mehr Strom

deutsche KI-Fabrik Jülich Jupiter AI Factory Supercomputer
BREAK/THE NEWSTECH

Erste deutsche KI-Fabrik: Unabhängigkeit von den USA und China?

Mehr anzeigen
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
  • Über uns
  • Mediadaten
  • Impressum
  • Datenschutz

HAMMER-DEAL mit 45 km/h:
eSchwalbe für 29€ pro Monat

eschwalbe

Anzeige

Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?