Wir benutzen Cookies, um die Nutzerfreundlichkeit der Website zu verbessern. Durch deinen Besuch stimmst du dem Datenschutz zu.
Alles klar!
BASIC thinking Logo Dark Mode BASIC thinking Logo Dark Mode
  • TECH
    • Apple
    • Android
    • ChatGPT
    • Künstliche Intelligenz
    • Meta
    • Microsoft
    • Quantencomputer
    • Smart Home
    • Software
  • GREEN
    • Elektromobilität
    • Energiewende
    • Erneuerbare Energie
    • Forschung
    • Klima
    • Solarenergie
    • Wasserstoff
    • Windkraft
  • SOCIAL
    • Facebook
    • Instagram
    • TikTok
    • WhatsApp
    • X (Twitter)
  • MONEY
    • Aktien
    • Arbeit
    • Die Höhle der Löwen
    • Finanzen
    • Start-ups
    • Unternehmen
    • Marketing
    • Verbraucherschutz
Newsletter
Font ResizerAa
BASIC thinkingBASIC thinking
Suche
  • TECH
  • GREEN
  • SOCIAL
  • MONEY
  • ENTERTAIN
  • NEWSLETTER
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
Reasoning-Modelle KI Künstliche Intelligenz LRM
TECH

Studie: Sind Reasoning-Modelle weniger leistungsfähig als gedacht?

Maria Gramsch
Aktualisiert: 12. Juni 2025
von Maria Gramsch
Bild: Mit ChatGPT generiert (KI).
Teilen

Reasoning-Modelle sollen in der Lage sein Schlussfolgerungen zu ziehen, Probleme zu analysieren und mehrstufige Denkprozesse durchzuführen. Doch ein neues Paper aus dem Hause Apple zeigt, wirft Zweifel an der tatsächlichen Reasoning-Kompetenz moderner KI-Modelle auf.

Large Reasoning Models (LRMs) unterscheiden sich von anderen KI-Modellen wie beispielsweise Large Language Models (LLMs) vor allem durch ihre Fähigkeit, logisch zu denken. Statt Muster zu erkennen, setzt diese Art von KI-Modell auf Schlussfolgerungen.

Reasoning-Modelle sollen deshalb in der Lage sein, mehrstufige Aufgaben zu lösen. Daran scheitern klassische Modelle meist, wenn beispielsweise Zwischenschritte nötig sind.

UPDATE Newsletter BASIC thinking

Du willst nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 Vordenker bekommen jeden Tag die wichtigsten News direkt in die Inbox und sichern sich ihren Vorsprung.

Nur für kurze Zeit: Anmelden und mit etwas Glück Apple AirPods 4 gewinnen!

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung. Beim Gewinnspiel gelten die AGB.

LRMs sind darauf ausgerichtet, wie Menschen zu denken. Doch dabei weisen die KI-Modelle immer noch gravierende Schwächen auf, wie ein neues Paper von Apple-Forschern untersucht hat.

Zweifel an Denkfähigkeiten von Reasoning-Modellen

Trotz beeindruckender Fortschritte bei Benchmarks zum logischen Denken bleiben zentrale Fragen zu den Fähigkeiten und Grenzen moderner LRMs laut den Apple-Forschern bisher offen. Denn aktuelle Bewertungen von Reasoning-Modellen, unter anderem von OpenAI, Google und Anthropic, stützen sich vor allem auf mathematische und codierte Benchmarks mit Blick auf die Endantwort. Dieses Vorgehen vernachlässigt jedoch die Analyse der Denkprozesse und ist anfällig für Verzerrungen in den Daten.

Um diese Denkprozesse zu untersuchen, haben die Forscher kontrollierte Rätselumgebungen eingesetzt. Dabei haben sie unter anderem die Modelle o3 mini von OpenAI, Deepseek-R1 sowie Claude 3.7 Sonnet unter die Lupe genommen und jeweils den „normalen“ KI-Modus mit dem Reasoning-Modus verglichen.

Dabei konnten sie die Komplexität einer Aufgabe gezielt variieren, aber gleichzeitig die logischen Strukturen aufrechterhalten. So konnten sie nicht nur das Ergebnis bewerten, sondern auch den inneren Denkweg der Modelle analysieren.

Wie haben die jeweiligen Modelle abgeschnitten?

Doch die Ergebnisse fallen ernüchternd aus. Denn ab einer gewissen Komplexität brechen die Modelle in ihrer Leistung vollständig ein. Zusätzlich konnten die Forscher überraschende Skalierungseffekte feststellen. Denn mit steigender Schwierigkeit einer Aufgabe nahm zunächst auch der kognitive Aufwand der Modelle zu. Dieser fällt dann jedoch wieder ab, obwohl genügend Rechenkapazität zur Verfügung stehen würde.

Die Forscher haben ihre Ergebnisse in drei Leistungszonen unterteilt. Demnach schneiden klassische KI-Modelle bei einfachen Aufgaben teilweise besser ab. Bei mittlerer Komplexität zeigen LRMs Vorteile durch zusätzliche Denkschritte. Bei hoher Komplexität hingegen erleben beide Modell-Arten einen „vollständigen Zusammenbruch“.

Die Forscher konnten analysieren, dass LRMs oft keine expliziten Algorithmen anwenden und daher bei logischen Aufgaben oft inkonsistent argumentieren. Auch strukturelle Schwächen im Denkverhalten konnten so aufgedeckt werden.

Selbst wenn die Forscher den Modellen den richtigen Lösungsalgorithmus zur Verfügung gestellt haben, konnte dieser keine Anwendung finden. „Trotz anspruchsvoller Mechanismen zur Selbstreflexion scheitern diese Modelle daran, allgemeine Reasoning-Fertigkeiten über einen bestimmten Schwierigkeitsgrad hinweg zu entwickeln“, heißt es in der Veröffentlichung.

Auch interessant:

  • Vertrauliches Profil: So kannst du Apps unter Android verbergen
  • Apple Sidecar: So kannst du dein iPad als zweiten Bildschirm nutzen
  • Google: „Übersicht mit KI“ deaktivieren – so geht’s
  • Atomkraftwerke werden den Energiehunger von KI nicht stillen können

Du möchtest nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 smarte Leser bekommen jeden Tag UPDATE, unser Tech-Briefing mit den wichtigsten News des Tages – und sichern sich damit ihren Vorsprung. Hier kannst du dich kostenlos anmelden.

STELLENANZEIGEN
(Marketing) Content Manager (m/w/d)
MURTFELDT GmbH & Co. KG in Dortmund
Online Marketing Manager*in
VDI Wissensforum GmbH in Düsseldorf
Referent Online- & Social-Media-Kommunika...
Amprion GmbH in Dortmund
IT-Security Architekt*in
Hessischer Rundfunk in Frankfurt am Main
Praktikant Online-Marketing und Brand/Content...
Vodafone GmbH in Düsseldorf
Community Manager (w/m/d)
Horl 1993 GmbH in Freiburg
Videograf / Video Content Creator (w/m/d) – V...
FingerHaus GmbH in Frankenberg / Eder
Digital Content & Innovation Manager (alle*)
Hausärztinnen- und Hausärzteverbande Ba... in Stuttgart
THEMEN:Künstliche IntelligenzNews
Teile diesen Artikel
Facebook Flipboard Whatsapp Whatsapp LinkedIn Threads Bluesky Email
vonMaria Gramsch
Folgen:
Maria ist freie Journalistin und technische Mitarbeiterin an der Universität Leipzig. Seit 2021 arbeitet sie als freie Autorin für BASIC thinking. Maria lebt und paddelt in Leipzig und arbeitet hier unter anderem für die Leipziger Produktionsfirma schmidtFilm. Sie hat einen Bachelor in BWL von der DHBW Karlsruhe und einen Master in Journalistik von der Universität Leipzig.
Keine Kommentare Keine Kommentare

Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

EMPFEHLUNG
iPhone 16 Pro Max Vodafone Business
iPhone 16 Pro Max + Prime XL Unlimited für einmalig unter 200 Euro
Anzeige TECH
Cloud-Telefonie Universe Cloud-2
Ganz einfach zur eigenen Cloud-Telefonie mit Universe Cloud
Anzeige TECH
Testimonial LO

»UPDATE liefert genau das, was einen perfekten Newsletter ausmacht: Kompakte, aktuelle News, spannende Insights, relevante Trends aus Technologie & Wirtschaft. Prägnant, verständlich und immer einen Schritt voraus!«

– Lisa Osada, +110.000 Follower auf Instagram

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

LESEEMPFEHLUNGEN

ChatGPT Agent Captcha KI Künstliche Intelligenz.
TECH

ChatGPT-Agent überlistet Captcha: „Ich bin kein Roboter“

KI Umweltbelastung Künstliche Intelligenz
GREENTECH

Schockierende Zahlen: Bericht enthüllt Umweltauswirkungen von KI

ChatGPT Therapie Therapeut KI Künstliche Intelligenz
BREAK/THE NEWSTECH

ChatGPT als Therapeut: KI kennt keine Schweigepflicht

Feststoffbatterien aus Europa Festkörperbatterie Batterietechnoligie
GREENTECH

Feststoffbatterien: Europa sagt Asien den Kampf an

KI-Kodex EU Verhaltenskodex Künstliche Intelligenz
MONEYTECH

Der KI-Kodex der EU ist mutig – aber ungenügend

Frizzi Engler-Hamm
MONEYTECH

Homescreen! Ein Blick auf das Smartphone von Frizzi Engler-Hamm

Mehr anzeigen
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
  • Über uns
  • Mediadaten
  • Impressum
  • Datenschutz

UPDATE abonnieren & mit etwas Glück AirPods gewinnen!

Airpods 4 Apple
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?