OpenAI hat behauptet, dass GPT-5 gleich mehrere komplizierte Probleme der Zahlentheorie gelöst hat. Doch während das Unternehmen in den sozialen Medien eine Mathe-Revolution feierte, entlarvten Experten eine Falschdarstellung. Von der Konkurrenz hagelte es Spott.
OpenAI feiert Mathe-Revolution, die keine ist
- In der Mathematik gibt es zahlreiche Probleme, die Experten seit Jahrzehnten beschäftigen. Der britische Mathematiker Thomas Bloom hat deshalb die Website erdosproblems.com ins Leben gerufen. Dort listet er die Erdős-Probleme. Diese gehen auf den ungarischen Mathematiker Paul Erdős zurück und gelten als besonders schwer nachweisbar. Einige davon soll GPT-5 laut OpenAI gelöst haben. Bloom entlarvte diese Behauptung.
- KI-Modelle von Google DeepMind und OpenAI haben bei der Internationalen Mathematik-Olympiade (IMO) 2025 erstmals Goldmedaillen-Level errungen. Beide Systeme lösten fünf von sechs Aufgaben, was den bisherigen Stand der KI-Forschung beim mathematischen Denken deutlich verschiebt. KI ist mittlerweile also sehr gut darin, mathematische Probleme zu lösen, stößt allerdings bei komplizierten Aufgaben an ihre Grenzen – und neigt gelegentlich zu Halluzinationen.
- Trotz der rasanten Entwicklungen im KI-Bereich gilt die Mathematik immer noch als eine der größten Herausforderungen. Der Grund: Sprachmodelle antworten anhand von Mustern und Wahrscheinlichkeiten, anstatt auf Grundlage von echtem Wissen oder Verständnis. Für einige mathematische Gleichungen mag das reichen. Für andere erfordert es logische Schlüsse, mit denen KI überfordert ist.
Keine Mathe-Revolution, aber beachtliche Recherche-Leistung
Die Mathe-Panne von OpenAI offenbart die Maßlosigkeit eines Hypes, dem das Unternehmen nun selbst aufgesessen ist. Man könnte zwar argumentieren, dass das Unternehmen einem Irrtum erlegen ist. Doch das zieht automatisch die Frage nach sich, warum OpenAI seine Behauptungen nicht überprüfen lässt.
Die Antwort? Ein fast schon absurder KI-Wettstreit, der offenbar einen solchen Druck ausübt, dass vermeintlich spektakuläre Durchbrüche überhastet gefeiert werden.
Der Vorfall wäre für OpenAI jedoch weitaus weniger dramatisch, wenn er nicht ein Kommunikationsdesaster aufzeigen würde, das den ohnehin schon kritisch beäugten Hype um ChatGPT weiter anheizt.
Dabei verbirgt sich hinter dieser Blamage sogar eine beachtliche Leistung. Denn GPT-5 hat zwar kein Mathematik-Problem gelöst, aber beeindruckende Recherche-Fähigkeiten gezeigt. Berichten zufolge hat die KI relevante Publikationen identifiziert, die selbst Experten wie dem Mathematiker Thomas Bloom nicht bekannt waren.
Stimmen
- OpenAI-Manager Kevin Weil verkündete in einem mittlerweile gelöschten Beitrag auf X (ehemals Twitter): „GPT-5 hat gerade Lösungen für 10 (!) bisher ungelöste Erdős-Probleme gefunden und bei 11 weiteren Fortschritte erzielt. Diese waren alle seit langem ungelöst.“
- Mathematiker Thomas Bloom widersprach umgehend: „Hallo, als Eigentümer/Betreuer von erdosproblems.com halte ich dies für eine dramatische Falschdarstellung. GPT-5 hat Referenzen gefunden, die diese Probleme lösen, von denen ich persönlich nichts wusste. Der Status „offen“ bedeutet lediglich, dass mir persönlich keine Veröffentlichung bekannt ist, die dieses Problem löst.“
- Nachdem Bloom die Falschdarstellung aufklärte, löschte OpenAI seine Posts. Von der Konkurrenz hagelte es derweil Kritik. Deepmind-CEO Demis Hassabis dazu kurz und bündig: „Das ist peinlich.“ Yann LeCun, KI-Chef von Meta, sagte, dass OpenAI seinem eigenen Hype aufgesessen sei: „Von ihren eigenen GPTards hochgezogen“.
OpenAI: Mathe-Blamage offenbart Achillesferse der KI-Branche
Der Mathe-Lapsus von OpenAI offenbart den wunden Punkt der KI-Branche: maßloses Overstatement. Das Paradoxe: Statt über die eigentlichen Fortschritte zu sprechen, werden Marginalitäten als Revolutionen auserkoren.
Der eigentliche Gamechanger, nämlich die schier grenzenlose Möglichkeiten der Datenverarbeitung durch KI gerät dabei ins Hintertreffen. Wer ChatGPT und Co. jedoch weiter mit dem Denkvermögen eines Menschen vergleicht, sitzt einem Irrtum auf.
Das gilt sowohl für Unternehmen als auch private Nutzer. Die Krux, die es dabei zu verstehen gilt: Künstliche Intelligenz kann Menschen in den wenigsten Fällen ersetzen. Sie muss als Assistent verstanden werden, der Kontrolle bedarf und vor allem kritisch hinterfragt werden sollte.
Dann kann KI vor allem für Recherchen und in der Datenverarbeitung ein echter Gewinn sein. Angekündigte Revolutionen oder intellektuelle Durchbrüche sind jedoch stets in der PR-Schublade zu verorten.
Auch interessant: