OpenAI hat mit ChatGPT-5.4 ein neues KI-Modell vorgestellt. Es soll den Chatbot nicht nur in vielen Bereichen deutlich verbessern, sondern es ihm ermöglichen, gezielt Maus und Tastatur zu steuern. Die Funktion scheint eine große Wette auf die Zukunft zu sein, ist aber noch nicht ganz ausgereift. Eine kommentierende Analyse.
Was kann ChatGPT-5.4?
- Strenggenommen hat OpenAI mit GPT‑5.4 Pro und GPT‑5.4 Thinking sogar zwei neue KI-Modelle veröffentlicht. Während die Thinking-Version direkt in ChatGPT integriert wird, richtet sich die Pro-Variante über die Programmierschnittstelle (API) vor allem an Entwickler und Unternehmen. Das Versprechen: GPT-5.4 Thinking soll vor allem bessere Antworten im Chat liefern, indem das Modell gezielter im Netz recherchiert. GPT-5.4 Pro wurde wiederum für komplexe Aufgaben und mehr Leistung konzipiert. Das Modell soll unter anderem besser darin sein, Tabellen, Präsentationen und Dokumente zu erstellen.
- Die wohl wichtigste Neuerung ist, dass ChatGPT mit GPT-5.4 erstmals Computeroberflächen steuern kann. OpenAI zufolge ist das Modell in der Lage, Maus- und Tastaturbefehle auszuführen sowie Programme zu bedienen. Dazu analysiert die KI Screenshots des Bildschirms und entscheidet dann selbstständig, welche Aktionen notwendig sind. ChatGPT soll dadurch beispielsweise Programme öffnen und bedienen, Formulare ausfüllen sowie Daten aus mehreren Anwendungen zusammenführen können.
- Eine weitere Neuerung ist die deutliche Erweiterung des Kontextfensters. GPT-5.4 kann laut OpenAI bis zu eine Million Token zeitgleich verarbeiten. Dadurch soll die KI große Dokumente, ganze Code-Projekte oder umfangreiche Datensätze mit einer einzigen Anfrage analysieren können. Mit einer Erfolgsquote von 83 Prozent stelle die KI die Konkurrenz (70 Prozent) in diesem Bereich in den Schatten. Das Update soll zudem die Genauigkeit der Antworten steigern. Einzelne falsche Aussagen würden etwa 33 Prozent seltener auftreten, während komplette Antworten 18 Prozent weniger Fehler enthalten sollen.
ChatGPT-5.4 soll Computer steuern
Mit GPT‑5.4 hat OpenAI ein Update geliefert, das in vielen Bereichen offenbar tatsächlich besser funktioniert, anstatt neue Fehler zu verursachen. Die Möglichkeit, Maus und Tastatur zu steuern, eröffnet der KI theoretisch Möglichkeiten, die die Konkurrenz in den Schatten stellen könnte. Diese Computer-Use-Funktion stellt einen deutlichen Schritt in Richtung autonomer Agenten dar, bei dem der Mensch aber noch aktiv mitspielen muss.
Interessant ist, dass die Handschrift des autonomen KI-Agenten OpenClaw bereits sichtbar wird. Mit der Verpflichtung des Entwicklers Peter Steinberger scheint OpenAI die nötige Expertise für komplexe und praktische Anwendungen eingekauft zu haben. Fokus auf Coding, Präsentationen und Office-Aufgaben ist wiederum klar an den aktuell wohl größten Konkurrenten Anthropic adressiert.
Trotz der vermeintlichen Fortschritte gibt es aber Einschränkungen. Denn in Bereichen wie Gesundheit, Gedächtnis oder unmöglichen Aufgaben zeigt GPT‑5.4 Schwächen. Das gibt sogar OpenAI unverblümt zu. Die KI liefert zwar häufig sehr gute Einzelantworten, driftet aber gelegentlich vom Thema ab.
Das deutet auf ein bekanntes Muster hin, das zeigt, dass Fortschritt in einem Bereich oft Rückschritte in anderen Bereichen mit sich bringt. Auch wenn OpenAI hier offenbar Fortschritte erzielt hat, scheint das Unternehmen dieses Problem immer noch nicht gänzlich im Griff zu haben.
Stimmen
- OpenAI-Chef Sam Altman in einem Beitrag auf X (ehemals Twitter): „GPT-5.4 ist großartig in den Bereichen Programmierung, Wissensarbeit, Computernutzung usw., und es ist schön zu sehen, wie sehr die Leute daran Freude haben. Aber es ist auch mein Lieblingsmodell, mit dem ich mich unterhalte! Wir haben eine Zeit lang das Ziel der Modellpersönlichkeit verfehlt, daher fühlt es sich besonders gut an, nun in die richtige Richtung zu gehen.“
- Ein Reddit-Nutzer ist voll des Lobes: „Ich bin sehr zufrieden mit ChatGPT 5.4. Ehrlich gesagt hatte ich seit Version 4.0 keine Version mehr erlebt, die mir in Bezug auf Qualität, Konsistenz und natürliche Interaktion so gut gefallen hat. ChatGPT 5.4 fühlt sich flüssiger, stabiler und für den täglichen Gebrauch viel besser an. Meine wichtigste Bitte ist einfach: Bitte ruiniert nicht das, was bereits so gut funktioniert. Nicht jedes Update muss die Identität dessen ersetzen, was die Menschen bereits lieben. Manchmal ist es am klügsten, das zu bewahren, was funktioniert, und darauf aufzubauen. Vielen Dank für ChatGPT 5.4 und bitte bewahren Sie diese starke Grundlage.“
- Journalist David Gewirtz hat ChatGPT 5.4 für ZDNET getestet. Sein Fazit: „Jede Antwort, die ich erhielt, war für sich genommen recht gut. Aber in der Hälfte meiner Tests hat die KI die gestellte Frage nicht beantwortet. Man kann gute Antworten erhalten, aber man muss die KI unerbittlich korrigieren, damit sie beim Thema bleibt. Das wird mit der Zeit ermüdend. Es könnte zu Fehlinterpretationen führen. Da die Antworten so gut und so selbstbewusst geschrieben sind, kann man sich leicht von der KI mitreißen lassen, auch wenn die Antwort nicht passt. Immer wenn ich solche Ergebnisse sehe, mache ich mir zunehmend Sorgen um eine Welt, die von KI-Agenten überrannt wird.“
Für OpenAI steht viel auf dem Spiel
Ob GPT‑5.4 mehr als ein hübsches Upgrade bleibt, werden erst die kommenden Wochen über eine breitere Nutzerbasis zeigen – und zwar jenseits kontrollierter Demo-Daten und Presseversprechen. Denn erst wenn Tausende echte Nutzer das Modell über Stunden testen, wird sich zeigen, ob es Sicherheit, Kreativität und Nützlichkeit harmonisch unter einen Hut bringen kann.
Für OpenAI steht dabei viel auf dem Spiel. Schließlich gilt es Vertrauen zurückzugewinnen, nachdem bekannt wurde, dass man seine KI-Modelle dem US-Militär zur Verfügung stellt und viele Nutzer dem Unternehmen daraufhin den Rücken kehrten. Gelingt es, wieder mehr Leistung als Politik sprechen zu lassen, könnte GPT‑5.4 ein Volltreffer werden. Die Computer-Use-Funktion stellt dabei eine große Wette auf die Zukunft dar und soll ChatGPT autonomer agieren lassen.
Das eröffnet aber auch Fragen. Wie weit kann und darf autonome Interaktion am Rechner etwa gehen, ohne dass der Mensch die Kontrolle verliert? Wie wirken sich die neuen Fähigkeiten auf den Arbeitsalltag, Datenschutz und ethische Standards aus? Und nicht zuletzt: Wird die KI den Spagat zwischen Leistung und Kontrollverlust meistern oder verschlimmbessert OpenAI durch eine solche Funktion ChatGPT einmal mehr?
Auch interessant:









