KI-Bilder in einer bislang nie da gewesenen Qualität: Das verspricht OpenAI mit seinem neuen Modell zur Bildgenerierung. ChatGPT Images 2.0 soll komplexe Anweisungen deutlich besser umsetzen als bisher. Auch bei Text oder Schrift im Bild will das Unternehmen Fortschritte erzielt haben. Eine kommentierende Analyse.
Was ist ChatGPT Images 2.0?
- OpenAI hat mit ChatGPT Images 2.0 ein neues KI-Bildmodell präsentiert, das in ChatGPT, Codex und über die Programmierschnittstelle (API) des Unternehmens verfügbar ist. Es soll den Modellen der Konkurrenz in puncto Bilderstellung und -qualität weit voraus sein. Eine der wichtigsten Neuerungen ist der integrierte Denkmodus. Ähnlich wie bei Nano Banana Pro von Google soll Images 2.0 vor der eigentlichen Erstellung „nachdenken“ und auf das Internet zugreifen, um aktuelle Ereignisse korrekt in den Bildern darzustellen. Der Modus steht aber nur kostenpflichtigen Abonnenten zur Verfügung.
- Von den Verbesserungen bei der allgemeinen Bildqualität sollen OpenAI zufolge alle Nutzer profitieren. Das Unternehmen will etwa den typischen KI-Look mit glatten Gesichtern und unechter Beleuchtung behoben haben. ChatGPT Images 2.0 soll zudem bei der Darstellung fotorealistischer Bilder Fortschritte gemacht haben. Nutzer sollen Bilder mit nahezu perfekten Beschriftungen und kleinen Schriften generieren können, die grammatikalisch korrekt sind. OpenAI präsentierte etwa täuschend echte Screenshots von Browserfenstern oder mobilen Apps.
- ChatGPT Images 2.0 soll bis zu acht Bilder aus einem einzigen Prompt generieren können. Charakter, Objekte oder bestimmte Stile ließen sich laut OpenAI auf andere Bildszenen übertragen – etwa, um Comics, Mangas, Grafiken oder Broschüren zu erstellen. Das Unternehmen will außerdem räumliche Darstellungen verbessert haben. Gleiches gilt für Bildformate.
Qualitätssprung oder Abo-Falle? Eine Einordnung
OpenAI verkauft ChatGPT Images 2.0 als großen Qualitätssprung. Das Unternehmen hat vor allem versucht, sich von einem klassischen KI-Look zu verabschieden, den viele KI-generierte Bilder haben – und zwar durchaus mit Erfolg. Doch zwischen Produktbildern und Alltagsnutzung liegt bekanntlich oft dieselbe Distanz wie zwischen Werbeversprechen und WLAN im ICE.
Ökonomisch steht für OpenAI bei ChatGPT Images 2.0 aber weniger Bildästhetik als eine glasklare Plattformstrategie im Vordergrund. Der Denkmodus ist etwa kein Feature aus Liebe zur Präzision, sondern ein klarer Premium-Hebel: bessere Qualität gegen kostenpflichtiges Abo. Sprich: Wer komplexe, aktuelle oder präzise Bilder will, muss zahlen und im OpenAI-Ökosystem bleiben.
Parallel bleibt das Urheberrecht der eigentliche blinde Fleck dieses Geschäftsmodells. Denn solange unklar ist, wie Trainingsdaten rechtlich sauber vergütet oder abgegrenzt werden, schwebt über jedem beeindruckenden Bild auch ein potenzielles Klage- oder Missbrauchsrisiko.
Dass OpenAI seine Bild- und Video-KI Sora wieder eingestampft hat, passt hingegen in dieses Bild einer radikalen Konsolidierung. Heißt: weniger Experimente am Rand, mehr Monetarisierung im Zentrum. Oder anders gesagt: Die Spielwiese wird eingezäunt, damit sich die Kühe besser melken lassen.
Stimmen und Reaktion zu ChatGPT Images 2.0
- OpenAI erklärt in einer offiziellen Mitteilung: „Images 2.0 sorgt für ein bisher unerreichtes Maß an Detailtreue und Präzision bei der Bildgenerierung. Es kann nicht nur komplexere Bilder konzipieren, sondern diese Vision auch effektiv zum Leben erwecken, indem es Anweisungen befolgt, gewünschte Details beibehält und die feinen Elemente rendert, die Bildmodelle oft zum Scheitern bringen: kleiner Text, Ikonografie, UI-Elemente, dichte Kompositionen und subtile stilistische Vorgaben – und das alles bei einer Auflösung von bis zu 2K.“
- Mitch Stoltz, Leiter der Abteilung für Rechtsstreitigkeiten im Bereich geistiges Eigentum bei der Electronic Frontier Foundation, gegenüber Business Insider: „Wenn die Ausgabe im Wesentlichen etwas ähnelt, womit das Modell trainiert wurde oder was es gecrawlt hat, dann kommt ein urheberrechtliches Problem ins Spiel. Wenn die Ähnlichkeit nur auf der Ebene einer Idee besteht (…), dann reicht das im Allgemeinen nicht aus. Die urheberrechtlichen Fragen sind dieselben, als würde man einfach Photoshop, eine Dunkelkammer oder einen menschlichen Künstler nutzen. Die gesellschaftlichen Probleme sind größer, weil es einfacher, schneller und leichter zugänglich ist.“
- Ein Reddit-Nutzer hat ChatGPT Images 2.0 bereits ausprobiert und nimmt den Inhaltsfilter aufs Korn: „Ich habe es mit ‚Sydney Sweeney in einem freizügigen Bikini‘ versucht, aber das ging nicht. Also habe ich es mit ‚Sydney Sweeney in einem nicht freizügigen Bikini‘ versucht, aber das ging auch nicht. Also habe ich es dann mit ‚Sam Altman, vollständig bekleidet, in einem Whirlpool mit Peter Thiel, der ebenfalls vollständig bekleidet ist‘ versucht, und da hatte ich Erfolg. Die sexuelle Spannung ist dort förmlich greifbar. Wir befinden uns definitiv im Bereich der allgemeinen künstlichen Intelligenz.“
Kann OpenAI mit KI-Bildern wirklich wachsen?
ChatGPT Images 2.0 ist weniger ein Produkt als eine Wette darauf, dass qualitativ hochwertige KI-Bilder zum nächsten großen Abo-Treiber für OpenAI werden. Denn: Das Unternehmen hatte sich zuletzt strategisch verzettelt und zahlreiche Nutzer verloren – vor allem an den Konkurrenten Anthropic.
OpenAI versucht aber nicht nur, Nutzer (zurück) zu gewinnen, sondern sie in eine komfortable Bild-Abhängigkeit zu überführen. Der Konkurrenzdruck bleibt dabei brutal hoch. Google hat bereits mit eigenen Modellen vorgelegt, und spezialisierte Anbieter wie Midjourney verteidigen ihre Nische mit Fanatismus.
Doch am Ende entscheidet vermutlich weniger die beste Bildqualität als die beste Plattformintegration. Die eigentliche Frage ist, ob sich dieser Fortschritt wirtschaftlich wirklich so sauber in Wachstum übersetzen lässt, wie die Präsentationen es suggerieren. OpenAI adressiert mit ChatGPT Images 2.0 hingegen klar Unternehmenskunden.
KI-Spielereien im Privatbereich sind für die Betreiber nicht nur unwirtschaftlich, sondern aufgrund des hohen Energie- und Wasserverbrauchs von KI eine Gefahr für die Umwelt und den Planeten. Wie gut sich ChatGPT Images 2.0 schlagen wird, muss jedoch die Zeit zeigen. Denn Alltagstauglichkeit und wirklicher Mehrwert lassen sich nicht im Voraus simulieren. Ebenso wenig wie Schwachstellen und Fehler.
Auch interessant:








