Das Freiburger Start-up Black Forest Labs hat seinen neuen KI-Bildgenerator „FLUX.1 Kontext“ vorgestellt. Die Künstliche Intelligenz vereint Text-zu-Bild-Generierung und Bildbearbeitung in einem und ermöglicht das Bearbeiten von Bildern per Prompt.
Anfang August 2024 hat das Start-up Black Forest Labs aus Freiburg seinen KI-Bildgenerator FLUX.1 vorgestellt. Nun folgt mit der Veröffentlichung von „FLUX.1 Kontext“ eine neue Version der Software.
Die Serie generativer Flow-Matching-Modelle ist dafür gedacht, Bilder sowohl zu erstellen als auch zu bearbeiten. Die Modelle sollen laut dem Unternehmen im Gegensatz zu bestehenden Text-zu-Bild-Modellen eine kontextbezogene Bildgenerierung durchführen können. Black Forest Labs will es so ermöglichen, Eingaben sowohl via Text als auch per Bild vorzunehmen.
Was ist „FLUX.1 Kontext“?
Black Forest Labs selbst bezeichnet FLUX.1 Kontext als „bedeutende Erweiterung klassischer Text-zu-Bild-Modelle“. Denn das Modell könne sowohl die textbasierte Bildbearbeitung per Prompt als auch Text-zu-Bild-Generierung ausführen.
Als multimodales Flow Model kombiniert es modernste Zeichenübereinstimmung, Kontextverständnis und lokale Bearbeitungsfunktionen mit einer leistungsstarken Text-zu-Bild-Synthese.
Das Modell kann Charaktere im Bild erkennen und diese so in einen anderen Kontext bringen. Sind Menschen Teil des zu bearbeitenden Bildes, bleiben diese gleich, können aber anderweitig inszeniert werden. Die KI kann beispielsweise Objekte hinzufügen oder aus dem Original eliminieren.
Auch die anschließende Bearbeitung wird mit dem neuen Modell erleichtert. In einem bereits begonnen Projekt kann die KI weitere Anweisungen entgegennehmen und so das vorherige Ergebnis weiter bearbeiten. Auch spezifische Einheiten des Bildes können angepasst werden. Das restliche Bild wird dabei nicht beeinflusst.
In einem Beispiel zeigt Black Forest Labs das Bild einer jungen Frau, die in einer Moorlandschaft in die Ferne blickt. Nach Eingabe des Prompts „dreh ihren Kopf zur Kamera“ ist das Gesicht der Frau zu sehen. Mit dem Prompt „bring sie zum Lachen“ erhält das Gesicht ein Lächeln – während der Rest des Bildes nicht verändert wird.
Visuelle Konzepte sollen laut Black Forest Labs so nahtlos extrahiert und modifiziert werden können. Das KI-Start-up aus Freiburg will es ermöglichen, dass neue, kohärente Darstellungen erstellt werden können.
Modellfamilie mit drei Varianten
Black Forest Labs hat für sein neues Modell gleich drei Varianten veröffentlicht. Dazu zählen das Premium-Modell FLUX.1 Kontext [max], das Modell FLUX.1 Kontext [pro] sowie das Modell FLUX.1 Kontext [dev].
Black Forest Labs selbst bezeichnet das Modell FLUX.1 Kontext [max] als „Pionier für schnelle, iterative Bildbearbeitung“. Es soll lokale Bearbeitungen, generative kontextbezogene Modifikationen und klassische Text-zu-Bild-Generierung ermöglichen.
FLUX.1 Kontext [max] bietet laut dem Freiburger Start-up „maximale Leistung bei hoher Geschwindigkeit“. Das „experimentelle Modell“ soll die Prompt-Einhaltung und die Typografie-Generierung erheblich verbessern. Es biete außerdem „eine hohe Konsistenz bei der Bearbeitung“.
FLUX.1 Kontext [dev] ist bisher nur in der privaten Beta-Version verfügbar. De3 Open-Weight-Variante soll für Forschungszwecke und Sicherheitstests zum Einsatz kommen.
Auch interessant: