KI realistische Bilder HART

HART: Neue KI erzeugt realistische Bilder – schneller als je zuvor

Felix Baumann
Christine Daniloff, MIT.

Anzeige

Forscher des Massachusetts Institute of Technology (MIT) und von Chiphersteller Nvidia haben mit „HART“ ein neues KI-Modell entwickelt, das realistische Bilder schneller und effizienter als je zuvor erstellen können soll. 

Forscher des MIT und von NVIDIA haben ein neues KI-Modell namens HART (Hybrid Autoregressive Transformer) entwickelt, das realistische Bilder schneller und effizienter generieren soll als bisherige Systeme. Die KI kombiniert die Stärken zweier Ansätze: der schnellen, aber fehleranfälligen autoregressiven Modelle und der qualitativ hochwertigen, aber langsamen Diffusionsmodelle.

Das Ergebnis ist ein hybrides System, das Bilder bis zu neunmal schneller generieren können soll, als je zuvor – bei gleichbleibend hoher Qualität. Autoregressive Modelle, die auch in Sprachmodellen wie ChatGPT eingesetzt werden, erzeugen Inhalte schrittweise – also beispielsweise Bildbereiche nacheinander.

UPDATE Newsletter BASIC thinking

Du willst nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 Vordenker bekommen jeden Tag die wichtigsten News direkt in die Inbox und sichern sich ihren Vorsprung.

Nur für kurze Zeit: Anmelden und mit etwas Glück Beats-Kopfhörer gewinnen!

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung. Beim Gewinnspiel gelten die AGB.

Diese Methode ist schnell, aber fehleranfällig. Denn solche Systeme können Fehler nicht wieder korrigieren. Diffusionsmodelle hingegen arbeiten iterativ und verfeinern ein Bild durch mehrere Rechenschritte. Sie liefern relativ gute Ergebnisse, sind aber deutlich langsamer und energieintensiver.

So generiert das KI-Modell HART realistische Bilder

Bei HART erstellt ein autoregressives Modell zunächst eine grobe Bildversion, die in kompakte Datenpakete – sogenannte Tokens – umgewandelt wird. Anschließend übernimmt ein kleines Diffusionsmodell die Feinarbeit, indem es nur noch Details wie Kanten, Gesichter oder Haare optimiert.

Weil sich das Diffusionsmodell ausschließlich auf diese Bereiche konzentriert, reichen ihm acht Rechenschritte – statt der 30 oder mehr, die sonst üblich sind. Ein entscheidender Vorteil von HART ist seine Effizienz. Es benötigt rund 31 Prozent weniger Rechenleistung als aktuelle High-End-Modelle, liefert aber eine vergleichbare Bildqualität.

Möglich wird das durch eine kompakte Architektur: Während andere Systeme mit Milliarden von Parametern arbeiten, kommt HART mit deutlich weniger aus – ohne Qualitätseinbußen. Dadurch lässt sich das KI-Modell sogar auf einem Smartphone betreiben.

Effiziente Leistung für reale Anwendungen

Diese Leichtgewichtigkeit macht das KI-Modell HART besonders interessant für mobile oder Energie-begrenzte Anwendungen. Es bringt die nötige Kraft mit, um realistische Bilder schnell und ressourcenschonend zu erzeugen – auch außerhalb von Rechenzentren.

Künftig könnte das Modell eine Schlüsselrolle in sogenannten multimodalen KI-Systemen spielen – also in Anwendungen, die Text, Bild und Ton gleichzeitig verarbeiten. Besonders interessant dürfte das System für die Robotik, den Gaming-Bereich oder virtuelle Assistenten sein. Denn dort müssen Inhalte in Echtzeit generiert und kombiniert werden.

Auch interessant:

🤝 25 Euro geschenkt!

Eröffne jetzt dein kostenloses NIBC Tagesgeld und erhalte bis zu 2,75 Prozent Zinsen auf dein Geld! Und obendrauf gibt's sogar noch 25 Euro geschenkt!


Jetzt Zinsen sichern

Voraussetzungen gelten, Anzeige

STELLENANZEIGEN
Graphic Designer & Content Creator (m/w/d)
FamiCord AG in Leipzig
Senior SAP Consultant FI/CO (f/m/div.)
Bosch Gruppe in Wetzlar
Intern/Working Student (m/f/d) in Generative AI
Clarios Germany GmbH & Co. KG in Hannover
Intern (m/f/d) in Digital Marketing
Clarios Germany GmbH & Co. KG in Hannover
Senior Cyber Security Engineer (m/f/d)
Clarios Germany GmbH & Co. KG in Hannover
Digital Marketing Manager (m/w/d)
Schwer Fittings GmbH in Denkingen
Personalberater (m/w/d)
Ratbacher GmbH - Karriere bei Rat... in Stuttgart, M...
Organizational Integration Manager (m/f/d)
Clarios Germany GmbH & Co. KG in
Teile diesen Artikel
Felix Baumann ist seit März 2022 Redakteur bei BASIC thinking. Bereits vorher schrieb er 4 Jahre für den Online-Blog Mobilegeeks, der 2022 in BASIC thinking aufging. Nebenher arbeitet Felix in einem IT-Unternehmen und beschäftigt sich daher nicht nur beim Schreiben mit zukunftsfähigen Technologien.