KI realistische Bilder HART

HART: Neue KI erzeugt realistische Bilder – schneller als je zuvor

Felix Baumann
Christine Daniloff, MIT.

Forscher des Massachusetts Institute of Technology (MIT) und von Chiphersteller Nvidia haben mit „HART“ ein neues KI-Modell entwickelt, das realistische Bilder schneller und effizienter als je zuvor erstellen können soll. 

Forscher des MIT und von NVIDIA haben ein neues KI-Modell namens HART (Hybrid Autoregressive Transformer) entwickelt, das realistische Bilder schneller und effizienter generieren soll als bisherige Systeme. Die KI kombiniert die Stärken zweier Ansätze: der schnellen, aber fehleranfälligen autoregressiven Modelle und der qualitativ hochwertigen, aber langsamen Diffusionsmodelle.

Das Ergebnis ist ein hybrides System, das Bilder bis zu neunmal schneller generieren können soll, als je zuvor – bei gleichbleibend hoher Qualität. Autoregressive Modelle, die auch in Sprachmodellen wie ChatGPT eingesetzt werden, erzeugen Inhalte schrittweise – also beispielsweise Bildbereiche nacheinander.

UPDATE Newsletter BASIC thinking

Du willst nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 12.000 Vordenker bekommen jeden Tag die wichtigsten News direkt in die Inbox und sichern sich ihren Vorsprung.

Nur für kurze Zeit: Anmelden und mit etwas Glück 50€ Amazon-Guthaben gewinnen!

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung. Beim Gewinnspiel gelten die AGB.

Diese Methode ist schnell, aber fehleranfällig. Denn solche Systeme können Fehler nicht wieder korrigieren. Diffusionsmodelle hingegen arbeiten iterativ und verfeinern ein Bild durch mehrere Rechenschritte. Sie liefern relativ gute Ergebnisse, sind aber deutlich langsamer und energieintensiver.

So generiert das KI-Modell HART realistische Bilder

Bei HART erstellt ein autoregressives Modell zunächst eine grobe Bildversion, die in kompakte Datenpakete – sogenannte Tokens – umgewandelt wird. Anschließend übernimmt ein kleines Diffusionsmodell die Feinarbeit, indem es nur noch Details wie Kanten, Gesichter oder Haare optimiert.

Weil sich das Diffusionsmodell ausschließlich auf diese Bereiche konzentriert, reichen ihm acht Rechenschritte – statt der 30 oder mehr, die sonst üblich sind. Ein entscheidender Vorteil von HART ist seine Effizienz. Es benötigt rund 31 Prozent weniger Rechenleistung als aktuelle High-End-Modelle, liefert aber eine vergleichbare Bildqualität.

Möglich wird das durch eine kompakte Architektur: Während andere Systeme mit Milliarden von Parametern arbeiten, kommt HART mit deutlich weniger aus – ohne Qualitätseinbußen. Dadurch lässt sich das KI-Modell sogar auf einem Smartphone betreiben.

Effiziente Leistung für reale Anwendungen

Diese Leichtgewichtigkeit macht das KI-Modell HART besonders interessant für mobile oder Energie-begrenzte Anwendungen. Es bringt die nötige Kraft mit, um realistische Bilder schnell und ressourcenschonend zu erzeugen – auch außerhalb von Rechenzentren.

Künftig könnte das Modell eine Schlüsselrolle in sogenannten multimodalen KI-Systemen spielen – also in Anwendungen, die Text, Bild und Ton gleichzeitig verarbeiten. Besonders interessant dürfte das System für die Robotik, den Gaming-Bereich oder virtuelle Assistenten sein. Denn dort müssen Inhalte in Echtzeit generiert und kombiniert werden.

Auch interessant:

🤝 Zins-Knaller bei Rediem Capital

Eröffne jetzt dein kostenloses Rediem Capital Festgeld und erhalte 2,75 Prozent Zinsen auf dein Geld – und das garantiert für 12 Monate!


Jetzt Zinsen sichern

Anzeige

STELLENANZEIGEN
Openstack Engineer (m/f/d)
CompuGroup Medical SE & Co. KGaA in Koblenz
Digital Marketing Manager (m/w/d)
Schwer Fittings GmbH in Denkingen
Organizational Integration Manager (m/f/d)
Clarios Germany GmbH & Co. KG in
Sales Manager (m/w/d) Online Marketing
Sellwerk GmbH & Co. KG in Düsseldorf, Meerbusch, Kaa...
Sales Manager B2B für Stellenanzeigen und Soc...
Recruiting Excellence GmbH in Düsseldorf
(Junior) Social Media Manager*in (m/w/d) – Be...
Digital Vision Academy in Berlin
Performance Marketing Lead (m/w/d) – Pa...
NILO HAMBURG Inh. Niclas Tretschock in Meerbusch
Trainee Online Marketing Manager (m/w/d) Schw...
Finnwaa GmbH in Jena
Teile diesen Artikel
Felix Baumann ist seit März 2022 Redakteur bei BASIC thinking. Bereits vorher schrieb er 4 Jahre für den Online-Blog Mobilegeeks, der 2022 in BASIC thinking aufging. Nebenher arbeitet Felix in einem IT-Unternehmen und beschäftigt sich daher nicht nur beim Schreiben mit zukunftsfähigen Technologien.