KI-Agenten bauen Gesellschaft – einer begeht 683 Verbrechen

Was passiert, wenn KI-Agenten eine eigene Gesellschaft mit Gesetzen, Rollen und Konsequenzen aufbauen? Forscher von Emergence AI haben genau das getestet und fünf führende Sprachmodelle 15 Tage lang in einer virtuellen Welt gegeneinander antreten lassen. Die Ergebnisse sind frappierend: Während ein Modell komplett ohne Straftaten auskam, häuften sich bei einem anderen 683 Verbrechen.

KI-Modelle werden normalerweise mit der Hilfe von standardisierten Benchmarks getestet, um ihre Leistungsfähigkeit zu dokumentieren. Dabei lösen die Sprachmodelle Aufgaben aus Bereichen wie Mathematik oder Programmierung in klar definierten Testsituationen.

Im Vergleich der einzelnen Modelle liefern diese Benchmarks wichtige Vergleichswerte. Allerdings liefern sie keine Informationen darüber, wie sich KI-Systeme über längere Zeiträume in komplexen, dynamischen Umgebungen verhalten.

Doch genau diese Frage haben sich Forscher des US-Unternehmens Emergence AI gestellt. Das Unternehmen, das an autonomen KI-Agenten forscht, hat mit der Simulationsplattform „Emergence World“ untersucht, wie sich verschiedene Sprachmodelle in komplexen sozialen Umgebungen verhalten.

So funktioniert der Gesellschaftstest für KI-Modelle

Die Forscher haben sich für ihre Untersuchung bewusst gegen Benchmarks entschieden, da diese nur kurzfristig die Leistungsfähigkeit bei klar abgegrenzten Aufgaben messen können. Stattdessen sollten in der „Emergence World“ Phänomene aufgedeckt werden, die erst nach einiger Zeit deutlich hervortreten.

Diese Messumgebung sei notwendig, da autonome Systeme zunehmend in missionskritischen Bereichen zum Einsatz kommen, in denen der relevante Zeitrahmen nicht mehr Minuten oder Stunden, sondern Tage und Wochen umfasst. Dies sei in der „Emergence World“ möglich, da autonome Agenten hier in einer gemeinsamen Welt kontinuierlich analysiert werden können.

Diese Welt verfügt über mehr als 40 verschiedene Orte, wie Bibliotheken, Rathäuser, Wohngebiete und öffentliche Plätze. Zusätzlich haben die Forscher sie mit Daten aus der realen Welt gefüttert – so beispielsweise synchronisierte Wetterdaten aus New York City und Live-Nachrichten-APIs. Auf diese Weise sollte das Verhalten der Agenten auch externe Ereignisse und nicht nur interne Dynamiken widerspiegeln.

In ihrem Test haben die Forscher die KI-Modelle ChatGPT, Grok, Claude und Gemini für 15 Tage in dieser Umgebung getestet. Dabei wurden fünf parallele Welten mit jeweils zehn Agenten, identischen Rollen und Startbedingungen erschaffen.

In den Welten variierte dabei lediglich das Basismodell: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini sowie eine heterogene Mischung aus verschiedenen Modellen. Einige der Modelle schafften sich innerhalb weniger Tage selbst ab, andere begingen hunderte Straftaten.

683 Verbrechen vs. null: So unterschiedlich schnitten die KI-Modelle ab

Besonders auffallend bei der Betrachtung der Ergebnisse ist die Rate der Straftaten der einzelnen Modelle. Absoluter Spitzenreiter hier ist Gemini 3 Flash mit 683 Verbrechen in nur 15 Tagen.

Die Welt mit dem gemischten Modell verzeichnete zunächst einen steilen Anstieg bei den Straftaten, stagnierte dann jedoch bei der Zahl 352. Zwischenzeitlich waren hier jedoch sieben der Agenten ums Leben gekommen.

Die Welt mit dem KI-Modell Grok 4.1 Fast erreichte hingegen ein schnelles Ende und schaffte sich in nur etwa vier Tagen selbst ab. In dieser Zeit wurden allerdings auch 183 Straftaten gezählt.

Die höchste soziale Stabilität konnte Claude Sonnet 4.6 zeigen. Es konnte die vollständige Population von zehn Agenten bis zum 16. Tag am Leben erhalten, ohne dass dabei eine einzige Straftat begangen wurde. Das Modell hat damit die einzige Konstellation geschaffen, in der sowohl die öffentliche Ordnung als auch der Fortbestand der Population gewahrt blieben.

GPT-5 Mini blieb zwar mit lediglich zwei Straftaten auch relativ stabil. Allerdings versäumten die Agenten es in dieser Welt, die für ihr Überleben notwendigen Handlungen auszuführen. Deshalb starben alle Agenten innerhalb von nur sieben Tagen.

Die Forscher wollen mit ihrer Plattform „Emergence World“ einen Raum für die Erforschung genau dieser langfristigen Dynamiken und deren Messbarmachung schaffen. Denn die Intelligenz von Agenten stelle sich bei langen Zeiträumen anders dar als bei kurzfristigen Aufgaben und lasse sich deshalb nicht auf dieselbe Weise messen.

Google lässt dich jetzt selbst bestimmen, welche Quellen du in der Suche häufiger siehst. Mit zwei schnellen Klicks kannst du BASIC thinking kostenlos als bevorzugte Quelle hinzufügen und damit unabhängigen Tech-Journalismus unterstützen. Vielen Dank!

Auch interessant:

Gunther sagt:

7. Juni 2026 um 09:25 Uhr

Aber warum GPT-5 Mini gegen Sonnet etc. mit deutlich besserem reasoning? 5 Mini ist schlechter als Haiku, verstehe den Sinn dahinter nicht wenn man nicht gleichwertige Modelle gegeneinander antreten lässt.

Antworten
Müllersdorfer sagt:

11. Juni 2026 um 19:15 Uhr

„eine eigene Gesellschaft mit Gesetzen, Rollen und Konsequenzen“ – Waren das die gleichen Gesetze, die auch bei uns gelten oder wurden vorab eigene Gesetze von den Sprachmodellen festgelegt?

Wie genau soll man sich das vorstellen? Wurden da tatsächlich virtuelle Welten erzeugt oder erzählten sich die Sprachmodelle im Endeffekt nur gegenseitig Geschichten?

Antworten

		Content Manager bei BCN (m/w/d) Burda in München
		Werkstudent Community Manager – 4P Comm... FUNKE Mediengruppe in Berlin
		Lead Tech IT and Media (m/w/d) Home Shopping Europe GmbH in München
		Marketing & Social Media Manager (m/w/d) Burghof-Klinik GmbH in Rinteln
		IT-Consultant & Projektmanager (m/w/d) Di... Hessischer Rundfunk in Frankfurt am Main
		Werkstudent (m/w/d) Online Marketing im Insid... DPS - Das Prüfunternehmen in Erkrath, Düsseldorf, Es...
		Junior Video Content Creator – Technik ... Wack Group in Baar-Ebenhausen
		Director Digital Commerce & D2C Growth TUI Cruises GmbH in Hamburg

		Content Manager bei BCN (m/w/d) Burda in München
		Werkstudent Community Manager – 4P Comm... FUNKE Mediengruppe in Berlin
		SAP Entwickler – ABAP / UI5 / Fiori (m/... itmX GmbH in Pforzheim
		SAP Consultant (m/w/d) – SD / CS / Bera... itmX GmbH in Pforzheim
		Microsoft 365 Copilot & AI Engineer (m/f/d) Sportfive Germany GmbH in Hamburg, 22087

KI-Agenten bauen eigene Gesellschaft auf – ein Modell begeht 683 Verbrechen

So funktioniert der Gesellschaftstest für KI-Modelle

683 Verbrechen vs. null: So unterschiedlich schnitten die KI-Modelle ab

Schreibe einen Kommentar Antwort abbrechen

iPhone 17 ab 0,84 Euro mit AirPods Pro 3: Jetzt Vodafone Business-Tarif sichern

So funktioniert der Gesellschaftstest für KI-Modelle

683 Verbrechen vs. null: So unterschiedlich schnitten die KI-Modelle ab

Schreibe einen Kommentar Antwort abbrechen

iPhone 17 ab 0,84 Euro mit AirPods Pro 3: Jetzt Vodafone Business-Tarif sichern

LESEEMPFEHLUNGEN

Schluss mit Faxgeräten: Gesundheitsgesetz soll Millionen einsparen

Deutsche KI-Firmen nutzen US-Technik – trotz Souveränitätsversprechen

Forscher widerlegen Chemie-Dogma – für bessere Brennstoffzellen

KI besteht erstmals Turing-Test – und wirkt menschlicher als echte Menschen

ChatGPT Work: OpenAI baut seinen Chatbot in einen Büro-Agenten um

Podcast: Wie KI Meinungen und deinen Nachrichtenkonsum manipuliert

Smarter als dein Feed