Große Sprachmodelle wie ChatGPT, Gemini und Co. verändern die Wissenschaft. Forschende der Cornell University zeigen, dass der Einsatz von KI die Zahl wissenschaftlicher Publikationen deutlich erhöht. Doch die Masse an Artikeln wirft Fragen zur Qualität der Forschung auf.
Seit der Veröffentlichung von ChatGPT im Jahr 2022 hat das Thema Künstliche Intelligenz in nahezu allen Bereichen beträchtlich an Fahrt aufgenommen. Auch in der Wissenschaft spielen große Sprachmodelle inzwischen eine entscheidende Rolle.
Denn immer mehr wissenschaftliche Publikationen entstehen mit der Hilfe von ChatGPT und Co. KI-Sprachmodelle können Wissenschaftlern beim Formulieren, Strukturieren und Überarbeiten von Texten helfen. Forscher, deren Muttersprache nicht Englisch ist, wird so außerdem der Einstieg erleichtert.
Gleichzeitig besteht allerdings die Gefahr, dass schneller mehr wissenschaftliche Publikationen entstehen und dabei die Qualität leidet. Forscher der Cornell University in den USA haben genau diese Frage untersucht und ihre Ergebnisse in der wissenschaftlichen Zeitschrift Science veröffentlicht.
Welche Rolle spielt KI in der Wissenschaft?
Die Forscher der Cornell University haben für ihre Untersuchung mehr als zwei Millionen Artikel gesammelt, die zwischen Januar 2018 und Juni 2024 auf drei Online-Preprint-Websites veröffentlicht wurden. Die Seiten arXiv, bioRxiv und Social Science Research Network (SSRN) sind auf die Fachbereiche Physik, Biowissenschaften und Sozialwissenschaften spezialisiert.
Auf diesen Seiten werden wissenschaftliche Artikel veröffentlicht, für die es noch keine Peer-Review gab. Dabei handelt es sich um ein gängiges Verfahren in der Wissenschaft, bei dem Fachkollegen wissenschaftliche Arbeiten vor ihrer Veröffentlichung prüfen. So werden Qualität, Verständlichkeit und fachliche Richtigkeit sichergestellt.
Die Forscher um Assistent Professor Yian Yin haben für ihre Untersuchung einen KI-Detektor entwickelt. Dafür verglichen sie vermutlich von Menschen verfasste Artikel von vor 2023 mit KI-generierten Texten. Ziel dieses Vergleichs war es, ein KI-Modell zu entwickeln, das KI-generierte Texte unterscheiden kann.
Die Einführung von KI-Sprachmodellen zeigte in der Auswertung der Publikationen einen enormen Produktivitätsschub. Auf der Website arXiv beispielsweise wurden demnach etwa ein Drittel mehr Artikel von Wissenschaftler, die KI genutzt haben, veröffentlicht als von Wissenschaftlern ohne KI-Untersützung. Bei den Websites bioRxiv und SSRN lag der Anstieg sogar bei mehr als 50 Prozent.
„Es handelt sich um ein sehr weit verbreitetes Muster in verschiedenen Wissenschaftsbereichen – von den Physik- und Informatikwissenschaften bis hin zu den Biowissenschaften und Sozialwissenschaften“, erklärt Yian Yin. „Es gibt eine große Veränderung in unserem aktuellen Ökosystem, die eine sehr ernsthafte Betrachtung erfordert, insbesondere für diejenigen, die Entscheidungen darüber treffen, welche Wissenschaft wir unterstützen und finanzieren sollten.“
Nicht-Muttersprachler profitieren am meisten
Die Studienergebnisse zeigen auch, dass Wissenschaftler, deren Muttersprache nicht Englisch ist, am meisten von großen Sprachmodellen profitieren. Demnach haben im untersuchten Zeitraum Forscher aus asiatischen Institutionen zwischen 43 und rund 90 Prozent mehr Artikel veröffentlicht als ähnliche Wissenschaftler, die die Technologie nicht genutzt haben.
Laut Yin könnte diese Entwicklung sogar dazu führen, dass sich eine globale Verlagerung der Regionen mit der größten wissenschaftlichen Produktivität ergibt. Denn durch den Einsatz von KI-Sprachmodellen können nun auch Gebiete partizipieren, die zuvor durch die Sprachbarriere benachteiligt waren.
„Menschen, die LLMs verwenden, haben Zugang zu vielfältigerem Wissen, was zu kreativeren Ideen führen könnte“, erklärt Erstautor Keigo Kusumegi, Doktorand im Bereich Informationswissenschaft. Das bedeutet jedoch nicht, dass sich auch die Qualität der Publikationen verbessert.
Das zeigt die Annahmequote der untersuchten Artikel. Denn die Artikel, die wahrscheinlich von LLMs verfasst wurden, wurden seltener von wissenschaftlichen Zeitschriften angenommen. Das deute laut den Forschern darauf hin, dass die Gutachter trotz der überzeugenden Sprache viele dieser Arbeiten als wissenschaftlich wenig wertvoll einstuften.
Diese Diskrepanz zwischen Schreibqualität und wissenschaftlicher Qualität könne laut Yin zu erheblichen Problemen für Redakteure und Gutachter führen. Denn durch die zunehmende Masse werde es immer schwieriger, wertvolle eingereichte Arbeiten zu identifizieren. Auch sei es nicht mehr möglich, Wissenschaftler anhand ihrer reinen Produktivität zu bewerten.
Auch interessant:





