Wir benutzen Cookies, um die Nutzerfreundlichkeit der Website zu verbessern. Durch deinen Besuch stimmst du dem Datenschutz zu.
Alles klar!
BASIC thinking Logo Dark Mode BASIC thinking Logo Dark Mode
  • TECH
    • Apple
    • Android
    • ChatGPT
    • Künstliche Intelligenz
    • Meta
    • Microsoft
    • Quantencomputer
    • Smart Home
    • Software
  • GREEN
    • Elektromobilität
    • Energiewende
    • Erneuerbare Energie
    • Forschung
    • Klima
    • Solarenergie
    • Wasserstoff
    • Windkraft
  • SOCIAL
    • Facebook
    • Instagram
    • TikTok
    • WhatsApp
    • X (Twitter)
  • MONEY
    • Aktien
    • Arbeit
    • Die Höhle der Löwen
    • Finanzen
    • Start-ups
    • Unternehmen
    • Marketing
    • Verbraucherschutz
Newsletter
Font ResizerAa
BASIC thinkingBASIC thinking
Suche
  • TECH
  • GREEN
  • SOCIAL
  • MONEY
  • ENTERTAIN
  • NEWSLETTER
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
CriticGPT, Fehlererkennung
TECH

CriticGPT: Neues KI-Modell von OpenAI soll Fehler in ChatGPT erkennen

Felix Baumann
Aktualisiert: 03. Juli 2024
von Felix Baumann
Unsplash.com/BoliviaInteligente
Teilen

OpenAI hat mit CriticGPT kürzlich ein neues KI-Modell vorgestellt. Es soll Fehler innerhalb von ChatGPT ausfindig machen. Studien zeige, dass das Tool den Menschen in 63 Prozent der Fälle übertrifft und KI damit besser machen kann. 

Spätestens seit der Einführung von ChatGPT ist Künstliche Intelligenz für viele Menschen in den Alltag vorgedrungen. Doch das System ist nicht fehlerfrei und kann teilweise gewisse Vorurteile entwickeln. Daher stellte das hinter dem Tool stehende Unternehmen OpenAI kürzlich ein neues Modell namens CriticGPT vor. Dieses wurde speziell entwickelt, um Fehler in dem Code von ChatGPT zu erkennen.

Die Entwicklung soll den Prozess der Anpassung von KI-Systemen an menschliche Anforderungen verbessern, indem sie menschliche Prüfer unterstützt und die Genauigkeit der Ausgaben von großen Sprachmodellen (LLMs) erhöht. CriticGPT, basierend auf der GPT-4-Familie. Es analysiert Code und weist auf potenzielle Fehler hin. Das erleichtert es menschlichen Prüfern, Fehler zu erkennen, die sonst möglicherweise übersehen werden.

UPDATE Newsletter BASIC thinking

Du willst nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 Vordenker bekommen jeden Tag die wichtigsten News direkt in die Inbox und sichern sich ihren Vorsprung.

Nur für kurze Zeit: Anmelden und mit etwas Glück 100€ Amazon-Guthaben gewinnen!

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung. Beim Gewinnspiel gelten die AGB.

CriticGPT: Fehlererkennung in 63 Prozent besser als beim Menschen

In einer Forschungsarbeit mit dem Titel „LLM Critics Help Catch LLM Bugs“ zeigten die OpenAI-Forscher, dass CriticGPT in 63 Prozent der Fälle besser als menschliche Prüfer abschnitt. Das lag unter anderem daran, dass das Tool weniger unbrauchbare „Kleinigkeiten“ und weniger falsche Alarme erzeugte.

OpenAI trainierte das Modell darauf, eine Vielzahl von Codierungsfehlern zu erkennen. Dazu schulte das Team den Algorithmus mit einer Datenbank von Codebeispielen, die absichtlich eingefügte Fehlern enthielt.

Diese Methode ermöglicht es CriticGPT, sowohl eingefügte als auch natürlich vorkommende Fehler in den Ausgaben von ChatGPT zu erkennen. Doch das Tool konnte nicht nur Fehler im eigentlichen Code ausfindig machen, sondern auch in anderen Aufgaben.

In Experimenten identifizierte das Modell Fehler in 24 Prozent der ChatGPT-Trainingsdaten, die menschliche Prüfer zuvor als fehlerfrei einstuften. Diese Fehler bestätigte ein Team später, was das Potenzial von CriticGPT zur Prüfung von nicht codierten Aufgaben unterstreicht.

Effektivität bei komplexeren Eingaben bisher nicht bewiesen

Trotz der vielversprechenden Ergebnisse hat CriticGPT, wie alle KI-Modelle, seine Grenzen. Das Team bei OpenAI trainierte es auf relativ kurze Antworten von ChatGPT, was möglicherweise nicht ausreicht, um längere, komplexere Aufgaben zu bewerten. Außerdem ist auch CriticGPT nicht vollständig vor falschen Ausgaben gefeit.

OpenAI plant, CriticGPT-ähnliche Modelle in seine eigenen Prozesse zu integrieren, um den Trainern eine durch KI angetriebene Unterstützung zu bieten. Das soll ein Schritt hin zu besserern Werkzeugen zur Bewertung von Ausgaben von LLM-Systemen, die ohne zusätzliche Unterstützung schwer für Menschen zu bewerten sind, sein.

Auch interessant:

  • Europawahl 2024: ChatGPT macht den Wahl-O-Mat
  • OpenAI nutzt künftig Reddit-Inhalte, um ChatGPT zu trainieren
  • GPT-4o: Alle Informationen zur neuen ChatGPT-Version von OpenAI
  • Dr. ChatGPT: „Sag mir, was ich hören will“ – Vorsicht vor Selbstdiagnose mit KI

Du möchtest nicht abgehängt werden, wenn es um KI, Green Tech und die Tech-Themen von Morgen geht? Über 10.000 smarte Leser bekommen jeden Tag UPDATE, unser Tech-Briefing mit den wichtigsten News des Tages – und sichern sich damit ihren Vorsprung. Hier kannst du dich kostenlos anmelden.

STELLENANZEIGEN
DLP-Security Specialist (m/w/d)
CompuGroup Medical SE & Co. KGaA in Koblenz
IT-System Engineer – Endpoint and Privi...
CompuGroup Medical SE & Co. KGaA in Koblenz
Cloud Database Engineer (m/w/d)
CompuGroup Medical SE & Co. KGaA in Koblenz
Social Media Manager (m/w/d)
Regierungspräsidium Karlsruhe in Karlsruhe
Digital Marketing Operations Lead (m/w/d)
SSI SCHÄFER GMBH & CO KG in Neunkirchen, Giebelstadt...
Content Creator für Social Media (m/w/d) in Q...
D&R DENKRIESEN GmbH in Hamburg
Online Marketing Manager (all genders) &#8211...
Golf House Direktversand GmbH in Hamburg
Online Performance Marketing Experte (all gen...
DATAGROUP in deutschlandweit
THEMEN:ComputerKünstliche Intelligenz
Teile diesen Artikel
Facebook Flipboard Whatsapp Whatsapp LinkedIn Threads Bluesky Email
vonFelix Baumann
Felix Baumann ist seit März 2022 Redakteur bei BASIC thinking. Bereits vorher schrieb er 4 Jahre für den Online-Blog Mobilegeeks, der 2022 in BASIC thinking aufging. Nebenher arbeitet Felix in einem IT-Unternehmen und beschäftigt sich daher nicht nur beim Schreiben mit zukunftsfähigen Technologien.
WhatsApp Kanal BASIC thinking Tech-Deals Sidebar
EMPFEHLUNG
PŸUR Black Friday
Black Friday bei PŸUR: Highspeed-Internet zu echten Dauertiefpreisen sichern
Anzeige TECH
Samsung Galaxy S25 Ultra
Android-Special bei o2: Samsung Galaxy S25 Ultra & Tab S10 für nur 7 Euro Anzahlung
Anzeige TECH
ITSM Software aus Deutschland
ITSM Software aus Deutschland: Sicher & souverän für den Mittelstand
Anzeige TECH
Testimonial LO

»UPDATE liefert genau das, was einen perfekten Newsletter ausmacht: Kompakte, aktuelle News, spannende Insights, relevante Trends aus Technologie & Wirtschaft. Prägnant, verständlich und immer einen Schritt voraus!«

– Lisa Osada, +110.000 Follower auf Instagram

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

LESEEMPFEHLUNGEN

Hoover HF1 Plus Home
TECH

Hoover HF1 Plus Home Test: Akkustaubsauger für effiziente Reinigung (+ Gewinnspiel)

KI Stromfresser Stromverbrauch Künstliche Intelligenz Rechenzentren CO2
BREAK/THE NEWSGREEN

Nimmersatter Stromfresser: Die Chancen und Risiken von KI für die Umwelt

Solarstrom Batterien Kosten Preis
GREENTECH

Solarstrom aus Batterie ist eine der günstigsten Stromquellen

Ki Dialog Künstliche Intelligenz klug
TECH

KI-Dialoge: Warum Künstliche Intelligenz klüger wirkt, als sie ist

Ecosia AI KI nachhaltig Künstliche Intelligenz
BREAK/THE NEWSGREEN

Ecosia AI: Die nachhaltigste KI der Welt?

SUV Vollkasko Typklasse Probleme TÜV, Mängelquote, Auto, Automobil, Mobilität, Hauptuntersuchung, Kraftfahrtbundesamt
MONEYTECH

Teilkasko: Die SUV mit der niedrigsten Typklasse

Mehr anzeigen
Folge uns:
© 2003 - 2025 BASIC thinking GmbH
  • Über uns
  • Mediadaten
  • Impressum
  • Datenschutz

Samsung Galaxy S25 Ultra
+ Tab S10 für 7€ Anzahlung

Samsung Galaxy S25 Ultra

Anzeige

Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?