Ein Roboter arbeitet dank gpt-realtime als Voice-Assistent im Kundenservice.

gpt-realtime: Das Ende der Callcenter rückt näher

Christian Erxleben
Bild: mit KI generiert (Adobe Firefly)

Anzeige

Mit gpt-realtime hat OpenAI ein neues, fortgeschrittenes Speech-to-Speech-Modell vorgestellt. Damit lassen sich Sprach-Assistenten bauen, die selbstständig und zuverlässig Gespräche führen und protokollieren können. Es stellt sich die Frage: Was passiert mit den vielen Support-Mitarbeitern?

BREAK THE NEWS BASIC thinking

Unser exklusives Format »Break the News«, in dem wir aktuelle Nachrichten in ihre Einzelteile zerlegen, erscheint immer zuerst in UPDATE, unserem täglichen Tech-Briefing. Hier kannst du dich über 10.000 anderen Lesern anschließen und dich kostenlos anmelden:

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

Hintergrund: gpt-realtime als Support-Ersatz

  • Ende August hat OpenAI gpt-realtime und die dazugehörige Realtime API veröffentlicht. Dabei handelt es sich um ein sogenanntes Speech-to-Speech-Modell. Das heißt: Die Künstliche Intelligenz muss das Gehörte nicht erst in Text übersetzen, um dann eine Antwort in Textform zu formulieren, die dann wiederum als Audio ausgegeben wird, sondern antwortet direkt und in Echtzeit auf die Anfragen. Die KI führt also ein echtes Gespräch.
  • Zum Start von gpt-realtime sind die Kosten mit 32 US-Dollar pro eine Million Audio-Input-Tokens relativ hoch. Alex Levin, CEO beim Voice-Agent-Spezialisten Regal.io, schreibt auf LinkedIn, dass Konkurrenzprodukte derzeit noch vier Mal günstiger sind. Allerdings ist davon auszugehen, dass OpenAI die Kosten durch die Skalierung in der Masse schnell drücken kann.
  • Hinzu kommt: Immer mehr Konzerne bauen massiv Stellen in ihren Kundenservice-Abteilungen ab. Salesforce-Chef Marc Benioff hat unter anderem verkündet, dass 4.000 Stellen im Kundendienst durch KI ersetzt werden. Die Angestellten sollen – angeblich – im Vertrieb weiterbeschäftigt werden.

Einordnung: Win-Win-Situation für Firmen

Der Kundenservice gehört zu den größten Pain Points eines jeden Unternehmens. Wer als Unternehmen keinen oder einen mangelhaften Support anbietet, wird dafür heftig kritisiert – Neobroker Trade Republic ist ein Vorzeigebeispiel dafür. Wer sich dagegen die Mühe macht und ein leistungsstarkes Support-Team aufbaut, sieht sich mit sehr hohen Personalkosten konfrontiert.

Dabei ist bei einem menschlichen Support noch nicht einmal sichergestellt, dass die Kunden am Ende mit der Beratungsleistung zufrieden sind. Ein Blick in Bewertungsportale wie „Trustpilot“ genügt vollkommen. Letztendlich ist es also eine Win-Win-Situation für Firmen, wenn sie Voice-Assistenten auf Basis von gpt-realtime integrieren.

Auf der einen Seite verbessert sich die Außendarstellung: Mit KI-Assistenten lässt sich ohne Probleme eine 24-7-Erreichbarkeit bewerkstelligen – ganz ohne nervige arbeitsrechtliche Diskussionen. Auf der anderen Seite sorgen ausgereifte Voice-Agenten dafür, dass die Anzahl der Mitarbeiter im Support massiv zusammengestrichen wird. Denn wenn wir ehrlich sind wissen wir: Stellen, die eingespart werden können, werden eingespart – alle vermeintlichen Dementis im Voraus zum Trotz.

Stimmen

  • Der Telefonkonzern T-Mobile hat die neue OpenAI-Technologie nach einer sechsmonatigen Testphase eingeführt. Kirby Thorton, Senior Product Manager of AI bei T-Mobile, sagt: „Die Realtime-API von OpenAI und das neue Speech-to-Speech-Modell lassen unseren Upgrade-Assistenten natürlich wirken: Schneller Sprecherwechsel, Kunden können mitten im Satz unterbrechen und umleiten, und die Stimmen klingen menschenähnlich. Das Modell befolgt Anweisungen zuverlässig und verbindet sich dank Function Calling sicher mit unseren Preis-, Bestands- und Angebotsdaten. Es ist der erste Voice-Stack, den wir eingesetzt haben, der ein großartiges Nutzungserlebnis mit der Zuverlässigkeit kombiniert, die wir im Produktivbetrieb benötigen.“
  • Andreas Granig ist CEO beim Telefondienstleister Sipfront. Er sieht die Geschäftsmodelle vieler Voice-AI-Start-ups in Gefahr. In einem LinkedIn-Post schreibt er: „Es gibt eine ganze Reihe von Start-ups, die lediglich eine Schnittstelle zum öffentlichen Telefonnetz für bestehende Speech-to-Speech-KI-Dienste bereitstellen – oft ohne nennenswerten Burggraben und größtenteils auf Twilio und andere angewiesen. Und jetzt stehen sie unter massivem Druck.“
  • Salesforce-Mitbegründer Marc Benioff schlägt im Podcast (ab Minute 1:45) in die gleiche Kerbe. „Ich habe die Zahl der Service-Mitarbeiter von 9.000 auf 5.000 reduziert, weil ich weniger Mitarbeiter brauche. […] Wir haben jetzt einen agentenbasierten Vertrieb, der jede Person zurückruft, die uns kontaktiert.“

Ausblick

Es ist kein Geheimnis, dass der Niedriglohnsektor durch Künstliche Intelligenz stark bedroht ist. Daraus entsteht die Frage, was die Millionen von Support-Mitarbeitern rund um den Globus machen, wenn sie ihre Stellen verlieren? Eine Beschäftigung im Vertrieb, wie bei Salesforce, ist auch nur eine Zwischenlösung.

Bei gpt-realtime fehlt derzeit noch die Möglichkeit, die Ergebnisse im vollen Umfang auszuwerten. Es ist für Unternehmen also nur bedingt möglich, die getroffenen Aussagen zu bewerten, was eine Kontrolle schwierig gestaltet. Auch die höheren Kosten sind zu Beginn gerade für Start-ups und KMU eine Hürde, die dazu führt, dass der eine oder andere langjährige Service-Mitarbeiter seine Stelle noch ein paar Jahre behalten wird.

Wer die Entwicklung von KI und Sprachmodellen in den letzten Monaten und Jahren beobachtet, weiß allerdings auch: Sowohl die Kontrollmöglichkeiten als auch das finanzielle Problem werden früher oder später kein Hindernis mehr darstellen. Mit besseren KI-Modellen und einer Konsolidierung im KI-Markt werden die Preise sinken und die Leistung zu gleich besser werden. Und dann wird es für menschliche Service-Mitarbeiter wohl leider schwer.

BREAK THE NEWS BASIC thinking

Unser exklusives Format »Break the News«, in dem wir aktuelle Nachrichten in ihre Einzelteile zerlegen, erscheint immer zuerst in UPDATE, unserem täglichen Tech-Briefing. Hier kannst du dich über 10.000 anderen Lesern anschließen und dich kostenlos anmelden:

Mit deiner Anmeldung bestätigst du unsere Datenschutzerklärung

Auch interessant:

🤝 25 Euro geschenkt!

Eröffne jetzt dein kostenloses NIBC Tagesgeld und erhalte bis zu 2,75 Prozent Zinsen auf dein Geld! Und obendrauf gibt's sogar noch 25 Euro geschenkt!


Jetzt Zinsen sichern

Voraussetzungen gelten, Anzeige

STELLENANZEIGEN
Graphic Designer & Content Creator (m/w/d)
FamiCord AG in Leipzig
Senior SAP Consultant FI/CO (f/m/div.)
Bosch Gruppe in Wetzlar
SAP Project Manager (m/w/d)
Bosch Gruppe in Stuttgart
Werkstudent*in Online Marketing (w/m/div)
Sparda-Bank Berlin eG in Berlin
Key Account Manager (m/w/d) im Bereich Online...
AZ fundraising services GmbH & Co. KG in Gütersloh
Intern/Working Student (m/f/d) in Generative AI
Clarios Germany GmbH & Co. KG in Hannover
Intern (m/f/d) in Digital Marketing
Clarios Germany GmbH & Co. KG in Hannover
Senior Cyber Security Engineer (m/f/d)
Clarios Germany GmbH & Co. KG in Hannover
Teile diesen Artikel
Christian Erxleben arbeitet als freier Redakteur für BASIC thinking. Von Ende 2017 bis Ende 2021 war er Chefredakteur von BASIC thinking. Zuvor war er als Ressortleiter Social Media und Head of Social Media bei BASIC thinking tätig.