Mit gpt-realtime hat OpenAI ein neues, fortgeschrittenes Speech-to-Speech-Modell vorgestellt. Damit lassen sich Sprach-Assistenten bauen, die selbstständig und zuverlässig Gespräche führen und protokollieren können. Es stellt sich die Frage: Was passiert mit den vielen Support-Mitarbeitern?
Hintergrund: gpt-realtime als Support-Ersatz
- Ende August hat OpenAI gpt-realtime und die dazugehörige Realtime API veröffentlicht. Dabei handelt es sich um ein sogenanntes Speech-to-Speech-Modell. Das heißt: Die Künstliche Intelligenz muss das Gehörte nicht erst in Text übersetzen, um dann eine Antwort in Textform zu formulieren, die dann wiederum als Audio ausgegeben wird, sondern antwortet direkt und in Echtzeit auf die Anfragen. Die KI führt also ein echtes Gespräch.
- Zum Start von gpt-realtime sind die Kosten mit 32 US-Dollar pro eine Million Audio-Input-Tokens relativ hoch. Alex Levin, CEO beim Voice-Agent-Spezialisten Regal.io, schreibt auf LinkedIn, dass Konkurrenzprodukte derzeit noch vier Mal günstiger sind. Allerdings ist davon auszugehen, dass OpenAI die Kosten durch die Skalierung in der Masse schnell drücken kann.
- Hinzu kommt: Immer mehr Konzerne bauen massiv Stellen in ihren Kundenservice-Abteilungen ab. Salesforce-Chef Marc Benioff hat unter anderem verkündet, dass 4.000 Stellen im Kundendienst durch KI ersetzt werden. Die Angestellten sollen – angeblich – im Vertrieb weiterbeschäftigt werden.
Einordnung: Win-Win-Situation für Firmen
Der Kundenservice gehört zu den größten Pain Points eines jeden Unternehmens. Wer als Unternehmen keinen oder einen mangelhaften Support anbietet, wird dafür heftig kritisiert – Neobroker Trade Republic ist ein Vorzeigebeispiel dafür. Wer sich dagegen die Mühe macht und ein leistungsstarkes Support-Team aufbaut, sieht sich mit sehr hohen Personalkosten konfrontiert.
Dabei ist bei einem menschlichen Support noch nicht einmal sichergestellt, dass die Kunden am Ende mit der Beratungsleistung zufrieden sind. Ein Blick in Bewertungsportale wie „Trustpilot“ genügt vollkommen. Letztendlich ist es also eine Win-Win-Situation für Firmen, wenn sie Voice-Assistenten auf Basis von gpt-realtime integrieren.
Auf der einen Seite verbessert sich die Außendarstellung: Mit KI-Assistenten lässt sich ohne Probleme eine 24-7-Erreichbarkeit bewerkstelligen – ganz ohne nervige arbeitsrechtliche Diskussionen. Auf der anderen Seite sorgen ausgereifte Voice-Agenten dafür, dass die Anzahl der Mitarbeiter im Support massiv zusammengestrichen wird. Denn wenn wir ehrlich sind wissen wir: Stellen, die eingespart werden können, werden eingespart – alle vermeintlichen Dementis im Voraus zum Trotz.
Stimmen
- Der Telefonkonzern T-Mobile hat die neue OpenAI-Technologie nach einer sechsmonatigen Testphase eingeführt. Kirby Thorton, Senior Product Manager of AI bei T-Mobile, sagt: „Die Realtime-API von OpenAI und das neue Speech-to-Speech-Modell lassen unseren Upgrade-Assistenten natürlich wirken: Schneller Sprecherwechsel, Kunden können mitten im Satz unterbrechen und umleiten, und die Stimmen klingen menschenähnlich. Das Modell befolgt Anweisungen zuverlässig und verbindet sich dank Function Calling sicher mit unseren Preis-, Bestands- und Angebotsdaten. Es ist der erste Voice-Stack, den wir eingesetzt haben, der ein großartiges Nutzungserlebnis mit der Zuverlässigkeit kombiniert, die wir im Produktivbetrieb benötigen.“
- Andreas Granig ist CEO beim Telefondienstleister Sipfront. Er sieht die Geschäftsmodelle vieler Voice-AI-Start-ups in Gefahr. In einem LinkedIn-Post schreibt er: „Es gibt eine ganze Reihe von Start-ups, die lediglich eine Schnittstelle zum öffentlichen Telefonnetz für bestehende Speech-to-Speech-KI-Dienste bereitstellen – oft ohne nennenswerten Burggraben und größtenteils auf Twilio und andere angewiesen. Und jetzt stehen sie unter massivem Druck.“
- Salesforce-Mitbegründer Marc Benioff schlägt im Podcast (ab Minute 1:45) in die gleiche Kerbe. „Ich habe die Zahl der Service-Mitarbeiter von 9.000 auf 5.000 reduziert, weil ich weniger Mitarbeiter brauche. […] Wir haben jetzt einen agentenbasierten Vertrieb, der jede Person zurückruft, die uns kontaktiert.“
Ausblick
Es ist kein Geheimnis, dass der Niedriglohnsektor durch Künstliche Intelligenz stark bedroht ist. Daraus entsteht die Frage, was die Millionen von Support-Mitarbeitern rund um den Globus machen, wenn sie ihre Stellen verlieren? Eine Beschäftigung im Vertrieb, wie bei Salesforce, ist auch nur eine Zwischenlösung.
Bei gpt-realtime fehlt derzeit noch die Möglichkeit, die Ergebnisse im vollen Umfang auszuwerten. Es ist für Unternehmen also nur bedingt möglich, die getroffenen Aussagen zu bewerten, was eine Kontrolle schwierig gestaltet. Auch die höheren Kosten sind zu Beginn gerade für Start-ups und KMU eine Hürde, die dazu führt, dass der eine oder andere langjährige Service-Mitarbeiter seine Stelle noch ein paar Jahre behalten wird.
Wer die Entwicklung von KI und Sprachmodellen in den letzten Monaten und Jahren beobachtet, weiß allerdings auch: Sowohl die Kontrollmöglichkeiten als auch das finanzielle Problem werden früher oder später kein Hindernis mehr darstellen. Mit besseren KI-Modellen und einer Konsolidierung im KI-Markt werden die Preise sinken und die Leistung zu gleich besser werden. Und dann wird es für menschliche Service-Mitarbeiter wohl leider schwer.
Auch interessant:
- Warum du keine Bilder von dir bei ChatGPT hochladen solltest
- Ausbleibende Dividenden und schlechter Kundenservice: Trade Republic hat nichts gelernt
- Aufgaben, Fähigkeiten, Alltag: Was macht ein Director for Customer Support?
- Schlechter Kundenservice: Das kannst du bei Problemen tun – und das sind deine Rechte