Killt KI den Radiostar?

Von Sophia Olesko

Es ist sieben Uhr morgens und du öffnest die Radio-App auf deinem Handy. Zeit für die Nachrichten und das Wetter. Das Moderator*innen-Team steht noch nicht im Studio, aber das fällt nicht auf. Durch Technologien, die von KI-Gebrauch machen, wird ein automatisch erstelltes Skript von einer synthetisierten Stimme vorgelesen. Sie klingt täuschend echt: „Das war das Wetter und ich bin Sanja, deine KI-Moderatorin!“

Copyright: Melina Nassioudis

KI regt auf und regt an

Nicht nur Privatpersonen nutzen die Automatisierungsmöglichkeiten, die eine KI bietet. Zum Beispiel beim Verfassen eines Textes durch ChatGPT oder zur Generierung eines KI-Bildes, wie das vom Papst in der Balenciaga-Jacke. Künstliche Intelligenz, auf Englisch Artificial Intelligence (AI), wird in verschiedenen Bran­chen genutzt. Etwa in der Musikbranche, wobei hier kürzlich die Veröffentlichung des KI-generierten Songs Heart on My Sleeve für Aufregung sorgte. Mittels ei­ner KI-Anwendung wurde hierbei von einer anonymen Person ein Song produ­ziert, der klang, als wäre er von den ka­nadischen Stars Drake und The Weeknd eingesungen worden. Mittels der soge­nannten Sprachsynthese wurde eine KI durch Audiomaterial der Artists trainiert und konnte so ihre Stimmen nachahmen. Dieses Beispiel zeigt auf, welches Poten­tial hinter den KI-Technologien steckt.

Auch für die Radiobranche sind diese Entwicklungen von großer Bedeutung. „Jede Woche habe ich das Gefühl, ich kriege irgendeine Meldung oder neue Website, die noch bessere Tools zur Ver­fügung stellen“, erzählt Michael Fischeneder, der sich mit Künstlicher Intelligenz auseinander­setzt und sich selbst als technikgetrie­ben beschreibt. Mit Tools meint er zum Beispiel eine Audio-zu-Text Anwendung, wie mygoodtape.com, die eine Audioda­tei zu Geschriebenem umwandelt. Oder auphonic.com, eine Webservice der die Hintergrundgeräusche von Interviews durch KI-Technologie entfernt.

KI zum eigenen Vorteil nutzen

Early Adopters, wie der Programm­chef der Antenne Steiermark, arbeiten daran, KI-Anwendungen in Arbeitsab­läufen zu integrieren und ihre Teams auf den neuesten Stand der Technik zu bringen. Generell sei die Radiobranche experimentierfreudig, erklärt Fischene­der. Durch KI kann die Playlist für den Webstream besser automatisiert wer­den, in der Audio-Aufbereitung werden O-Töne von Hintergrundgeräuschen befreit oder Songs für Jingles von der Leadstimme. Diese kann die KI einfach „rausrechnen“. „Es geht darum, dass die Tools, die uns in die Hand gegeben werden, uns das Leben vereinfachen können, damit wir dann in weiterer Folge unsere Stärken noch besser ausspielen. Denn der Mensch ist kreativ, aber wenn ich am Tag zehnmal das Gleiche mache, dann sage ich mittlerweile ‚Muss das sein, oder könnten wir das irgendwie automatisieren? Damit man dann mehr Zeit hat in weiterer Folge, um kreativ zu sein.“

Webseiten, die KI-Anwendungen anbie­ten, sprießen derzeit in die Höhe wie Un­kraut. Das Internet ist eine wahre Fund­grube für alle, die die Möglichkeiten der KI-Automatisierungen erproben möchten. Einen Überblick zu behalten, ist dabei aber derzeit schwer möglich. Jedoch bringt eine einfache Suchmaschinen- Eingabe vieles ans Licht. Mit Suchbegriffen, wie „Beste KI für Transkription“ oder „AI tools for business“ erscheinen sei­tenweise Listen mit bereits einsetzbarer Software. Diese variieren aber stark in der Quali­tät, sodass man wohl oder übel im Moment darauf angewiesen ist, sich durchzuprobieren. Die angebotenen Services sind da­bei anfangs gratis, kosten aber bei regelmäßiger Anwendung gar nicht so wenig. Sie stellen für viele IT-Unternehmen eine neue Einkommensquelle dar.

Schlechte Nachricht für  Moderator*innen?

Wie sieht es aber aus, wenn man die Services von Futuri Media´s RadioGPT in Anspruch nimmt? Die AI-Technologie des IT-Un­ternehmens kann beliebte The­men erkennen, daraus ein Skript schreiben und dieses mit täu­schend menschlich klingenden Stimmen vorlesen. „Es handelt sich um ein End-to-End-System. Das ganze System ist so kon­zipiert, dass es das alles für Sie erledigt“, sagt Zena Burns, die bei Futuri für „Content und Special Projects“ zuständig ist. RadioGPT hat vier Komponen­ten: Echo, TopicPulse, die GPT- 4-Technologie sowie das Text-zu-Sprache Element. Das pa­tentierte System namens Echo ist in der Lage zu erkennen, was auf dem Radiosender passiert, was gerade gespielt wurde und was demnächst folgt. Es ist das Bindeglied, das den anderen Komponenten mitteilt, was tat­sächlich auf Sendung ist.

TopicPulse ist eine KI-Techno­logie, die Facebook, Twitter, Instagram und über 250.000 andere Nachrichten- und Infor­mationsquellen im Internet und in den sozialen Medien scannt. So werden Geschichten aus­findig gemacht, die für die Ziel­gruppe relevant sind. Hier gibt es auch eine prädiktive Kompo­nente, die Erkenntnisse darüber liefert, welche Themen dem­nächst viral gehen werden. Die­ses System ist seit etwa zehn Jahren verfügbar und wird stän­dig weiterentwickelt, tausende von Content-Produzent*innen nutzen es bereits.

TopicPulse hat ein Team von menschlichen Moderatoren, die die Daten überprüfen, und ist die einzige Komponente von RadioGPT, an der Menschen beteiligt sind. Die GPT-4-Tech­nologie von OpenAI als dritte Komponente, kann verschiede­ne Dinge tun. Sie ist vielen als die Methode hinter ChatGPT bekannt. Die Technologie er­stellt zum Beispiel ein Skript auf der Grundlage von TopicPul­se. Dieses wird dann durch die letzte Komponente vorgelesen, dem KI-Stimmensystem. Diese Stimmen können dabei mit ver­schiedenen Eigenschaften er­schaffen werden, zum Beispiel mit einem gewissen Sarkasmus. Mit den Technologien von Futuri ist es Radiostationen so mög­lich, digitale Persönlichkeiten zu erschaffen.

Wir brauchen mehr Kreativität denn je

Sieht so aus, als könn­ten die Morningshow- Moderator*innen nun bald alle jeden Tag ausschlafen. Dass sie ganz ersetzt werden sollten, denkt Burns aber nicht. „Wir sind der festen Überzeugung, dass die beste Art, RadioGPT zu nutzen, darin besteht, lokale Talente zu umge­ben“, verrät die Senior-Vice-Präsidentin. In vielen Ländern gäbe es nur sehr wenige Radiosender, die rund um die Uhr Live-Inhalte ausstrahlen und nur tagsüber Beiträge von Menschen senden, die sich tatsächlich in den Städten befinden, aus denen sie senden. Deswegen würde Radio Sendezeiten an die Streaming-Dienste abtreten, weil es nichts Frisches und Ansprechendes gebe, erklärt Burns. Generell geht der Trend bei Audio-Angeboten Richtung Streaming und On-Demand-Services. Radio verliert seit Jahren Rezipient*innen und ist gefordert, sich anzupassen. Da ist es keine Über­raschung, dass Radiostationen aus mehreren Dutzend Ländern rund um die Welt am Angebot von RadioGPT interessiert sind. Wie sehr die der­zeitigen technischen Innovationen dazu beitra­gen können, wettbewerbsfähig zu bleiben, ist ein Thema, das den Mediensektor stark beschäftigt. „Denn es gibt Dinge, die eine künstliche Intelligenz nicht leisten kann, oder?“, gibt Burns zu bedenken. „Künstliche Intelligenz kann keine Spendensamm­lungen veranstalten oder mit Werbetreibenden zusammenarbeiten, um eine Werbekampagne zu entwickeln“. Im Prinzip kommt auch das End-to-End-System von Futuri nicht ohne Menschen und deren Kreativität aus. Denn das Konzept einer Radioshow, und die Personality der KI-Stimme, ist nach wie vor eine Entscheidung, die von Men­schen getroffen werden muss.

Auch Fischeneder sieht derzeit nicht die Mög­lichkeit, ein Radio ohne Menschen zu betreiben. „Wir sehen uns als Entertainment-Factory, wenn ich an meinen Kollegen in der Früh denke“, er­zählt er. Dieser schreibt Lieder über steirische Gemeinden und spielt sie selber ein, dabei nützt er Informationen, die die Hörer*innen dem Ra­diosender zukommen lassen. Das könne eine KI zwar auch, räumt Fischeneder ein, bei der Hörerschaft würde man damit aber mal nicht ge­winnen. Bezüglich des Einsatzes von Sprachsyn­these relativiert der Programmchef, dass es das sicher mal geben werde, dass er einige Stunden Sprach-Audiomaterial in ein Modul reinladen wür­de, um einen Moderator simulieren zu können. „Trotzdem wird mir der Morningshow-Moderator hin und wieder Antworten geben, mit denen ich jetzt vielleicht nicht rechne“, erklärt Fischene­der. Man müsse nichtsdestotrotz dranbleiben. Sein Fazit: „Nutze die Technik, um dein Pro­dukt zu verbessern und nicht, um dich wegzurationalisieren.“

Künstlich, aber nicht fake

Wenn aber eine Technologie eingesetzt wird, um Themen auszumachen, die im World Wide Web kursieren und daraus ein Skript zu schreiben, kur­sieren dann nicht sofort Falschnachrichten im Sy­stem? TopicPulse von Futuri wird seit zehn Jahren von Menschen „trainiert“, erklärt Burns. Künstliche Intelligenz sei nur so gut wie die Informationen, mit denen sie gefüttert wird. Ein Verifizierungs­system, das präventive Filter beinhalte, würde das Auftreten von spekulativen oder ungenauen Inhalten, die manchmal als Halluzinationen be­zeichnet werden, überprüfen und reduzieren. „Wir haben eine Reihe von Schutzmaßnahmen und Fil­tern eingerichtet, um sicherzustellen, dass solche Dinge oder anstößige Inhalte nicht durch das Sy­stem gelangen“, erklärt die Senior-Vice-Präsiden­tin. Wie das klingt, kann jeder selbst nachhören.

RadioGPT bietet eine Livestream-Demoversion an, wo man hören kann, wie die Stimmen, die die Firma zur Verfügung stellt, klingen und welche In­formationen das System anbietet. Neben Songs aus den 80s und 90s (Overkill von Men At Work hat es gleich in meine Playlist geschafft) sind im Demo-Stream KI-Stimmen zu hören, die in fast jeder Moderationsstrecke erwähnen, dass sie künstlich erschaffene Personen sind. Nach dem Grund dafür gefragt antwortet Burns darauf: „Wir denken, wenn eine Künstliche Intelligenz einge­setzt wird, um einer ganzen Sendung eine Stim­me zu geben, sollte das wahrscheinlich offenge­legt werden. Es gibt eine Reihe von Möglichkeiten, wie man KI-Stimmen im Rundfunk nutzen kann, die nicht unbedingt eine Offenlegung erfordern.“ Dafür nennt sie als Beispiel einen Moderator, der in 50 verschiedenen Märkten auftritt. Das Ra­diosystem von Futuri könne die Stimme dieser Persönlichkeit das Wetter in Echtzeit in all diesen 50 lokalen Märkten vorlesen lassen. So, dass es sich sehr live und lokal anfühle. Wie so oft hat hier Amerika einen gewaltigen Vorsprung in der Tech­nologie. Ob diese technischen Innovationen auch bald in unseren Breitengraden angewendet wer­den, wird die Zeit weisen.

Sophia Olesko | Copyright: Nikolas Rode