Klangvolle Maschine: Wie KI die Podcast-Welt umkrempelt und auf das nächste Level hebt

Der kontinuierliche Fortschritt der künstlichen Intelligenz krempelt auch die Podcast-Welt um. Die KI hebt die Branche auf das nächste Level und verleiht jedem einzelnen Schritt in der Podcast-Produktion eine neue Dimension.
Willkommen in der Ära der klangvollen Maschinen.

Gil Sprangler & Theresa Walzer

Prompted by Theresa Walzer an KI-Tool Lexica am 03.12.2023 um 18:20 Uhr:
“Artificial Intelligence and podcasts”

Im November 2022 veröffentlichte das US-Unternehmen OpenAI die künstliche Intelligenz ChatGPT. Es erkennt, versteht und erfasst komplexe Zusammenhänge in natürlicher Sprache. Als wegweisender Schritt in Richtung starker künstlicher Intelligenz gilt ChatGPT als Sprachmodell der neuesten Generation basierend auf dem Transformer-Modell. Es baut auf den früheren Modellen GPT, GPT-2 und GPT-3 auf, wurde mit umfangreichen Textdaten trainiert und zielt darauf ab, den Anforderungen der Nutzer:innen ethisch korrekt und inhaltlich präzise gerecht zu werden. Eine Erweiterung des Transformer-Modells um das Reinforcement Learning kennzeichnet diese Entwicklung.1

In Anlehnung an Katzenberger, Keil und Wild aus dem Jahr 2022 hat die Podcast-Branche hat eine bemerkenswerte Entwicklung erlebt. Einst eine Nische, sind Podcasts als Audio on Demand zum Mainstream avanciert und fester Bestandteil der Mediennutzung vieler. Jeder kann nun dank minimaler technischer Hürden problemlos eigene Shows erstellen und teilen. Die Grundlagen wurden bis ins Jahr 2000 gelegt, gefolgt von Hardware- und Software-Entwicklungen (2002-2004). Zwischen 2004 und 2014 etablierten sich Podcasts als Massenmedium, gefolgt von erneuter Beliebtheit ab 2014. Die Nutzer:innenzahlen erlebten einen weiteren Anstieg während der Corona-Pandemie 2020.2

Prompted by Theresa Walzer an KI-Tool Lexica am 03.12.2023 um 19:35 Uhr: “Podcast Microphone”

KI in der Podcast-Produktion

KI transformiert die Podcast-Branche in allen Produktionsphasen. Es existieren bereits Podcasts aus gänzlich künstlich generierten Stimmen . Das deutsche Medienunternehmen Schønlein Media arbeitet in seinem Podcast Wissen Daily bereits mit solch einer Stimme von ElevenLabs.

Text-to-Speech-Systeme (TTS) automatisieren das aufwendige Einsprechen von Texten durch den Einsatz synthetischer Stimmen. Aufgrund von Deep Learning werden Schriftstücke künstlich generiert, die von der Sprache eines Menschen nur mehr schwer zu unterscheiden sind. KI wird auch dafür genutzt, um die Klangqualität der Podcasts zu optimieren, unerwünschte Hintergrundgeräusche sowie den Zeitaufwand in der Post-Produktion beim Schneiden zu reduzieren. KI-Algorithmen werden in weiterer Folge zudem für die Ex-Post Medienforschung eingesetzt, um Hörpräferenzen zu analysieren und anschließend Podcast-Empfehlungen abzugeben. KI kann in der Podcast-Produktion vielfältig bei Tätigkeiten wie transkribieren, Untertitel erstellen, schneiden, Jingles kreieren und bei der Erstellung des Covers eingesetzt werden. Hilfreiche Tools dafür sind unter anderem: Midjourney, ElevenLabs, Autopod, und Riverside.fm.


Die wirtschaftliche und soziale Komponente von KI im Podcasting

Die KI treibt einen Wandel im Podcast-Markt voran, wobei positive und negative Auswirkungen zu beobachten sind. Traditionelle Medien wie das Radio setzen die Dynamik und Modernität der KI aktiv ein. Obwohl KI-Tools die Produktion effizienter machen, ist eine genaue Überprüfung der Informationen für journalistische Integrität unerlässlich. Synthetische Stimmen ermöglichen zwar schnellere Produktion, aber es fehlt an emotionaler Tiefe, was das menschliche Engagement verringern kann. Die Anwendung von KI in deutscher Sprache zeigt Defizite im Audioschnitt und bei Quellenangaben, erfordert Schulungen. Die Integration von KI im Podcasting nutzt den Skaleneffekt, reduziert Kosten pro Episode und verbessert die Effizienz von Unternehmen. Die Automatisierung steigert den Output, rationalisiert Abläufe, senkt Fixkosten pro Einheit und trägt zur Rentabilitätssteigerung bei.3

 Ethische Verantwortung und die Zukunft des KI-Podcastings Die Entwicklung der KI basiert auf Trainingsdaten, Uploads und Algorithmen, jedoch fehlen oft ethische oder moralische Grundprinzipien bei Entscheidungen. Automatisierte Systeme neigen dazu, Minderheitsgruppen zu diskriminieren, während Gesichtserkennung in autoritären Regimen für Überwachung und Repression eingesetzt werden. Daher sind eine verantwortungsbewusste Regulierung und Überwachung von KI unerlässlich, um ethische Standards zu wahren. Transparenz hinsichtlich positiver und negativer Aspekte spielt dabei eine zentrale Rolle. Wie sich KI-Podcasting zukünftig entwickeln wird, wurde ChatGPT 3.5 am 14.12.2023 um 15:38 Uhr mit dem Prompt: Was kann man sich von KI-Podcasting in Zukunft erwarten? Bitte schreibe mir einen vollständigen Text in 100 Wörtern, ohne Aufzählungszeichen.“ 4, befragt.

In der Zukunft des KI-Podcastings erwartet man eine tiefgreifende Veränderung. KI optimiert nicht nur die Produktion durch automatisierte Bearbeitung und Transkription, sondern bietet auch maßgeschneiderte Inhalte. Fortschrittliche Algorithmen analysieren Hörerpräferenzen für individuelle Empfehlungen. Natürliche Sprachverarbeitung ermöglicht interaktive Podcasts mit KI-gesteuerten Assistenten. Automatisierte Skripterstellung und menschenähnliche Stimmen steigern die Produktivität. KI verbessert auch die Inhaltqualität durch Faktenprüfung und unterstützt hochwertige Recherche. Die anhaltende KI-Entwicklung führt das Podcasting in personalisierte, interaktive und effiziente Zeiten, um Hörerlebnisse zu optimieren.

Prompted by Theresa Walzer an KI-Tool Lexica am 03.12.2023 um 19:40 Uhr:
 “AI produces podcasts in the future”

Die KI verändert die Podcast-Branche von Transkription bis hin zur personalisierten Empfehlung und optimierter Produktion. Besonders die Effizienz und der Medienproduktion wird vorangetrieben. Diese technologischen Fortschritte ermöglichen eine enorme Interaktivität und Anpassungsfähigkeit, die die das Hören verbessern kann. Die Zukunft des Podcastings verspricht eine Fusion von menschlicher Kreativität und maschineller, intelligenter Unterstützung.  

Prompt-Verzeichnis Text:

1 Text gekürzt mit KI-Tool ChatGPT 3.5 am 09.12.2023 um 09:47 Uhr: „Kürze mir bitte diesen Absatz mit einem Textumfang von 785 Zeichen netto auf ca. 600 Zeichen netto: …“

2 Text gekürzt mit  KI-Tool ChatGPT 3.5 am 09.12.2023 um 10:22 Uhr: „Kürze mir bitte diesen Text mit einem Textumfang von 1.144 Zeichen netto ohne die Kernaussagen zu entfernen auf ca. 600 Zeichen netto:….“

3 Text gekürzt mit KI-Tool ChatGPT 3.5 am 29.12.2023 um 17:06 Uhr: „Bitte kürze mir diesen Text mit einem Textumfang von 1.202 Zeichen netto auf 800 netto Zeichen: …“

4 Prompt an KI-Tool ChatGPT 3.5 am 14.12.2023 um 15:38 Uhr: „Was kann man sich von KI-Podcasting in Zukunft erwarten? Bitte schreibe mir einen vollständigen Text in 100 Wörtern, ohne Aufzählungszeichen.“

Über die Autorinnen

Bild Copyright: Fototeam Puntigam

Gill Sprangler studiert im 3. Fachsemester Medienmanagement an der Fachhochschule St. Pölten. Sie hat die HAK-Matura erfolgreich absolviert und ist mit ihrem organisatorischen Engagement bei diversen Veranstaltungen an der Fachhochschule tätig. Im Alltag betreibt sie Sport und verbringt viel Zeit mit ihrer Familie und Freunden.

Kontakt:

linkedin.com/in/gill-sprangler-05a393296

Bild Copyright: Foto Schwarzenegger

Theresa Walzer studiert im 3. Fachsemester Medienmanagement an der Fachhochschule St. Pölten. Nach der HAK-Matura ist sie bis heute neben dem Studium bei der Niederösterreichischen Versicherung in der Unternehmenskommunikation tätig. In ihrer Freizeit findet man sie in der Backstube, im Tanzstudio oder beim Heurigen.

Kontakt:
http://linkedin.com/in/theresa-walzer-0b1a12274