Wie hilft eure KI-Plattform Redaktionen, mit wenig Aufwand eigene Podcasts zu produzieren?

Aus eigenen Texten fertige Podcasts produzieren, und das ganz ohne professionelles Audiostudio und sogar ohne Sprecher:innen: Das können Redaktionen mit Audiomatika. In der MIZ-Innovationsförderung haben Chris Guse und Pavel Tyukavin von der Podcast-Produktionsfirma BosePark Productions eine Plattform entwickelt, die verschiedene KI-Funktionalitäten vereint: Audiomatika fasst Artikel zusammen, optimiert die Texte fürs Hören, vertont sie mithilfe synthetischer Simmen und mischt verschiedene Elemente mit Sounds zu einem fertigen Podcast. Wie das technisch funktioniert, welche Podcasts bereits mit Audiomatika entstanden sind und für welche Formate sich die Plattform eignet, hat Chris zum Abschluss der MIZ-Förderung im Interview verraten.

Chris Guse und Pavel Tyukavin vom Projektteam Audiomatika aus der MIZ-Innovationsförderung
Chris Guse und Pavel Tyukavin vom Projektteam Audiomatika

Wir haben eine Plattform entwickelt, die es möglich macht, mit eigenen Textdaten automatisiert fertige Audiobeiträge oder ganze Podcasts zu bauen und auch automatisiert hochzuladen."

Lieber Chris, KI-Tools gibt es inzwischen viele, auch für den Podcast-Bereich. Was unterscheidet Audiomatika von anderen KI-Lösungen?

Chris Guse: Aktuelle KI-Tools lösen spezifische Probleme: Stimmen synthetisieren, Texte zusammenfassen oder übersetzen. Werden diese verschiedenen Tools manuell eingesetzt, nimmt das Verstehen, Anpassen, Kopieren und Einfügen immer noch viel Zeit in Anspruch. Fehlende Ressourcen sind aber gerade der Grund, warum es sehr wenige Podcasts oder Audiobeiträge im Bereich der lokalen Berichterstattung gibt.

Genau hier setzen wir mit Audiomatika an: Wir haben eine Plattform entwickelt, die es möglich macht, mit eigenen Textdaten automatisiert fertige Audiobeiträge oder ganze Podcasts zu bauen und auch automatisiert hochzuladen.

Was genau habt ihr im Rahmen der Förderung entwickelt und wie kommt bei Audiomatika KI zum Einsatz?

Chris: Wir haben ein Frontend für Audiomatika entwickelt, über das sich User:innen sicher einloggen können, um Parameter der einzelnen Formate einstellen zu können. Und wir haben ein Backend entwickelt, das als modulares System in der Cloud die einzelnen Stufen der Audioproduktion automatisiert ausführt.

KI-Modelle kommen bei uns als vorbereitende Schritte für die Audioproduktion bei der Auswahl, Zusammenfassung und beim Umschreiben von Texten zum Einsatz. Darüber hinaus benutzen wir KI-Systeme für die Stimmensynthese, sodass die Redaktionen keine eigenen Sprecher:innen mehr aufzeichnen müssen. Diese einzelnen Audioteile werden dann im Backend mit Sounds und Musik fertig abgemischt und veröffentlicht.

Screenshot der Plattform Audiomatika aus der MIZ-Innovationsförderung
Im Frontend von Audiomatika können die Nutzer:innen Texte automatisiert zusammenfassen lassen und vertonen sowie die verschiedenen Audioelemente zu einer Podcastfolge arrangieren.

„Unser System ist immer dann sehr nützlich, wenn es bereits aktuelle, selbstrecherchierte Daten in Textform gibt. Die schreiben wir für das gesprochene Wort um und stellen sie zu kurzen Podcasts zusammen."

Welche Formate können Redaktionen mit euch realisieren und wie funktioniert die Zusammenarbeit konkret?

Chris: Aktuell haben wir einen klaren Fokus auf kurze Newsformate. Noch sind Stimmen und KI-Sprachmodelle nicht so weit, dass längere Gesprächsformate damit realisiert werden können. Das ist aber sowieso nicht das Ziel.

Die Idee von Audiomatika ist es, Lokalredaktionen die Möglichkeit an die Hand zu geben, in der gleichen Geschwindigkeit Audio-News zu veröffentlichen, wie sie und ihre Leser:innen es aus der Text-/Push-Welt auf dem Handy gewohnt sind. Insofern ist unser System immer dann sehr nützlich, wenn es bereits aktuelle, selbstrecherchierte Daten in Textform gibt. Die schreiben wir dann für das gesprochene Wort um und stellen sie zu kurzen Podcasts zwischen fünf und 15 Minuten Länge zusammen.

Könnt ihr ein konkretes Format nennen, das ihr mithilfe von Audiomatika produziert? Wie kommt Audiomatika in dem Projekt zum Einsatz?

Chris: Wir haben mit dem wöchentlichen Podcast der Wübben Stiftung Bildung einen komplett automatisierten Podcast, der zwei Meldungen aus dem Bildungsbereich für Audio aufbereitet und auf dem Podcastkanal der Stiftung veröffentlicht. Hier arbeiten wir mit den Originaltexten von der Blogseite der Stiftung und haben dazu die Stimme der Redakteurin synthetisiert.

Einen Schritt weiter sind wir mit der Sportredaktion der Lausitzer Rundschau gegangen, indem wir den ersten KI-Hybridpodcast gestartet haben. Die beiden Redakteure der Sportredaktion melden sich hier jede Woche mit Geschichten rund um den Fußballverein FC Energie Cottbus. In der Mitte des Podcast hören wir dann von Audiomatika zusammengestellte Audio-News aus der Fußballwoche. Hier nehmen wir die gut recherchierten Texte der Lausitzer Rundschau und vertonen sie mit den gleichen Stimmen der Redakteure, in dem Fall dann aber als synthetisierte KI-Varianten.

Der Hybrid-Podcast "Doppelsechs" der Lausitzer Rundschau wird mithilfe von Audiomatika produziert

Ihr testet Audiomatika schon jetzt mit mehreren Redaktionen. Wie lief die Zusammenarbeit bisher und welche Herausforderungen habt ihr identifiziert?

Chris: Die größte Herausforderung liegt nicht im technischen Bereich, sondern im menschlichen. Die technische Entwicklung ist derart schnell, dass wir Menschen erst einmal „hinterherkommen“ müssen. Es gibt sowohl einen großen Kommunikationsbedarf bei allen Beteiligten als auch Skepsis und Argwohn gegenüber KI-Systemen – gute und wichtige Reaktionen, die uns davor bewahren werden, zu leichtfertig mit KI-Systemen umzugehen.

Es braucht Zeit, in einem Projekt diese unbekannten Stellen im Umgang mit der Technik zu identifizieren, darüber zu sprechen und sie für alle transparent und verständlich nutzen zu können. Unsere Erfahrungen in der Zusammenarbeit waren hier durchweg positiv, da sich alle Beteiligten diese Zeit gerne und bewusst genommen haben.

Chris Guse und Su Holder präsentieren die Plattform Audiomatika auf dem Spotify
Im April 2024 präsentierten Chris Guse und Su Holder die Plattform Audiomatika auf dem Spotify "All Ears" Podcast Summit

In unseren Fällen hat der Einsatz von KI-Modellen dazu geführt, dass Podcastformate möglich werden, die vorher aus Kostengründen nicht möglich waren."

Es gibt sicherlich auch Podcaster:innen, die KI-produzierten Podcasts kritisch gegenüberstehen. Was entgegnet ihr ihnen und warum ist Audiomatika trotzdem eine sinnvolle Innovation?

Chris: Unsere persönliche Erfahrung ist, dass eine kompetitive Sichtweise nicht der Realität entspricht. KI ist keine Entweder-Oder-Entscheidung und der Einsatz von KI-Modellen macht einen nicht automatisch zum Anwalt oder Fürsprecher dieser Technik.

In unseren speziellen Fällen hat der Einsatz von KI-Modellen dazu geführt, dass Podcastformate möglich werden, die vorher aus Kostengründen nicht möglich waren. Der menschliche Faktor ist und bleibt die Seele jeder Contentproduktion. Welcher Teil dieser Produktion allerdings wirklich noch per Hand gemacht werden muss und was auch automatisiert produziert werden kann, das verschiebt sich gerade und genau hier setzen wir mit Audiomatika an.

Wie geht es jetzt nach Abschluss der MIZ-Förderung mit Audiomatika weiter?

Wir arbeiten gerade daran, weitere Formate über die Plattform zu veröffentlichen. Dafür sind wir im Gespräch mit verschiedenen Medienpartnern. Außerdem hat uns der Einsatz von Audiomatika bei den ersten Podcasts auf Ideen gebracht, die wir weiter vorantreiben wollen – zum Beispiel die automatische Lokalisierung von Podcasts, also den gleichen Podcast in mehreren Sprachen anzubieten. Darüber hinaus sind wir in Gesprächen mit mehreren Verlagen, um Audiomatika für die Vertonung zum Beispiel von erfolgreichen Newslettern zu verwenden.

>>> Mehr über Audiomatika
>>> Alle Folgen des Doppelsechs-Podcast der Lausitzer Rundschau
>>> Website von BosePark Productions

Ansprechperson

Photo

Marion Franke

Förderung

Marion leitet den Bereich Innovationsförderung. Sie ist Ansprechpartnerin für alle Fragen zu den Förderbedingungen, der Antragstellung und verantwortlich für die Betreuung der Projekte.

+49 331 58 56 58-26

Zurück