Wie baut eure KI-Lösung Barrieren beim Radiohören ab?
Radiosender sind für viele Menschen eine wichtige Quelle für tagesaktuelle, lokale Informationen. Gerade für Menschen mit Höreinschränkungen oder für Nichtmuttersprachler:innen ist Radiohören allerdings mit Barrieren verbunden. Im Media Founders Program von MIZ Babelsberg und MediaTech Hub Accelerator entwickeln Kristian Müller und Petros Theocharous deshalb „Radiozeit“: Die App- und Website-Lösung generiert automatisiert Untertitel fürs Radio und spielt diese synchron zum Audio-Stream aus – auf Wunsch sogar in verschiedenen Sprachen. Wie „Radiozeit“ funktioniert, welchen Mehrwert Radiosender aus den automatisierten Transkripten ziehen können und wie es nach Abschluss der MIZ-Förderung jetzt mit dem Projekt weitergeht, hat uns Kristian im Interview verraten.
Kristian Müller präsentiert das Projekt Radiozeit beim MIZ Innovation Pitch #4. Foto: Franziska Ahrendt
„Mit unserer Lösung können lokale und regionale Radiosender noch mehr Menschen mit Informationen versorgen."
Lieber Kristian, ihr wollt mit eurem Projekt „Radiozeit“ Radiosendungen besser zugänglich machen. Wer kann von eurer Lösung profitieren?
Kristian Müller: Beim „Radio zum Mitlesen“ denkt man im ersten Moment vielleicht an Menschen mit Hörbehinderung. Tatsächlich ist es für uns eine Herzensangelegenheit, dieser Zielgruppe das Medium Radio zugänglich zu machen. Insbesondere die Altersschwerhörigkeit betrifft Personen, die vielleicht ihr Leben lang gerne Radio gehört haben und nun auf eine geliebte Angewohnheit verzichten müssten.
Spannend finde ich allerdings auch den zweiten Aspekt unseres Produktes. Denn neben der Anzeige der jeweils gesprochenen Worte im Karaoke-Stil ermöglicht Radiozeit auch das Mitlesen oder sogar das Radiohören in einer anderen Sprache. Damit erleichtern wir es Menschen, die nicht die Sprache des Radiosenders sprechen, zu verstehen, worüber geredet wird.
Das ist auch für den Lokaljournalismus interessant. Denn mit unserer Lösung können lokale und regionale Radiosender noch mehr Menschen mit Informationen versorgen – zum Beispiel Expats, Tourist:innen oder Menschen mit Migrationshintergrund. Und die Übersetzungsfunktion kann auch ein spannendes Hilfsmittel zum Lernen einer neuen Sprache sein.
Natürlich ist die Anzeige der Radiozeit-Radiountertitel auch für jede:n andere Radiohörer:in interessant. Denn in lauten Umgebungen, wie zum Beispiel dem ÖPNV, kann man einfach kurz mitlesen, worum es gerade geht, ohne gleich die Kopfhörer aufzusetzen.
„Sobald ein Wort gesagt wird, erscheint es wie ein Karaoke-Untertitel auf dem Bildschirm und man kann komfortabel mitlesen."
Welche verschiedenen Features bietet „Radiozeit“?
Kristian: Als Nutzer:in von Radiozeit benötigt man ein Smartphone, einen Laptop oder ein Tablet mit Internetanbindung. Dann kann man beispielsweise das Tablet auf den Frühstückstisch stellen und darüber Radio hören. Sobald ein Wort gesagt wird, erscheint es wie ein Karaoke-Untertitel auf dem Bildschirm und man kann komfortabel mitlesen.
Die Live-Transkription von Radiozeit ist seit Mai 2024 im Einsatz bei ALEX Berlin. Die Übersetzungsfunktion soll bald folgen.
Neben dem reinen Mitlesen der originalen Sprache kann man eine andere Sprache auswählen und dann in dieser Sprache mitlesen. Im Rahmen der MIZ-Förderung haben wir auch einen Prototypen entwickelt, der mithilfe einer KI-Stimme den übersetzen Text wieder einspricht. Dann könnt ihr beispielsweise BBC-Radio auf Deutsch hören. Allerdings ist diese Funktion derzeit noch zu teuer für einen durchgehende Nutzung bei einzelnen Radiosendern.
Ein weiteres Ziel eures Projektes war es, Radioinhalte besser durchsuchbar zu machen. Wie funktioniert das?
Kristian: Da der transkribierte Text auch in einer Datenbank gespeichert werden kann, ist es möglich, eine Suche über die Inhalte der letzten Tage und Wochen durchzuführen. Wir haben es geschafft, diese Datenbank mit einem Chat-Interface durchsuchbar zu machen. Damit kann man direkt Fragen an den Radiosender stellen. Zum Beispiel: „Was hat unsere Außenministerin heute Morgen im Radio gesagt?“ Unser System kann dann das relevante Transkript finden und das Chat-Interface kann die Antwort auf die Frage anzeigen. Diese Funktionen bieten wir Radiosendern an, damit sie sie in ihre Apps und auf ihren Webseiten integrieren können.
Wie funktioniert Radiozeit technisch?
Kristian: Um eine synchrone Darstellung des Textes mit dem gesprochenen Wort zu ermöglichen, verzögern wir das Audiosignal etwas. Diese Verzögerung – von weniger als einer Minute – erlaubt es uns, verschiedene KI-Modelle laufen zu lassen. Nur dadurch ist es möglich, ohne Verzögerung das aktuelle Wort hervorzuheben und bereits den Rest des aktuellen Satzes anzuzeigen.
Das einzigartige am Medium Radio ist, dass ein solcher Ansatz fast keine Auswirkungen auf das Hörerlebnis hat, da die geringe Verzögerung oft nicht einmal bemerkt wird. Wir glauben, hier eine echte Innovation entwickelt zu haben und haben diesen Ansatz daher auch zum Patent angemeldet.
Zur Transkription nutzen wir ein sehr gutes KI-Modell, das daher auch sehr rechenintensiv ist. Das Large Model benötigt mehr als drei Gigabyte Speicher auf unserem Server und kann damit mehr als 100 verschiedene Sprachen nahezu fehlerfrei transkribieren. Im Vergleich dazu haben kleinere Modelle, die z.B. auch auf Smartphones laufen, nur eine Größe von 80 Megabyte und sind qualitativ nicht vergleichbar. Insbesondere bei Interviews, in denen sich Sprecher abwechseln oder bei der Nutzung von O-Tönen kann das große Modell glänzen.
Um Radiozeit 24 Stunden am Tag und sieben Tage die Woche nutzen zu können, ist es wichtig, die Kosten für die Verarbeitung des KI-Modells gering zu halten. Wir setzen hierbei auf spezielle Serverhardware die wir in deutschen Rechenzentren einsetzen. Das hat auch den Vorteil, dass wir Sendern garantieren können, dass ihre Inhalte nur in der EU verarbeitet werden.
„Neben der Integration des Live-Transkripts bei Radiosendern haben wir eine eigene Radiozeit-App entwickelt, mit der jede:r den eigenen Lieblingssender hören und mitlesen kann."
Welche Produkte stehen jetzt am Ende der Entwicklung?
Kristian: Neben der Integrationsmöglichkeit des Live-Transkripts bei Radiosendern haben wir auch eine eigene Radiozeit-App entwickelt, mit der jede:r den eigenen Lieblingssender hören und mitlesen kann. Im deutschsprachigen Raum ist Radiozeit für Android und iOS ab Ende Juli 2024 verfügbar. Diese Freemium-App dient hauptsächlich als Showcase, um Radiosendern zu zeigen, wie eine Integration in ihre Apps aussehen kann.
Außerdem haben wir verschiedene Redaktionstools entwickelt, mit denen das Transkript einer Sendung genutzt werden kann, noch während sie läuft. Diese Transkripte helfen den Sendern dabei, die Sendungswebsites mit mehr Details zu füllen. Das kann unter anderem für Suchmaschinenoptimierung (SEO) sinnvoll sein, denn je mehr Details zu einer Sendung online auffindbar sind desto mehr Hörer können sich zu den besprochenen Themen informieren.
Konkret haben wir ein Interface entwickelt, mit dem man den Programmplan des Senders anzeigen kann. Darin kann man einzelne Sendungen anwählen und bekommt das jeweilige Transkript und weitere Zusatzinformationen – wie Kurzfassungen des Inhalts einer Sendung – zum Teilen auf Social-Media-Kanälen angezeigt.
Kristian Müller und Petros Theocharous vom MIZ-Projektteam Radiozeit bei den Radiodays Europe 2024
Ihr habt bereits verschiedene Projektpartner für Radiozeit gewonnen. Welche sind das und wie wird Radiozeit bei ihnen zum Einsatz kommen?
Kristian: Zum Start der Projektförderung sind wir auf zwei Radioveranstalter zugegangen, die uns im Prozess begleitet haben. Das ist einerseits der private Radiosender Radio TEDDY und andererseits das öffentlich-rechtliche Deutschlandradio. Radio TEDDY prüft derzeit die Integration unserer Lösung in seine App, mit Deutschlandradio konnten wir bereits eine Kooperation vereinbaren: Bis zum Ende des Jahres sollen die Radiozeit-Untertitel für den Sender „Deutschlandfunk“ in die DLF-App integriert werden.
Neben diesen beiden Veranstaltern sind wir nun mit weiteren deutschen Sendern sowie unter anderem mit Anbietern in Polen und den Niederlanden im Gespräch. Mit ALEX Berlin haben wir unseren ersten Kunden gewinnen können.
Habt ihr bei der Zusammenarbeit mit den Projektpartnern neue Bedarfe entdeckt, die ihr jetzt berücksichtigen wollt?
Kristian: In der konkreten Umsetzung der Idee konnten wir als erstes die Machbarkeit und konkreten Integrationsmöglichkeiten des Live-Transkripts erproben. Schnell kamen dabei weitere Ideen für zukünftige Produkte auf. Uns ist wichtig, uns erst einmal auf den aktuellen Use-Case zu konzentrieren und hier wirklich einen Mehrwert für die Radiokonsument:innen zu schaffen.
Parallel möchten wir aber auch Wert auf das Thema Social-Media-Integration und SEO legen, denn darin liegen klare Mehrwerte für Redaktionen der privaten Anbieter. Sender, die die Radiozeit-Lösung nutzen, können damit noch während die Sendung läuft das meiste aus ihrem Transkript machen.
„Ziel ist es nun, nachdem wir erste Kund:innen gewinnen konnten, eine Firma aufzubauen, die als Partner der Radionsender die Technologie zur Live-Transkription und -Übersetzung weiterentwickelt."
Wie geht es nach der MIZ-Förderung mit eurem Projekt weiter und wie soll die langfristige Finanzierung aussehen?
Kristian: Wir haben das Glück, im Media Founders Program gefördert geworden zu sein. Daher sind wir sehr froh darüber, dass wir im zweiten Teil des Förderprogramms nun auch in die aktuelle Kohorte des MediaTech Hub Accelerators aufgenommen wurden.
Ziel ist es nun, nachdem wir erste Kund:innen gewinnen konnten, eine Firma aufzubauen, die als Partner der Radionsender die Technologie zur Live-Transkription und -Übersetzung weiterentwickelt. Unser Firmenziel ist dabei, jeden Sender in jeder Sprache verständlich zu machen.
>>> Mehr über Radiozeit
>>> Website von Radiozeit
>>> Radiozeit im Einsatz bei ALEX Berlin
Ansprechperson
Marion Franke
FörderungMarion leitet den Bereich Innovationsförderung. Sie ist Ansprechpartnerin für alle Fragen zu den Förderbedingungen, der Antragstellung und verantwortlich für die Betreuung der Projekte.