10.04.2024

KI-Podcast

Und plötzlich spricht Mohamed Ali Camara Deutsch

Ein Podcast mit dem guineischen Fussballspieler überwindet die Sprachbarriere und lässt den Frankophonen dank KI (und viel Handarbeit) Deutsch sprechen. So sind die Berner Young Boys und ihre Partner-Agentur Newsroom Communication dabei vorgegangen.
KI-Podcast: Und plötzlich spricht Mohamed Ali Camara Deutsch
Der YB-Verteidiger Mohamed Ali Camara bei der Aufzeichnung des Podcasts. (Bild: BSC Young Boys)

So vertraut und doch so fremd: Wer in der aktuellen Episode des YB-Podcast dem Fussballer Mohamed Ali Camara zuhört, reagiert vermutlich irritiert. Das ist doch seine Stimme. Aber seit wann spricht der fliessend und akzentfrei Deutsch? Er tut das tatsächlich. Und es ist auch sein charakteristischer sonorer Bass – einfach geklont und übersetzt und darum auch monotoner im Duktus als im französischsprachigen Original.

Als sich die Verantwortlichen des Berner Sportclubs dafür entschieden hatten, erstmals eine Podcast-Episode mit einem französischsprachigen Spieler zu produzieren, standen sie vor einem Dilemma: Sollte ein Grossteil der Fans wegen der Sprachbarriere aussen vor bleiben? Oder gäbe es eine Lösung, um auch den deutschsprachigen Zuhörenden diese Episode zugänglich zu machen? Bei einem Videopodcast kann man mit Untertiteln arbeiten. Bei einem Audioformat geht das nicht. Und eine Stunde Overdubbing mit Synchronübersetzung macht nicht wirklich Freude zum Zuhören.

«Wir haben spontan zugestimmt»

Einen Ausweg aus dem Dilemma bot schliesslich die KI mittels Sprachsynthetisierung und automatisierter Übersetzung. «Unsere Partner von Newsroom Communication schlugen dieses Vorgehen vor», sagt Sebastian Helbig am Telefon mit persoenlich.com. «Und wir haben spontan zugestimmt.» Helbig ist Sponsoringchef des BSC Young Boys und ist in dieser Funktion auch Mitinitiator des Podcasts des Fussballclubs. «Es geht uns nicht darum, hier eine Vorreiterrolle spielen zu wollen. Aber wir sind innovationsfokussiert und wollen unseren Fans den bestmöglichen Service bieten», betont Helbig. In diesem Fall sei nun KI die passende Antwort gewesen.

Die Technologie, wie sie YB nun zur Übersetzung eines Podcasts einsetzt, machte bisher vor allem im Zusammenhang mit sogenannten Deep Fakes von sich reden, wenn einer Person Aussagen in den Mund gelegt werden, die sie nie gesagt hat, oder wenn englischsprachige Promis plötzlich perfekt Polnisch sprechen.

Doch die Übersetzung des Fussballerinterviews ist weder Fake noch Jux, sondern redaktionelles Handwerk mit einem publizistischen Plan. Hier kommt Brian Ruchti ins Spiel. Der Gründer und Mitinhaber von Newsroom Communication zeichnete für die Umsetzung der KI-Übersetzung verantwortlich. Seine Agentur arbeitet seit über 15 Jahren für den Fussballclub Young Boys, unter anderem als Betreiber des Fan-Radios «Radio Gelb-Schwarz».

Die Grenzen der Automatisierung

Ruchti nahm das Audiofile des stündigen Interviews mit Mohamed Ali Camara und befahl der KI zuerst zwei Sachen: die Stimme des Spielers zu synthetisieren sowie ein Transkript des Gesagten zu erstellen. Beides erledigt der kommerzielle Dienstleister Rask AI. Auch die weiteren Schritte bis zur übersetzten Endfassung könnte die KI vollautomatisch erledigen. «Das Ergebnis wäre auch so schon unglaublich gut, aber nicht perfekt», sagt Brian Ruchti im Gespräch mit persoenlich.com.

Damit die deutschsprachige Version möglichst deckungsgleich mit dem ursprünglich Gesagten daherkommt, erfordert es viel Handarbeit, sowie Augen und Ohren fürs Detail. Schliesslich könnte Ruchti dem Fussballer irgendetwas in den Mund legen; das wäre dann Deep Fake. «Darum ist das Ganze nicht ungefährlich», warnt Ruchti. «Ich habe mehr als vier Stunden den KI-generierten deutschen Übersetzungsvorschlag durchgearbeitet und mit dem französischen O-Ton verglichen», erklärt Ruchti sein Vorgehen. Knifflig wurde es etwa dann, wenn das deutsche Transkript an gewissen Stellen wesentlich länger oder kürzer ist als das Original. «Um möglichst den gleichen Rhythmus beizubehalten in beiden Sprachversionen, muss ich dann kürzen oder sinngemäss ergänzen, ohne aber Abstriche am Inhalt zu machen.»

Auch so dauert der deutsche Podcast nur 40 Minuten gegenüber einer Stunde beim Original. «Alle Lacher und Räusperer glättet die KI raus, darum wird die Übersetzung kürzer», sagt Brian Ruchti. Dem Hörgenuss ist das nicht unbedingt zuträglich, gerade bei einem persönlichen Gespräch gehören auch Zwischentöne dazu.

Sieh dir diesen Beitrag auf Instagram an

Ein Beitrag geteilt von BSC YOUNG BOYS (@bscyb_offiziell)


Um die Authentizität des Gesagten zu belegen und die Machart offenzulegen, erscheint als Intro zu dieser speziellen Podcastfolge ein entsprechender Hinweis, der auch in den Shownotes veröffentlicht wird.

Ob es sich um ein einmaliges Experiment handelt oder um eine Blaupause für noch mehr Inhalte in dieser Form, wird das Publikum entscheiden. «Wir sind da sehr flexibel. Wenn dieser Podcast nicht ankommt, dann können wir reagieren», sagt YB-Mann Helbig. Klar ist aber auch: Die Qualität synthetisierter Stimmen wird von Tag zu Tag besser. «Schon in zwei Monaten steht die Technologie an einem ganz anderen Punkt», gibt Brian Ruchti zu bedenken. «Es ist für uns als Agentur sicher nicht das letzte Mal, dass wir auf diese Art einen Podcast übersetzen.»

«Wir haben dieses Vorgehen erst intern getestet»

Dass es gegenwärtig noch gewöhnungsbedürftig ist, einer solchen Stimme zuzuhören, liegt auch daran, dass diese Art, fremdsprachige Gespräche zugänglich zu machen, bisher noch nicht genutzt wurde. Der YB-Podcast leistet hier Pionierarbeit. Das bestätigt auch Nico Leuenberger von der Agentur Podcastschmiede. «Wir haben dieses Vorgehen erst intern getestet, aber noch nie in einer Publikation eingesetzt», teilt Leuenberger auf Anfrage von persoenlich.com mit.

Der Podcast-Profi hegt aber keine grundlegenden medienethischen Bedenken. «Selbstverständlich muss immer deklariert werden, dass es sich um eine KI-Übersetzung handelt. Und Medienschaffende, aber auch die breite Bevölkerung müssen über geklonte Stimmen aufgeklärt werden», so Leuenberger.

Ein Blick in die Richtlinien zum Umgang mit KI von SRF, Ringier und Presserat zeigt denn auch, dass es keinen «Killer-Paragrafen» gibt, der solches Vorgehen im journalistischen Einsatz a priori verunmöglichen würde. Am ehesten steht diesem Anwendungsfall die Sorge um die publizistische Glaubwürdigkeit oder um das eigene Image entgegen. Der Newsroom eines Fussballclubs geniesst aber grössere Narrenfreiheit als die Redaktion eines Medienunternehmens und kann sich ein solches Experiment – mit allen Risiken und Nebenwirkungen – eher leisten.


Newsletter wird abonniert...

Newsletter abonnieren

Wollen Sie Artikel wie diesen in Ihrer Mailbox? Erhalten Sie frühmorgens die relevantesten Branchennews in kompakter Form.

Kommentar wird gesendet...

KOMMENTARE

Diese Artikel könnten Sie auch interessieren

Die Branchennews täglich erhalten!

Jetzt Newsletter abonnieren.