StartseiteArtikel

Der CEO von Microsoft gibt das Hören von Podcasts auf. Ein weiterer „Opfer“ der KI-Technologie taucht auf.

三易生活2025-07-15 07:36
In der gegenwärtigen Podcast-Branche sollte man vielleicht lieber einen Abstand zu "KI-Podcasts" halten.

In den letzten zwei Jahren wurden unzählige Branchen von KI (Künstlicher Intelligenz) getroffen. Jetzt scheint es an der Zeit zu sein, dass auch die Podcast-Branche betroffen ist. Kürzlich wurde bekannt, dass Microsoft-CEO Satya Nadella sagte, er mag Podcasts, aber seit der Einführung von Copilot höre er keine Podcasts mehr.

Satya Nadella erklärte, dass er seine Informationsaufnahme geändert habe. Anstatt direkt Podcasts zu hören, lädt er nun die Texte der Podcasts in die KI-Assistentin Microsoft Copilot hoch und diskutiert während seiner Pendelstrecke mit der KI über die relevanten Inhalte. In gewisser Weise zeigt diese Veränderung des Microsoft-CEO direkt den Einfluss der KI-Technologie auf das Medium Podcast.

Der Begriff „Podcast“ leitet sich, wie der Name schon sagt, von „iPod“ und „broadcast“ (Sendung) ab. Die Kombination aus traditionellem Medium und neuer Technologie zeigt, dass der Podcast ein sowohl nostalgisches als auch modernes Produkt ist. Der am Anfang dieses Jahrhunderts entstandene Podcast ist eigentlich das Ergebnis des Niedergangs traditioneller Radiosender und des Aufstiegs des Internets und digitaler Medien. Er wird in Form von digitalem Audio verbreitet, und das Abonnieren und Herunterladen über das Internet ist die Grundlage für seinen Erfolg.

Im September 2004 veröffentlichte Apple die Software iPodder, was als das Markenzeichen für die Entstehung des Podcasts gilt. Diese Software erlaubte es den Benutzern, Internet-Radiosendungen und andere Audioinhalte auf ihren iPod herunterzuladen und zu hören. Mit iPodder konnten Benutzer Audio-Programme bequem abonnieren und herunterladen, und diese Audio-Programme waren die Vorläufer der heutigen Podcasts.

Der Podcast ist das Ergebnis einer technologischen Revolution, die das traditionelle Medium bereichert hat. Doch die Entstehung der KI-Technologie hat auch direkt auf den Podcast gewirkt und seine Grundlagen erschüttert. Tatsächlich war 2023, als die generative Künstliche Intelligenz (AIGC) gerade erst aufkam, die vorherrschende Meinung in der Podcast-Branche, dass „Technologie die Zukunft der Stimme verändert“ und die KI die Produktion und Verbreitung von Podcasts verändere und ihm neue Flügel verleihe.

Damals waren viele Podcast-Ersteller optimistisch, dass die KI als Werkzeug den kreativen Prozess unterstützen würde. Laut relevanten Daten betrug die durchschnittliche reine Arbeitszeit pro Podcast-Episode von chinesischen Podcast-Erstellern 2024 12,9 Stunden, wobei der Schnittvorgang allein etwa 4,5 Stunden in Anspruch nahm. Mit der Entstehung von KI-gestützten Audio-Postproduktionswerkzeugen wie Descript und Auphonic, die automatisierte Audio-Schnitt, Lautstärkeanpassung und Rauschunterdrückung ermöglichen, wurden die Ersteller von mühsamen Produktionsprozessen befreit.

Darüber hinaus wird die KI-gestützte Digital-Person-Technologie auch in der Podcast-Branche eingesetzt. Ein typisches Beispiel ist die Funktion „Audio Overviews“ von Google NotebookLM. Nachdem der Benutzer Textinhalt hochgeladen hat, kann der KI-Sprecher lebendige Dialog-Audioinhalte erzeugen, deren emotionale Ausdrucksweise fast der eines echten Menschen entspricht.

Obwohl die AIGC die Produktivität der Podcast-Branche sprunghaft gesteigert hat, hat sich das weitere Geschehen den Erwartungen der Podcast-Ersteller entgegengewandt. Mit der breiten Anwendung der AIGC in der Podcast-Branche haben einige aufmerksame Zuhörer die Schwächen der Podcasts erkannt: Wenn man die individuellen emotionalen Ausdrücke des Menschen entfernt, enthält der Podcast zu wenig Informationen. Als Medium ist er weit hinter Videos und Text-Bild-Inhalten zurück.

Wenn man Informationen erhalten möchte, ist der Podcast derzeit das ineffizienteste Medium in der digitalen Welt. Um dem Problem noch zugrunde zu legen, kann die KI Informationen aus Podcasts noch effizienter extrahieren. Beispielsweise ist Tongyi Tingwu von Alibaba ein guter Helfer beim Umwandeln von gesprochener Sprache in Text. Eine seiner wichtigen Funktionen ist die Transkription von Podcast-Links, wodurch die Benutzer, die Informationen aus Podcasts erhalten möchten, nicht mehr „Podcasts hören“ müssen, sondern direkt „Podcasts lesen“ können.

In gewisser Weise beweist die Tatsache, dass Microsoft-CEO Satya Nadella auf das Hören von Podcasts verzichtet, dass die heutige Podcast-Branche der „KI-Podcasts“ misstrauisch gegenüberstehen sollte. Die Verwendung von KI-Sprechern würde die Wettbewerbsfähigkeit der Podcasts schwächen. Darüber hinaus zeigt es auch das Problem der geringen Informationsdichte von Podcasts auf, die auf der Stimme basieren. Der „Emotionswert“ ist die Kernkompetenz der Podcasts. Ohne künstliche Filter und Bühnenwirkung vermittelt nur die Stimme echte Gefühle.

Warum hat der Podcast auch in einer Zeit, in der Kurzvideos populär sind, eine beträchtliche Zuhörerschaft? Der Grund liegt darin, dass der Podcast nur das Hörvermögen der Benutzer beansprucht. Anders als beim Ansehen von Kurzvideos müssen die Benutzer nicht ständig auf den Bildschirm schauen. Der Podcast kann während der Pendelstrecke ein Begleiter sein oder als Hintergrundmusik beim Haushalt dienen. Im Vergleich zu sozialen Plattformen bietet der Podcast Privatsphäre. Mit Kopfhörern kann man sich in die Welt der Stimmen vertiefen.

Mit anderen Worten, Podcasts, die sich hauptsächlich auf Wissensvermittlung konzentrieren, werden unter dem Druck der KI-Technologie zurückgehen. Die KI ist bei der Sammlung, Organisation und Zusammenfassung von Informationen weit überlegen. Für denselben Podcast-Inhalt kann die KI in nur wenigen Sekunden eine vollständige Analyse liefern. Die Benutzer müssen nicht mehr den gesamten Podcast hören.

Aktuell hat die KI jedoch noch Schwächen bei der Wahrnehmung menschlicher Emotionen und kann die menschlichen Gefühle nicht perfekt imitieren. Hier liegt der Unterschied zwischen Podcasts und KI: Podcasts, die emotionale Begleitung bieten, haben eine Wettbewerbsvorteil. Die Podcasts, die stärker von Menschen gemacht werden und individuellere Ausdrücke haben, werden unter dem Einfluss der KI überleben.

[Die Bilder in diesem Artikel stammen aus dem Internet.] 

Dieser Artikel stammt aus dem WeChat-Account „Sanyi Life“. Verfasser: Sanyi Jun. 36Kr hat die Genehmigung zur Veröffentlichung erhalten.