首页
学习
活动
专区
圈层
工具
发布

AI播客圈“大逃杀”:谷歌被吊打,字节“兄弟阋墙”,谁才是最后赢家?

Hi,我是宇森(被迫改名),一位专注于人工智能领域的产品研究员。

在之前的文章中,我曾以一个普通办公族的视角,抛开繁杂的性能基准,从实际“好不好用”出发,对多款AI办公产品进行了横向评测。

对于PPT制作,

我测了9款AI,只想问:所谓的Agent,到底把PPT变成了什么鬼东西?

我们探讨了市面上那些所谓的“PPT Agent”为何常常产出排版怪异、格式不兼容的“AI方格子”作品。

经过九款产品的实测,最终发现,在AI与PPT的结合上,AIPPT 和 WPS AI 的表现最为成熟和实用。

对于Excel数据处理,

再见,Excel!你好,表格Agent!

我们面临一个选择:是拥抱Excel内置的AI能力,还是借助第三方的Agent服务?

评测结果显示,对于重度使用Excel的人来说,直接用WPS的Excel就好,AI能力很完备,对于选择Agent的朋友来说,Manus和Genspark在数据处理上各有所长,效果最符合用户预期。

从PPT到Excel,我们解决了视觉呈现与数据分析的效率问题。现在,让我们把目光投向信息获取的另一重要媒介——播客(Podcast)。

在信息密度日益爆炸的今天,播客凭借其“伴随性”和高质量的信息流,正成为越来越多人通勤、休息时的首选。

AI生成播客(AIGC Podcast)的工具也如雨后春笋般涌现。它们宣称能将任意文章、链接、PDF一键转化为音频节目。

但,只有用过才有发言权! 这场技术革新,究竟是“真·生产力”,还是又一个华而不实的噱mux?

我将以亲身经历,从四大核心维度出发,对市面上主流的AI播客产品(至于其他的产品,没听过)进行一次深度横评,探究它们到底能否满足我们挑剔的耳朵。

1

评测维度:一把好播客的标尺

为了系统性地评估这些AI工具,我设定了以下四个评测维度:

一、内容质量:AI能否成为有料的叙事者?

信息准确性: 内容中的事实、数据是否忠于原文,真实可靠。

知识深度与广度: 对主题的探讨是否深入,能否提供有价值的见解,而非简单的信息罗列。

内容相关性与时效性: 能否紧扣核心主题,并结合当下语境,让听众产生共鸣。

创意与独特性: 在叙事结构、观点呈现上是否有新意,能否避免千篇一律的机器感。

二、听觉体验:是“机”声“机”语,还是声临其境?

声音质量: 发音是否清晰、悦耳,音量、语速是否稳定适中,无明显电流声或瑕疵。

语调与情感: 语调是否自然、有起伏,能否根据内容表达相应情感,增强感染力。

口语化程度: 语言表达是否流畅自然,像聊天而非“念稿”,这是摆脱AI味的关键。

三、制作水准:从业余剪辑到专业出品有多远?

剪辑与后期: 音频剪辑过渡是否流畅,背景音乐、音效的加入是否画龙点睛。

节目结构与节奏: 是否有清晰的开场、发展和结尾?节奏是否张弛有度,能抓住听众的注意力。

时长控制: 节目时长是否合理,既能讲透主题,又不让听众感到冗长。

四、用户体验:产品好不好上手,用起来顺不顺心?

操作稳定性与便捷性: 从上传到生成,过程是否流畅无卡顿?获取和订阅是否方便?

互动性: 是否提供反馈渠道?能否对生成结果进行二次编辑和调整?

2

选手登场:五款主流AI播客产品实测

本次评测,我统一使用一篇关于“AI Agent”的学术论文作为输入材料,来考验各家产品的真实水平。

Google NotebookLM:“客串”播音员

首当其冲的,必然是Google的NotebookLM。

NotebookLM 是一款 AI 研究助理,助力用户提炼想法和整理思路。

它支持多种文件和来源上传,包括 PDF、网站、YouTube 视频等。具备 Gemini 高级推理和交互功能,可通过多种方式和语言交流。能与笔记本聊天获取有依据且准确透明的信息,还能将来源转为学习指南、简报等易懂格式。

我先把Agent AI那篇论文上传到里面,等待它解析完成。

生成的思维导图如下:

这是它生成的播客。

评测打分:

内容质量: ★★☆☆☆

内容基本忠于原文,但更像是一篇“有声版”的论文摘要,缺乏故事性和深度解读。

听觉体验: ★☆☆☆☆

生成的音频是标准的单人朗读,语调平淡,机械感十足,更接近于一个屏幕阅读器,而非一档播客节目。

制作水准: ★☆☆☆☆

无任何剪辑、配乐或结构设计,仅仅是文本到语音的直接转换。

用户体验: ★★★☆☆

操作非常简单,但功能过于基础。

一句话点评:

NotebookLM的播客功能只是其强大研究能力的附属品,定位并非专业播客工具。你可以把它当成一个能“朗读”学习资料的智能文件夹,但离真正的播客创作相去甚远。

idoubi的PodLM

由国内知名开发者“豆神”出品,是较早进入AI播客领域的玩家,并带有播客属性。

当前支持聊天、网页URL、长文本三种生成方式。

我浏览了社区内的播客,风格多为单人播客或访谈类,这很符合其诞生时代的产品特征。

评测结果:

内容质量: ★★★☆☆

社区内的内容质量尚可,可以看出用户在利用工具进行一些个人化的表达。

听觉体验: ★★☆☆☆

大多数作品仍是单人播讲,虽然比NotebookLM略显自然,但AI的“味道”依然存在。

制作水准: ★★☆☆☆

基础的音频生成,缺乏专业的后期制作元素。

用户体验: ★★★☆☆

拥有播客社区是其一大亮点,增加了产品的互动性和可玩性。

一句话点评:作为早期探索者,PodLM功不可没,但产品形态和生成效果相比后起之秀已略显单薄。

orange.ai发布的listenhub

由AI自媒体大V、前MiniMax产品经理“橘子老师”打造,定位精准于播客创作。。

link:https://listenhub.ai/zh

目前支持短文本/长文本,网页链接,PDF文件的方式进行创作播客节目。

本来想着上传PDF的方式创作节目,结果发现文件大小超出10MB。

好吧,我转成markdown格式吧,给他上传上去,然后还可以选择不同的音色。

点击创建,等待它生成即可。

生成的播客还是有AI味道,完整听了一下,“林溪: 哈哈”这个细节就没有处理好,非常AI。

生成的大纲和脚本:

GO

评测结果:

内容质量: ★★★★☆

生成的播客大纲和脚本结构清晰,内容逻辑性强。

听觉体验: ★★★☆☆

音色选择丰富,但AI感依然明显。在收听过程中,出现了将文本中的“林溪: 哈哈”直接、生硬地读出来的情况。这个细节暴露了AI对文本内非语言性、情景性内容的理解短板,严重影响了沉浸感。

制作水准: ★★★☆☆

提供了脚本,方便二次创作,但音频本身后期处理较少。

用户体验: ★★★★☆

界面友好,流程清晰,但文件大小限制和对文本细节处理的不足是减分项。

一句话点评:

ListenHub在内容结构化上表现出色,但语音表现的细节瑕疵暴露了当前AIGC“知其然,不知其所以然”的通病。

豆包的AI播客

豆包最近也是崽卷,没日没夜的肝。。

这个播客功能是上个月17号在电脑版和网页端全量上线,现在支持上传PDF和网页链接一键转成双人播客节目。

首先给他上传一份论文的PDF,让他制作一个双人播客节目。

点击“生成播客”,然后等待生成播客节目

当我从最开始听这个播客,听了五分钟左右,发现我已经沉浸在里面了。

最开始的时候有开始的开场旋律(音乐MV),有今天聊的主题介绍,一男一女两个主持人进行录制,男的是比较专业一点,女的是提问者,引导下一步对话。

然后,他们两个偶尔会抢台,女生会有非常微弱的语气应答(对,),作为听者,符合我们日常的逻辑习惯。

评测结果:

内容质量: ★★★★☆

不仅准确提炼了论文核心,还创造性地设计了“专业男主持”与“引导女主持”的角色分工,通过问答将复杂概念讲得深入浅出。

听觉体验: ★★★★★

这是本次评测最惊艳的部分。

听了不到五分钟,我几乎忘记了这是AI。开场的BGM、自然的对话节奏、一男一女两位主播的音色和情感都非常到位。

最重要的是,它模拟了真人的微小互动,例如一方发言时另一方会发出“对”、“嗯”等微弱的应答声,甚至还有自然的“抢话”,极大地增强了真实感和沉浸感。

制作水准: ★★★★★

从开场音乐、节目流程设计到角色互动,已经具备了专业播客的雏形,完成度非常高。

用户体验: ★★★★☆

集成在豆包App内,操作简单直接,一键生成体验极佳。

一句话点评:

豆包AI播客凭借其超拟人的双人对话和精良的制作,为AI播客的“可用性”树立了一个新标杆。

扣子(Coze)空间播客

体验完豆包的AI播客,相信你会被它超拟人的双人对讲音频所震撼到,不至于此,除了豆包AI播客,字节旗下的扣子空间(另外一个团队赛马)做的播客功能,也是非常厉害的。

在Coze中,你只需将PDF或链接发给指定的Bot,并下达“制作播客”的指令。

它的独特之处在于,你会看到它执行任务的完整流程:思考 -> 规划 -> 执行。它会自主规划生成脚本、选择音色、合成音频、最后打包成一个HTML网页。

如下,是扣子空间里面执行这个任务的流程,在不断的思考+规划执行,成功将论文生成了播客节目。

最终它给了我播客脚本,生成了播客的一个HTML网页。

生成的播客节目如下:

生成的HTML播放网页如下:

向下滑动查看

根据我给出的评测维度,进行如下评价:

内容质量方面(通过Google Gemini2.5 Pro辅助评测)

评测结果:

内容质量: ★★★★☆

生成的脚本同样质量很高,逻辑清晰,内容详实。

听觉体验: ★★★★☆

语音表现与豆包不相上下,同样是高质量的双人对话模式,非常自然。

制作水准: ★★★★★

最终交付物是一个可分享的HTML播放页面,内含音频播放器和完整的播客脚本,这是一个非常完整和专业的结果。

用户体验: ★★★★★

“过程可视化”是其最大亮点。Coze让你看到了AI Agent是如何一步步完成任务的,这种透明度不仅令人惊叹,也给予用户更强的掌控感和信任感。

一句话点评:

如果说豆包是“一键出片”的魔法师,那扣子空间就是一位展示自己所有工作步骤的、技艺高超的“技艺巧匠”。但是,扣子空间生成的播客,它本身没有强的播客属性,没有像小宇宙APP那样的社区,所以现阶段也很尴尬,手机端去操作也非常难。

综合对比下来,AI播客,大有可为。

从本次评测来看,AI播客已经从“听个响”的玩具阶段,进化到了真正具备“可用性”甚至“优质”的生产力工具阶段。

以豆包和扣子为代表的头部产品,其生成的播客在内容深度、听觉体验和制作水准上,已经足以媲美部分制作中等的真人播客。它们不仅解决了从文本到音频的转换,更重要的是,它们通过模拟双人对话、增加后期效果等方式,解决了音频的“可听性”和“趣味性”问题。

就在最近,B站也高调宣布入局AI视频播客。

可以预见,音视频内容的AI生成将是下一个巨头必争之地。对于我们普通用户和内容创作者而言,这意味着一个全新的、低门槛、高效率的创作时代,或许正在加速到来。

播客,大有可为。

而AI,将是这片蓝海中最强劲的引擎。

对此,你怎么看,欢迎评论。

注:本文未经授权禁止转载。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OJCEDtBVjG_P0BPbFmD3qTkg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券