We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode EP79 太🔥了,我们也聊聊 NotebookLM 和 AI 播客

EP79 太🔥了,我们也聊聊 NotebookLM 和 AI 播客

2024/10/15
logo of podcast 硬地骇客

硬地骇客

AI Deep Dive AI Chapters Transcript
People
异象
赛头
龟龟
Topics
赛头: 本期节目讨论了AI生成播客,特别是Google的NotebookLM。从AI播客的听感体验出发,深入探讨了它的应用场景(资讯、读书、访谈等)、对播客产业的影响(生产力提升和内容竞争),以及未来发展趋势(商业化前景和创作者应对挑战)。 赛头认为,AI播客的真实感虽然一开始很高,但听久了会产生不真实感。他更喜欢文字型内容消费,因为可以主动控制节奏。赛头对AI播客的音色不敏感,更关注内容质量。他认为AI播客的出现,会让一些资讯类和读书分享类的播客制作更高效,但对谈类播客则难以替代。赛头认为,未来播客创作者需要学习使用AI工具,并保持自身个性和价值输出,才能在竞争中立足。他认为,单纯提供情绪价值的AI播客可能会有市场。最后,赛头总结了大多数中文播客不赚钱的现状,鼓励创作者坚持创作,并根据听众反馈调整方向。 异象: NotebookLM并非近期产品,而是Google工程师利用20%业余时间,历时近两年开发的项目,之前一直不温不火。其最初源于Google内部一个针对小型语料库对话的研究项目,旨在利用企业内部私有文档等小型语料库进行个性化对话。NotebookLM的名字最初让人联想到个人知识库管理工具,而非播客生成工具。近期走红是因为新加入的音频概述功能,无意中切中了播客场景,从而病毒式传播。Google的项目基因是数据驱动型,先研究技术再寻找应用场景,NotebookLM的播客应用是机缘巧合。NotebookLM团队规模很小,证明优秀产品并非一定需要大型团队。异象认为,NotebookLM生成播客的关键在于语言模型对知识点的把握和梳理,以及TTS的合成技术。他认为,AI生成的音频内容在短视频平台上已经很常见,未来可能也会在播客领域普及,但对谈类播客难以被AI替代。异象认为,播客创作者需要学习使用AI工具,并保持自身个性和价值输出,才能在竞争中立足。他认为,AI可以用于制作资讯类、读书分享类和陪伴型播客。 龟龟: 龟龟认为NotebookLM生成的音频在语气语调上非常真实,但听多了会感觉不真实。他认为NotebookLM的音频概述功能适合快速了解长篇PDF内容,而非深入研究。对AI音频的接受程度取决于应用场景,单向资讯类AI音频更容易被接受。龟龟更喜欢文字型内容消费,因为可以主动控制节奏。他认为,AI可以用于制作资讯类和读书分享类播客,但访谈类播客难以被AI替代,因为嘉宾的临场发挥和个性化表达难以被复制。龟龟认为,NotebookLM的出现会提高播客的生产效率,但不会颠覆播客产业。他认为,播客创作者需要适应AI工具,并保持自身个性和价值输出,才能在竞争中立足。他认为,AI可以用于制作一些特定类型的播客,例如资讯简报和读书分享,但对谈类播客则难以替代。

Deep Dive

Chapters
本节探讨了Google的NotebookLM,它如何将文本转换成播客对话,以及其背后的技术和团队。它并非最近才出现,而是一年前才走红,最初由Google工程师利用20%的业余时间开发,起源于一个面向小型语料库对话的研究项目。
  • NotebookLM并非新产品,而是Google工程师利用20%业余时间开发的项目,起源于小型语料库对话研究。
  • NotebookLM最初不温不火,因加入音频概述功能而走红,无意中切中了播客场景。
  • Google的项目多是技术驱动型,而非需求驱动型。
  • NotebookLM团队很小,证明优秀产品不一定需要大型团队。

Shownotes Transcript

大家好,欢迎收听尼海克,我是赛头,我是异象

我是龟龟实时 AI 的时代终于还是来了 10 月 25 号到 26 号 RTE 开发者社区联合声网策划的 RTE 大会 2024 将在北京举行今年的技术论坛将覆盖前沿音视频技术 AI 生成视频 Voice AI 多模态大模型空间计算和新硬件云编端架构和 AI infra 等话题同时还有开发者市集动手编程工作坊创新大赛路演等活动

大会特意为印第亥克的听众准备了限免门票在下方的 show notes 中扫码或者点击专属邀请链接即可领取与此同时大会还提供快闪摊位供开发者使用如果你自己的项目想在 RTE 大会上展出交流也欢迎通过邮箱联系我们报名好的那开始我们本期的节目吧前几天 Google 的 Notebook LM 因为一个新功能又火了一把它可以将任何的文本内容转化成对谈类型的播客

并且效果还挺自然的但是暂时还不支持中文但是我感觉这个是迟早的事情了我感觉离我们硬底骸科事业又近了一步那我们今天也抓住这个难得的机会吧也聊聊要革我们命的 Notebook LM 吧我觉得一笑要不然先给我们介绍一下 Notebook LM 因为也不是说所有人都知道嘛

对,Low Book LM 它其实不是一个最近才出来的产品,它只是最近才走红了嘛,它其实是在很早,一年前吧,去年其实都已经上线了,但是这个产品其实做的还更早,应该在 22 年可能就已经开始在探索了,过去一年多时间,甚至近两年时间里面可能一直也是不温不火的。

和大多数 AI 产品的命运感觉差不多它其实一刚开始是 Google 的一个工程师自己探索的这样的一个产品它其实利用的是 Google 所谓的有 20%的业余自己探索项目的一个时间所以说就是一个 20%的时间产出的这样的一个项目

但是这个项目它早期在 Google 内部它其实起源是来自于另外一个研究型的一个项目那个项目可能大概是一个就是面向那种小型语调库的对话这样的一个项目因为我们和 Chat GPT 一起对话的话其实是面向整个大模型已经训练好的模型进行对话但我们其实最后发现大模型出来过后每个人都有自己的一个知识库或者说你企业里面的自己的

私有的这样的一些文档这些东西都可以被统称为一个小型的语调库对就是我们能不能借这样的一些语调库去做一些歌性化的去探索去对话对就是以这样的一个研究型的项目

所以说这个工程师可能就去做了一个叫 Low Book 的这样的一个产品其实从 Low Book 的这个名字其实也可以看得出来它本身就是一个做笔记面向笔记本这样的一个概念在这个点上和刚才 Sato 说的它因为播客爆火听上去其实没有半毛钱关系其实当我第一眼看到 Low Book ALM 这个名字的时候我根本想象不到它和播客能够结合起来至少从名字上

我的第一反应这玩意儿难道不是对着 notion 去做的事情吗当然大家都知道就是像这种面向个人知识库或者语料库的对话这种场景就是我们可以理解成一些典型的场景可能就是什么 chat with pdf 对吧还有个人知识库的搜索等等其实这一块在过去的一年里面竞争还是很激烈的

有各种这样的产品比较很知名的 pdf.ai 对吧当然这种太多太多了很多网站上都有一个 chipboard 干这种类似的事情还是我们回到最近 notebook lm 走红病毒式的开始去扩散出来

这件事其实核心对就是因为它加入了一个新的功能叫音频的 overview 对就是用音频帮你去做一个 summary 该要刚好就是这个功能可能就无意之中吧我觉得它就切中了播客这个场景所以说就被各大 KOL 开始传播开来完全就是病毒式的传播了对

所以说其实核心也是一个无意中切中了这样的一个场景那其实这儿我想简单的去分享一下就是 Google 它是一种什么样的一个基因其实 Google 还是非常典型的一个基数驱动型的一个

这样的一个基因了就他们的很多的项目可能在内部它的出发点就是为了技术研究觉得说我要去探索这样的一项技术比方像音频做播客这个技术在它内部其实很早都已经有了可能都已经做得还不错了对

但是他们并没有那样的一个想法说这个东西能用来解决什么样的一个实际的产品需求和问题对它的出发点不在这个地方就是他们的大多数项目并不是说像我们的思考一样从需求啊或者说问题出发它是典型的先研究技术对那

自己最终比如像这次 loadbook 把它应用到了这样一键状, 播客这样的一个地方的时候完全是一种机缘的巧合所以基于这个点, 其实 loadbook 的那个产品负责人他自己在对外的分享里面其实也有提到加这个功能当时也是觉得说要想给 loadbook LAM 去探索一个好玩的一个点出来恰好 Google 内部又存在这样的技术所以说就把它应用到这个地方上了

就做了音频 overview 的功能对就是今天大家看到的生成博客但是我觉得这里面其实有很多东西它确实是一种巧合比如过去的一年里面这个产品都没有火但是在今天它就是突然就火了对所以这里面其实它也有运气的成分对吧当然运气的背后还是实力的积累对再回到 Notebook 的 team 其实我们还是很感兴趣的这个 team 其实真的很小很小

可能我们觉得说这个产品是来自于 Google 我们觉得在它背后可能有一个非常非常强大的团队对可能有很多人或者之类的其实并不是如此就像它刚开始只有一个人 20%的时间对吧但是它到今天为止可能也不到 10 个人可能就 8 个人的样子对其实它在起初的阶段有很长一段时间应该就是三个人就和我们今天一样对所以说其实有很多爆红的产品或者优秀的产品

以我今天的理解可能真的并不是说一定要大厂里面需要一个大的团队可能真的就是几个人就可以干出一个还不错的一个优秀的产品吧

看来 Google 的这个 20%还是出东西的我们上期不是聊那个 Atlasia 然后他们每个季度也有一个 Hackathon 所以说我感觉这个模式还是有点用的就是看公司能不能把这个事用得好那当然我们也不知道说 Notebook IOM 这个项目它能持续多久然后未来 Google 会不会给它再投有更大的一些力气然后持续来做

我相信你们也可能也体验过 Notebook LM 了我不知道你们有什么感受假如说未来真的有很多 AI 博客的话你们会不会去听对 Google 看项目属于传统也不知道它这个能活多久对其实刚刚一下也讲了 Notebook 并不是专门用来文字转博客的但就这个使用场景传播的特别广泛但实际上人家其实也不能叫博客就是音频的盖栏

但他确实这个转出来的音频很惊艳啊就语气语调什么的都非常真实

但我不知道你们怎么感觉我总觉得听多了还是会有不真实感冒出来也可能就是我有预设的立场知道这两个声音是不真实的你可能一开始听的时候觉得他们是真人但是你听多了老听这两个声音你就会觉得下意识地知道他们不是真人然后我就会听的时候就觉得说有的时候会感觉他们在说相声而且彭根的特别努力精神饱满就说 No way

就来这种特别强烈的语气词当然我觉得这个可能也是故意调试成这样的因为他想要抓住听的人的注意力然后又有的时候又觉得他没那么激动的时候又觉得缺少变化没有惊喜感不知道是不是因为预设立场在

而且说实话它其实作为音频盖栏来说确实也无所谓这个惊喜感不惊喜感的稍微有点鸡蛋里挑骨头那从这个 notebook 本身它的这个主要的目的啊因为它的目的是 research 嘛对吧它是从深入学习的角度去做的这个产品

那从深入学习的角度我其实还是比较喜欢阅读文字因为阅读的话你比较容易自己把握节奏嘛你想比如说我中间停下来思考啊或者说查点关联的这个资料啊去问一下 AI 一个相关的问题啊就阅读文字都会比较方便但音频的话你就得去暂停

然后你如果要就是想不起来前面的东西你要回听你还得导回去就不太方便会打断你的思考所以我理解这个转音频的功能在 notebook 里面只是用来出个概览对吧为什么它是一个音频概览它就是为了只是为了出个概览

我觉得这个盖揽场景呢对我来说确实相对来说是挺合适的当你手里有个很长的 PDF 在下决心去深入研究之前能用顺便一听这样的这种低心智负担的方式去做个先行的了解确实就比较舒服

只可惜现在这个转音频的功能它只支持英语对吧那像我这样的渣渣听力听这个就反而要全神贯注就起不到这个降低心智负担的作用你问说未来会不会听 AI 播客我觉得对于 AI 音频那种我个人态度是分场景的就对于那种带有双向沟通性质的我是非常不喜欢 AI 音频的

像现在那种推销电话也有一些调研和回访电话其实是由 AI 打的会有一种强烈的不被尊重的感觉虽然我的时间也不值钱但你就拿这个来浪费我的时间是吧人与人之间的尊重在哪而且他们也没拿我当人我感觉我就是一个接口

我就是一个接口被人拿 AI call 一下然后拿个 response 就这种感觉你知道吧那我肯定不干对吧所以现在我遇到 AI 电话我都是直接挂就是给对方一个 404 但凡我说话回应了我就觉得我输了我就我居然没有认出来这是给 AI 给了他一个 200 但是对那种单向提供资讯类的我倒是不抵触只要听感好就 OK 以前那种合成音确实听感不好现在 AI 生成的这个听感就非常自然我就不是很抵触了

我是从来不接电话的任何人给我打个电话只要没有名字我根本都不会接他的不管他是我根本不管他是谁打的对完全不会给机会因为现在垃圾电话确实实在是太多太多了一接起来要么就是给你推销保险的要么就是给你放贷款的对吧你说到这个点必须得扯个段子刚才龟龟讲的事可能是被

那种不受尊重给你 AI 给你打来是吧对你没有吸引力但其实现在有很多卖保险的电话打给你是非常有吸引力的对我之前无意中接了一个电话一接通过后第一句话那边的人他可能不是问你要不要保险或者之类的相关的信息他是直接一上来都把你一通骂就他会骂你哈哈哈哈

你知道他骂你啥吗他说当然他的骂不是骂脏话他就会用非常严肃的语气说你这个人怎么这个样子你的那个保险快到期了你不知道吗他说马上都要过期了给你打了好多电话你都不接电话他说我都为你着急反正就是这个样子把你一通数落对数落完了才发现刚开始接到的时候你肯定是懵逼的觉得说我好像有一个什么真的难道我因为你自己肯定买到保险都觉得

反正我真的有个保险没有缴怎么怎么样的你可能就慌了对然后接下来就会认真的去接受他开始给你一些 PV 一些乱七八糟的东西对我觉得现在的套路真的是很深的现在这些推销的电话你说不被尊重吗其实他还把你看得挺重的像这种还精心编排了这么多的剧情对

来好像来对待你对我觉得现在这种方式也是有了回到播客这件事情上回到 AI 回到播客很多人其实都知道其实我自己是不怎么听播客的对所以说我还是更喜欢文字型的消费这个和刚才龟龟提到的那一点是几乎是一样的对也不是说我完全就不听除非就是碰到一集特别好的比如那里面可能他们

他们访谈的那个人啊或者说访谈的那个那家公司啊或者什么我特别感兴趣这种我才会去听一下相对来说就比较少我可能不会像很多人一样每天出门都挂着一个耳机然后上面就是在听播歌可能听了很多比如有托克秀的呀或者

其他的一些陪伴型的一些包括这种我几乎不听对我听的其实还是以资讯或者给我输入一些刚过的这样的一些节目对关于听这件事和读这件事我一直是坚持听比读要慢的

当然我说的这个慢它不是说是时间的消耗上或者说效率上面对因为听它其实是一种被动接收的行为就是别人强制的灌输给你对其实这个节奏就像刚才规规提到的这个节奏你自己无法去掌控无法去把握但是读的话完全就是一个主动行为了我可以主动的去控制一切

所以这个东西对我来说我想去了解资讯也好想去探索一些知识或者信息也好因为主动权在你的手上这种节奏好把握我觉得这种方式我个人是非常更喜欢的相对于说听来说我不希望被强制灌输然后节奏把控不了不太舒服当然回到 AI 播客这件事情上的话我自己是完全没有歧视的对

我觉得你那个声音调得怪一点或者说调得好听一点优美一点这件事其实我不是很反感就像我自己我自己的普通话声音各种它也不好对吧有些人喜欢有些人不喜欢我觉得这个都是很正常的所以我自己对 AI 播客的音色

怎么样这件事其实我不太 care 我重点还是关注的是内容那个内容如果真的是好的那我其实是同样接受的所以说我是对这个东西没有歧视然后反倒就有很多的 AI 的声音其实我也平时会听到不管你是在视频里面的或者啥的其实有时候我听到那种有一些 AI 调出来的声音其实有时候我觉得配上那种搞笑的场景其实也还行我觉得还可以还挺能接受的对

其实 Notebook.com 刚火的时候在推特上面有一个非常火的一个帖子那个帖子的发布人叫 Andrew Cappasi 然后他是之前特斯拉 AI 团队的负责人然后还是 OpenAI Funding Team 的成员他就发了个帖子他说他用两个小时的时间做了十期世界未解之谜的博客

然后里面就有一些比如说古代的那个巴格达电池就是在巴格达发现了一个装置那个装置很像电池然后他就讲那个电池是怎么回事就类似于这样的就是各种各样的世界未解之谜就把它发布在了 Spotify 上面然后我今天因为做这期节目然后又回看了一下 Spotify 发现它的整体评价有 4.5 分

然后我就说这个 AI 播客还有 4.5 分我看了一下我们我们才 4.4 分这个怎么办总分 5 分吧对吧

对所以说这其实刚好应征了我前面说的看来大多数人对 AI 调出来的音色也好这件事其实大家确实不抵触的至少就像我是完全能够接纳的我一点抵触都没的就是我觉得世界未解之谜这个主题我觉得他选的真的就很好这个主题至少也是在我很喜欢的这样的一个范畴内的不可能会

也愿意花很多的时间去了解一下去听一听或者之类的就是真正好的内容我觉得它的形式或者说传播的渠道可能真的就没那么重要的你是用文字可能很多人也爱读是书籍或者说你是播客有些人也喜欢可能在车上听一听或者之类的那

另外一个方面我觉得从另外一个方面来这刚好也应征了 Low Book LRM 博客生成的能力确实就很优秀对吧因为我觉得 Low Book LRM 它的生成博客它其实分成两个很关键的部分往往我们只会去关注 TTS 这个部分

当然 TTS 这个部分肯定很重要因为 Lobok M 他们的团队对外去透露也提到了他们去做音频 overview 的时候去训练 TTS 的合成这一块其实本身也是接近了播客里面大家去聊天的这样的一个语速或者说音色这种节奏感所以它调出来你就会觉得它很达到播客这种效果它本身就是接近了播客这种场景去做的这件事儿

但其实比如像我去做世界未解之谜其实除了最后合成 TTS 以外在这个之前你怎么能够在语料库里面去把握那些关键的知识点能够去把它梳理成一个我哪怕是读了世界未解之谜假设这是一本书我读了这本书我怎么把它转述通过播客讲给大家听讲得更有趣更有故事性

拆解的更好就这件事它本身是一个语言模型的事情对所以这件事情其实是至关重要你只有把这件事情做得很好它最后 TTS 合成声音又合成得很好那这个事它就才能够成了对所以说我就说 Notebook 可能在做这件事情它确实很优秀已经至少超越了很多人的这样的一个期望的水平今天的期望吧至少对我们来说我觉得作为 AI 的从业者来说的话

这种行业的进步那我们肯定是应该为他们鼓掌对吧那技术的更迭进步那未来肯定也会给不管是独立开发者也好还是给那些想创业的或者都会带来更多的一些新的机会我觉得对我觉得你们两个刚才都有提过就是我们现在在看视频的时候尤其你可能去刷抖音我们已经有很大一部分比例的内容就它的文本就是通过 TTS 念出来的

而且我感觉大家现在已经习惯了毕竟量太大了就是可能我不知道具体的百分比但是我感觉已经有相当比例的内容就是可能完全都是用 TTS 读的你们会觉得说 Notebook IOM 的这个技术会把这个趋势延续到我们在播客里面吗或者说播客会出现越来越多的内容是通过 TTS 念出来的吗嗯

你要说大家听习惯这个 TTS 我觉得我是反而有点反胃了因为抖音里面说实话基本上 90%可能都是 TTS 的

而且全是那几个声音你一听就是这个短视频里面冒出来的是皇上然后孙悟空的声音对吧天天都是这个我一听到这个我就很烦躁特别是很多人不管讲的内容是什么他都给你拿个孙悟空的配音往上套我是真的有点受不了对啊这样是就是有人拿这个孙猴子这个语音生成一期播客我是绝对不会去听的

除非他讲的是唐僧在女儿国和蜘蛛洞的八卦我听一下这个开个玩笑但是播客领域的话我觉得那种陪伴型的播客用 TTS 可能是不太合适的比如上线协议聊天会那种对吧其实大家要讲一个临场反应什么的我觉得这个大家应该都会同意但相对偏干货的播客呢

我不知道我一开始也觉得说 TTS 不合适为啥我前面不是也表达了我对这种双向沟通性质的 AI 语音特别反感吗但播客虽然感觉上是在单向输出啊我又觉得听众和主播其实还是有一种在神交的关系那你想一下你想象一下假设你听了很长时间的一档播客节目主播忽然把自己换成了他自己的 TTS 合成语音你会不会有一种被背叛了的感觉

反正我觉得我好像会有一点啊就咱俩已经不是一个物种了没法深交了物种隔离了这种但换一个场景呢又觉得似乎没有问题就比如说有一档播客节目从第一天开始就是一个 TTS 数字人在当主播那我又觉得没问题了对吧虚拟主播嘛这也很正常就有点微妙而且实际上今天的 TTS 啊在你预先不知道的情况下其实很难听出来是不是真人

对吧那像孙悟空这种声音你肯定一听就知道不是真人但是如果是主播自己做的这个他自己的这个数字人可能你很难听出来是不是真人只要语气一定要到位那是不是只要你没听出来你就不会觉得被背叛你会不会觉得不舒服完全取决于你知不知道真相

以后说这个播客主播塌房了是因为他被扒出来居然用 TTS 合成自己这个听起来也有点荒谬但是其实和我自己的好恶无关 TTS 被应用到播客领域实际上是已经在发生那件事情

当然了这个问题我的答案肯定是肯定的就像我前面说的因为我对 AI 这件事是完全不抵触的当然我其实这点还是想分开讲一下播客它其实还是分很多类型的像脱口秀这种访谈读书资讯简报对吧

那里面肯定有一些我觉得是非常合适用 AI 来做的对就是说 AI 它可能今天没办法帮我们去做所有的博客但是这里面还是有些合适的所以说我觉得在探索相关的人和探索 AI 博客的人完全可以在这种类型的博客上多去做一些事情对

它比较像资讯简报这件事我觉得真的是非常非常合适用大模型用 TTS AI 来生成的因为我觉得现在你说你每天花那么多时间去录一期资讯简报就不是很没有价值吗浪费了你自己的时间对吧因为做资讯简报这件事我觉得完全可以做得极致一点

其实我自己有想过如果我们英地海克是一个流通类的节目的话那我肯定就用 AI 来做了我们把它全流程做到完全的自动化然后后台有机器人每天到互联网上去把新闻找一些

反正你把它做到极致然后自己再把它改写转述成生成播客是吧自己啥都不用管本事天天啃吃啃吃的涨那还挺有意思这个可能是想的多了所以我觉得还是这样做 lose letter 来的可能这个几乎是共识对吧但是其实还有一类我是真的想过的就是像那种

我昨天还在和别人去聊像读书类的合不合适用 AI 来做其实我们最后的共识是觉得读书分享类的用 AI 来做真的很好因为今天有很多在小宇宙上也好或者其他的平台也好其实有很多读书分享类的播客节目其实非常多就像最著名的就是纵横世海

对吧他们可能都讲得很好特别是像《纵横四海》可能就讲得特别特别的好对吧他们里面可能经常有一些自己的经历的分享啊就穿插在书里面对所以我觉得做读书分享的它可能不光光是一个读后感它可能是结合自己个人的一些经历故事还有你自己包括一些历史上的一些事件或者说还有一些引进据点的等等等等最后把这本书融会贯通了讲给

听众听这件事听上去其实很复杂但是反过来想其实 AI 特别擅长做这件事因为你说讲故事可能 AI 的讲故事能力我觉得比我们可能都强他可能知道全世界很多很多的案例对我们可能才知道多少案例我们根本不知道多少案例他引进据点可能对历史上的一些引进据点的这些能力可能也比我们强

对就完全我觉得往下面发展可能就是他读完一本书然后用他知道的一些故事引进据点的方式把它拆解成播告我觉得这件事是特别合适做的一件事情对

而不是说一个人去讲一本书因为人局限性还是太大了你的知识容量是有限的我觉得就是这是关于读书类的但我也讲一下那个访谈类的我觉得这个东西是真的不行就是我其实认真想说哪些是好做的哪些是完全不行的

我觉得访谈播客是真的不行这个不行的角度其实我觉得主要是两点第一我觉得多数的嘉宾其实在被访谈的时候都是临场发挥的对吧就像我们自己别人访他们自己其实聊聊故事也好或者其实很多很多的话题都是临场发挥的你不可能说给嘉宾认一个说你写个文字稿给我那这个东西对嘉宾的压力太大了对时间成本各方面对

还有一点就是我觉得很多大脑型的嘉宾他们其实是爱惜自己的羽毛的嘛对吧肯定不能接受说你用 AI 来克隆我的声音然后让我去录一档节目至少我是不行的我觉得说如果有一档播客节目说你邀请我做嘉宾然后说我用 AI 来克隆你的声音做一个你你也不需要来现场录了就是这件事我其实仔细想了想我自己不能接受对

我觉得很奇怪我不知道就你们能不能接受所以说我觉得很多人应该都是爱惜自己的羽毛觉得说反正不太行我也接受不了主要是现在的技术可能达不到非常的自然再加上那个内容的话你用 AI 客轮玩我之后其实我自己还要再去审稿其实这个时间成本还不如我自己再说一遍的

关键是如果克隆你的这个 AI 真的能替代你了你不觉得更加冒犯吗对就是很奇怪对就是你做个主播他其实是感觉很自然的就像刚才贵贵讲的我做一个虚拟主播但是你说嘉宾把嘉宾给克隆了这件事就是怎么想就是奇怪的对

就站在嘉宾的角度下我觉得这个事确实是有点奇怪的对然后你看我们 Podwise 其实是播客领域里边的一个消费端的一个生产力工具对然后 Notebook LM 其实是一个生产端的这个生产力工具对那这个工具如果在未来被大量使用过后当然现在已经在使用了如果未来被大量采用过后你们觉得说这个东西对播客这个市场会有什么样的影响或者是整个产业

我觉得生产力提高肯定是会带来更多内容的产出

但我觉得对播客产业的影响不是颠覆式的有些人可能觉得这个东西太牛逼了可能是颠覆式的我个人不觉得首先一个现在 Notebook 本身我感觉还不能直接就当成生产播客的工具流来用因为它没法定制音频生成的意图从现在的功能上它就只是说把功能封装成了音频盖蓝的这样的一个功能但是背后的技术能力肯定是能做到的

我能想到两种博客生产方式在我的想象中一种是创作者自己写好竹子稿然后用 TTS 产生音频这种就只有 TTS 那这种可以确保你自己想表达的都表达了但可能在生产效率上的提高就比较有限虽然你不用录不用剪了但最花时间的其实就是你的竹子稿对吧

如果你追求质量,你可能还要花时间去微调每一个地方的语气然后去回听,可能还要再调整,然后重复去生成几遍其实我感觉效率上提高的不多另外一种就有点像 notebook 这样准备好一堆的背景资料然后你可能说我通过提示词直接去生成音频然后也可以拆解成说我通过提示词生成文本之后

再去 TTS 两步当然还是同样的问题就是如果你追求输出质量特别是你追求你的个人表达你少不了需要去做这个回听和调整而且这第二种方式我觉得可能就比较难体现主播自己的个性

因为大部分的内容其实是 RAM 去帮你生成出来的嘛那这种第二种呢其实刚刚一下也提到过对吧对于那种拆书类博客包括其实还有那种研究 case 的这种博客我觉得觉得很合适典型的像综合四海或者说快二的对吧他去研究公司的这种就比较合适

另一个更大的问题找人对谈的或者说多人讨论的这种节目显然是做不了但这类节目我自己的体感上可能也是因为跟我听的有关系我觉得它应该占了博客的半壁江山吧一半全是这种跟人对谈的节目你总不能说我拿个 AI 去和嘉宾对谈吧克隆嘉宾肯定是不现实那我自己拿个 AI 去跟嘉宾对谈我也有点太不尊重这个嘉宾了吧我凭什么但是说到这个呢我脑子里又有个画面啊我又觉得是相反的但又完全有可能

发生的就比如说我真的做出一个现象级的特别火的虚拟 AI 主持人

我觉得起码在一段时间里面应该会有茫茫多的嘉宾想排队上这个节目和这个 AI 对谈因为它也是流量嘛就还挺矛盾的但是说实话比起播客领域大家是不是都忘了 Notebook.am 本质上其实是个 chat with PDF 的应用最慌的不应该是 pdf.ai 吗结果大家今天都在聊这个播客到底怎么怎么样对因为它一开始确实是一个 chat with PDF 对但是其实没火

证明这个赛道本身不是一个特别大的赛道对大家转过头来发现哎你竟然有生成播客的内容这个功能有意思对吧一下给传播开了对我觉得也是挺意外的就跟一笑一开始介绍的对吧就其实他一开始想做的事情并没有火但后来出了这个功能之后就一下相当于二次火了对

我就想到你看你们两个都在讲说像这个播客的内容啊比如说像对谈啊我觉得这部分内容可能暂时就替代不了但是像那种拆书类的然后研究公司类的像这种播客的话假如啊真的未来这种很多的播客被 notebook lm 这种东西要去生成的话对那像我们这样的播客创作者比如像宗森四海像 acquired 的然后他们要怎么去面对呢他们要怎么去争取更多的听众呢

他们的创作方向要不要调整再一个就是说是不是说他们只能加点自己的故事加点自己的八卦之类的然后对吧加点情绪价值然后把这个事给他导过来嗯

我觉得最积极的这个自处方式当然就是去学习去思考你怎么用这个工具对吧去适应用这个工具的工作方式如何争取听众以及创作方向的调整我觉得它不会因为工具而改变虽然在追热点的时候大家可能会被形式暂时吸引但最终还是要回归到这个价值上面不管是情趣价值或者内容价值

那比如你的听众觉得说你是人有趣那我觉得你就继续 be real 就好了对吧如果一定要在那个 AI 赛道里去参与一下那你就想办法让你的这个 TTS 结果真假难辨但是你要真的做你自己你可能还是要自己去输出文本

然后那些比如说提供独特观点的节目那你肯定还是要自己去输出文本因为除非你真的能够把你自己那个 LIM 也训的跟你自己一样真假难辨上了 AI 手段其实最终还是要想办法把你这个人的个性投出来那创作方向的话就

就看吧对吧如果你的创作方向是提供不是这种说我陪伴性的 be real 的而是提供知识和资讯的那借助 AI 去更高效的整理和创作其实也不会影响你的创作方向哪怕你不真人出演来录制可能也影响不大反倒是硬在这种节目里面加梗和八卦可能就适得其反

而且实际上我也觉得说其实 AI 如果真的做得好的话你让 AI 去加故事加八卦你只要给他一定的提示他也做得到对吧 AI 也能给你情绪价值只不过这个情绪价值是不是你真正就是当下的反应不一定只是不够像你的自己的个性而已

新工具可能加剧了竞争但我觉得不至于说要去影响你的节目的调性你节目该是怎么样其实还是怎么样只不过你不要在竞争中因为不熟悉工具的分心去在效率上或者说在节目质量上落后了我觉得就可以了我感觉博客还是一个更加个性化的输出方式相对于一些别的途径来说我突然有个想法刚才说情绪架子这个点

其实我反倒觉得说你真的用播客去做一档单纯提供情绪价值的这样的播客说不定他真的是更擅长的就像今天不是大家都在做陪伴型的 AI 产品吗陪伴型的 AI 产品这个东西给它变成是一档陪伴型的 AI 播客比如说就像以前那种有那种晚上给你那种知心大姐姐给你讲点睡前故事可能就是这种就不就是陪伴型的对吧

那 AI 的话它其实每天可以有讲不完的东西觉得说今天晚上又给你讲点啥其实说不定你还有一种期待感觉得在睡前今天它会给我讲点啥毕竟它是个 AI 对吧你会觉得很有期待感

是吧每天晚上可能就去他他又会给我讲点什么我觉得这个还挺有意思的你这长期一听又奔着 28 去了还是回过头来说我们自己吧可以认真的给大家讲一点实话其实像我们这种大多数的中文播客他本身其实是不赚钱的嘛

就像我们自己播客本身他不赚钱的要知道大多数肠胃的尾部的都不赚钱但是我们主播们可能大家还是在继续保持更新这里面可能就像我们除了想要去获得一些流量想要获得一些宣传推广

这些之外的话对我们自己来说这也是一种保持输出的一种方式对因为输出其实是很重要的输出才能够出尽力去做更好的学习更好的去思考一件事情对吧

对我觉得这个东西其实是很重要对因为有的人他只学他不输出这种是在我身边是大有人在的对但我觉得一个人如果能够把自己的观点还有你积累的东西能够把它讲出来并且讲清楚这真的是一种能力所以说还是可以鼓励我们的听众朋友没事可以自己也录录节目去讲一下自己学习的一些东西我觉得这个还是

挺有帮助的然后最后我还有一个小小的观点不管你是创业还是像我们做播客这种做内容创作那你反正还是自己做自己擅长的事情是最好的嘛你去创作内容我觉得我们还是反正跟着自己的节奏去做自己觉得有价值的东西然后根据听众的反馈然后再在自己的主线上去调整我觉得这就是更好的对

你不可能说因为一个 AI 把你所有的节奏给打乱了对吧当然我们肯定是要去靠近 AI 的对因为 AI 能力才就像说的我们是不是可以用 AI 去做一个陪伴型的博客对吧用 AI 再去做一个资讯类的节目去做一个猜数类的节目我觉得这些都是可以探索的

对 我觉得依照刚才讲的 AI 陪伴的逻辑我昨天还是前天又刷到了一个 AI 陪伴女友她把 AI 女友已经放在手机里面内置了然后你可以随时跟她聊天然后聊完之后她还自动给你带表情的 TTS 然后直接讲出来对 就这个事跟你睡前聊因为睡前聊你其实只有声音你其实没有画面她其实直接连画面都给你有了对 她就在你的右边给你放一个手机

然后手机里面就有一个 AI 女友然后你想什么想说什么话干嘛的然后就直接可以跟她说这其实就是一种陪伴你说 AI 有没有陪伴能力对它就直接已经有了所以说我觉得这个也是我觉得你去输出一个陪伴型的播客感觉确实是没有任何问题的对 Notebook IOM 刚出来你看我们刚才有讲过那个安卓然后它就用两个小时然后做了 17 播客然后出来效果还可以再往前到 Sono 出来的时候

我就发现有一批人在用 sono 做那种 lo-fi music 就是那种比如说大家正在写代码干嘛的然后你可能会听一些背景音但那些背景音可能没有声音没有什么的它就是一堆音乐对然后可能让你很安静然后可能让你可以持续的去工作对就很多人去做这种 lo-fi music 然后他会把这个 lo-fi music 放到 spotify 或者放到 youtube 上面

对游戏放到 YouTube 上面然后他再配一个那种稍微动一点点的那种动画只要你去播放了他就会有收益就据我所知啊就 Sono 那边那一波去做这种 lo-fi music 是有些人通过做这个东西赚到了一些 YouTube 的一些广告分成的我不确定

我不确定会不会有人会通过 Notebook Fm 然后跟安卓一样他就冲进去然后一下子可能做了 100 档 200 档博客然后就靠这个东西赚了 Spotify 的广告费我不知道你们怎么想这个事我个人觉得跟音乐还是有点区别当然短期来看你追热点去产生一些广告收益我觉得是没问题的

中长期是播客的话这个流量肯定还是要回归内容价值音乐你刚刚提到他们生成的是 lo-fi 的这种 music 其实它就是旋律好听就行了歌词可能压根没有或者说我压根都没听进去就没那么有所谓但是你播客肯定不行你肯定是要听内容的其实你提到它在 YouTube 上播放的广告收入 Solo 其实还有一种收入方式就是 Solo 官方也一直在给创作者发钱

之前他们搞过一个叫 The Summer of Solo 的活动就是每个月按排行榜给音乐创作者发钱那这个排行榜是播放量啊然后点赞啊收藏啊的这个就是一个榜

第一名给一万刀然后这活动一直在办现在新活动不叫这个名字了但是就是还是在办第一名已经涨到了两万五千刀就是如果你每个月都能做一个榜首的歌的话确实也够你生活了哈哈哈哈对但整体金额还是不是特别高但播客呢总感觉就是和音乐还是有区别

不管是受众群体还是在生产难度上其实也挺有意思的在没有 AI 的时候可能播客生产难度相对更低因为你要去做音乐还是要相对特别专业但是播客没错人人都能录一段播客对吧

在纯 AI 的情况下反而反过来了是吧就是你生成一首歌的话你 solo 上写个提示词你就生成了但是播客你还是要想办法把内容去搞一个那听歌可以没有目的但听播客我觉得和找篇文章来看是一样的但是多少有点目的就是你需要它的内容对吧你不管去学习还是怎么样也好所以我感觉可以类比一下通过 AI 去生成文章然后走 SEO 占据搜索入口

在展示广告的这种方式但这个就有点不是特别通畅首先播客目前还不能被广泛的搜索当然现在其实大家也都在做嘛对吧搜播客内容这么一件事情但是这个肯定是要流量足够整个整体流量足够大的时候可能才比较好其次就是如果真的要走这条路的话那我为什么不直接去生成文章就算了明显这个文章这个盘子更大嘛对吧但其实你整个逻辑是一样的

对对这个问题其实我觉得和规规的看法其实差不多反正我就有一个另外一个角度一个很小的一个观点我觉得就是说你想靠流量去撞广告那你必须得要这个流量的池子要够大才行就是说你的收众比如音乐因为音乐的收众那是非常多的音乐也是没有国界的没有文化的接线几乎没有大家都能听对但是你的播客你中文播客

就像我们曾经说到文化界限这件事我就脑洞大开想过说我们能不能把中文播客给它再转成英文播客然后去出海让播客内容去出海你仔细想想这件事你会发现它根本都行不通就是因为有一个文化界限在这里面比如就像我们在播客里面聊的这些梗有翻译成英文老外他也听不懂啊

对不是说语言通了就通了对文化不通这件事它是很麻烦的对所以说音乐因为没有国界没有文化的界限所以说它这个词子太大了你随便做一段好听的选择可能全世界的人都喜欢听它对所以你去赚这个流量赚广告就很好

波克这个词子太小了我们先不谈国界文化边界这件事光是在中国里面这个波克的这个词子也就太小了所以说我觉得词子小了再去谈流量撞广告边线这件事我自己的话就觉得这个东西很难很难了对完全和音乐没法比了对对对我觉得你讲到这个池子的这个问题确实就是这种 love and music 有一个很大的一个优点就是它是可以循环听的

就跟现在喜马拉雅做的为什么比较好就是它波克其实没太做起来但是喜马拉雅掌握了一个巨大的一个流量池就是郭德纲

就是郭德纲的那个晚上的那个睡前的那个对吧睡前助眠的这个赛道对吧他是可以无限的重听的而且我前段时间在 YouTube 还是在哪里看到了一个郭德纲的那个就是他已经助眠住到了一种神乎其技的形态就是他助眠的时候他会写这个内容是没有唱的因为有时候郭德纲一唱他会很吵

他突然起一个高调很吵对然后他说这一段是没有唱的 30 分钟的这个相声听完之后然后会有大概另外 30 分钟的那种舒缓助眠的音乐对又是没有郭德纲的对然后我觉得这个

真的是助眠这个赛道简直太大了对为什么讲到这个就是 Lofi 的这个内容因为它可以持续不断的循环听那循环听的情况下其实它这个广告是可以持续不断的转的而且像我比如说我习惯了用一段 Lofi 音乐然后可能我去写代码也好工作也好干嘛的我可能就会记住这个东西然后我会持续不断的放对吧就跟我晚上不听郭德纲睡不着是一个道理没错对吧

对就是所以说这个事其实确实这个流量是可以无限循环而且可以越做越大的对但是播客这个事情

就我听一遍我再听第二遍我不太可能去对吧一个播客不断的喜欢听对他也不是郭德纲对吧这个事确实还是我觉得流量池子的这个大小还是挺不一样的对而且我现在还发现啊就是我们国内的这些硬币骇客嘛就是确实现在挺牛的对 notebook lm 不是才出来英文版出来没多久估计可能就两个礼拜过后吧我就发现有团队已经在做 notebook lm 的中文版了

我是听了一下他们的那个结果就我感觉现在他们的 TTS 没有 Notebook LM 那么到位毕竟 Google 可能去微调了很多 Notebook LM 的它的那个 TTS 的输出嘛对它就对于博客的这个输出可能更到位一些对我现在听他们的这个结果我感觉有点出戏对但是我相信可能未来的不久这个出戏的这件事可能就会被解决对但是我就想问你们的是你们觉得说这个赛道有搞头吗就是单纯生成中文博客这件事嗯

初期这个问题我觉得肯定是很快能解决反正 TTS 作为一个模型基础设施我们独立开发者就到时候看谁的好就用谁好了最后这个中文 TTS 不论是国内团队搞出来还是 GoogleMetaOpenAI 弄反正谁效果好我们就用谁就好了但是生成中文播客这个事说实话大家做播客都不赚钱谁给你去付这个钱对

这确实就是我的一个观点经常在思考的就是我们先不谈技术问题不管这个 TTS 难不难调的问题你做一个产品其实你到最后一定要去考虑商业化要货币化的能力你究竟行不行的通或者说这里面的潜力大不大一位中文的播客创作者服务的生产力工具究竟有多少主播会为你付费这个问题你是不得不考虑的你不能说

不思考这个问题就冲进去做你的产品对我觉得这个问题很重要我们就拿 low book lm 来说对中文的这些头部的播客来讲我估计他们很难会采用虽然说我们不是头部对但是我觉得头部来说不太会去使用

即使他支持中央我的意思是对我们首先去分析这些头部的播客究竟有多少类型是适合用 notebook lm 其实就很少然后我们再回到尾部的这些播客就像我们或者还比我们的更尾部的大家都不赚钱了对吧不赚钱那在为你生产的工具付费从何谈起对吧我们都知道一个道理反正最容易让生产者付费的工具

那肯定就是能够帮他赚到钱的工具这种是付费能力最强的一定的对吧对 是的就是看怎么样能够帮做播客的这个人赚钱对但是现阶段我们去做这个 Notebook AM 的中文版最底层的老苦大众做播客的人还没有赚钱呢然后你就想从大家身上再去掏点钱确实是有点难对对

现在除了这个 Notebook LM 中文版的这个方向然后我还看到已经有人怎么玩了就是他已经在用 Notebook LM 的英文版再加上 Hey Gene 开始做视频播客了假如说这个东西然后再加上 Sora 可灵这些让他去生成一些 AI 画面然后作为那种 B-Roll 对吧他讲到某一个东西的时候突然给你揣来一个图表对吧类似于这样子就是我感觉这种简单的这种视频播客这种场景就是已经完全可以被模仿了

甚至两个人完全不用出镜就是 A 跟 B 完全没关系夸一个视频播客已经做完了对就已经上线了对现在这种事已经完全可以做到了对就我觉得这两年确实变化太快了我估计啊不久的将来啊不会用 Cursor 的程序员跟不会用 Sora 的内容创作者就可能很快就会归为上一代的创作者时代的变化确实非常非常的快对

那我们本期反正也聊了很多关于 NodePro LM 相关的一些内容我觉得如果大家对于这方面 AI 生成内容感兴趣的话欢迎加入我们知识星球然后跟我们一起学习讨论好吧那我们本期我们就先到这里吧那我们下期再见好的拜拜拜拜

以上就是我们本期播客的全部内容感谢大家收听也欢迎大家踊跃留言如果你喜欢我们欢迎点赞并分享给感兴趣的朋友如果你在用苹果播客收听也希望你花几秒钟给我们一个好评这会让更多的人了解到我们要是能再点击一下订阅那就再好不过了我们下周见