We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode EP 519: NotebookLM Updates - Thinking model and 50+ languages. What you need to know.

EP 519: NotebookLM Updates - Thinking model and 50+ languages. What you need to know.

2025/5/6
logo of podcast Everyday AI Podcast – An AI and ChatGPT Podcast

Everyday AI Podcast – An AI and ChatGPT Podcast

AI Deep Dive Transcript
People
J
Jordan Wilson
一位经验丰富的数字策略专家和《Everyday AI》播客的主持人,专注于帮助普通人通过 AI 提升职业生涯。
Topics
我,Jordan Wilson,在本期节目中讨论了Google的Notebook LM的两个主要更新。首先,Notebook LM现在由Gemini 2.5 Flash模型驱动,这是一个强大的“思维模型”,能够进行更复杂的推理和思考。其次,Notebook LM的音频概述功能现在支持50多种语言,这使得该工具对全球用户更具吸引力。 在演示中,我展示了如何使用Notebook LM进行深度研究,并利用其新的思维模型功能来分析IBM Watson X平台的更新。我输入了来自多个来源的数据,包括Perplexity、Grok和Google Gemini的深度研究结果。Notebook LM能够有效地处理这些信息,并根据我的要求生成总结和分析。 我还展示了Notebook LM的其他新功能,例如思维导图和改进的源发现功能。思维导图功能可以帮助用户可视化地组织和理解大量信息,而改进的源发现功能则使得添加新来源更加便捷。 总而言之,Notebook LM的更新使其成为一个功能更强大、更易于使用的AI工具。Gemini 2.5 Flash模型的加入显著提升了其推理和思考能力,而多语言支持则扩展了其用户群体。这些新功能使得Notebook LM在深度研究、信息组织和学习新知识方面都具有显著的优势。

Deep Dive

Shownotes Transcript

这是 Everyday AI Show,一个每天播出的播客,我们简化 AI 并将其力量带到您的指尖。每天收听,获取提升您的职业、业务和日常生活的实用建议。一个对每个人都可用且免费的最强大的 AI 工具已经以两种非常大的方式进行了更新。

我说的是 Notebook LM,它正是我们 2024 年 AI 工具奖的获得者。因此,这个模型或这个功能(我想)来自 Google,非常强大。我认为值得重新审视,主要是因为有两个重大更新。

也就是说,Google 更新了现在运行 Notebook LM 的 Gemini 模型,并且使极其流行且有时会病毒式传播的音频概述多语言化。因此,我们今天将在 Everyday AI 上回顾这些更新以及更多内容。

大家好!我的名字是 Jordan Wilson,欢迎来到 Everyday AI。这是您的每日直播播客和免费每日新闻通讯,帮助我们所有人不仅学习 AI,而且学习如何实际利用它并用它来发展我们的公司和职业。所以如果这听起来像,哟,这正是我想做的。

您来对地方了,也许您一直都在听,也许是您第一次听,如果这是您第一次听,我们每天(至少)周一到周五都会进行直播,美国中部标准时间上午 7:30 开始,所以向我们的直播观众致敬,

呃,我喜欢说的一件事是,它是人工智能中最真实的事情。您可能看到的、读到的或在 YouTube 上观看的某些教程中的许多内容都是预先制作好的,对吧?它非常精致,经过精心编辑。所以在今天的节目中,我将进行现场直播。呃,所以,呃,

无论如何,我需要为我在波士顿正在进行的一个项目使用 Notebook LM,所以我认为,还有什么比在我完成所有操作时向您介绍这些新更新更好的方法呢?好吧,感谢您的收听,如果您还没有,请访问 youreverydayai.com,我们在那里会提供今天的每日新闻,我们只会把它放在那里,我希望这一集不要

太长了,但您也可以获得今天播客/直播的重点内容。如果您听到一些内容,也许您正在椭圆机上锻炼或在家做三件事,只是在后台听着我,您会想,等等,Jordan 关于那个新功能说了什么?好吧,所有这些都将在我们的新闻通讯中。因此,请务必访问 youreverydayai.com 查看。

好的。有趣的是,我今天实际上正在和某人交谈。如果您正在观看直播和播客观众,我现在在波士顿。这是其中之一。您可能想查看您的节目说明并观看此视频。它更直观一些,但我将逐步介绍。无论如何,我今天在波士顿与某人进行了交谈。就像,“嘿,你明天的节目是什么?”我说,

我不知道。它总是很有趣,但有时也很可怕。但我将缰绳交给我们的新闻通讯观众,并说:“你们想听更多什么?”本周,过去一周宣布了许多我认为可以成为精彩剧集的新事物。所以我问了你们在我们的新闻通讯中。所以这是您应该注册并阅读它的另一个原因。

但我说道,“嘿,你知道,OpenAI 和 ChatGPT 发布了他们的新购物功能。Claude 有许多新的、非常强大的企业集成,例如 Zapier。然后我说,Notebook LM 有些我们尚未介绍的非常酷的更新。我说,你想听什么?你们选择了 Notebook LM。没有什么比我每天都不知道我要做什么几个小时,然后把它交给你们更好了。但是,你知道,我的笑话是我为你们所有人工作,但它是免费的。所以,好吧。

好了,闲话少说。让我们深入探讨一下有什么新内容。实际上,如果您不介意的话,我将按顺序进行。去年,我们现在可以稍微疯狂一下吗?也许。所以我现在实际上要做的是

呃,并且,并且,并且希望,呃,你们可以看到,呃,我的屏幕在这里。呃,我将开始进行一些深入的研究。好的。所以,呃,让我首先,在我们甚至进入新内容之前,因为我不希望这花费太长时间。我将在后台进行一些深入的研究。并且,呃,就像我告诉你们所有人一样,呃,我在这里,呃,在 IBM Think 上,呃,IBM 的会议上。所以,呃,非常,呃,很高兴能与 IBM 合作,并且,呃,

让我这样说。我显然关注所有大型科技公司所做的一切,但我是一家小型企业,所以我不会持续使用 IBM 的产品和服务。对。我们与一些使用 IBM 产品和服务的客户进行咨询,多年来,我在这个节目中邀请了许多优秀的 IBM 嘉宾,但我总是需要进行研究。对。所以这是一些,你知道,无论是会议,

播客剧集,我都一直使用 Notebook LM。我通常从进行多次深入研究开始。所以我将把这些内容在后台运行,但我希望向你们所有人展示,这是现场直播,这是工作。

无论如何,我都会这样做。所以我说道,“嘿,我很高兴你们投票选择观看 Notebook LM,因为无论如何我都需要为明天的会议做这项工作。”我很兴奋。或者对不起,主题演讲今天举行。所以我对此感到兴奋,无论如何我都需要这样做。

所以我将要做的是,我有一个非常简单的提示。我将立即将其投入多个深度研究产品中。这里没有什么疯狂的事情。所以我四处跳跃。我使用 Perplexity 深度研究。我使用 Google Gemini 的深度研究。我使用,让我这样做。

呃,我想,我想就是这样了。所以,呃,我知道对于,呃,Google Gemini 的深度研究,我必须单击“开始研究”,呃,对于 ChatGPT 版本,这非常好。嗯,

哦,但我没有正确操作。呃,对于他们的深度研究版本,我必须回答一些问题。所以我至少会向您介绍一下。然后我们将讨论 Notebook LM 中的新内容。然后我们将返回并使用它来向您展示这些新功能。因为就像,我可以向您展示这些要点,但您不妨看看,呃,希望看到一些实际的好处。所以首先,嗯,

ChatGPT 是唯一一个问我问题的人。所以,本质上,我在这个提示中说的是,请按月给我一份 IBM 的 Watson X 和 Watson AI 更新的逐月细分,从 2024 年 1 月开始,到 2025 年 5 月结束。

请慢慢研究,一步一步来,所有我通常都会做的好事。所以我必须回答 ChatGPT 的这些问题。它说只有 IBM 的官方产品更新和功能公告,或者第三方。所以我只会说两者。通常我会仔细检查并完成一个过程,但我正在现场直播。所以,

我会快速进行。第二个问题是,我是否应该包含 Watson X 治理和 Watson、Watson X 数据更新,还是只包含 Watson X AI?所以我只会说全部。然后第三个问题是,您是否希望更新包含技术细节、模型更改、API 改进,还是只包含高级摘要?所以对于这一点,我会说主要是摘要,但也有一些技术细节。让我们这样做。好的。完美。所以什么,

现在我们已经完成了这项工作,并且我们的深度研究人员正在进行研究,让我们来谈谈 Notebook LM 中的新内容。我告诉过你们两件事。第一,我们有新的 Gemini 2.5 Flash 模型,它现在是一个思考和推理模型,为 Notebook LM 提供动力。然后我们还有 Flash。

50 多种新语言,音频概述可以使用。好的,让我们首先回顾一下音频概述更新。正如我所说,现在有 50 多种受支持的语言,使用户能够听到用多种语言生成的 AI 文档摘要,而不仅仅是英语,这只是它最初可用的语言。

考虑到 Google 的用户群,这是一个相当大的技术进步,对吧?他们在世界各地都有用户。所以,我认为这真的拓宽了谁可以使用这个工具的范围,对吧?因为我认为很多人……

最初被 Notebook LM 吸引,对吧?它已经存在很长时间了,但我认为人们并没有真正开始关注它,这很遗憾,因为即使在 AI 音频概述之前(顺便说一句,这是一个很棒的功能),它也是一款革命性的 AI 产品。但我认为很多人直到音频概述才开始关注 Notebook LM,这些概述是某种 AI 深度潜水播客,其中两位 AI 主持人就您上传的文档进行对话。所以,你知道,世界各地的许多人都说,“嘿,

就像,“嘿,我的语言呢?”所以 Notebook LM 和 Google 团队一直在推出许多很棒的生活质量更新,但他们说这也是其中最大的更新之一,以及 iOS 和 Android 应用,我相信这两个应用都即将推出。还没有,但有一个注册这些应用的选项,但音频概述和 50 种新语言现在已经推出。所以有

选择您首选的语言非常容易,并且有很多选择,呃,你知道,一些在全球广泛使用的流行语言,如西班牙语、普通话、印地语、德语等等。同样重要的是要注意,Notebook LM 仍在试验阶段,呃,但现在它将吸引更多人,所以

你知道,我一直关注 Twitter 和 Google 博客上的对话。所以,你知道,Google 说,“是的,有一些错误。我们正在解决这个问题”,并且他们在英语中已经有更多时间来解决这个问题。但我认为此举现在使 Google 领先于许多竞争对手,因为他们没有提供如此广泛的选择。

语言支持,不仅仅是音频摘要,而且是一般意义上的支持。对。当我们谈论大型语言模型的未来时,它是多模态的。许多大型参与者现在并不支持 50 种语言。

因此,Google 也在表明多模态 AI 不仅仅是锦上添花,它是一种必需品。所以那里相当令人兴奋的更新。当我们现场进行此操作时,我将向您展示如何选择不同的输出语言,我们也将对其进行测试。我还没有测试过这个。

所以我们将现场直播。有时我喜欢现场直播这些事情,并且,你知道,我可以找出或对不起,与你们所有人一起学习。所以,是的,这些都没有经过编辑或编写脚本等等。好的。下一个。

Google 忙到什么程度,以至于这甚至没有出现在他们的博客文章中?他们的另一个重大更新是更新了实际运行 Notebook LM 的模型,这是一件非常重要的事情。因此,Notebook LM 的推文说:“我们这周很忙。忙到我们忘记提到 Notebook LM 现在正式由 Gemini 2.5 Flash 提供支持。”

2.5 模型是思考模型,因此您应该开始看到更全面的答案,特别是对于复杂的多步骤推理问题。这是巨大的。

好的。这是巨大的。让我们开始吧。为什么?好吧,如果您不每天关注大型语言模型的更新,像我一样,也许您更喜欢偶尔收听这个播客。这是大事。所谓的“老式”Transformer 模型和所谓的“新型”推理或思考模型之间的差距很大。你知道,这些新的思考或

或推理、提前计划的模型。这几乎就像他们使用这种思维链推理一样,通常情况下,“经验丰富的”提示工程师仍然可以从大型语言模型中挤出这种“汁液”,但您必须非常有经验。您必须知道自己在做什么,并且真正投入时间才能从大型语言模型中获得最佳或最多结果。但这些思考模型大不相同,对吧?他们提前计划。他们思考,他们

他们推理,你知道,阅读思维链或总结的思维链非常有趣,你知道,看看这些模型是如何思考的。你知道,这真的很令人兴奋,有时也很可怕,因为你会看到一个模型自己开始走 A 路径,然后

然后意识到 A 路径可能会有死胡同,哦,我实际上需要一个分叉,我需要创建一个 B 路径、C 路径,我可能需要后退几步。所以,如果您像我一样是书呆子,并且阅读思维链或总结的思维链,您可以学到很多东西。它可以帮助您编写更好的提示。它可以帮助您更好地使用这些模型。但现在 Notebook LM 由 Gemini 2.5 Flash 中的思考模型提供支持,这是一件大事。

不要让 Flash 这个名称迷惑你,对吧?因为,你知道,我会说,当 Flash 系列首次推出时,人们真的认为这是,你知道,“哦,这是 Google 的廉价快速模型”。是的,它是。但是 Gemini 2.5 Flash,如果您查看不同的基准测试,在某些基准测试中,它是前五名的基准测试。

模型,Flash,所谓的 Flash,那个应该,哦,这是小型廉价模型,对吧?如果您在后端使用 API,它非常强大。我会说它是世界上最令人印象深刻的模型之一,原因如下:第一,

它的速度有多快。如果您将其用作后端开发人员,那么就性价比而言,它非常实惠。因此,如果您在 Notebook LM、Google Gemini 或 AI Studio 中使用它,您无需支付实际使用费用。呃,对。但在此之前,Notebook LM 运行在 Gemini 2.0 Flash 上,它不是一个思考模型。所以现在我们得到的答案显示出更多的细微差别。呃,希望在这个例子中,呃,我们将

我们将拥有能够弯曲或展示其思维能力的东西。我的意思是,我们会看到我们正在现场直播。

所以那是,呃,那是新的两件事,我将演示其他一些新的进展,不是那么新。所以这两者都是,呃,我认为音频概述在一周多前发布,而 Gemini 2.5 Flash 也是如此,同样,他们甚至没有为此发布博客文章,因为它是在,呃,

周五下午发布的,对吧?Google 已经停止发布了。呃,就像,我看着我的,呃,我的,呃,

在我的酒店房间里,在,呃,Habba。你知道,Google 是,它就像一个造船厂。就像我看着所有这些船,我想,“那就是 Google”。就像他们不像他们自 12 月以来就没有停止发布一样。我认为即使在周末,他们也在修复错误,添加新的更新。呃,这,这,这,这令人印象深刻。所以,呃,让我们开始吧。呃,让我们现场直播。呃,这总是很有趣的。可能会出错什么,呃,在 Apple 的

绝对糟糕的酒店 Wi-Fi 上进行直播。没有什么会出错,对吧?好的。所以作为快速提醒,这基本上是我告诉这些不同模型的内容。所以我说道,

请按月给我一份 IBM 的 Watson X 和 Watson X AI 更新的逐月细分,从 2024 年 1 月开始,到 2025 年 5 月结束。好的,所以我将要做的是,我将把所有这些信息复制并粘贴到 Notebook LM 中。所以首先,我在这里的第一部分。

Perplexity,我可能应该直接滚动到底部并单击复制按钮。那会好一点,对吧?好的。所以我将复制此信息,然后进入 Notebook LM。我在 Notebook LM 加上一个 Notebook LM,它是免费使用的。呃,如果您想要一些更好的限制、更好的数据保护,呃,那么您可能应该使用 Notebook LM Plus。呃,

所以我只是,实际上,让我先简要介绍一下它的工作原理以及为什么我认为它非常特别。它是一个接地模型。这意味着它使用 Gemini 2.5 Flash 模型,但它只会处理

您输入的信息。所以想想您可以使用 Notebook LM 的所有不同方法,对吧?呃,您可以输入所有会议记录、冗长的电子邮件线程。如果您正在从事一个项目,对吧。您可以在 ChatGPT 和 Gemini、呃,Claude 的项目中完成所有这些操作,对吧?有很多不同的方法可以做到这一点,但是缺点是,对吧。

也有缺点。你知道,优点很多。您可以通过多种方式做到这一点,或者有很多方法可以抚摸猫。我不会说剥猫皮。我不喜欢这句话,我喜欢猫。我永远不会说有不同的方法来剥猫皮。有不同的方法来抚摸猫,对吧?你可以用你的肘部、你的手抚摸猫,你知道,如果猫,你知道,蹭你,那就是抚摸猫的不同方式。所以你可以,你可以,你可以通过各种方式做到这一点。但是,

但是让我只是,让我们直接进入主题。好的。所以首先,我将粘贴所有我的信息。好的。

当我现场直播时,这可能会更有意义。好的。对于我们的播客观众,我所做的只是访问 notebooklm.google.com。就像我说的,我有一个帐户,但它是接地模型。这意味着我现在粘贴了 Perplexity 深度研究的结果。现在,你知道,我的,这个模型是接地模型。所以快速介绍一下,我现在可以进入,你知道,

这个 Notebook LM,我只有关于 Watson X 的信息,我可以说,你知道,什么是

芝加哥以什么而闻名,对吧?我按回车键,我得到的回复是。这需要一段时间,因为它正在使用一个思考模型,它什么也没说,对吧?它说,根据提供的来源和我们的对话历史,没有关于芝加哥市以什么而闻名的信息。所以,作为一个例子,我可以,如果我进入 Gemini 并使用 2.5 Flash,实际上,我不能在这里。哦,是的。

哦,是的,就是这样。然后说,芝加哥以什么而闻名?作为一个例子,它显然会告诉我芝加哥以什么而闻名。对。所以就是这样。如果你在 Gemini 或 Google 的 AI Studio 中,你可以看到它的思考过程。不幸的是,你在这里看不到它的思考过程。

在 Notebook LM 中,即使您使用的是相同的模型。所以,如果您想了解差异,您可能需要进入 Google Gemini,但您会在这里看到,当我使用 Google Gemini 时,相同的模型会给我一个回复,并说明芝加哥以什么而闻名,因为它仍在使用它自己的内部知识库。当它需要时,它仍然可以访问互联网。所以这就是使用 Notebook LM 的主要区别。它只基于您输入的信息。

好的,现在我们已经解决了这个问题,您可能就能理解为什么使用能够思考的模型会非常令人印象深刻。

一个只能使用您的数据的模型。这是巨大的,伙计们。是的,显然,我们有很多思考模型,对吧?我们可以使用许多优秀的思考模型,但您不能轻易地控制它们,至少不能通过大量的迭代和一些基本的到高级的提示工程技能来控制它们。您不能说,我的意思是,您可以说,“嘿,只使用这个项目中的文件,这个项目中的信息”。对。您可以尝试控制它的思考过程,但它经常会超出这些界限。它可能会使用它自己的内部数据。它可能会出去使用来自网络的信息。所以在很多情况下,你。

只希望模型使用您提供的信息,而绝对不使用其他任何信息,这就是为什么我个人对此感到非常兴奋的原因

好的,我正在清除此聊天。我将继续在 Notebook LM 中标记。这是一个好习惯。所以我只会说 Perplexity 深度研究,保存它。我将跳过。我将使用,这里是 Grok。我将滚动到,我认为它在底部,在那里复制。就是这样。我将添加一个来源,粘贴文本。

单击插入。如果您是新手,则可以使用不同的方法在 Notebook LM 中添加来源。您可以直接连接到您的 Google Drive,显然还有 Google Slides、指向网站的不同链接、YouTube 视频或只是复制的文本。我在网站上。

加上 Notebook LM+,它是 Google Gemini One 计划的一部分。您可以访问它,所以它不是单独的订阅。这是另一件需要知道的好事。所以,作为一个例子,如果您已经在您的组织中可以访问 Gemini Advance,那么您可以访问 Notebook LM+,因此您可以拥有 300 个来源,这是一个巨大的信息量。我将继续。哦,我已经粘贴了第二个。我将向上移动并标记它。我将标记为 GrokDeepResearch.com。

就是这样。我将进入 Google Gemini 及其深度研究 2.5。好的。他们的新版本非常令人印象深刻。我不得不说,早期,Oban AI 赢得了深度研究游戏。现在我不确定了。好的。所以我们将进入。我们将在这里粘贴文本。好的。然后我将稍后标记它。完成后作为 Gemini 深度研究。

好的,我将保存它。然后我们将看看我们的最后一个是否完成了。它还没有完成。OpenAI 的深度研究。通常情况下,它一直是最好的,直到 Google 将他们的深度研究更新到 2.5 Pro。

不是 Flash 版本。Google 的 Google Gemini 深度研究使用 2.5 Pro,它也是 2.5 Flash 的大哥,Notebook LM 现在使用的是 2.5 Flash。所以它仍然是或对不起。所以 ChatGPT 的深度研究版本仍在进行中。但让我们在等待的同时继续。我将继续展示一些其他新的更新,你知道,新的。

实际上,为了计时和按顺序进行操作,对吧?我们必须正确地进行 PEMDAS。我总是和我的妻子开玩笑。就像,对。有很多事情要做。我说,“好吧,这个的 PEMDAS 是什么?我们的运算顺序是什么?”

好的,运算顺序,实际上,因为它可能需要一分钟,我们实际上需要查看语言和输出。所以现在,使用这些不同的语言非常容易。它实际上就像点击一样简单。所以我将转到设置,然后转到输出语言。

然后您将看到一个名为“配置设置”的内容。然后有很多不同的新选项。我的意思是,这里有很多。所以我将,作为一个例子,我希望我实际上是双语的。我不是。说出来很尴尬。所以我在这里滚动。我试图找到西班牙语。我知道西班牙语是,

是其中之一,就是这样。西班牙语。好的。我将使用拉丁美洲西班牙语,然后单击保存。好的。所以仅供参考,我还没有这样做。我希望它能奏效。如果没有,我会联系 Google Gemini 团队,但我相信他们已经在处理这个问题了。所以我将继续单击自定义。好的。在这个深度对话中,右侧的音频概述,我相信你们中的许多人都听过。如果没有,本质上,有一个男性和一个女性以及

AI 生成的播客主持人,你知道,他们会互相调侃一下,但他们基本上会就您上传的文档进行对话。所以非常有用。我实际上只是点击生成,没有其他操作。您可以自定义说明,但是,你知道,在这种情况下,我不会这样做,主要是因为我可能无法理解其中的 90%,因为它将是西班牙语,而我不懂西班牙语。

好的。但是在我们等待的同时,我们也可以讨论一些新的更新,你知道,新的。

所以还有另外两个。就像我说的,我们有新的 Gemini 2.5 Flash,我们将在询问它时展示它。希望一会儿能问一个难题。我们现在可以使用 50 多种语言的音频概述,我们现在正在运行它。还有一些我认为我们至少没有在播客中讨论过的新功能。也许我们在 YouTube 上做过一些关于这些的教程,但其中一个是思维导图,我真的很喜欢。

真的很喜欢。所以基本上,当你使用 Notebook LM 时,有三种不同的面板,对吧?所以在左侧,你有你的来源,你可以添加一个来源。然后你有一个聊天页面。

然后你在右侧有一个工作室,它基本上是你有音频概述的地方,你也可以创建不同的笔记,不同的预设笔记,或者你可以手动创建笔记。所以 Notebook LM 的工作方式与你习惯使用的其他大型语言模型或 AI 聊天机器人略有不同。但在中间位置,

面板,呃,你知道,你也可以在那里点击概述,但这就是思维导图所在的地方。好了。这是新功能之一。很多人难以找到它,呃,因为基本上,特别是如果你没有放大或放大太多,对吧。就像我这里屏幕上一样,你实际上看不到我的地图。

一旦你开始聊天,因为你可以像在 Google Gemini 或 ChatGPT 中一样与所有文档和来源聊天。但思维导图部分消失了。它真的只在摘要中。所以我将点击思维导图。然后你会在右侧看到,它显示正在生成思维导图。

而且我不确定它是否会生成思维导图。我们可能必须完全等待音频概述完成。我实际上从未测试过同时生成两者。通常思维导图只需要几秒钟就能生成,但也许它只是把它放在队列中。哦,不,它没有。好的,就是这样。所以思维导图现在完成了。所以我们至少可以看看这个。

你会注意到,当我切换输出语言时,它也会,让我看看。让我在这里仔细检查一下。好的,它没有。我不知道它是否会改变文本更新的实际语言。它没有。好的,让我们来看看。我之所以这么说,是因为文本的名称

思维导图的名称现在是西班牙语。所以我想,哦,思维导图的内容会是西班牙语吗?不是的。它是英文的。所以看起来,即使你更改输出语言,它也不会影响思维导图。但这就是

令人惊奇的地方,对吧?我将为此进行一些学习,因为这是我本周将要做的 IBM 工作。所以它自动开始将其分解为四个类别,对吧?然后就像任何,如果你曾经使用过交互式思维导图,非常酷。我爱他们。如果你是一个视觉学习者,我

老实说,对吧。Notebook LM 有很多用例。我认为很多人应该使用它,将所有会议记录放在那里,冗长的电子邮件线程,你的所有文件,你的 Google 文档,等等。嗯,但你知道,另一件事就是当你试图学习一个新主题时。我认为,呃,无论是音频概述还是思维导图,呃,我不知道还有什么比 Notebook LM 更好的工具来学习新东西了。所以,你知道,现在

你知道,它给它起了一个标题。它说 IBM Watson X 和 Watson XAI 更新 2024 年 1 月至 2025 年 5 月。然后它将其分解为四个主要类别。它说平台和生态系统更新、Watson XAI 更新、Watson X 治理更新和 Watson 组件更新。我个人关注 XAI 类别。

实际上,我可能关注这两个类别,但我很好奇,因为我没有像其他人那样密切关注 Watson X AI 更新。所以我可以把它分解一下。现在它显示基础模型和生命周期功能和能力更新、自动 AI 和 RAG 更新以及价格调整。

所以我实际上想了解更多关于 Watson X AI 平台的自动 AI 和 RAG 更新的信息。然后我又点击它。所以如果我在这里缩小,对吧,现在我们已经在我的交互式思维导图中深入四层了,这真的很酷。我至少看到这两个子项中还有更多。所以看起来 2025 年 4 月有一些更新。

我可以点击它。所以当你点击一个实际元素时,它也会将其发送回聊天。所以基本上,如果你只想了解更多关于某事的信息,你可以点击该小元素的中间部分,它会将其分解到聊天界面中,它现在正在这样做。但我也可以看到,你知道,还有一些其他元素。

当我调出思维导图时,我的意思是,对于我们的直播观众来说,这很酷。如果你是一个视觉学习者,对吧。你可以展开所有这些,对吧。所以,呃,对于我们的,呃,播客或抱歉,对于我们的直播观众,呃,我将在这里缩小,你会看到,你知道,这实际上有多令人印象深刻。我不会,你知道,逐一阅读所有这些,但是,呃,我

我的意思是,你们,这就像太缩小了。这看起来像,你知道,在所有那些犯罪节目中,那些睡不着觉的疯子,我觉得通常是连姆·尼森或梅尔·吉布森,对吧?他们墙上贴满了照片,还有所有这些笔记,看起来很疯狂。就像,哇,这就像视觉混乱。所以它有点像混乱而不是混乱。

它是清晰的,对吧?因为现在我们有了这个很棒的思维导图概述,我可以更深入地研究它。非常令人印象深刻。然后你会看到,显然,因为我将输出语言更改为西班牙语。现在我在这里输入的文本也是西班牙语。

好的。我们有音频概述。另一件我没有测试过的事情是,如果我将输出语言改回,我们将找出第一点,我猜音频概述将消失,但我们将看看我们当前在聊天中间的所有笔记是否被重置。所以首先,我实际上必须删除它并将其重新添加到舞台上。

作为一个标签。希望你们都能听到这个西班牙语的音频概述。让我们快速听一下。

我在没有实际共享我的标签的情况下启动了它。就是这样。

好的。嘿,直播观众,有人说西班牙语吗?请告诉我。听起来,所以再说一次,我不说。我懂一点。听起来事情进展顺利。Estos últimos, ¿qué? 17 meses, hasta mayo de 2025. La idea es destilar lo más importante de toda esta información, ¿no? Pensemos que la IA avanza rapidísimo. Así que estos cambios son un buen reflejo de esa carrera.

所以我到目前为止注意到的一件事听起来

你还在为了弄清楚如何利用 AI 发展你的业务而苦苦挣扎吗?也许你的公司已经使用大型语言模型一年或更长时间了,但无法真正获得牵引力来找到生成式 AI 的投资回报率。嗨,我是 Jordan Wilson,这个播客的主持人。

像 Adobe、微软和英伟达这样的公司已经与我们合作,因为他们信任我们在教育大众了解生成式 AI 以领先方面的专业知识。一些美国最具创新性的公司聘请我们帮助他们制定 AI 战略,并培训他们数百名员工如何使用生成式 AI。所以无论你是在寻找数千人的 ChatGPT 培训,

还是只需要帮助构建你的前端 AI 战略,你也可以与我们合作,就像世界上一些最大的公司一样。访问 youreverydayai.com/partner 与我们的团队联系,或者你可以点击我们网站的合作伙伴部分。我们将帮助你停止在那些 AI 圈子里兜圈子,并帮助你的团队领先,并建立一条通往生成式 AI 投资回报率的直线路径。

对。再说一次,我不流利。我的西班牙语非常糟糕。但是它听起来很棒。

相当不错。所以,嘿,说西班牙语的观众,请告诉我。这听起来对你来说相当不错吗?我注意到的一件事,几件事。当你使用不同的语言时,看起来好像没有加入直播的功能。这实际上可能只在英语中可用,但你实际上可以

与 AI 主持人交谈并向他们提问,他们会回复你并倾听你。所以也许目前还不可用。看起来它不是。另一件事是通常有两个主持人互相开玩笑。所以我将在这里点击一下,看看我们是否能得到另一个主持人。30,000 个标记。就是这样。Una barbaridad.

好的,我们确实得到了那里的两个主持人。所以只是花了一段时间才得到我们的第二个主持人。就是这样。立即能够为我自己创建一个定制的西班牙语播客。好的,我将转到这里的设置。我将把输出语言改回英语。然后我将刷新。

我将刷新此页面,我很想知道。所以现在我只是在中间输入,我将看看我们是否回到了聊天窗格中的英语,我相信我们应该会的。我只是要说,你知道,要点。我只是要说解释一下什么是 Watson X,一句话。

就是这样。我们现在应该是默认语言。我只是不知道如果你用西班牙语开始了一些东西,它是否会保持西班牙语。它不会。所以这部分按预期工作。它说,根据提供的资料来源,Watson X 是 IBM 面向企业的综合人工智能和数据平台。这是正确的。就是这样。完美。好的。所以这就是,我们刚刚看到了……

至少一个新的更新,让我实际回顾一下两个。节目中的一个主要更新,另一个次要更新。所以这里另一个很酷的东西是这个新的发现来源。在左侧选项卡和来源中,你可以逐个手动添加来源,或者你可以点击这个发现来源,它有点像

它有点像传统的谷歌搜索,然后你可以选择。所以,呃,假设我要输入 IBM,呃,Watson X,让我们看看。然后我将输入 AI。我将点击提交,然后它将引入它认为是好来源的东西,然后我可以自动添加这些来源,呃,而不是,你知道,手动搜索并引入它们。呃,所以,你知道,人们,我认为对此有不同的看法,呃,但是

你知道,当我向下滚动时。所以我希望,我希望这被标记,我可以看到实际的 URL,对吧?在某些情况下,我可以有点,

理解这里的内容。对。呃,所以第二个说,你知道,IBM Watson X 维基百科。呃,第一个只是,它什么也没说。呃,所以它只是提取我认为是标题的内容,也许,呃,元描述的第一部分。我认为这是来自 IBM 网站的,但我不知道。所以我必须实际,呃,

点击它,然后我可以看到,是的,它来自 developer.ivm.com。好的。然后你可以一次性或逐个导入这些来源。让我举个例子。我将引入来自维基百科的 IBM Watson X。就是这样。最后但并非最不重要的一点是,

我将回到我们的 ChatGPT,持续了 12 分钟的那个。好的。所以我将在这里进行研究。我将复制它,跳回到我们的 Notebook LM,将其添加为来源,粘贴文本。就是这样。所以我们已经有点……

呃,做了一切,除了一个重要的事情,那就是测试新的模型,它是 Gemini 2.5 Flash,它是一个思维模型,所以希望这会有点道理,所以我将……我将问它一些可能有点棘手的问题,好的,所以我正在这里放大……

所以我说,请仔细分析所有源材料。实际上,我将提出两个,两个快速提示。所以首先我说,请分析所有源材料,并给我一个事实性的逐月细分,说明 IBM 的 Watson X 和 Watson X AI 更新,从 2025 年 1 月开始,到 2025 年 5 月结束,抱歉,从 2024 年 1 月开始,到 2025 年 5 月结束。所以是的,不幸的是,你现在只能得到这三个点,对吧?

对吧?所以如果你,你知道,曾经给某人发短信,并且正在等待他们回短信,这就是你得到的。所以也许将来,我不知道,也许我们会得到思维链,因为我真的很想看看 Gemini 2.5 是如何思考的,但只在你的数据范围内思考,这对像我这样的书呆子来说将非常令人着迷,对吧?我花了大量时间阅读原始思维链或总结的思维链,因为我认为这是

这真的是一个作弊码,如果你想更好地使用大型语言模型的话。你会看到,它已经大约 30 秒,40 秒了。所以当它运行时,好的,它现在完成了。这是一个很好的细分,好吗?使用……的好处

使用 Notebook LM 的好处是,正如你在我的屏幕上看到的,对于我们的直播观众来说,它总是会引用来源。对。所以我可以点击这些不同的来源。例如,让我去一些地方。

所以它说一些 Watson X AI 更新,这是几月份?2024 年 1 月。它说自动 AI 功能得到了增强,可以支持所有实验类型的有序数据。我可以悬停在其上,然后可以点击它。然后它会把我带回到那个来源指南。那是来自 Rock 深度研究的。然后它找到了确切的部分。然后如果我想的话,我可以去阅读更多关于这方面的信息。

好的。所以你会看到,我的意思是,对于我们的直播观众来说,那里有很多东西。有很多。让我回到我们的聊天界面。逐月有很多信息。所以今晚我将阅读它,对吧?并可能根据此创建一个音频概述。我可能会与它进行对话,以帮助我更好地理解所有这些事情。但是,

但是,你知道,另一件事是我想更多地测试一下。所以我要说,你知道,请仅根据 IBM 的产品路线图和他们对 Watson X 和 Watson X AI 平台所做的更新来识别潜在趋势。好的。

所以这很有趣。所以我在给,这在 Gemini 2.0 上是行不通的,类似这样的事情,你有点,

要求模型做一些传统大型语言模型无法很好地完成的事情。所以我想也许在 Gemini 2.0 上,这可能有效。我没有尝试过这个确切的事情,但它在思维模型上会工作得更好。它实际上很快就吐出来了。它说,根据提供的关于 IBM Watson X 和 Watson XAI 平台的来源的更新和信息,

IBM 产品路线图中出现了一些潜在趋势。所以它有点在字里行间思考。所以它说,好的,快速而多样的基础模型演变和扩展,对企业治理、信任和负责任 AI 的强烈重视,对混合云、多云和全球可用性的承诺,等等。很好。所以现在我要说,你知道,请识别,

IBM 平台在这一时期经历的任何路线变化,无论是公开的还是秘密的。我要说类似的话,你知道,请尝试一下。

挖掘字里行间的信息,你知道,但要保持事实性,对吧?

对。所以我在测试这里 Gemini 2.5 Flash 是否能够真正利用这种能力来进行推理和思考信息。对。所以我不仅仅是在要求事实性回忆。好的。当我们等待时,想想这样的事情会有多么有用。想想假设你每天都有一个会议。对。对。

你的团队,你知道,也许是远程的,是混合的,它每天都被记录下来,你已经做了很多年了。你可以从字面上上传所有这些记录,或者至少,你知道,运行一个可以批量转换它们的小型自动化程序,将它们扔进 Notebook LM,你可能还需要 plus 版本才能做到这一点。然后运行类似的提示,说,嘿,

我是这个部门的经理。你知道,这是我们,我们,我们的 10 人会议的记录,你知道,给我一份关于市场部约翰的绩效报告,你知道,我错过了哪些关于他绩效的东西?我们有我们的每日,呃,你知道,我们的每日会议记录。

我错过了什么,他在哪里,你知道,约翰在哪里表现出色,他在哪里挣扎,他经常放弃哪些项目,他很快就能完成哪些项目,所以你知道,即使只是拥有这样一些东西,它可以连接你所有的数据,但可以快速使用一些推理和逻辑,非常强大,所以让我们快速看看……好的,就是这样,这里有一个很好的例子……

所以它首先发现的是 IBM 已经,它从主要以 IBM 为中心的模型产品转向了一个广泛、多样化和开放的模型生态系统。它说最初 IBM 主要展示的是它自己的 Granite 模型。

然而,现在有各种各样的第三方和开源模型,包括 Meta 的 Llama、Mistral 模型和其他一些模型。我显然知道这一点。对。但如果你没有非常密切地关注这样的事情,并且你只是在查看公司发布的信息,你知道,有时他们可能不会说,嘿,我们正在改变我们的战略。对。他们可能只是发布新的更新。

显然,我一直在关注这一点,但这是一个很好的例子。这实际上正是我所希望的,因为我知道它最初只包含 Granite 模型。然后在 2025 年最近,他们已经转向包含更多对开放权重模型的访问,例如那里列出的那些模型。所以

我知道这是一个比较长的版本,但我想要做几件事,第一,你们要求这一集,你们想看看 Notebook LM 中有什么新东西,但我也想给你们一个实际的例子,因为你知道人们总是问我,嘿

Jordan,你如何使用 AI,或者你如何才能了解所有这些事情?好吧,我刚刚向你展示了我如何工作,我如何操作。对。我一直在使用 Notebook LM。所以通常我从多个深度研究工具开始。我将把它们扔进 Notebook LM。有时我会继续与这些单独的深度研究进行聊天,但我可能会进入并与这个 Notebook 进行对话。

我刚刚制作的。我可能会听音频概述,然后提问,但这是一种很好的学习方式。现在它由 Gemini 2.5 Flash 提供支持,这是一个思维模型,巨大的,呃,开放了对 50 个,呃,新的,

输出语言的访问。文本和音频概述都很好。这两个不是新的,但有点新,功能是发现来源和思维导图。再说一次,我认为 Notebook LM 是你不能不使用的工具。好的。这就是全部,你们。如果你想了解更多关于 Notebook LM 的信息,我已经做过几集了。

它们有点旧了,但如果你想了解基础知识,请收听第 383 集或第 370 集,在那里我更深入地介绍了 Notebook LM。我们也在那里做了一些现场演示。只是要知道这些现在已经有点过时了。所以请记住这一点。我希望这有帮助。请在评论中告诉我是否有帮助。你喜欢这些直播吗?它们分散注意力吗?

它们分散注意力吗?对。就像我说的,我经常收到这样的请求,人们只是想知道,嘿,Jordan,你如何使用 AI?你能做更多演示吗?就像,我想实际看到。但是再说一次,

我鼓励你考虑你可以使用它的所有不同方法,对吧?无论你是在使用公司自己公开可用的信息,还是在使用,你知道,上传,你知道,记录,我认为这是一个很好的用例。学习新东西,或者如果你只想与 AI 专家交谈。

在,在,在对话中,但基于你的数据或仅基于你提供的数据,呃,这很棒。呃,所以再说一次,呃,如果你诚实的话,我认为你不能不使用 Notebook LM。好的。呃,所以如果这有帮助,如果你正在收听播客,请,请,请,呃,Spotify 更改一些内容。你知道,如果你想帮助更多的人,嗯,

你知道,学习 AI,如果你能给我们留下评论,我将不胜感激,Spotify 最近更改了他们的算法。所以越来越少的人听到 Everyday AI 节目。所以如果你在播客或直播中发现有价值的东西,如果你能给我们留下评论,尤其是在 Spotify 上,

呃,我们将不胜感激。呃,是的。现在,不幸的是,所有,呃,大型科技集团,呃,播客都,呃,越来越受关注。所以,呃,如果你,如果你喜欢这项工作,如果它在这里有所帮助,呃,请考虑在 Spotify 上给我们留下评论,呃,如果这有帮助,请在社交媒体上分享,并且,呃,

更重要的是,访问 youreverydayai.com,注册免费每日通讯,并确保今天晚些时候加入。我可能会在 IBM Think 的主题演讲之后在 LinkedIn 上发布一篇文章。我对与 IBM 的合作感到兴奋。所以一定要收听那篇文章。所以感谢你收听,现在一定要在明天和每天加入我们,了解更多 Everyday AI 的内容。谢谢你们。

今天的 Everyday AI 节目到此结束。感谢您的收听。如果您喜欢本集,请订阅并给我们评分。这有助于我们继续前进。更多 AI 魔法,请访问 youreverydayai.com 并注册我们的每日通讯,这样你就不会被落下。去打破一些障碍,我们下次再见。