cover of episode EP 501: Google's Logan Kilpatrick: Gemini AI updates that create new possibilities live from Google Cloud Next

EP 501: Google's Logan Kilpatrick: Gemini AI updates that create new possibilities live from Google Cloud Next

2025/4/10
logo of podcast Everyday AI Podcast – An AI and ChatGPT Podcast

Everyday AI Podcast – An AI and ChatGPT Podcast

AI Deep Dive AI Chapters Transcript
People
L
Logan Kilpatrick
Topics
Logan Kilpatrick: 我对Gemini 2.5 Pro持续感到兴奋,它正在我们的开发者产品和消费者产品中推出,并提升了深度研究、画布等功能。它在深度研究方面的表现优于市场上的其他产品。画布功能允许用户无需编程经验即可生成代码。Veo视频生成模型和实时API的可用性也令人兴奋,并且这些新功能正在谷歌生态系统中广泛应用。我使用深度研究工具来了解人们对MCP的普遍情绪以及进行竞争分析。Canvas仍处于早期阶段,其实用业务价值在于连接公司数据。我很兴奋Gemini应用成为一个AI接口,连接谷歌生态系统中的所有内容,例如利用谷歌搜索历史进行个性化。新的AI工具提升了创意人员的能力,例如Veo视频生成模型和文本转音乐功能。Firebase Studio是下一代AI增强型IDE,将AI融入开发环境。Gemini 2.5 Pro在编码、创意写作和构建自主产品方面表现出色,它带来了新公司和产品诞生的可能性。实时API允许模型查看用户屏幕,简化了AI工具的使用,并为未来工作方式带来新的可能性。 Jordan Wilson: 作为一名用户,我对Gemini 2.5 Pro的性能印象深刻,它能够处理大量数据并且在AI Studio中免费使用。我对Canvas、Veo以及Firebase Studio等新功能的实际应用和商业价值充满期待。

Deep Dive

Chapters
This chapter explores the new updates in Google Gemini, focusing on Gemini 2.5 Pro and 2.5 Flash, their deep research capabilities, and the Canvas feature. The discussion also touches upon the use of deep research for competitive analysis and sentiment analysis.
  • Gemini 2.5 Pro is rolling out across developer and consumer products.
  • Gemini Advanced users get 20 deep research queries.
  • Canvas allows for code generation without coding experience.
  • Vio, a video generation model, and its live API are now available for developers.
  • New capabilities are becoming ubiquitous across the Google ecosystem.

Shownotes Transcript

这是 Everyday AI Show,一个日常播客,我们简化 AI 并将其力量带到您的指尖。每天收听,获取提升您的职业、业务和日常生活的实用建议。

在 Google Cloud Next 上刚刚宣布了很多新内容。我很难理解这一切。似乎有数十个新的 AI 更新。所以我认为,最好邀请他们的领导者之一来帮助我们理解这一切。因此,我们今天将讨论一下 Google Gemini、Google Gemini AI Studio 内部的新内容,例如

与 Google DeepMind 的高级产品经理 Logan Kilpatrick 的一切。Logan,感谢你第二次加入我们。是的,第二轮。我不记得我们第一轮谈论的是什么。感觉好像是很近的事,但是……

有很多新东西要谈,所以我很高兴回来。是的,绝对的。所以,你知道,从上到下,我的意思是,我们看到 Google Gemini 2.5 Pro 在其他地方推出更新,Google Gemini 2.5 Flash 中的新模型,对吧?开发人员有很多东西,但是从哪里开始呢?或者也许,你最兴奋的是 Google Cloud Next 上刚刚宣布的内容是什么?

是的,这是一个很好的问题。我一直对 2.5 Pro 感到兴奋。我认为我们看到 2.5 Pro 正在我们的开发者产品、消费者产品中推出。它昨天刚刚进入深度研究,人们对此非常兴奋。我认为,如果您是高级 Gemini 高级用户,您可以获得 20 次深度研究查询。

你知道,我们的客户更喜欢 Gemini Advanced 与 2.5 Pro 的组合(比例为 2:1),而不是市场上的其他产品,我认为这只是一个很好的指标,例如,

实际上,这个模型从深度研究的角度、从画布的角度解锁了新的东西,如果大家还没有尝试过 Gemini 应用程序中的画布,能够编写代码并自动编写代码而无需成为开发人员,这是一种非常酷和特殊的体验。所以,我一直对此最兴奋。我认为今天在 Cloud Next 上,我们知道,推出了大量新内容。Vio 可供开发人员使用。

如果大家还没有看到,这是我们最先进的视频生成模型,它很棒。我们刚刚宣布了实时 API,我认为很多人都这样认为,实际上与之并行的是,实时模式也正在向一些客户和 Android 推出。所以,一切都在发生。我最开心的事情之一是,感觉我们越来越接近这样的状态:随着这些新功能上线,它们最终会在整个 Google 生态系统中无处不在,这真的很酷,因为,你知道,有些人是 Gemini 用户,

用户。有些人是 Google AI Studio 用户。我们有企业用户。我们在搜索中有人。我认为,能够达到新事物启动后对全世界都可用这样的状态真是太棒了。所以我想快速深入探讨你刚才提到的两件事。所以深度研究,我,

我印象深刻,不仅仅是,你知道,我认为你们几次先将其更新到 2.0,现在我认为更新到 2.5 Pro。是的,你谈到了关于偏好的基准测试结果,我会说,它与 OpenAI 的产品相比,对吧?我认为这是一个很好的,你知道,一个很好的产品。但是,你知道,现在你们的产品似乎

好得多。呃,你甚至在将深度研究工具用于什么?我喜欢问构建它的人,你在用它做什么?因为我认为人们可以从你的使用方法中学习。是的,这是一个很好的问题。我认为有些东西,嗯,

我想到的两个用例,一个是,我正在查找人们对 MCP 的总体情绪。如果大家没有关注,这是,我们不会在这个对话中深入探讨 MCP 线程,但是如果你以前没有做过 MCP,没有研究过它,请使用深度研究。它实际上给出了一个相当有力的答案,并提供了一些关于人们在 Twitter 上如何看待 MCP 的辅助材料,但它是一种代理

与工具交互的方式。这是一个用例,因为我非常想知道这样做会发生什么。另一个是我一直在对我们考虑如何在市场上展示自己的方式进行竞争分析,与其他提供商相比,我们是什么样的?我认为对我来说,深度研究

这个管道非常有趣,因为深度研究实际上能够捕捉到的是互联网上可用的信息。我认为这就像,你知道,我可以去和客户谈谈并获得这种观点吗?是的,这实际上是一个非常有趣和有用的观点,但实际上也很有趣的是捕捉互联网上人们对 Gemini API 或 ASGD 等的看法。所以对我来说,这真的很有趣,就像

拥有这种体验。而且它实际上与一些有趣的方式不同,例如,人们亲自告诉我他们如何看待产品的使用方式以及所有这些东西。所以如果大家还没有做过这个练习,真的很有趣。如果你有你构建的产品,或者你有喜欢的东西,就像问一样

Gemini 应用程序中的深度研究功能来整理报告,看看这与你的观点或你的看法有何不同。是的。你刚才提到的另一件事是画布中的代码编写。所以画布已经发布了多久了?两周?两周左右,对吧?我已经多次使用它了,对于一个只发布了两周的工具来说,但是也许可以引导人们了解一些,你知道,实际应用。我认为很多人都在想,哦,让我们

你知道,创建一个游戏,这很有趣。但是,你知道,就业务效用而言,你们看到的一些更令人印象深刻或有用的画布模式应用是什么?是的,我认为我们仍然处于,

我认为聊天机器人总体上长期处于这种状态。我认为在过去的六到八个月里,它已经不再仅仅是一种新奇事物了。我认为画布有点像仍然处于这种状态,它可以做一些有趣的事情,正如你所说的那样,例如从头开始构建游戏。像我现在从头开始编写一个游戏需要很长时间。人工智能能够做到这一点真是太棒了。是的。

但是实际的业务价值在哪里呢?我认为对很多人来说,实际的业务价值在于当你将这个东西连接到你的公司数据和所有数据时,并且,这是一种目前还不存在的东西,至少在我们拥有的画布环境中是这样。这就是我最兴奋的地方,因为我认为,最终为了让这些工具有用,你需要将你的许多东西连接到它们,并让它们,你知道,访问你的电子邮件,然后我可以围绕我的电子邮件构建一个工具来做到这一点。所以我对此非常兴奋,我认为,

从我的角度来看,我不是 Gemini 应用程序的产品经理,但我是一个 Gemini 应用程序的用户,我喜欢它,我认为它是一个很棒的产品。我最兴奋的事情之一是,Gemini 应用程序的这种趋势正在成为,

AI 接口和 AI 通道,用于 Google 生态系统内部发生的所有事情。一个相关的例子是 Gemini 应用程序,除了所有其他画布内容、深度研究以及其他所有正在发生的事情之外,它还有一个个性化功能。个性化功能实际上是基于你的 Google 搜索历史记录构建的。因此,你可以选择加入,例如,嘿,你知道,基本上根据 Google 搜索个性化模型给出的答案。这听起来表面上非常

无趣,但它开始进入一个世界,在这个世界里,AI 是连接到这组庞大数据的接口。我从工作环境和个人环境中考虑这一点,例如我一直在使用 YouTube。我一直在使用 Gmail。我一直在搜索东西。我一直在使用文档。因此,能够将所有这些体验整合在一起真是太好了。我认为画布就像

第一步,特别是与 Docs 和 Cone 结合使用。所以我非常兴奋。是的。如果你还没有时间使用画布,我强烈推荐它,对吧?它实际上能够运行和渲染代码。你甚至不需要知道编码。太容易了。另一件事,Logan,你提到的

VO2 以及 Vertex 中的一些新功能,调整摄像机角度,对吧?这对创意人员有什么作用,对吧?今天宣布了很多我甚至没有预料到的新内容。文本转音乐,对吧?更新后的 chirp。

这对创意人员有什么作用?这如何在 Vertex 和 AI Studio 中解锁?是的,我认为让我兴奋的总体趋势是,我实际上刚刚与 Vertex 团队的人员进行了关于此的对话,他们也同意这一点,那就是,

人们能够提升到更高水平的这种普遍趋势。我不擅长创意,我也不擅长游戏设计。在游戏设计用例中,我无法构建视频游戏。我以前尝试过。这非常困难。这并不是,试图这样做并不会很有趣。我认为在视频用例中有很多情况也是如此。像你和我一样,就像你一样,我们在镜头外谈过话,像

编辑视频很困难,并且有很多很棒的工具可以帮助做到这一点,但在很多情况下仍然很痛苦。能够让所有这些 AI 工具开始采取这些步骤并提升那些真正兴奋并去除我不感兴趣的事情的人,我感到非常兴奋。我认为 Vio 特别是

人们长期以来一直为之疯狂的一个。这实际上是第一次,除了 YouTube,它是在非常具体的产体验中设置的。这是第一次,除了 YouTube,它是在非常具体的产体验中设置的。这是第一次,像原始模型一样,普遍地提供给全世界的人们实际使用,这感觉像是一个疯狂的,呃,我认为它还没有像现实中那样成为一个疯狂的,

公众时刻。但是,像世界上最好的视频生成模型一样,现在可以让人们实际使用并开始构建了。所以我认为我们将看到这项技术开始以许多新的、有趣的方式出现。是的。而且它令人印象深刻。我们今天将在新闻通讯中分享他们所做的演示。我相信 Google 将在网上发布它。对。能够,你知道,对拉斯维加斯的现场镜头进行动画处理并为其配乐。超级令人印象深刻。另一个真正

新的更新在这里。Firebase,是这样吗?Google 是否突然发布了一个 IDE?告诉我们 Firebase 是什么。它是如何工作的?是的,这是一个很好的问题。所以这是一个轻微的开发者上下文。所以,如果你不是开发者,有些东西可能

它可能不相关,或者它可能没有多大意义。但是,该产品的原始版本,今天成为 Firebase Studio,被称为 Project IDX,我们在去年的 Google I/O 上宣布了它。Project IDX 的目的是,我们如何为开发人员构建下一代 IDE(集成开发环境)来实际使用……

我认为这是独一无二的,就像今天的开发人员一样,将本地 IDE 下载到他们的计算机上,并在本地进行开发。这将 IDE 带给了开发人员,带给了,带给了,

浏览器。该产品套件的下一个迭代,这是由 Firebase 团队创建的,这就是它最终成为 Firebase Studio 的原因。该产品的下一个迭代是如何不仅进行基本的开发人员环境,而且是如何将 AI 融入其中?以及如何帮助开发人员启动实际创建应用程序和产品等?所以我对 Firebase Studio 非常兴奋。我认为对于那些不熟悉 Firebase 的人来说,Firebase 拥有很多

像 StreetCred 一样,是一个非常以开发人员为中心的团队和产品表面。所以我认为我没有花很多时间与 IDX 相处,我花了很多时间与 IDX 相处。我还没有花很多时间与 Firebase Studio 相处,但我完全相信该团队会取得成功。希望我们会看到更多这样的工具,让那些不是开发人员的人能够开始参与和工作

构建以前无法构建的东西。是的。你知道,一件事,回到 2.5 Pro,我喜欢,我认为值得大肆宣传一下。我喜欢在主题演讲中提到 LM Arena,并且,我认为它在发布时领先于第二名模型 39 分。Gemini 2.5 Pro 有多好。这让我难以置信。当我在 AI Studio 中使用它时,我觉得我在偷东西,因为它太棒了。它可以处理大量数据。而且它是免费的。它在 AI Studio 中是免费的。谈谈你看到的 Gemini 2.5 Pro 的一些最佳用例。是的,这是一个很好的例子。实际上,我认为有趣的事情之一,我和 DeepMind 团队的一些人进行了这样的对话,例如,

有时你实际上会在某个基准测试中看到 40 分的跳跃。而且它实际上并没有完全说明它有多好。还有另一个方面,然后我会直接回答你的问题。还有一个其他的方面,那就是每次出现新模型时,都会出现一类以前不可能存在的公司,它们只是变得可能了。当您获得这种

巨大的能力提升时,我认为这对于 2.5 Pro 来说也是如此,现在有很多新的公司是可能的。我认为有很多编码方面的内容。有趣的是,让我最兴奋的事情之一是,当你看到这些通用前沿模型时,就像能力发生了阶跃式变化一样,它就像

在每个用例中都是如此。所以像你一样,我认为一个以前效果不太好,现在效果很好的用例是编码。所以很多人对该模型进行代码的能力非常兴奋,但是我看到了大量的创意写作示例。我看到很多人使用 2.5 pro 作为构建代理产品的工具,这有点像幕后的事情。嗯,

是的。我认为这实际上,我们甚至还没有达到像即将发布的,像我们看到的 2.0 flash 的多模式内容一样,我认为这是自上次我们联系以来发生的事情。发生的事情太多了。很难。确实很难跟上。

与。好吧。所以很难跟上。Logan,我知道你很忙。你必须去和成千上万的人说话。但是,你知道,在我们结束今天的快速对话时,因为,你知道,也许我们必须让你第三次来。但是,你知道,即使谈到像新公司一样,对吧,这是一种很好的思考方式,使用 Gemini 2.5 Pro。但是,你知道,你对这个周末最兴奋的是什么?或者

也许对于普通的日常业务领导者来说,你最希望他们接触到的是什么?你认为,你知道,像,哦,现在有一类新的公司,因为这里宣布的内容,是否会有一类新的公司或一种新的日常工作方式?

我认为实时 API 就是这样,我们还没有讨论过,但是实时 API 基本上是这样的,我不记得我们是否做过演示。我认为没有。但是,如果大家还没有尝试过,AISTudio.google.com/live 有这样的体验,你可以进来,你可以与模型对话,你可以共享你的屏幕,如果你允许,模型实际上可以查看你的摄像头。我认为这创造了人们将如何工作的未来,那就是模型实际上可以……

看到你看到的东西,我认为这解锁了,我认为这消除了使用 AI 工具的枯燥工作,我的个人观点是,今天,

使用 AI 的挑战在于,作为 AI 产品的用户,你必须做很多工作才能将所有上下文带给模型。而且,通常情况下,对我来说,作为想要使用 AI 的人,我就像,上下文已经存在了。我正在屏幕上查看它。为什么将这些信息带到任何 AI 产品中如此费力?这是一个非常简单的事情,所有这些新的,回到像要构建的新公司类别这样的主题,所有这些要构建的新公司和产品

你只需切换一下开关,然后突然之间,你知道,你正在使用的任何随机产品都可以看到你的屏幕,并帮助你解决你正在尝试解决的任何问题。它可以实时从 Google 搜索中引入真实信息。它可以代表你执行代码,所有这些,像非常非常有趣的东西,我不,我不认为我们已经看到使用这项技术构建的产品了,这让我感到兴奋,因为我认为它会很棒。

好吧。这是一个令人兴奋的。一次快速而激烈的采访,就像我们迄今为止在这个会议上看到的一样。快速而激烈的更新。所以,Logan,非常感谢你抽出时间加入 Everyday AI。我们真的非常感谢。是的。对于那些没有观看视频的人来说,Jordan 穿着一件很酷的 Everyday AI 耐克衬衫,看起来很棒。你做得很好。

现在我将被要求淹没。好吧。好吧,再次感谢,Logan。如果你想要更多,我们在很短的时间内谈论了很多内容。所有这些都将在新闻通讯中。所以,如果你还没有,请访问 youreverydayai.com。注册免费的每日新闻通讯。让我知道。我们应该让 Logan 第三次回归吗?在 500 集之后,第一个第三次回归的人?好吧。感谢收听。我们明天和每天都会回来,了解更多 Everyday AI 内容。谢谢大家。

今天的 Everyday AI 节目到此结束。感谢您的收听。如果您喜欢本集,请订阅并给我们评分。这有助于我们继续前进。要获得更多 AI 魔法,请访问 youreverydayai.com 并注册我们的每日新闻通讯,这样您就不会落后。去打破一些障碍,我们下次再见。

今天的 Everyday AI 节目到此结束。感谢您的收听。如果您喜欢本集,请订阅并给我们评分。这有助于我们继续前进。要获得更多 AI 魔法,请访问 youreverydayai.com 并注册我们的每日新闻通讯,这样您就不会落后。去打破一些障碍,我们下次再见。