有趣的是,在这场人工智能大战中,直到现在我才成为山姆·阿尔特曼的粉丝。他做的第一件事就是推出一个与Perplexity直接竞争的产品,试图接管搜索,并宣布,有点像向谷歌和搜索宣战。
接下来他做的就是找到乔尼·艾夫,说,好吧,我现在要开始制造设备了。全垒打。媒体的未来将彻底改变,因为它将按需提供。就像,这就是我希望为我即时创建的东西。很好奇人们如何在个人层面上使用它。但我真的会用它来创造我自己的娱乐吗?好莱坞被摧毁了。我认为它在未来两三年内还会继续存在。女士们,先生们,这是一个登月计划。
大家好,欢迎收听《登月计划》。我和我的登月伙伴戴夫·布伦登和萨利姆·伊斯梅尔在一起。这是一集关于“科技界刚刚发生了什么”的节目。伙计们,这周大事不断,特别是谷歌I/O和我们Anthropic的朋友们。戴夫,你今天在哪里?我在美丽的韦克菲尔德,离麻省理工学院10英里。事实上,这是我创立DataSage之后创立的公司,管理着2万亿美元的数据。
美国股市有50万亿美元。其中2万亿美元在这个建筑物中交易和流动。所以它看起来很平静,但这个建筑物有很多数字流动。
你知道,你把万亿美元说得好像微不足道一样,但是,嘿,很高兴知道。虽然不错。有人这么做。萨利姆,我知道你大概在卧室里,大概三五米远的地方。所以我和萨利姆实际上在蒂布伦。昨晚我们参加了一个朋友举办的活动,呃,大家都睡着了,因为他们凌晨两点才到。我们在这个临水的建筑里。太美了。这是一个关于量子和意识的对话。非常棒。呃,
但我们一大早就起床录制这个播客,因为这是一个令人难以置信的一周。所以你们很多人都在做。好吧,你你醒了。
我醒了,我认为这是我们有史以来最繁忙的一周之一,就科技方面而言。哦,是的。好吧,让我们深入探讨。让我们谈谈人工智能。就科技新闻而言,它是本周的赢家,我认为它将成为未来每一周的赢家。戴夫,太好了。
你能给我们一些关于这个新闻的线索吗?OpenAI将以65亿美元的价格收购苹果乔尼·艾夫的人工智能设备初创公司。嗯,
这上了头条新闻。你知道,在这场人工智能大战中,有趣的是,直到现在我才成为山姆·阿尔特曼的粉丝。这是所有举动中最重要的一步。我知道山姆谈到了这个巨大的政变和非常激进的举动。这实际上可能一直都在山姆的脑海里。他只是在等待3000亿美元的估值,这样他才能买得起。
但他大约一年前就谈到了这件事。当时,他退缩了,不想惊动竞争对手。他说,你知道,iPhone可能是人类有史以来制造的最完美的设备。所以试图与iPhone和Android手机直接竞争有点疯狂。所以在制定计划的同时,他还在退缩。而现在这是他的行动。所以这里的基本思想是人工智能是一个如此重大的变革者。
所有大型科技公司都需要一个直接面向消费者的设备或界面。所以,Meta收购WhatsApp。Meta收购Instagram。你只需要控制消费者的前端。谷歌开发了Chrome。谷歌推出了Android。Android甚至不赚钱。为什么谷歌需要Android?但我们需要控制消费者每天使用的那些数据和前端界面。
在所有大型人工智能公司中,山姆是最直观地理解这一点的人。
所以他做的第一件事就是推出一个与Perplexity直接竞争的产品,试图接管搜索,并向谷歌和搜索宣战。接下来他做的就是找到乔尼·艾夫,说,好吧,我现在要开始制造消费者直接与之互动的设备了。所以许多其他基础模型公司只是试图构建基础模型,并让经济围绕它们发展。山姆实际上试图控制高端低端市场。
并获得消费者的前端和整个AI骨干。但我认为这里最大的见解是,你可以构建一个以人工智能为首的消费设备,这意味着你总是在与它交谈。你像与人互动一样与它互动。这具有足够的颠覆性,以至于许多iPhone的魔力实际上并不重要。因此,我们有可能超越并绕过它。
然后,你知道,花65亿美元在一个没有收入的想法上,但你得到了这个人和团队。这非常像史蒂夫·乔布斯,我们可以对此进行评论。但我认为这太棒了。是的。所以最终的问题是,下一代设备将会是什么?它会是眼镜吗?它会是一个一直在倾听的设备吗?有几家不同的公司正在推出这个。萨利姆,你要说。
是的,我认为这直接让我们想到了那个贾维斯的东西,一个从你的角度来看,总是观察世界并倾听并理解世界的代理。所以我认为这是一个巨大的进步。正如你所说,戴夫,非常非常大胆,我喜欢它。是的,实际上非常相似。谷歌,你知道,他们花了30亿美元收购Character AI,专门是为了让Noam Shazier回来。
所以这是另一个例子,你愿意为一个基本上是一个人写一张九位数的支票,但你知道这个人会带一个团队来,他们会带来那种史蒂夫·乔布斯的魔力。但这些价格标签是前所未有的。但成功的回报也比以往任何时候都大几个数量级。所以这实际上非常合理。
是的。好吧,我迫不及待地想看看接下来会发生什么。你知道,当然,其中一个问题是,我们可能会有一大堆人工智能设备一直在倾听你的谈话。我认为它最终会被社会……
接受,但在开始时,呃,你知道,当你走进去,你正在和你的朋友交谈,你注意到他们戴着一个吊坠或某种东西在他们的头上或手腕上,它在倾听,问题就变成了,你是否同意你进行的每一次谈话都被记录下来,因为这就是我们前进的方向。
这就是我们前进的方向。你知道,我认为这实际上是我们几天前与阿尼什进行的播客也直接与此相关。阿尼什指出,有大量的不同人群,包括老年人,包括不同国家的巨大人群,他们完全错过了iPhone、Android手机革命。
而人工智能界面,这种超级有同理心的语音界面打开了它。所以,你知道,你不需要让每个人明天都停止使用他们的iPhone。你需要做的是打开以前被忽视的整个新用户领域。所以我认为这很可能会以这种方式迅速普及。是的,它将像一个轻量级、易于使用、可能非常便宜的设备,你只需要与它交谈,它有一个作为核心的代理来做你要求它做的所有事情。
是的。而潜伏将是有趣的,对吧?在哪里,呃,你知道,你不知道。还记得谷歌推出谷歌眼镜的时候吗?呃,他们戴着眼镜去酒吧,人们说,你知道,他们给了他这个词。是的。被打。是的。呃,所以这将是,这将是令人着迷的。我们,我们即将看到人与人之间与人工智能的互动社会规范。呃,
开始很快就被定义。看,它已经开始了。现在每次我和几个人进行Zoom会议时,他们的AI都会在他们之前出现。你必须说,等等,我们想在这里进行一次秘密会议。然后我们必须把它们都关掉等等。转变正在发生。
你是对的。我们可以就此进行评论。但是监管方面,基本上没有监管。监管机构完全袖手旁观。但是如果你看看TCPA,你知道,你不能窃听电话线,这是有充分理由的。
但所有这些现在都转移到了数字领域,那里根本没有任何法律。但你会注意到,当Zoom通话开始有人工智能间谍时,他们会自我介绍。就是这样。现在他们只是倾听,你甚至不知道他们在那里。消费者电话也是如此。我们许多公司的销售或电话客户支持正在以惊人的速度转向人工智能语音,顺便说一句,使用了地球上所有的GPU。它运行得非常好。它比人工接线员好得多。
但他们大多数人不会告诉你他们是人工智能。也没有规定说你必须告诉你。所以很多时候我都在听电话,消费者,你知道,大约10%到20%的时间他们知道他们在和人工智能交谈。其余时间他们不知道。
但这太神奇了。我的意思是,这,你知道,对那里的设计师表示祝贺。我的意思是,这太非凡了。而且它只会越来越好。每周,我都研究未来十年将改变行业的十大主要科技元趋势。我涵盖的趋势包括类人机器人、AGI、量子计算、交通、能源、长寿等等。没有废话。只有重要的东西,那些影响我们生活和职业的东西。如果你想让我与你分享这些,
我每周写两次简讯,通过电子邮件发送两分钟的阅读内容。如果你想在其他人之前10年发现最重要的元趋势,这些报告适合你。读者包括来自世界最具颠覆性公司和企业家的创始人、首席执行官,他们正在建立世界上最具颠覆性的公司。
如果你不想了解即将发生的事情、它为什么重要以及你如何从中受益,它就不适合你。要免费订阅,请访问dmandus.com/Metatrends。这是dmandus.com/Metatrends,以便在其他人之前10年以上获得趋势信息。
好吧,让我们继续。我们有很多事情要谈。所以,底线,谷歌至少在一段时间内窃取了这一周。戴夫,你想概述一下我们在这里看到的内容吗?这是一个标题为“双子座在所有模型中领先”的幻灯片,我们正在讨论双子座与GPT、3045、DeepSeek、Grok,所有的一切。是的。
是的,这就是“帝国反击战”。所以OpenAI窃取了受众、用户群和人工智能的优先地位。XAI在2月份非常短暂地夺回了它。
然后谷歌强势回归,或者抱歉,OpenAI凭借新模型强势回归。然后这唤醒了谷歌。谷歌来了,帝国反击了。好吧,我们已经在实验室里有了这个。我们不知道该如何宣布或何时宣布。但是现在竞争压力来了,我们……
将全力以赴,呃,这是我们拥有的所有东西中最好的,我们将在本周推出所有这些,然后就是这样,它令人难以置信,所以他们声称在每个类别中都排名第一,呃,我们将……是的,好吧,所以吸引了每个人想象力的是,总的来说,显然,呃,图像生成,呃,
难题。难题是,你知道,难题。我想这很明显。编码和数学,他们声称在几个小时内在这方面排名第一。数学他们仍然拥有。创意写作,看到人们写他们的英语论文。长查询。所以他们在超长上下文窗口中已经占据主导地位相当长一段时间了。他们只是没有告诉全世界。这正是,彼得,你几周前所说的。
大公司在创新者困境方面确实很挣扎。所以即使这已经在实验室里了,Demis Hassabis和他的团队已经研究了很长时间。他们已经有了,但他们非常担心如何推出以及是否会有消费者的强烈反对。但现在在竞争压力下,它被释放了。
我的意思是,这反复发生在谷歌身上。我的意思是,谷歌首先拥有Transformer。它做了所有基础工作。它基本上拥有等同于GPT的东西,但决定不做每个人都说的事情。不要这样做。不要公开发布人工智能。不要让它对每个人都可用。不要让它受苦。
参考性地编程自身。当然,一旦它被释放到以太坊中,双子座或谷歌就必须回来证明自己。听着,我喜欢谷歌这家公司。我对他们印象深刻。他们拥有非凡的基础可以继续发展。对不起,萨利姆,你要说吗?
不,你知道,几天前,我生成了一张古腾堡印刷机的图像,我说,给我一张它的照片。我在几个模型上都做了这个,而双子座模型比其他所有模型都好得多。太不可思议了。所以我认为随着时间的推移,我们会发现兴趣仍然在OpenAI身上。那里有很多关注,但我认为随着时间的推移,纯粹的质量会显现出来。
我认为如果你喜欢好的戏剧,你知道,这是太空竞赛的千倍,参与者不断地超越对方。你稍后会看到,你知道,谷歌的王牌是它拥有硬件控制,硬件设计控制。所以你从算法一直到芯片设计,使用TPU V7s。没有其他人拥有这个。
但其他人也有我们可以稍后在播客中讨论的其他竞争性武器。所以不要指望这是结束。事实上,我已经看到“游戏结束”这句话说了大约20次了。每次有人超越其他人时,这绝对不是游戏结束。游戏才刚刚开始。如果你喜欢好的戏剧,这只是下一幕。我们稍后会看到。如果你曾经想过……
这个领域是否正在加速?它正在大规模加速,这是这些公司之间的竞争压力。它不再是国家之间,而是几家试图超越对方的公司之间。挑战在于ChatGPT,即OpenAI,作为首发优势战略,抓住了世界的思维方式。
你知道,从小学到高中和大学的孩子们,你知道,那里的普通爸爸妈妈,他们都在使用ChatGPT,这反映在OpenAI的收入中。Gemini真的需要赶上,因为我不在乎你有多好,如果你的产品没有被使用,你就会遇到麻烦。这是一件有趣的事情,仅仅是因为纵观历史,
即使我们谈论的是首发优势,但赚钱的从来都不是首发者,对吧?谷歌不是第一个搜索引擎。Facebook不是第一个社交网络。
OpenAI领先,还有待观察。它实际上可能是一个完全新的竞争对手,彻底改变了所有人的游戏规则。哦,会的。会的。我的意思是,毫无疑问。所以在这里,我们正在展示的这张图表,如果你在YouTube上观看这个,是谷歌在各个领域都排名第一。
但是戴夫,几个小时后,我们得到了这张图表?Anthropic推出了Claude 4.0。是的。所以在那里令人惊叹的24小时。所以Sundar走上舞台,谈论了一些我们稍后会看到的东西,你可以基本上一直使用所有人工智能,而不用使用普通的谷歌搜索。我们稍后会看到。谷歌股价大幅下跌。
然后第二天,他们推出了VO3,其中包含大量令人难以置信的人工智能,你知道,排名第一的基准股价上涨了7%,你知道,仅仅是对此的反应。所以每个人都想知道,这里发生了什么?就在中间有这么多的混乱。Claude 4出来了。所以Dario说,是的,看,Sundar刚刚声称在编码方面排名第一。
不正确。好吧,昨天是正确的。现在不正确了。今天我们有Cloud 4,这里有一些基准。顺便说一句,这些都是准确的。谷歌确实在编码方面领先了大约24小时。而现在,如果你看这张图表,实际上这是一个相当大的差距。Cloud 4刚刚再次跃居榜首。而最左边的那些分数对于那些理解其含义的人来说是非常有意义的。你知道,对于像我们投资组合中的Blitzy这样的公司来说,它们进行长篇编码,一夜之间完成300万行代码,你知道,Brian Elliott在YouTube上到处谈论它。它之所以能够发挥作用,从根本上是因为最左边的基准。人工智能现在实际上可以构建整个产品,
当你睡觉的时候,第二天回来使用它,它就可以使用了。当这些基准达到80%左右时,该应用程序就可以工作了。当这些基准在50%到60%左右时,它不起作用。第二天代码中会有太多错误。所以即使在这个图表上看起来不多,但当你达到SWEBench上80%以上的水平时,它是一个令人难以置信的转折点。而且
而且现在我们需要重新发明基准,顺便说一句。这是SWEBench,这是衡量人工智能编写的代码质量的最基本基准。有一个新的基准即将推出,叫做SWEReBench,它只是让它更难,并对其进行升级。但我们现在需要新的基准,因为人工智能基本上已经打破了基准。
你知道,当雷谈论奇点时,在那一点之后,你无法预测接下来会发生什么,这就是你在这里看到的,对吧?你看到的是一次又一次的“放下麦克风”时刻,不断地超越其他人。
这令人敬畏。好吧,这是等式中的另一部分。我们谈到了人工智能基于多种不同因素的改进,更好的硬件,更多的资金涌入。而这一个确实是算法的改进,算法的改进。而这里的预测是……
我们将看到算法性能提高10倍到100倍。萨利姆或戴夫,为什么不评论一下呢?这是我们一直在跟踪的东西,比如太阳能,永远如此,材料变得更便宜,锂离子电池在过去十年中其价格性能下降了90%。同样的事情,人们忘记了这一点,他们有点根据当前模型查看电力需求,然后他们预测这一点,每个人都说,哦,我的上帝,哦,我的上帝。
没有意识到模型正在变得非常高效,非常迅速。作为一个现实世界的例子,几十年来,飞机穿越大西洋所需的燃料量下降了三分之二,仅仅是因为发动机效率更高了。我们知道路线
飞行路线,哪里空气阻力较小等等。所以我认为我们将在人工智能领域看到同样的情况,模型变得非常高效,这将改变游戏规则。不足以推动上涨,但它肯定会极大地帮助整体能源需求。是的,我检查了这篇文章并研究了它的准确性,
有两件事需要评论。一个是杰文斯悖论,我们都喜欢谈论它。事实上,我们好朋友埃里克·布林约尔松可能是这个领域的世界顶级人物。我们应该邀请他作为嘉宾来谈论这个问题。然后另一件事是这被严重低估了。所以从被低估的方式开始,这值得一读,但它是通过自下而上推断构建的。
但我知道幕后推动这一进展的实际创新,它们比这大得多,而且速度也快得多。人工智能完成的软件创新可以实时部署。你不需要等待任何硬件或其他东西上线。你只需部署并运行。所以一旦人工智能能够自我改进,这将发生得比图表上显示的快得多。
另一件事是,你知道,它推断到大约100倍,从30倍到240倍不等。但我知道,仅在神经网络的量化方面,在这个维度上就有大约20到40倍。然后在思维链推理中,就在那里。顺便说一句,这些都是乘法的。所以我知道至少有三个维度是20到100倍,它们彼此相乘。
所以它将更像一千到一万倍。麻省理工学院有一位非常出色的研究员,Shane Longprey,我昨天和他谈过。他非常想围绕他建立一家公司,但他必须先完成他的博士学位。这非常令人沮丧。他只剩下几个月的时间了。但他正在做很多伟大的工作,你知道,现在,当你使用人工智能为你做某事时,为你制作视频或成为你的代理。
那里的参数也会说斯瓦希里语,并且了解量子,你知道,量子计算。就像所有其他知识实际上正在……
正在使用GPU,并且正在使用计算能力,即使它与该问题无关。所以你实际上可以使用该大脑的更小的子集来给你同样好的答案。这本身就是一个大约100倍的因素。他现在正在完成这方面的研究,然后我们将最终尝试将其产品化。所以我毫不怀疑这被严重低估了,无论是在时间上还是在影响上。所以是的,这非常令人兴奋。是的。
底线是,当埃里克·施密特说人工智能被严重低估时,这是我们意识到我们可以旋转所有这些旋钮,它们将给我们带来改进。每一个,100倍的改进乘以五或六个不同的旋钮。
这太疯狂了。让我们也谈谈杰文斯悖论。是的,请继续。因为我认为这,你知道,我认为100年来没有人说过杰文斯悖论,直到现在它每周都会出现。所以我们最好都理解它。为我们定义一下。好吧,事情是这样的。在正常的经济学中,埃里克·本·约尔弗森是这方面的专家。在正常的经济学中,你有供求关系,你知道,ISLM。我不知道你是否曾在麻省理工学院上过1402课程。我上过。
你知道,所以如果你说,嘿,我找到了一种种植香蕉的方法,你知道,它们现在便宜了两倍。它们的成本降低了一半。你知道,人们不会因为它们便宜了一半而消费两倍的香蕉。他们可能只消费多5%的香蕉。那是正常的经济学,对吧?价格下降。
然后经济的这一部分会变小,因为价格较低,石油就是这方面的经典例子。然后你进入科技领域,一些非常奇怪的事情发生了,如果我让GPU以相同的价格快10倍……
我的电子游戏变得更好。我使用电子游戏的数量减少了10倍吗?不,不,我实际上比以往任何时候都使用更多的电子游戏,因为它比以前更有趣了。所以即使它便宜了10倍,我的整体消费量实际上以美元计算却上升了,而不是下降了。这对经济学家来说是完全矛盾的。所以你看到了,呃,
最明显的是在人工智能领域,比以往任何时候都更明显,如果它更强大,因为你使模型在这种情况下的效率提高了30到240倍,这难道不会降低对GPU和数据中心的需求吗?不会的。它将走向另一个方向。对数据中心、芯片和电力需求实际上会急剧增加。
非常非常陡峭。所以很多人错误地预测了对能源、数据中心供应和芯片的投资。你知道,由于这个原因,至少在未来五年,也许是无限的未来,芯片都将供不应求。因为能力,就像VO3中的一个,我们稍后会看一些VO3视频,你会立即看到,一旦你这样做,你就会想要更多。是的。
每次能力提高时,你都会想要更多。你意识到它将重塑整个行业。我的意思是,不仅仅是给你一个新工具,它正在重塑整个行业。每个人都知道,今年早些时候,我在丰饶峰会上与一些令人难以置信的人一起登台,凯西·伍德、莫·加多特、维诺德·科斯拉、布雷特·阿德科克以及许多其他令人惊叹的科技首席执行官。我总是被问到,嘿,彼得,我在哪里可以看到峰会?好吧,
我终于发布了所有演讲。你可以在diamandus.com/summit免费访问我和凯西·伍德和莫·加多特的对话。这是与凯西·伍德和莫·加多特的免费谈话,网址是diamandus.com/summit。享受。我会要求我的团队将链接放在下面的节目说明中。好吧,让我们深入探讨谷歌I/O。
我们这里做的是,我们抓取了一个10分钟的视频。这是谷歌发布的回顾视频,是谷歌I/O的10分钟回顾。我们将以稍微加速的速度播放这段视频,我的“登月计划”伙伴们会随时参与并发表评论。这里面内容很丰富。人们理解谷歌刚刚宣布的内容非常重要。谷歌今天仍然是这里的主导者。
而且内容很多。好的,我们来看桑达尔开场,我们会抓住每一个机会进行一些有趣的对话。大家好,早上好。欢迎来到谷歌I/O。我们希望尽快将我们最好的模型和产品交付到你们手中。
我对模型的快速进展尤其兴奋。今天,Gemini 2.5 Pro横扫LM Arena排行榜所有类别。由于你们的努力,它在顶级编码平台上获得了广泛好评。Gemini 2.5 Pro是我们有史以来最智能的模型。
现在,由于它整合了LearnLM(我们与教育专家共同构建的模型系列),2.5 Pro也是领先的学习模型。是的,我们讨论了很多关于利用它来重新教育地球的事情。
我认为我们将看到各个领域的教育发生巨大变革。我们将面临的一个挑战是教育领域是否会接受这一点。我不知道你们对此有何看法,但教师工会必须参与进来。
我们将开始看到,你知道,我是让我的孩子去学校,因为他们使用的是旧式教学方法,还是用人工智能来教育我的孩子?想法?好吧……
是的。你知道,关于这一点的一个高级想法是丹尼斯·哈萨比斯将推动这一议程。他占据了制高点。现在观看谷歌的决定真的很有趣,看,我们诺贝尔奖获得者、才华横溢的家伙,我们将让他上台,让他成为中心人物。而且,你知道,他出色地完成了任务。但他无法与山姆·奥特曼在将以光速传播的用例方面竞争
你知道,虚拟朋友,创建你自己的内部侵犯版权的电影版本,所有这些东西。他无法触及这些,因为他是一位诺贝尔奖获得者。他致力于通过生物技术创新拯救数亿人的生命,你知道,因为他是一位AlphaFold专家,每个人都知道,所以他必须占据这个令人难以置信的道德制高点。所以,在舞台上,他非常专注于
从基本的物理原理开始工作的新的模型,来教授,来进行基本的科学创新,并教给世界他们需要的一切。这就像,这是令人难以置信的制高点,重要的用例需要很长时间才能渗透出来,因为,就像你说的那样,教师工会、监管等等。而与此同时,山姆则会在……
消费者方面,不管是不是间谍软件,我们都在做。我们正在全力以赴。这就是谷歌面临的困境。桑达尔不想成为那样的人。德米斯不想成为那样的人。下一个发言的女士也不想成为那样的人。这只是大公司与小公司思维模式的普遍现象。好吧,让我跳回去,然后萨利姆,我接下来会回到你这里。
我让2.5 Pro为我编写了一个简单的网络应用程序。有人带着一个绝妙的想法来找你。我将添加一个提示,要求2.5 Pro根据图像更新我的代码。以下是Gemini生成的。哇。我能够仅仅根据草图创建这个,但是如果它顶部呢?
这就是Gemini的原生音频的用武之地。那是一只穿山甲,它的鳞片由角蛋白制成,就像你的指甲一样。今天,我们通过引入一种名为DeepThink的新模式来使2.5 Pro变得更好。DeepThink利用我们在思维和推理方面的最新前沿研究,包括并行技术。我们正处于人工智能平台转变的新阶段。
几十年来的研究成果正在为世界各地的人们变成现实。推出Google Beam,一个新的AI优先视频通信平台。Beam使用一个新的最先进的视频模型来转换2D视频流
到逼真的3D体验。所以让我在这里暂停一下Google Beam。萨利姆和戴夫,我们有机会在今年的丰饶峰会上看到Google Beam。而且它不是,你知道,我的13岁儿子和我在一起,他们说这是他们在科技中心看到的最好的东西。
能够真正地在那里。现在,思科几年前尝试过这个,它很昂贵,需要数百万美元的硬件。我不知道Google Beam的价格是否已经公布,但这将是一种家用设备,当你想联系你的母亲或祖母时可以使用。它会非常便宜。是的,当然。
它可以非常便宜。我认为这是一件非常重要的事情,因为你可以考虑它带来的语言潜力。所有其他功能都将随之而来。我认为这将提升Zoom等公司的游戏水平,并迫使它们进入新的创新周期。
令人着迷。是的,我们还需要讨论一下价格点,因为很多东西都令人难以置信,你需要体验一下。然后谷歌说,要访问我在这里展示的任何内容,你必须获得每月250美元的Gemini Ultra帐户。
这是他们大胆的一步。大胆的一步。大胆的。我喜欢这个播客的一点是,看,这是可操作的,我们试图通过向人们提供尽可能多的可操作信息来改善人们的生活选择和轨迹。很多收听这个播客的人都会说,我不,每月250美元,就像房租一样。
所以好消息是,你可以以半价试用几个月,然后如果你想取消订阅。所以你,但你绝对必须尝试一下。我的意思是,你无法做到公正。谷歌已经训练我们免费获得一切,对吧。并且放弃我们的权利等等。我的意思是,Open AI已经证明20美元的价格点对大多数个人来说是可以接受的。我会放弃几杯拿铁,并获得世界上最优秀的人工智能,2或50美元,呃,
我认为这将成为任何专业人士的必备工具。因为这些工具将非常丰富,而且他们将从中获得足够的收益,我认为。六个月前,很多人都在说,基础模型是一场价格战。它们是商品。价格将会下降。鉴于它将成为商品,OpenAI的3000亿美元估值是疯狂的。
现在,很明显,所有这些都是错误的。绝对不可能更错了。因为你是一家基础模型公司,你可以发明和推出的功能以及它们将带来的价格点是天文数字的。现在,我们的任何听众基本上都在经历不可避免的事情。如果我没有接触到它,我就无法具有竞争力。我需要尝试一下。如果我不掌握这一点,我今天就会落后于社会。
如果我不掌握这一点,好吧,对不起,这将立即花费你250美元。我注意到,你知道,它立即收取了我的钱,但我花了24小时才制作我的第一个VO3视频。就像,哇,这件事结束了。我的意思是,我将其解释为它超额认购和超载。所以这显然是一场竞赛。戴夫,有一件事,
之前存在的功能,当我提到之前时,指的是上个月,上个季度,将免费提供。我们仍然会免费获得很多基础知识。但如果你想要最先进的技术,价格会随着时间的推移而上涨。
让我们回到这里。我们正在直接在Google Meet中引入实时语音翻译。很高兴终于能和你交谈了。所以是即时翻译,我们已经看到一段时间了。我认为将其整合到所有视频平台中将会非常有趣。我的意思是,现在YouTube正在在线翻译我们的播客。
在所有语言中,这太棒了。Zoom必须赶上Google Meet。萨利姆,对翻译有什么评论吗?我的意思是,我经常旅行,这将非常棒,可以举起我的手机并在不同的国家进行真实的翻译对话。我对此非常兴奋。有如此……
由此带来的赋能。我们一直在尝试它。它已经以一种笨拙的形式存在了很长时间。我认为这听起来像是从用户界面的角度来看达到了无缝的水平,这可能会改变游戏规则。所以,萨利姆,这直接影响了我们的旁注,顺便说一下,我们需要最终确定。彼得需要裁决几周前我们达成的这个旁注,我看到财富集中
到少数人手中的力量是压倒性的。然后民主化的力量发展得要慢得多。所以,你的旁注是,不,这将使人类的广大群体受益,你知道,在更……我们还没有量化这一点。所以我们必须解决这个问题,但我愿意为此投入任何你想要的金额。但在这里,它改变了定义。你之前谈到万亿美元,所以你可以投入万亿美元,我会投入几美元。我们拭目以待。
好吧,我们称之为比特币交易。但很有趣。听着,作为一个家长,你正在收听这个节目,过去你会说,哦,对我的孩子来说学习法语、希腊语、土耳其语或日语非常重要,无论你的文化根源是什么,或者你认为。你需要学习普通话,因为中国正在崛起的世界。然后你需要学习编码。编码总是像鼓励你的孩子学习编码一样。所以现在我们有……
这个数字世界允许我们通过自然语言进行编码,为什么如果我可以立即翻译,我还要学习一门外语呢?这里正在发生有趣的社会重组,因为当然,当你学习编码时,你会学习以不同的方式思考,当你学习语言时,你会以不同的方式学习文化,这将通过这里而变得多余,并且
所以我对此很着迷。我认为这里会有一些东西会持续存在,原因是当你学习一门外语时,你的大脑会自动重新连接。
会的。以根本不同的方式。这与许多有创造力的人演奏音乐、热爱音乐的方式相同,因为他们的大脑围绕着不同的范式进行了根本性的重新连接。你现在三角测量。你可以利用不同的脑神经回路。在印度,当他们举行全国性的数学竞赛时,总是由一个南印度人赢得。他们做数学的能力是……
是北印度人的10倍。他们发现这与语言的结构有关。节奏模式的结构使他们的思维自然地能够做到这一点。所以我认为学习钢琴、学习编码或学习某些深层技能或语言的想法将会持续存在,仅仅是因为它会为人们创造更多创造力。未来,只有创造力才能为人类所用。
好吧,我认为这会影响我们的旁注的原因,萨利姆,是因为全世界都有潜在的人才,它通常被语言障碍所束缚。现在翻译是实时的,它也保留了你的语音语调,所以你的自然声音,你实际上可以在你没有共同语言的不同国家交到真正的朋友。
我认为这是世界上的新事物。我们不知道它会走向何方。但我们所有成功的初创企业都以这个主题为主导:最好的朋友一起努力,每天工作24小时。哦,我的上帝。戴夫,这太棒了。我的意思是,我们现在能够找到——我的意思是,巴基斯坦、印度、东南亚部分地区有很多人才被束缚住,无法进入我们的资本市场。你可以想象——我们有Link Studios——
作为Link Exponential Ventures的一部分,它们位于麻省理工学院的校园内或附近。我们正在洛杉矶开设Abundant Studios。你可以想象利用这个深厚的资源库,并与我们街上的朋友进行自然的对话。那么,我们现在可以说我赢了赌注吗?
我回到Google I/O。我们有很多事情要讨论。我们的研究原型项目Mariner。它是一个可以与网络交互并完成任务的代理。我们在12月将其作为早期研究原型发布,从那时起我们取得了很大进展。我们开始将代理功能引入Chrome、搜索和Gemini应用程序。
让我向你们展示我们感到兴奋的东西。我们称之为代理模式。假设你想为你和两个室友在奥斯汀找一套公寓。你们每个人每月都有1200美元的预算。你们想要洗衣机烘干机,或者至少附近有自助洗衣店。
使用代理模式,Gemini应用程序会在幕后工作。你可能熟悉我们的人工智能驱动的智能回复功能。现在想象一下,如果这些回复听起来像你一样。这就是个性化智能回复的理念。在你的许可下,Gemini模型可以以私密、透明且完全在你控制之下的方式使用你的Google应用程序中的相关上下文。
假设我的朋友写信给我寻求建议。他正在去犹他州进行公路旅行,他记得我之前做过这次旅行。Gemini几乎可以为我完成所有工作,查看我在云端硬盘中的笔记,扫描过去的电子邮件以查找预订信息。Gemini匹配我从过去电子邮件中获得的典型问候语,捕捉我的语气、风格和最喜欢的词语选择,然后自动生成回复。
哇。太棒了。我的意思是,所以它就像那里的代理模式,以及谷歌以非常深刻和有意义的方式进行个性化定制。我惊呆了。我的意思是,不,听着,事实是他们的目标是让每个人都从iPhone切换到Android,从Outlook切换到所有谷歌套件。而且它
越来越有吸引力。我的意思是,它将达到我想要的地步,而且我愿意,你知道,切换平台的成本非常巨大。
如果谷歌能够提供足够吸引眼球的东西和足够的认知糖果让我切换,那将是一件大事。他们演示的用例对我来说非常有趣,因为桑达尔说,嘿,假设我想去犹他州,我想租一辆自行车。拜托,伙计。我们本周在Vestmark已经做了同样的事情,我们将相同的A2A代理到代理和MCP功能。
我们将其移到我们的防火墙内,它现在打开传入的电子邮件和带有交易请求的Outlook。
然后人工智能将读取交易请求,自动交易账户。我们这里谈论的是数万亿美元,自动生成交易文件,然后将其路由出去。因此,我们本周已经在这个高杠杆用例中使用了这种确切的功能,但完全构建了人工操作员。金融服务行业每年在与这些活动相关的后台运营上花费约1000亿美元。
当我们对它们进行抽样时,如果你愿意将其连接到敏感信息、金融账户,并且找到一种将其置于防火墙后面的方法,那么每一个都是现在可以使用人工智能完成的。他们本周刚刚推出这个。这是一个巨大的突破。但是,你知道,当你像这样登上舞台时,你必须谈论一些事情,比如,嘿,我正在租一辆自行车。好吧。桑达尔为什么听起来像人工智能?我的意思是……
好吧,他的名字是Pitch AI,所以我认为这就是他们选择他担任CEO的原因。哦,不。太糟糕了。但桑达尔身处困境,对吧?他身边有谢尔盖和拉里看着他。他又面临创新者的困境。同样,他们的全部收入基础一直是谷歌搜索。不是全部收入基础,而是三分之二的收入。他们有YouTube,这太棒了。他们有Waymo。他们还有一系列其他。但是
切换事物,我们稍后会看到这一点,将这些事物从搜索中切换出来,他们必须这样做才能继续生存和发展。萨利姆,对代理元素或个性化有什么评论吗?让AI搜索你的所有电子邮件并代表你回复是否感觉很奇怪?我的意思是,我发现
代表我们回复有点令人毛骨悚然和不安,对吧?因为你不知道它会说什么,等等,等等。我认为这只是我们习惯它的事情之一,它很快就会变得例行公事。人们最初的情绪反应会存在。我认为在商业方面,它的潜力比在个人方面要大得多。
这种类型的东西对企业级客户服务响应和各种事情的影响非常大。所以我认为我们将看到更多企业级而不是个人级的代理人工智能。是的。好吧,让我继续。有很多事情要谈。继续。继续,戴夫。继续。这很丰富。我们可以花几天时间讨论这些事情。但如果你说你想听。
在消费者方面,你知道,每个人都担心隐私,但随后他们推出了你绝对必须拥有的功能,你没有选择。你总是勾选复选框。你一天要按多少次接受按钮?你甚至不知道你刚刚接受了什么。我的意思是,隐私早就死了。我的意思是,拜托。我的意思是,人们不能,人们想要隐私,但你的Alexa在监听。你的Siri在监听。一切都在一直监听。隐私是一件非常值得渴望的事情。我不接受这是真的。
好吧,这就是为什么真正杰出的德米斯·哈萨比斯类型和马克·平卡斯,我们的朋友,
他们需要参与监管,你知道,这可能是他们在出生时、在成长过程中想到的最后一件事,那就是他们会参与监管。但随着这些能力的出现速度,如果像这样的人不参与监管,我特别提到这些人,因为他们真正关心,他们真的想要一个功能性、非反乌托邦的未来。我们必须将人工智能作为一种工具来创建人工智能的监管。没有其他方法能够跟上。
所以丹尼斯这样的人处于顶层令人欣慰,因为他们只是非常有人情味、善良的人。所以这令人鼓舞。
在政府方面,这是我们很久以前就跨越的鲁比孔河。在美国,不再有隐私权了。它已经被技术完全瓦解了。我看到的最好的框架是,假设你生活在一个全球机场。在机场,你知道你正在受到监视,你的权利随时可能被剥夺。从本质上讲,这现在正在传播到每个国家的每个生活方面。
是的,你让你的AI访问你的对话和电子邮件变得如此方便。它会让你世界变得自动化的,关闭它。
就像关闭你一半的认知能力一样。再说一次,我认为,彼得,记得10年前在奇点大学,我们播放了马克·扎克伯格的视频。这是马克·扎克伯格的洋葱视频剪辑。他们说,哇,这是有史以来最好的中央情报局特工。他让全世界都告诉我们他们在哪里。我们甚至不需要间谍了,因为这真的只是告诉我们
好吧,他们是。所以,马克·扎克伯格,这是你获得有史以来最伟大的中央情报局特工奖。我认为我们在这条道路上走了很长时间,我认为没有回头路了。本周早些时候,我与两家最大的保险公司(财富50强公司)举行了会议。
我说,听着,你们,你们将如何采取行动?你们需要像明天一样采取行动。其中一家想用人工智能来进行季度结算。所以你不能像上市公司那样谈论。所以世界上没有什么比你的季度结算数据更敏感的了。
他们说,好吧,我们有两个选择。微软说,把所有东西都给我们。相信我们。我们已经拥有你在Outlook中的所有电子邮件了。所以把它扔给我们,相信我们。他们说,是的,这听起来有点可怕,但也许吧。另一个选择是采用Llama 4。
对其进行蒸馏,并将其引入公司内部防火墙内。这就是初创企业的乐园。并且作为一种解决方案非常非常可行。他们只需要一个供应商来为他们连接它。所以我认为很多关心自己未来的公司和国家都会走后一条路
但另一种选择是将你生活的方方面面、你的数据和所有东西都让给OpenAI、微软、谷歌或XAI。对于主权国家来说,对于许多金融科技公司来说,走这条路是不可行的。
所以这是一个有趣的事情,你知道,非常非常充满活力的时候。我将回到Google I/O视频。好吧,让我们开始吧。Gemini Flash是我们最高效的模型。新的Flash在几乎所有方面都更好,在推理、代码和长上下文方面的关键基准测试中都有所改进。Flash将于6月初正式上市,Pro版本随后推出。Gemini Diffusion是一种最先进的实验性文本扩散模型。
它利用这种并行生成来实现极低的延迟。我们今天发布的Gemini Diffusion版本比我们目前最快的模型快五倍。这是我们对Gemini应用程序的最终愿景。
将其转变为通用的AI助手。在Project Astra中,我们对语音输出进行了升级,使其更加自然,并具有原生音频。我们改进了内存并添加了计算机控制。顺便说一句,你可能之前听我说过Fountain Life,你可能希望,彼得,请你停止谈论Fountain Life好吗?答案是我不会,因为我们真的正在经历一场医疗危机。你可能不知道这一点,但70%的心脏病发作没有任何先兆,没有疼痛,没有呼吸急促,
而其中一半患有心脏病的人永远不会醒来。除非到了三期或四期,否则你感觉不到癌症,直到为时已晚。但我们拥有所有必要技术来大规模地早期检测和预防这些疾病。这就是为什么包括托尼·罗宾斯、比尔·卡普和鲍勃·哈鲁里在内的一群人共同创立了Fountain Life。
一个一站式中心,帮助人们了解他们的身体内部发生了什么,然后再为时已晚,并获得治疗方法,让他们拥有几十年的额外健康寿命。从Fountain Life了解更多关于你身体内部情况的信息。访问fountainlife.com/Peter。
并告诉他们彼得让你来的。好的,回到节目。我们将展示Project Astra的视频示例。我的意思是,听着,贾维斯来了。我能够与Astra交谈并要求它为我做事、为我研究事情、向我展示房间里的某个东西的能力。我的意思是,这太疯狂了。我们将回到这一点,因为示例视频非常引人注目。
但我只是,你知道,我一直跟踪贾维斯,如果你愿意的话。它终于来了。感谢谷歌将其提供给世界上比任何其他产品更多的人。在我们最大的市场(如美国和印度),人工智能概述推动了显示它们的查询类型增长超过10%。
尤其令人兴奋的是,这种增长会随着时间的推移而增加。我们正在引入一种全新的AI模式。这是对搜索的彻底重新构想。借助更高级的推理,你可以向AI模式提出更长、更复杂的查询。我们很高兴从今天开始在美国为每个人推出AI模式。随着时间的推移,我们将直接将AI模式的许多前沿功能和能力整合到核心搜索体验中。
从今天开始,我们将为AI概述提供支持AI模式的相同模型。因此,你可以将你最棘手的问题直接带到搜索框中。好的。谷歌方面的一大举动。非常非常激动人心。孤注一掷。嗯哼。
最好将股价与这个确切的时间线叠加起来,因为这正是股价开始暴跌的时候。而且,你知道,它显然蚕食了核心业务。他们愿意这样做令人难以置信。然后就在那之后,他们必须推出。
他们必须。但是,你知道,当他们推出所有令人难以置信的人工智能功能时,他们第二天就收回了所有损失,甚至更多。所以它实际上在周末之前就奏效了,这是一个策略。但是,你知道,每个人都知道OpenAI正在抢占实际的人工智能用户群,而谷歌落后很多。但现在他们将声称,好吧,任何进行谷歌搜索并启用此模式的人……
都是人工智能用户。所以我们实际上领先于Open AI。这也是非常聪明和激进的。这很有趣。我的家人和朋友说,哦,是的,我问过Chat,对吧?他们与Chat GPT建立了私人关系。他们给它起了个名字。AI模式,如果你想让AI成为你日常生活的一部分,你需要个性化这些AI。所以我猜我与Gemini进行了一次对话,这就是它的发展方向。
Saleem,你怎么看待这个?我认为他们这样做值得称赞。他们很容易固守旧的搜索框,让它保持原样,同时进行实验。但要做出如此激进的改变,将其直接构建到他们的核心产品中,这需要极大的勇气。我同意他们别无选择,但许多其他公司不会这样做。所以让我们拭目以待。好的。
我认为如果你退一步来看,我的意思是,美国之所以能够运作,从根本上是因为初创企业不断创新并推动发展。但是这项能力本会在谷歌内部埋藏多年,甚至永远埋藏。是的。
没有竞争压力。所以这是一个很好的案例研究,我们需要在美国经济中保留的正是这种动态,即大公司只有在我们继续资助小公司的情况下才会行动。如果首次公开募股经济和风险投资经济崩溃,整个国家都会停滞不前。所以这是一个很好的案例研究。
我喜欢。说得很好。好吧,让我们继续。让我补充一点。如果谷歌是一家欧洲公司,这种情况永远不会发生。是的。是的。好吧,让我找到我们刚才的位置。这就像在我的搜索中拥有我自己的体育分析师。
搜索发现呈现这些信息的最佳方式是图表,它创建了图表。复杂的分析和数据可视化将于今年夏天用于体育和金融问题。使用您的相机,搜索可以查看您看到的内容,并在您实时来回切换时为您提供有用的信息。我们将 Project Mariner 的自主能力带入 AI 模式。
搜索可以在我的控制下帮我分担工作。搜索帮助我跳过许多步骤,直接链接到完成结账。门票已预订。通过 AI 模式,我们正在带来更高水平的智能来帮助您在 Google 上购物。搜索会动态生成一个可浏览的图像马赛克
和一些专为您个人定制的可购物产品。为了创建大规模适用的试穿体验,我们需要深入了解人体以及服装在人体上的外观。为此,
我们构建了一个专门针对时尚训练的自定义图像生成模型。好了,开始了。谷歌正在进军亚马逊的业务,即时购物。这将是一个有趣的叠加。戴夫?感觉他们只是把所有东西都扔到墙上。我的意思是,把所有东西都扔出去。
不过,让我告诉你背后的肮脏秘密。谷歌的搜索量在 2017 年就趋于平稳。几年前他们就停止报告了,因为它是平稳的。
但收入却一直在上涨。他们说,看,我们展示的广告数量与以往一样多。但他们实际上所做的是,他们取消了低价值搜索的所有广告,例如棒球比分就是一个很好的例子,并且他们在所有带来收入的主题上疯狂地增加了广告。所以那是汽车保险、抵押贷款、工作、旅行,只有一两个其他类别带来了所有收入。因此,当他们推出这项服务时,请注意他们提供的例子是棒球比分,
反正那里没有收入,所以把它转移到 AI。另一个是购物,他们在那里被亚马逊击败。大约 60% 或 70% 的所有可购物产品搜索,您都会直接去亚马逊。你甚至不会从谷歌开始。所以他们无论如何都赢不了这场战争。因此,他们基本上会宣称 AI 的霸权,并尝试只将点击率低的收入类别转移到亚马逊。
他们非常擅长在内部优化这种平衡。所以这是他们试图避免过度蚕食,同时声称拥有比 OpenAI 更多用户的策略。而且,你知道,没有什么……
我认为他们会在购买方面追击亚马逊,对吧?我的意思是,如果我使用 Gemini 处于 AI 模式,并且我正在谈论一些事情,它会弹出并说,顺便说一句,你可以在此处购买它。在对话中或研究过程中进行无缝购物,然后不得不转向亚马逊。这将是对亚马逊收入引擎的入侵。
这是一个很好的观点。实际上,在这场公关大战中,克劳德在这场活动中脱颖而出,每个人都在互相攻击。但亚马逊却异常沉默,尽管他们在 AWS 内部确实有很多事情要做。我知道他们在努力。他们肯定有计划。他们似乎并没有参与这场公关大战。
是的,然后苹果似乎完全放弃了。这太可怕了,太奇怪了。是的,太奇怪了。好吧,让我们回到这里。这是谷歌搜索的未来,一种超越信息走向智能的搜索。
我们的目标是使 Gemini 成为最个性化、最主动和最强大的 AI 助手。Gemini Live 现在包括相机和屏幕共享。所有这些都将在 Android 和 iOS 上的 Gemini 应用程序中免费推出。我们将最新、功能最强大的图像生成模型引入 Gemini 应用程序。
它被称为 Imagine 4。图像更加丰富,色彩更细致,细节更精细。今天,我很高兴地宣布我们新的最先进模型 VO3。VO3 带有原生音频生成功能。这意味着 VO3 可以生成音效、背景音和对话。
好了。VO3 大满贯本垒打。哦,我的上帝。非凡。戴夫,你在获得 250 美元的账户后就开始玩了。
它有多容易?是的,是的。哦,我的上帝。好吧,这很简单。您必须获得帐户并开始使用它。它立刻令人震惊。我认为音频的集成真正使其超越了顶峰。
但您会立即明白,媒体的未来将完全发生转变,因为它按需提供。就像,这就是我想为我即时创建的内容。而且一旦,你知道,每次你使用 VO3 时,它都会被剪辑成 8 秒,你立刻想要一部完整的电影。你会想,为什么我只能得到 8 秒?答案是地球上没有足够的 GPU。地球上还没有足够的计算能力。
来满足每个想要立即获得此功能的人的需求。这让你了解到,你知道,有多少数据中心和 Chase Lockmill 或 Caruso 将会成功。
因为仅此用例就会消耗所有资源,更不用说客户服务、代码编写以及所有这些组合在一起的事情了。但令人惊奇的是,Josh Woodward 获得了这个单元。就像,这是关键。就是这样。彼得,你的朋友乔什得到了它。是的,乔什今年在丰饶峰会上与我们同台。他是一位非常优秀的演讲者。但这太棒了。Saleem,你对 VO3 有什么想法?
我认为随着人们开始使用它,这将很有趣。我很好奇人们将在个人层面上如何使用它。显然有商业用途等等,但我真的会用它来生成我自己的娱乐吗?我不确定我会。你知道,我们之所以看电影,尤其是因为人们为我们创造了一种体验,对吧?所以我认为这对专业电影制作人来说将非常棒,而且对于制作试播集也很棒。
各种各样的东西都会通过这个出现。我认为它不会对最终消费者产生太大影响。我不确定这一点。我的意思是,听着,双子座……
Gemini 3、Gemini 4,其中一个会看过我喜欢的每一部电影。它会理解上下文,理解我真正喜欢的细微之处。我的意思是,如果它有一个对着我的摄像头,它会理解我什么时候在微笑,什么时候在皱眉,什么时候对它做出反应。它可以生成一个,你知道,想象一下你想看某个特定电视剧的下一季,对吧?我很想看看原版《星际迷航》的下一季。是的。
你会看到的。彼得,这是一个很好的例子,因为是的,每个 Netflix 节目,
你知道,《从地球到月球》或其他什么,当你结束时,你总是想要更多。而他们实际上无法创造更多。好吧,现在他们可以了。无论是被动还是主动,实时为你创造,还是制作人现在可以更快、更便宜地制作剧集。你永远不会让,比如哈利波特,你永远不会让观众失望。就像,哦,这是最后一本书,这是最后一部电影,消失了。仅仅让观众从悬崖上掉下去是极其低效的。
所以现在这种情况可能永远不会再发生了,无论是由于制作成本大大降低,还是因为人们可以自己创作。无论哪种方式,这种趋势都会发生。但我也很想和你打个赌,Saleem。我认为,你知道,电影制作人一直沉迷于这样一个概念,即人们从根本上来说是懒惰的。
但我认为并非如此。我认为这种媒介,被动媒介,如果你在洛杉矶阳光明媚的一天走进黑暗的剧院,然后走出黑暗的剧院,阳光普照,你会感觉很糟糕。你知道,你喜欢这部电影,但你会觉得,我在哪里?现在能够保持对话继续进行,你可以四处走动并继续进行,你可以引导它到你想要的方向。这对人们来说将非常有吸引力。我认为制作人还没有掌握新的媒介。但当他们掌握时,我认为……
我刚在谷歌上搜索了一下,上面写着,今天电影的平均镜头时间是多少?所以对于一部现代电影来说,平均镜头长度在 2.5 到 6 秒之间。在动作片中,每个镜头的时长为 2 到 3 秒。在剧情片或艺术片中,每个镜头的时长为 8 到 10 秒。因此,如果这里有任何物理限制,你只需要把这些拼凑在一起。但好莱坞被摧毁了。
我的意思是,对不起。你知道,当我身处洛杉矶时,我会开车经过好莱坞的所有工作室。他们如何在未来两三年继续存在?是的,你说的完全正确,因为,你知道,看看宝莱坞取得了多大的成功。而且,你知道,为什么?好吧,这是因为,看,电影在文化上是一致的,而且很有趣。
它只是与观众相符。但是,为什么所有电影最初都出现在洛杉矶呢?好吧,这是因为我们需要在户外拍摄场景,天气良好。每次纽约下雨时,将所有设备搬到室内都太贵了。所以我们必须在这里建立,这里天气好。但现在,你知道,这种内容与天气无关,它是全球性的,也是语言无关的。所以它只是受人才限制。所以是的,你是对的。它现在应该被民主化并迅速传播到世界各地。
好吧,让我们进入 Google I/O。我们已经完成了四分之三,还剩下四分之一。新的 SynthID 检测器可以识别图像、音频轨道、文本或视频中是否包含 SynthID。基于我们与创意社区的合作,我们一直在为创意人员构建一个新的 AI 电影制作工具。我们称之为 Flow,它将于今天推出。让我向您展示它的工作原理。
这些是我的素材,老人和他的车。我们让您轻松地将自己的图像上传到工具中。它还可以让您扩展剪辑,因此我可以获得我一直努力追求的完美结局。但是,关于可能让您以新方式体验 AI 助手的兴起形式因素呢?
这正是我们现在正在构建 Android XR 的原因,您应该通过我的 Android XR 眼镜的镜头看到我看到的东西,就像我这里美味的咖啡和莎伦刚刚发来的短信一样,让我们看看他说什么,好吧,这绝对是演出时间,所以我将启动 Gemini 并开始工作,Gemini,我之前喝的杯子上的咖啡店叫什么名字
嗯,那可能是 Bloomsgiving。好的,Gemini,向我展示步行到这里需要什么。大约需要一个小时。好的。我可以走几步,这些抬头显示方向和完整的 3D 地图应该会让它变得非常容易。我很高兴今天宣布,Gentle Monster 和 Warby Parker 将成为首批与 Android XR 合作制造眼镜的眼镜合作伙伴。好的。呃……
所以,我的意思是,我愿意付出任何代价来参加下一次苹果董事会会议,因为你有了萨姆·阿尔特曼说,我要找约翰尼。我要做设备。我让谷歌说,我要离开。我们有更好的 AI 驱动。而且,你知道,就像,哦,我的上帝,他们他们我的意思是,这就是,你知道,苹果应该付出代价的地方。他们什么都没做,甚至没有尝试。疯狂。是的。
所以,Saleem,我的意思是,XR 眼镜,我的意思是,是时候让我们运行一些好的 AR 了。但这会改变我们的行为,对吧?所以每天当我走在街上时,我是否开启了教育模式?我是否开启了游戏模式?我是否开启了娱乐模式?我的意思是,如果我们允许它,它将成为主要的教育伙伴。
你知道,Wubby Parker 来了,也许它们看起来不错。也许它们看起来很时尚。也许戴着它们你不会看起来像个书呆子。我认为任何东西都不能帮助你戴着这些眼镜时看起来不像个书呆子。但我去年在 A360 上玩了你分发的 Meta 眼镜,彼得。是的。它们太棒了。
它们看起来像好的太阳镜,它们的作用也像好的太阳镜,并且它们内置了所有这些 AI 功能。看到它真的很有趣。那就像第一版。下一版本的性能将是 AR 内置的 100 倍。
我认为这将在这个领域带来相当大的改变。我认为看到用例和潜在效用将非常令人惊奇。每天我都会收到最奇怪的赞美。有人会停下来对我说,彼得,你的皮肤真好。老实说,我从未想过会从任何人那里听到这句话。老实说,我不能完全接受这份功劳。
我所做的就是每天两次使用名为 OneSkin OS1 的产品。该公司由四位才华横溢的女性博士创立,她们发现了一种肽,可以有效逆转皮肤的年龄。我喜欢它,再说一次,我每天都使用它两次。您可以访问 OneSkin.co,并在结账时写下 Peter 以获得我使用的相同产品的折扣。那就是 OneSkin.co,并在结账时使用代码 Peter。好了,回到主题。
好吧,让我们快速浏览一下。我要退出 Google I/O 摘要。很多令人惊奇的东西。并向 Sundar 和 Sergey Brin,以及那里的整个团队,为他们所做的工作表示祝贺。他们本周确实名列前茅。如果你看看 PolyMarket,你知道,到 5 月底谁将引领 AI 吗?PolyMarket 的结果显示谷歌为 80%,Anthropic 为 19%,XAI 为 1%。
好的。这似乎是合理和合理的。然后让我们看看 Polymarket 对 2025 年年底的预测。谷歌仍然位居榜首,为 38%。OpenAI 回到了 26%。XAI 为 23%。我认为这对我来说是有道理的。OpenAI 将——这是一场他们之间的战斗。然后,当然,埃隆从右外野出来,显然。
而且,你知道,我的座右铭是永远不要与埃隆对抗。戴夫,对此有什么评论吗?这是世界上最娱乐的事情。但你说谷歌又回到了顶峰。但是看,在这个图表上,他们在三月份排名第三。所以每个人都认为他们不行了。如果你想靠押注谁在超越谁来谋生,你实际上可以在这上面下注。但在现阶段,你知道,尽管有这张图表,但这只是一场四马齐驱的全面竞赛。每个人都以人类所能达到的最快速度前进。
所以,你知道,我不认为短期趋势让谷歌跃居榜首,你知道,它实际上会崩溃。
在未来一年中,这四位参与者之间还会出现很多次。但这种强烈的能量水平是我们以前从未见过的。它正在加速我们的 AI 未来。这也是人类创新史上最重要的竞赛。现在的影响要大得多。
你知道,我们过去看到的比赛。所以资金数量、能量数量、时间短,如果你想跟踪一件事情并在你的一生中享受它,那就是它。我将只介绍几张 VO 幻灯片。我们看到了这张幻灯片,但你制作了这张,戴夫,告诉我们关于它的信息。这是我第一次使用 VO3。所以我只想纪念它。好的。并捕捉它。
你的提示是什么?就在那里。为我制作一个数据中心被恐龙淹没的视频。我不敢相信它有多好。无需重新提示,无需调整。这就是它返回的内容。但我脑海中浮现着 Chase Lockmiller、Crusoe 和 Project Stargate,因为 Chase 已经一夜之间成为名人。祝他一切顺利。他是我们的麻省理工学院校友。
而 Crusoe,你知道,他是正在德克萨斯州阿比林建造星门的公司。所以我一直在观看这个规模惊人的建筑工程的视频,电力、管道、发电,现在芯片将开始进入。这本身就是一个值得关注的故事。Chase 是一位非常优秀的人。他
他将在未来很长一段时间内成为另一个马克·扎克伯格式的人物。我不知道为什么我希望恐龙在它完成之前就将其淹没,但这只是我当时的想法。
好吧。我还需要展示一个 VO3。我发现它很有趣。我们所有人,你知道,晚间电视,你会看到这些荒谬的制药广告,他们在这些广告上花费了很多钱。好吧,这是一个用 500 美元而不是 50 万美元制作的制药广告的例子。只需快速听一下这个。我尝试了一切来治疗我的抑郁症。
什么都没用。每天都感觉很沉重。我感觉被困住了。然后我尝试了 Pupperman。我们的处方可以帮助您的身体分泌一种特殊的荷尔蒙,这种荷尔蒙会吸引小狗。所以那部电影,广告继续播放,它很搞笑。但对我来说,这相当于对某些东西的广告宣传,某些,
一些让你的,没关系。我不会去那里。那看起来令人瞠目结舌地真实。确实如此。确实如此。所以这是我最喜欢的。这是我最喜欢的 Google I/O 部分。对我来说,这是 Jarvis 的具体化。我想播放这个,看看这个,然后让我们谈谈令人震惊的时刻以及这将如何改变我们的生活。你能上 YouTube 找到一个关于如何解决这个问题的视频吗?当然可以。我现在正在打开 YouTube。
这看起来像一个不错的视频。在螺丝头上套上橡皮筋。哦,不错。你能查看我与自行车店的电子邮件并找到我需要的六角螺母尺寸吗?当然可以。根据 Bicycle Habitat 的电子邮件,您的链轮需要 3/8 英寸的六角螺母。我已经为您突出显示了正确的垃圾箱。看来我需要一个备用张紧螺丝。你能打电话给最近的自行车店看看他们有什么库存吗?是的。正在给他们打电话。我会告诉你他们有什么库存。
我认为我的刹车片磨损了。你能再次查看手册并查看它是否在任何地方谈到它们吗?根据手册,如果您查看第 24 页……嘿,你想吃午饭吗?是的,给我五分钟。你能说完你刚才要说的话吗?正如我所说,如果您查看第 24 页,第 2 节,您将看到如何更换刹车片。嘿,那个电话有什么更新吗?
是的,我刚和自行车店通完电话。他们确认他们有您的张紧螺丝库存。您想让我下个提货订单吗?你能给我展示一些我可以放在自行车上的狗篮子的例子吗?当然,我可以帮你。请稍等。这里有一些选择。我认为 Zuka 戴上这些会非常漂亮。
Jarvis 宝贝来了。我想解放自己,不再拿着手机。我想戴上我的眼镜和我的音频拾音器,让它看到我看到的东西。但是我的天哪。是的。好吧,这是一个很好的机会,让我向我们所有在中东和其他地方的至高无上的领导者朋友们致敬。你刚才看到的实际上不会发生在你的国家。
原因是,计算能力,你无法访问计算能力。你可以在接下来的几个月里做到这一点,但随后所有其他正在涌现的用例都将对你进行竞价以获得该数据中心空间。然后,除非你制定某种国家计算计划,否则你的民众将无法做到他们刚才看到的事情。而且,你知道,就像我们上次说的那样,200 个国家中大约有 180 个根本没有计划。
如果你想让你刚才看到的事情在你的民众中真正存在,你必须立即着手解决这个问题。他们会为此而尖叫。哇,是的。这是一个奇迹,它变成了我们期望并感觉自己应得的东西。Saleem,你对此有何看法?
视频很棒。一旦你可以以这种无缝的方式激活和使用数百万个小型 YouTube 剪辑。我的天哪,这太不可思议了。不过,我想回到戴夫刚才说的话。你知道,在线上发生的事情令人难以置信。
在这个领域,然后你看看大多数国家的国家政策,它们就像令人难以置信地落后。我与一个即将成为一个非常大、非常富裕的国家的兴起国家的国家元首进行了交谈。他们的第一个想法是让我们建立一个呼叫中心。
你会说,不,有四代人。让我们至少进入 19 世纪。忘记 20 世纪。忘记 21 世纪。我认为政府中聪明的人需要在那里真正改变游戏规则。因为世界上几乎每个国家的政策都是防御性和被动性的。只有两个地方积极主动地这样做,那就是迪拜和新加坡,对吧?
我在想,他们做得并不好。所以想象一下,如果任何国家都制定了具有前瞻性的政策。它真的可以改变游戏规则。所以我认为一两个或三个国家将开始这样做,然后我们将看到政府的这种普遍转变。但是,伙计,这将改变……我认为这将是推动这种转变的驱动力。所以这非常令人兴奋。我想补充一点,你知道,当我想到这是 Jarvis 时,与 Jarvis 相抗衡的政策
Jarvis 的合作伙伴是托尼·斯塔克,对吧?托尼·斯塔克是一位拥有这种令人难以置信的 AI 能力的激进亿万富翁。但猜猜怎么了?这种能力现在对每个人都可用。我们正在去货币化和民主化我们对这个未来的愿景。这太不寻常了。而且,你知道,这将影响你在这里赢得与我的赌注,Saleem。我只是
哦,我有。好吧。我们下次再谈这个。好吧,我们必须完成。我认为我们完成了。
我不想透露太多,好吧。好吧,让我们先完成赌注,然后我会告诉你为什么我会赢。好吧。实际上,彼得,我想告诉你,在纽约的 Saleem、麻省理工学院的我以及洛杉矶的你之间,我们现在正在启动一家新公司,它利用了,你看到那个合成广告和真实广告一样好。但我们在 EverQuote 使用名人广告进行了一些测试,它们效果非常好。
使用勒布朗·詹姆斯时遇到的一个问题是,他的峰值点击率或峰值印象值是在季后赛期间,那时他无法去工作室拍摄视频。因此,我们测试了两件事。如果你在
旺季制作一个合成的勒布朗·詹姆斯,点击率是多少?这太不可思议了。然后,如果你制作数千个广告变体,勒布朗在做不同的事情,也许是不同的语言,只是不同的信息,这也会极大地提高广告的价值。所以我们现在正在努力的是一家公司,基本上名人只需要勾选一个框并收钱。
他们不必露面拍摄任何东西。其他一切都是由人工智能完成的。太棒了。这也会吸引你很多洛杉矶的超级巨星,你经常看到的电影明星朋友们。他们从来不露面在麻省理工学院。只有Will.i.am和……好吧,他们有一半时间都不露面。他们只出现在自己的电影首映式上。是的。
好吧,所以你会惊讶地发现,如果你能请到Will.i.am或者任何人来麻省理工学院的校园,学生们会成百上千地涌出来。他们对名人反应过度。所以我真的很兴奋这个项目能把一小部分人带到校园里来。
我喜欢。这是达里奥发的一条有趣的推文,他说,2026年,我们将看到第一家只有一名员工的十亿美元公司。我们已经预测了很长一段时间了。我明白了。我同意。我不知道你们……两年前,你和我在推出EXO 2.0这本书时,我们说它需要三名员工和人工智能来交付。所以这并没有缩减到一个。顺便说一句,它很快就会缩减到零。
是的,有了代理人和加密货币。是的。好吧,谁拿到钱?这很有趣。代理人。这就是整个DAO模式即将实现的景象。是的,去中心化自治组织。对我来说,这可能是即将到来的最令人兴奋的事情之一
就是这些模型将如何帮助我们在数学、物理学和化学方面取得突破。所以这是来自,我相信,Anthropic的。这是对各个学科何时会被解决的预测。因此,纯数学将在2028年得到解决。
这意味着所有未解的数学难题都将由人工智能解决。让我们往下看。29年3月计算化学。到2029年10月,药物化学将产生候选分子。材料科学将在2030年得到解决。这意味着你可以说,我需要一种具有这些热力学特性、这些特性
成本特性,这令人难以置信的细胞生物学核心通路在2030年5月,气候地球建模系统在2033年,这是非线性的拐点,它彻底颠覆了我们对未来的所有预期,看看那个小字条,上面写着大多数可治愈疾病在两年半内,对吧,那条垂直线,太疯狂了
好吧,这就是我们看到的德米斯·哈萨比斯所说的。他们将在未来十年内治愈所有疾病。我想在纯数学或计算方面看到,我想看看他们期望取得哪些突破。因为我想看看这个学科是否被“解决”。但我想看看他们期望在那里达到哪些具体的里程碑。
所以,无论如何,我们可以在其他时间担心这个问题。但总的来说,这太令人惊叹了。是的,这就是我们非常需要理查德·索彻作为嘉宾的原因,因为他已经规划出了时间表。最好能得到他对这些时间表是否准确的意见。因为它们主要受仿真建模和合成数据的限制。这因学科而异。但我们知道量子计算对于材料科学来说非常非常重要。
以及化学反应模拟,也就是完整的细胞模拟器。因此,时间表和技术现在可能在某种程度上是可以预测的。
这就是为什么我喜欢和你俩一起参加这个播客,真正考虑一下过去一周发生的事情。你真的帮助我把它放在了语境中。对于所有在这里收听的听众,我希望你们喜欢这个节目,因为戴夫、萨利姆和我正在倾注我们的心血。我们每周都把它作为我们的首要任务,真正地向你们传递我们所看到的,以及它今天的意义。
所以请加入我们的“登月计划”,让我们一起推进这项工作。和我们每周一样,让我们谈谈加密货币和比特币。这是一个大事件。比特币超越了亚马逊和谷歌的市值。这对比特币来说也是一个重要的一周。萨利姆,你高兴吗?
随着事情的发展,我越来越高兴。对我来说,这就是民主化的定义,因为世界上每一个个体都可以拥有比特币。而拥有黄金,比如说,是非常非常困难的。
所以,我认为,这是一个朝着正确方向发展的巨大趋势。我们可以专门做一个节目来讨论这对法定货币的影响。这可能是与杰夫·布斯作为嘉宾,讨论一下我们50年来一直在做的事情的影响,法定货币承受着巨大的压力。我们本周看到了国会通过一项法案的斗争,这项法案只会让债务膨胀。
所以,所有这一切都有一些重大影响。
是的,我们将看到比特币也超越微软。它还需要一段时间才能超越黄金,但它也会到达那里的。当然,本周我们看到比特币飙升,超过11万美元,创下历史新高。正如我们每次所说,这是一个非凡的时代。你知道,我们谈论的是市场价值。每天交易500亿美元的比特币。
这是一个惊人的数字。我的意思是,这太不可思议了。是的,我知道一个人非常高兴,那就是迈克·塞勒。你知道,我没有看到MicroStrategy的股票在比特币上涨的同时继续攀升。如果它以某种方式与比特币脱节,那很有趣。但那是另一场对话。感谢大家加入我们。请订阅。我们希望向你们传递正在改变比特币的新闻。
我们如何治理我们的国家,如何经营我们的公司、我们的产业,甚至如何教育我们的孩子和我们的家庭。我一直感谢我的“登月计划”伙伴们,萨利姆·伊斯梅尔,他就在……
大约五米远的地方,还有戴夫·布伦登在美国波士顿的另一边,好吧,伙计们,我迫不及待地想看看下周会发生什么奇迹,所以在我们结束之前,彼得,我只想感谢你发明了这个播客,它的观看次数远远超出了我的预期,而且
对我来说,这改变了我的生活,因为这是一种比一对一会议、上台演讲(我经常这样做)更有效地与人们联系的方式。但这彻底改变了我的生活。我只是想感谢你发明了它,也感谢你邀请我加入你。这是这个家庭的一部分。我喜欢你的见解,兄弟。太有趣了。
我的意思是,你在民主化方面的一些说法是错误的,但戴夫,你提供的技术见解非常棒。太棒了。谢谢,琳恩。好吧,各位。再见。
好的。祝你们度过美好的一天。我迫不及待地想看看下周会发生什么。如果你在2000年代初就能在互联网热潮中领先十年,你会接受吗?每周,我都追踪主要的科技元趋势。这些都是巨大的、改变游戏规则的转变,将在未来十年内发生。从类人机器人到AGI、量子计算、能源突破和长寿,我将消除噪音,只提供
对我们的生活和职业生涯至关重要的事情。我每周通过电子邮件发送两次元趋势通讯,只需两分钟即可阅读。它是完全免费的。这些见解被世界上一些最具颠覆性公司的创始人、首席执行官和投资者阅读。为什么?
因为尽早行动至关重要。如果你想在未来到来之前看到未来并从中获利,那么这适合你。在dmagnus.com/Metatrends注册,领先于下一个科技泡沫。网址是dmagnus.com/Metatrends。
本集由LifeLock赞助播出。并非每个人都小心保护你的个人信息,这或许可以解释为什么美国每五秒钟就有一名身份盗窃受害者。幸运的是,有LifeLock。LifeLock每秒监控数亿个数据点,以防范对您身份的威胁。如果您的身份被盗,美国驻地恢复专家将保证修复它,否则退款。访问LifeLock.com/podcast,第一年可节省高达40%。适用条款。