We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Searching for the first great AI app

Searching for the first great AI app

2024/12/13
logo of podcast The Vergecast

The Vergecast

AI Deep Dive AI Insights AI Chapters Transcript
People
D
David Pierce
知名技术记者和播客主持人,专注于社会媒体、智能家居和人工智能等领域的分析和评论。
N
Nilay Patel
以尖锐评论和分析大科技公司和政治人物而闻名的《The Verge》编辑总监。
R
Richard Lawler
Topics
David Pierce: Google Gemini 2.0 的主要改进在于效率和速度提升,而非能力提升。它集成了多模态功能,可以原生处理图像和音频。Google 关注 AI 模型的效率提升,而非单纯追求更大模型带来的能力提升。当前 AI 行业的重点在于将现有模型转化为有用的产品。Google 的 Project Astra 是一款具有视觉、听觉和记忆功能的混合现实眼镜,Project Mariner 是一款 Chrome 扩展程序,可以浏览网页并执行任务,但速度较慢且不够稳定。 Nilay Patel: 当前 AI 技术的重点在于寻找其实际用途,而非追求完美的技术。Google 的 Project Astra 与 Apple 的 iOS 18.2 中的视觉智能功能类似,都旨在通过图像识别提供信息。 Richard Lawler: 对 Google 产品命名和 AI 应用场景的评论。

Deep Dive

Key Insights

Why is Google focusing on efficiency with Gemini 2.0 instead of increasing capabilities?

Google's stance is that while AI models may not see linear improvements with each iteration, there is still room for performance gains through new techniques rather than just larger models. Efficiency is crucial for scaling AI into products without excessive costs, especially for Google's own services like Gmail and search.

What are the key differences between Gemini 2.0 and its predecessor?

Gemini 2.0 is more efficient and faster than Gemini 1.5, with native support for images and audio, eliminating the need for separate models. It is designed to be a unified AI model for various Google products, including search, Gmail, and cloud services.

What are Project Astra and Project Mariner, and how do they relate to Gemini 2.0?

Project Astra is an AI-powered visual and auditory assistant designed for everyday use, like helping users find lost items. Project Mariner is a Chrome extension that acts as an AI agent, browsing the web to complete tasks like finding contact emails. Both projects leverage Gemini 2.0 for enhanced functionality.

Why is Apple's iOS 18.2 integration with ChatGPT significant?

iOS 18.2 integrates ChatGPT into Siri, allowing users to get more detailed and complex responses to compound questions. It also introduces visual intelligence and Genmoji, making the iPhone more capable of handling multimodal tasks like image recognition and personalized emoji creation.

What challenges does OpenAI's Sora face in terms of availability and content authenticity?

Sora, OpenAI's text-to-video tool, quickly reached capacity and stopped accepting signups due to high demand. It also faces challenges with content authenticity, as it uses visible watermarks and C2PA metadata, but platforms like YouTube and TikTok may not uniformly support displaying this metadata, raising concerns about AI-generated content being misidentified as real.

How does Reddit Answers aim to improve user experience with AI?

Reddit Answers uses AI to summarize Reddit threads in response to user queries, providing quick access to community insights. However, it struggles to deliver concise, useful answers, often reducing detailed discussions into overly simplified summaries.

What is the significance of YouTube's growth in the living room?

YouTube is increasingly focusing on TV as a primary platform, with 400 million hours of content watched monthly on TVs. The platform is introducing features like 'Watch With,' which overlays creator commentary on live events, signaling a shift toward more premium, TV-centric content.

What does Instagram's new feature for testing reels on non-followers reveal about its strategy?

Instagram's feature allows creators to test reels on non-followers before publishing, focusing on optimizing content for algorithmic performance rather than community engagement. This reflects a shift toward a more commercial, data-driven approach to content creation.

What does the TikTok court ruling mean for its future in the U.S.?

The court upheld a law that could force TikTok to either ban itself or be sold in the U.S., citing national security concerns. With the ban set to take effect on January 19th, TikTok has filed an appeal with the Supreme Court, but the future remains uncertain as the incoming administration may negotiate a sale to an American company.

What breakthrough did Google achieve with its quantum computing chip?

Google's quantum computing chip, Willow, completed a task in five minutes that would take a supercomputer 10 septillion years. While the practical applications are still theoretical, this achievement could potentially break cryptography and has raised questions about whether we live in a simulation.

Chapters
The Vergecast team discusses Google's recent AI advancements, focusing on the release of Gemini 2.0 and its implications for the tech industry.
  • Gemini 2.0 is the successor to 1.5, offering improved efficiency and latency.
  • The model now supports multimodal capabilities, including images and audio.
  • Google aims to integrate Gemini 2.0 across various products, contrasting with OpenAI's multiple model approach.

Shownotes Transcript

该节目的支持来自红杉资本的播客Crucible Moments。你可能很难想象在Dropbox、DoorDash、YouTube或任何其他科技巨头出现之前的生活。但这些公司的成功并非理所当然,播客Crucible Moments揭开了当今最具影响力的科技公司动荡和意义重大的转折点的面纱,这些故事由创始人自己讲述。

现在收听Crucible Moments的新一季节目。你可以在cruciblemoments.com或你收听播客的任何地方收听。The Verge Cast的支持来自AT&T。

使用AT&T NextUp随时随地获得新款iPhone 16 Pro是什么感觉?就像你第一次点燃烤架,想到所有令人垂涎的可能性一样。了解如何在AT&T上使用Apple Intelligence获得新款iPhone 16 Pro,并通过AT&T NextUp随时随地每年获得最新的iPhone。AT&T,连接改变一切。

Apple Intelligence将于2024年秋季推出,Siri和设备语言设置为美国英语。一些功能和语言将在未来一年推出。零美元优惠可能不适用于未来的iPhone。Next Up随时随地功能可能随时停止使用。如有更改,恕不另行通知。需支付额外费用,并受条款和限制的约束。详情请访问AT&T.com/iPhone。该节目的支持来自ServiceNow,这是一个用于业务转型的AI平台。

你已经听说了关于AI的巨大炒作,事实是,AI的强大程度取决于其构建的平台。ServiceNow是一个将AI用于整个业务中的人员的平台,它消除了员工的摩擦和挫败感,增强了开发人员的生产力,为您的服务代理提供了智能工具,使客户更满意。

所有这些都构建在一个你现在就可以使用的单一平台中。这就是为什么全世界都在使用ServiceNow的原因。访问servicenow.com/AI for people了解更多信息。大家好,欢迎收听VergeCast,这是代理时代的主打播客。这就是你向我们发送请求,而David必须执行它们的地方。但我们说这是AI。就像其他所有AI公司一样。我想明确一点。这就是它们的工作方式。

特斯拉的机器人出租车,一群人类操作员在后台等待伺机而动。这就是它的工作方式。本周发生了很多事情。我是你的朋友,尼尔。David Pierce在这里。你好。等待接收你的命令。David,记住这个名字列表,然后创建新的名字。我想谈论的是,正是你们糟糕的网站使得AI成为必需。是的。这就是我来的目的。Richard Lawler在这里。我爱AI。我现在是AI的忠实粉丝。我已经从加密货币转向了。

现在一切都是关于AI的。Richard,AI的忠实粉丝。这就是每个人所说的。我说,Richard,你还没有让AI将你身后的那辆梅赛德斯变成法拉利。没有梅赛德斯。只有法拉利。因此,它已经是法拉利了。无论汉密尔顿走到哪里,那都是法拉利。在许多方面,这也是AI的定义方式。这台计算机做什么就是AI。

他们应该让刘易斯·汉密尔顿来做这个。我喜欢只记住三个命令就能告诉我的电脑做一件简单的事情。这是使用它的最佳方式。F1有很多愚蠢的加密货币资金。F1现在有很多愚蠢的AI资金吗?还没有。他们在这方面有点落后。我不知道发生了什么。这是真的。好吧,新赛季即将到来,新的赞助机会正在等待。

我会说,Chrome赞助迈凯轮,然后让购物车字面意义上成为Chrome天才。非常好。就纯粹的……

实际的,比如产品的品牌,就像粉碎它一样。迈凯轮车轮是一个好主意,尤其是在它们不是Chrome的时候,但它们看起来像谷歌Chrome。是的。不,但他们在车上添加了真正的Chrome。这是今年的一大创新。他们在车上放了真正的镀铬,这可不是你想到F1赛车时会想到的。如果这看起来像20世纪50年代的牛?非常好。这就是我想说的。好吧,实际上本周有很多新闻,不是……

仅仅是Chrome的各个方面。其中很多是谷歌。David,你写了一些这些小片段。Gemini 2.0发布了。谷歌正在发出一些混合现实的噪音。还有一个Android混合现实的东西,又一次。说实话,他们以前尝试过。他们又回来了。有一个新的Jules AI用于代码。David,这里都发生了什么?好吧,所以……

让我们把所有这些分成三个部分,我们应该讨论所有这些,我认为这三个部分是Gemini 2.0,还有Astra和Mariner,它们与Gemini 2.0有点重叠,但它们是产品,而且很有趣,我们应该讨论它们,然后我们应该在最后讨论XR的东西,它……

被称为Android XR。我对使用XR的决定有很多想法,但我们应该讨论一下。但让我们从Gemini开始。所以本周的大新闻是谷歌开始推出Gemini 2.0,它是1.5的继任者,我认为它于2月份首次推出。所以……

大约九个月的开发之后,这就是新事物。Demis Hassabis告诉我,他领导谷歌的DeepMind,并负责他们所有的AI工作。顺便说一句,我本周早些时候和他谈过。

当他在瑞典接受诺贝尔奖时,他在诺贝尔晚宴之前从他的酒店房间给我打电话,这可能是我一生中经历过的最糟糕的权力动态访谈。这真是太不可思议了。我想,我不知道该如何告诉你在这方面你是错的,因为你今晚真的要获得诺贝尔奖了。但无论如何,他告诉我,基本上Gemini 2.0 Flash是……

大致相当于Gemini 1.5 Pro的性能。所以思考它的方法是,它在效率、速度和延迟方面是一个完整的提升,这些东西对于仍然与上次的专业级等级具有相同性能的东西来说非常重要。在这里解释一些谷歌的产品名称,Flash是一个应该运行的小型模型……

在手机上。没错。所以他们称之为主力模型。基本上,这是大多数人大部分时间都会遇到的模型。但这并不是手机上的那个。这只是你得到的flash。还有一个低于flash的模型,我不记得它的名字了,但是它……它就是……它是主要的模型。当你现在使用Gemini时,你正在使用1.5 flash。好的。当然。Nano是手机上的那个。好的。我只想记住谷歌的产品名称。我还想指出,他们把它命名为flash。

是的。在要重新激活的技术名称的历史中,他们选择了flash。是的,你并不喜欢Newgrounds。看,Homestar Runner很棒。对。如果这些AI系统能给我带来Homestar Runner,那就太棒了。如果谷歌让Homestar Runner成为其所有AI的官方吉祥物。而且,那就是我与之交谈的声音和个性。老实说,我会全力支持AI,就像锁定它一样。把这些觉醒的AI赶出去。让Strong Bad进来,让我们实现这一点。

好的,继续。没错。但是,所以,是的,所以对于他们来说,这是一种数量级的飞跃。它还在本地执行之前产品中分离的许多操作。因此,Gemini 2.0现在可以原生处理图像,这曾经是谷歌使用单独模型进行的操作。它可以原生处理音频,这是它在单独模型中进行的操作。所以有很多这种多模式的东西进入Gemini。这对于谷歌来说意义重大。但主要的是,这将是谷歌试图将其放置在任何地方的模型。这是他们将尝试出售给想要进行所有此类工作的云客户的模型。这是他们将放入AI概述和搜索中的模型。这是他们将放入Gmail中的模型。这是将出现在Gemini中的模型。就像……

谷歌越来越试图做与OpenAI相反的事情。OpenAI的想法是,我们有很多模型用于许多不同的东西,你可以使用它们,它们都可以互操作,但它对于不同的需求来说是不同的模型。谷歌的想法是Gemini。这非常类似于这家公司想要如何处理AI的方式。我确实感觉到他们认为这是一个朝着这个方向的大转变。等等,让我在这里问一个基础问题。是的。

在AI行业中,关于缩放定律以及训练下一个模型是否会带来更多能力,存在着大量的讨论。你对OpenAI试图重新定义AGI的方式写得很不屑。我认为你几周前在这个节目中实际上说过我们应该嘲笑Sam Altman。我确实说过。我仍然相信这一点。对。所以我们试图将AGI这个词拖到地上,就像任何东西一样。这辆F1赛车是AGI。当然。

然后是谷歌,它的最新模型具有相同的能力,但效率更高。

这似乎很重要,但在AGI的讨论中却有点迷失了。因为所有这些都像是,我们能否用我们今天拥有的许多NVIDIA芯片制造AGI?如果我们向它们投入更多数据,它们会变得更聪明吗?谷歌的想法是,它同样聪明,但效率更高。是的。所以我实际上与Demis讨论了很多关于这个问题的内容,我很高兴你提出了这个问题,因为我一直在这个公告的背景下思考这个问题。我认为谷歌的立场似乎是……

呃,还有更多的空间可以利用。他承认,这正在放缓,认为这些东西随着每个新模型线性变得更好的想法可能并不正确,但他确实说,他就像,仍然可以获得性能提升。我们还可以学习新的东西。他还说,实际上我们需要的是新的技术。我们不需要更多。我们需要新的东西,这有点像他一直说的那样,像转换器改变了我们思考这些东西的方式一样。如果我们要解锁AI的真正下一步变化,我们需要另一个这样的东西。他似乎认为这些东西存在,并且他们正在研究这些东西。他不想告诉我关于这些东西的信息,但是……还有向上的空间,但这不仅仅是……

仅仅是更大的模型。接下来是什么?我认为我们现在看到的,无论是谷歌正在做的事情,还是OpenAI正在做的这个为期12天的发货的事情,每个人现在都在试图弄清楚如何将这些东西变成产品。我该如何以一种有用、有价值且值得付费或至少使用的方式将这些东西呈现在你面前,并且以某种非常有意义的方式为这些正在把钱扔进厕所的公司带来回报?

让这些东西发挥作用。对于谷歌来说,我喜欢Demis Source流媒体的方式的一点是,谷歌在某种技术、基础设施层面开展所有这些工作。然后谷歌……

是谷歌最大的客户,对吧?所以他就像,我们认为这是,而这就像,你正在做鬼脸。这是每个人对他们自己的东西所说的。如果你在你的车里听到这个,想象一下我翻白眼翻得这么厉害,你的车撞了。Decoder上的每个人都说过他们公司的这些话。但在很多情况下,这是真的。我认为在这种情况下也是如此,谷歌需要的是解码器……

Gemini和Gmail不会让谷歌倒闭,因为运营成本非常高。对。因此,使这些东西更快、更高效、更低延迟的想法变得非常有意义,不仅因为谷歌与其他每家云公司都在进行这场令人难以置信的军备竞赛,以提供AI服务,而且这些东西正在迅速商品化。因此,能够说我们是价格最低、速度最快的是很快就会变得非常强大。

但它对谷歌自己的产品也意义重大。所以他一直对效率感到非常兴奋。我意识到他就像,哦,不,你是认真的。这意味着你可以以一种能够大规模运作的方式将它构建到产品中,而不会在整个过程中完全流失现金。是的,但我们应该讨论这些产品,我们会的。但我只想非常清楚地说。我是那个采访所有CEO关于他们成本的人。我不在乎。

对。就像我们让幻觉变得更便宜一样,我的意思是,老实说,在我的生活中曾经有一段时间,这将是一个非常有说服力的说法,但是……它们并没有更好。对。它们运行起来只是更便宜。我觉得我被困在那里了。就像,这是一件大事。我没有低估。这并不是一件大事,而是将它放在更多的地方,看看你能构建什么样的产品。也许每个人都只想让一些电子邮件看起来很棒,但它们还没有更强大。

就像这里的大创新是它变得更便宜了。如果谷歌想节省一些AI的钱,他们可以关闭我的搜索结果中的AI概述。我不知道这能为他们节省多少便士,但考虑到我的搜索量,至少应该有五分钱。这真的很有趣。谷歌,我认为是Sundar Pichai写了一篇博客文章,其中包含所有这些公告,内容是……

你知道,现在有超过10亿人在体验AI概述。我想,这与超过10亿人真的非常兴奋地使用AI概述是多么不同的说法。我们把这个强加给了10亿人。是的,没错。这就像,这是增长最快的搜索增强功能之一。我一直想着你们两个说,这是我们有史以来最成功的专辑,因为我们把它塞到了每个人的iPhone上。这就像……

我不知道这是否是你想表达的重点,伙计们。所以我们应该谈谈产品。真正让我眼前一亮的是,我们很快就从谈论模型变得更强大转向了我们担心这些将成为对我们的超级智能级别的灭绝事件。也许Sam Altman会说这是AGI,因为他想说,因为这会让他摆脱微软的合同,或者会发生一些事情,当他们上市时,这会提高他的股价。

到,我们已经让它更便宜了。我们可以把它放在更多的产品中,希望我们都能开始赚钱。这很好。就像,太棒了。就像很酷。产品仍然不存在。它们还不够引人注目。也许有人只需要弄清楚这一点。然后,感觉我一直在拿它与蓝牙进行比较。这就像,他们一直告诉我蓝牙很棒。我说,但这些耳机很糟糕,我们只是陷入了这个循环。所以告诉我,我想,告诉我耳机或耳机的情况。任何好东西。

好吧,让我向你描述一下耳机。谷歌推出了四款新的耳机。一款是Project Astra,我们之前见过。我们在节目中讨论过很多次。它基本上就像谷歌AI理念中最全面、最雄心勃勃的版本。它是视觉的。它在倾听。它有记忆。这是你喜欢的……

在你家四处走动的东西,然后你就像我把眼镜放在哪里了,它会告诉你,因为摄像头比眼镜高,这就是他们的想法,他们能够在那里做一些新的事情,它现在也连接到谷歌地图等东西,这很酷,所以就像他们开始能够插入其中的一些东西,而这正是……再次拥有Gemini作为所有这些东西的基础,使得……

以过去更难实现的方式做到这一点。这是一个。第二件事被称为Project Mariner。这是一个Chrome扩展程序。谷歌称之为实验。他们有数百万个不同的术语,所有这些术语都意味着原型的一些版本。我们可以不让你大喊大叫就取消这个。对。这就像最原型化的原型,但它就像我们已经讨论了一段时间的代理一样,因为它可以像浏览网页并为你做事一样。

我们团队的Kylie Robison获得了一些关于此的演示,她的看法基本上是它有效。它非常慢。它有点古怪。我不确定这比我自己查看一些网页更有意义。

但他们给出的一个演示是,查看这些网页并为我查找联系电子邮件。它实际上会点击页面并尝试为你查找电子邮件。我们可以谈谈那个吗?那就是我一开始就谈论的那个。是的。请求。你必须看到视频,我们在网站上放了一个截图。但这个请求对我来说很荒谬。它从记住这个列表开始。对于机器人来说,记住是什么意思?是的。

如果我给你一个列表,我假设你现在记住了它,如果你是一台电脑,因为这就是你所做的。不,不,不。这些电脑嗑药了,Richard。

现在我必须告诉电脑记住。然后在命令的其他地方,它还说,再次记住。所以现在我必须提醒你记住这件事,去做一件事。然后在上下文框中,它会在下面告诉你结果不可靠。所以我正在告诉一个不可靠的方指示它无法遵循的指令。如果我要让某人搞砸一项任务,我会自己做。AI为我做了什么?但是不,这让你可以搞砸更高价值的任务。是的。

这未能获得大量电子邮件地址,而你像,你知道,坠毁自行车一样做其他事情。在Project Astra演示视频中,还有一个很好的例子。它以一个试图进入公寓楼的人开始和结束。他做的第一件事是,查看我的电子邮件并找到这扇前门的代码,然后记住它。

这就像,我也有同样的反应。首先,它就在我的电子邮件中。就像,它可以每次都查看我的电子邮件。谁在记住任何东西?然后最后,他说,那是什么代码?这就像,你让我记住的代码。这就像,不,它仍然只是我电子邮件中的代码。我们完成了什么?如果你想的话,你只需要再次查看电子邮件。没关系。就像,现在我必须记住我与电脑关于我试图做的事情的对话。对。我必须告诉你我已经告诉过你的事情,这样你才能再次告诉我。这就像,什么……

告诉我代码。代码是什么?我们解决了这个问题。你让我在我的手机屏幕上固定笔记,然后我有了代码。围绕这些东西有很多奇怪的UI。以及像,这实际上完成了什么,是AI并且是新的?很难说。再说一次,我无法停止谈论这样一个事实,即……

以我的名义侵入像假装使用网络浏览器一样并不令人印象深刻,也不有趣。像做其他事情一样。好吧,让我们把这两个分开。Astro很有趣,对吧?因为在谷歌宣布所有这些事情的同一天。苹果宣布了iOS 18.2,发布了iOS 18.2,其中包含视觉智能和,嘿,看看一些东西并告诉我关于它的信息。这就是我们现在所处的世界。这是新的伟大的AI功能,你知道,其他公司以前也有过。

但现在它内置于iPhone中。然后谷歌正在谈论Astro。Astro似乎非常像谷歌Lens的未来,对吧?你只是看着东西。它在和你谈论它。你玩得很开心。但它非常像我查看了一张图片。我扫描了图片中的所有文本。我对正在查看的内容进行了一些视觉识别。这里有一些信息。你可以和我进行关于它的对话。在某种程度上,这对于人们来说非常有用,我明白了。

我认为仍然只是我一直在说的美国国会大厦问题。就像你问苹果视觉智能,1月6日国会大厦发生了什么?像这样的答案相当冒险。对。就像,有一群演员会喜欢改变这个答案,无论是在政治光谱的哪一边。这些公司都没有与之抗衡。

Astro也有同样的问题。其他人也有同样的问题。但他们正朝着这个方向前进。谷歌Lens很久以前就朝着这个方向发展了。等等,你认为这是一个真正的主流用例,很多人会经过国会大厦然后说,1月6日这里发生了什么?我认为这是一个真正的主流用例,你将来会戴着一副声称可以增强现实的眼镜,每个人都生活在一个奇怪的定制政治现实中。是的,当然。无论你是否正在看国会大厦。当然。

对。我的意思是,我不会深入探讨,因为它非常冒险且充满暗示,我们可能应该有一天专门为此做一个节目。但是你可以想到,当你看到一些东西时,会产生无限的问题,这些问题非常具有加载性,并且有人会因此引发文化战争。对。你家里的每一个……你可以看着东西然后说……

你知道,就像,牛仔队好吗?这下面有很多问题,这些问题真的很难。就像,嘿,那是Aaron Rogers吗?告诉我他的想法。就像你直接去做一样。就像日常生活中一样的事情。对我来说,我们正在为Astra构建技术,这很棒,它非常像谷歌Lens的未来,但随之而来的是所有这些问题的整个宇宙,我正在查看东西。告诉我关于它的信息。

谁将增强现实是一个很好的问题。是的,我认为……我认为这种事情有两种不同的部分。我对其中一种非常看好,而对另一种则有点悲观。我认为像……

如何从逻辑上度过你的一天,我认为像Astra这样的东西将非常有用,对吧?就像他们在他们刚刚发布的演示视频中有一个时刻,这个人举起他的手机,然后把它指向一辆正在经过的公共汽车。他说,好吧,这辆公共汽车把我带到了唐人街。在技术上有很多复杂的问题需要解决,但这确实是一个非常有趣的人机界面问题,因为这是一个很难回答的问题。如果AI助手可以回答它,那就非常酷。而且像……

我周围的东西以及我如何到达目的地,以及像如何度过你的一天一样。如果它有效的话,这种东西对它来说可能非常有用。我的意思是,我可以暂停一下公共汽车的例子吗?一,理想情况下,这辆公共汽车会把我带到我的目的地吗?这不是文化战争问题,对吧?这是一个有答案的问题。就像,这会去那里吗?这是谷歌已经在数百万个结构化数据库中使用确定性系统运行的答案。当然。所以你可以直接问谷歌地图,这个谷歌……

拥有各种公共交通基础设施项目,这些项目在公共汽车上安装了传感器,并且有开放系统,你可以构建产品等等。他们十年前就已经构建了这些东西来启用地图。所以现在你有一个对话层,这是一个新的界面,你就像,看看这个,我正在询问它,弄清楚它是什么。然后它将它解析为其现有谷歌地图系统的结构化查询,并以自然语言方式向你提供答案。所以实际上你只是……

为现有良好的系统构建了一个新的界面,该系统有效。我认为这非常强大。所有好的AI东西都是这样。对。我只是,这就像一个。当人们谈论它时,它正在成为一个平台转变。就像我看到的那个一样。就像我们制作了一个滚轮,现在我们有了iPod。我们制作了多点触控,现在我们有了智能手机。我们制作了相当不错的自然语言UI。现在我们将获得很多其他东西。我们制作了一个可以收听歌曲并告诉你关于它的UI。

对。有……有像很多这样的东西,我认为这很酷。这是下一个转变,就像,因为它是一个对话式的自然语言UI,你期望它与你进行对话,并且像一个有用的伙伴一样。这就是它总是似乎失败的地方。是的。因为系统实际上并不智能。而像,对我来说,这就像,它……我们一直在从一个滑到另一个。就像这里有一个很棒的方法来使用谷歌地图一样,这是一个你最好的朋友,如果你礼貌地问它,它会试图和你发生性关系。

Nilay, David, and The Verge's Richard Lawler talk about a big week in AI news. First, they go over all the latest on Google's Gemini 2.0 launch, and try to figure out whether Project Astra and Project Mariner will ever turn into products people use. They also discuss OpenAI's release (and un-release) of Sora, the new Reddit Answers tool, and what's new in iOS 18.2. Finally, in the lightning round, there's talk of YouTube, Instagram, TikTok, Sonos, and Cruise. There also is and isn't talk of quantum computing. Because that's possible now.Further reading: Google’s AI enters its ‘agentic era’  Gemini 2.0: what’s new in Google’s new flagship AI model Google’s AI-powered smart glasses are a little closer to being real  Google’s new Jules AI agent will help developers fix buggy code Google is testing Gemini AI agents that help you in video games Google built an AI tool that can do research for you Android XR_Keyword OpenAI has finally released Sora iOS 18.2 is out now, adding ChatGPT integration and more Apple Intelligence tools ChatGPT’s side-by-side ‘Canvas’ view is now available to everyone.  Reddit’s new AI search tool helps you find Reddit answers without Google YouTube is still growing fast on TVs in the living room Instagram will let creators test experimental reels on random people It sure sounds like Trump would be okay with a TikTok sale TikTok failed to save itself with the First Amendment Sonos Arc Ultra review: don’t call it a comeback (yet) Google reveals quantum computing chip with ‘breakthrough’ achievements Amazon’s online car ‘dealership’ with Hyundai is now live YouTube’s AI-powered dubbing is now available to many more creators Searching for color at Pantone’s all-brown party  Adam Mosseri on introducing Trial Reels From WSJ: iOS 18.2 Review: The AI Apple Promised Us

<raw_text>0 你就像,好吧,这实际上是一条很长的路。我们假设,因为其一,因此必然导致其二。是的。我认为每个人都应该停止这样做。我认为苹果做得对的一件事是,它坚持认为这些应该是实用的功能,而不是你拥有的最好的朋友伴侣。我认为……

在可预见的未来,你应该选择两者之一,而不是尝试同时做两件事,我认为你应该选择的是尝试提供帮助,因为我们不断看到关于朋友古怪和成问题的报道,我们刚刚从乔什那里报道了一个这样的故事,就像一个很长的……是的,这很混乱,而且这些事情是真实存在的,但是,在这种情况下,我认为

每条道路的尽头都有一场文化战争。我同意。对。就像,如果你,如果你,如果你追溯得足够久远,那里总会有文化战争,但是,一路上有一些事情是有效的,而且是有用的。我认为谷歌正在开始触及其中的一些东西,但是,我就像,文化战争甚至,我甚至不是说它在政治上很棘手。我的意思是,你在某个地方,你正在听麦当娜的新合唱版《祈祷》。你会想,这首歌适合在教堂里唱吗?有些人认为答案是肯定的。

因为他们今天在美国的教堂里演唱它。这就像,好吧,你只需要,你只需要,机器人需要为你打开那个盒子。对吧?我认为这些公司还没有准备好,真正让它们变得有用的方法是给出你可能不喜欢的答案。而我,他们在这个当前的政治环境下根本没有准备好。这就像,

这就是你转弯的时候。这就是它真正成为你一个有用助手的时候。即使我不喜欢,也要帮我找到一些信息。作为这个问题风险较低的一个版本,其中一个演示——我的意思是,像一首关于做爱的祈祷歌并不是一个高风险的问题。这取决于你在哪里。我想。他们用Project Mariner展示的例子之一是,有人在Google Docs中调出一个食谱,然后说,把这个食谱里的蔬菜添加到我的Safeway购物车里。

如果其中一样东西是水果,而我忘记了它是一种水果,而不是蔬菜,或者我只是不同意。是的。

现在这是一个高风险的问题。是的。把这些三明治添加到我的购物车里。其中一个是热狗,而那个东西就像美国某个地方的数据中心爆炸了。这件事会发生在某个人身上。是的。所以,我只是想指出这一点。就像,我们希望它们做的事情,这不仅仅是一个技术问题,而是一个彻头彻尾的文化问题,一个社会层面的问题。然后是真正有趣的部分,那就是为已经有效的系统构建更好的界面。

然后是这个奇怪的中间地带,我认为Mariner就是这样,微软的Copilot也是如此,所有这些代理系统,那就是,如果我们只是为你使用互联网呢?这就是我们解决问题的办法,我们需要一个有效的中间环节。大卫,我认为这就是你想要表达的意思,这是一个对网页设计的惊人谴责。

因为你就像,好吧,互联网相当糟糕。所以,如果某个不可靠的幻觉机器人为我使用它,会更好。对。假设你找不到任何东西,对于创建谷歌搜索的公司来说,这是一件非常有趣的事情。但是,是的,我们正处于这样一个时刻,人们认为向这个东西询问联系电子邮件地址比自己去查找联系电子邮件地址更容易。

同样,我认为我们得出的一个非常有趣的结论是,所有这些公司慢慢地发现,他们的工具所做的最有用的事情实际上非常无聊,而且非常像后台会计事务所做的事情。呃,

结果证明,这对于你需要让他们兴奋地使用你的产品的普通大众来说,并不是很有趣。所以他们陷入了这样的境地:所有这些公司实际上都在玩彻头彻尾的B2B游戏,只是假装他们在向主流消费产品迈进巨大的步伐。这很好,我认为,尼拉,我认为你确实很纠结于这些东西会出错,但同时,

人们还是会使用它们。就像这个东西会帮我写电子邮件,它会犯两个奇怪的错误,但我可以纠正它们然后发送。这比从头开始写电子邮件要好。或者不纠正它们。正如我们每天都在学习的那样,答案不是纠正它们。在某种程度上,答案是在有线新闻上大声朗读它们。答案是亨特·德布茨将拯救我们。但是,是的,就像,

亨特·德布茨将载入史册,就像——我拒绝解释。它就在那里,你可以查一下。——是的。具有讽刺意味的是,如果你搜索亨特·德布茨,你会得到关于我们正在谈论什么的正确信息。但无论如何。

我只是认为我们现在正处于这样一个时刻,对于所有这些人工智能来说,要回到最初的问题,那就是所有这些东西到底有什么用?我认为事实是,我们现在拥有的模型比我们许多事情所需的要好,而且与每个人一直在谈论的东西相比,相差甚远,就像一百万英里一样。对吧?所以现在的问题是,好吧,我们不会在很长一段时间内,甚至永远不会构建完美的东西。对吧?

我们现在能用我们现有的东西做什么?这就是效率发挥作用的地方,因为在某些时候,经营企业需要花钱,你必须能够做这些事情。如果你能降低成本,更多的人可以使用它们,并找到新的用途,等等。但问题是,好吧,如果你只采用我们现在拥有的技术,并且不假装它是上帝,那么它有什么用?这就是谷歌开始尝试回答的问题。这是OpenAI开始尝试回答的问题。这就是2025年的问题:所有这些东西到底有什么用?

因为答案是存在的。它们只是不像,它们不是上帝,它们不是火,它们也不是工业革命。那么它们是什么?它就像一个导游和一个极其不可靠的私人助理。公平地说,这并非一无是处。它并非一无是处。我可以理解为什么它们引人注目,我可以理解为什么。我的意思是,仅仅是演示。我的意思是,理查德,你已经提到了。就像谷歌对Mariner的演示,你只是在看Google Docs中的食谱。

你只需要让它在杂货网站上为你创建一个购物车,它就会为你做到这一点。整洁。名副其实的整洁。非常慢。慢到谷歌的产品经理实际上看到了凯莉注意到它有多慢,并说,这就是房间里的大象。它慢得令人难以置信。对吧?他们知道。他们知道。他们没有隐瞒。这是一个研究演示。但我被困住了……

系统本身并不具备能力。因此,它们正在搭乘其他可以完成这项工作的系统的便车。杂货网站必须存在并运行。它需要拥有杂货店所有食品的数据库。然后你需要能够把它放进购物车,就像,所有这些都必须有效、盈利和可持续。然后,最重要的是,你就像,然后这个机器人每月将花费20美元,并且为你做到这一点。最终你就像,如果,

如果这会破坏所有这些呢?我一直称之为DoorDash问题,DoorDash必须存在才能让这些服务中的许多服务为你提供三明治。如果你通过将它们从等式中剔除并将你,客户,从DoorDash那里带走,从而删除DoorDash的业务,那么,谁会得到三明治呢?你需要这个庞大、传统、确定性、逻辑的计算机来

拥有一个可靠的数据库来完成大量工作。因此,你的自然语言界面才能有用。我认为没有人解决了如何让DoorDash继续经营的问题,包括DoorDash。我并不是只选择DoorDash。随便。Uber,对吧?就像,Rabbit就像,我们将点击Uber网站。所有这些中间公司,这些像Web 2.0这样的公司,它们为非常实际的事情数字化界面。就像,

他们在当时相当贪婪,对吧?就像Uber是世界上最大的出租车公司,但它不拥有任何一辆出租车。Airbnb不拥有任何一家酒店。这就是关于这些企业的玩笑。现在,他们正面临人工智能系统的压力,这些系统可能会使用它们的界面,而永远不会向用户展示它们。这就像在哪里……这必须走向对人们真正有用的地方。好吧,这是一件奇怪的事情,因为你拥有……

所有的人工智能公司都会同意你的观点,但他们认为这是一种优势,而不是劣势,对吧?他们说的是,好吧,

我们将拥有一支服务提供商队伍,他们只是在你不知情的情况下完成工作。你不必担心他们是谁。你不必每次想点麦当劳时都访问DoorDash网站。你只需要点麦当劳,我们会帮你搞定。DoorDash或其他公司将成为我们选择的提供商来做到这一点。他们会称之为胜利,对吧?因为我,作为消费者,我不应该为了得到麦当劳而与DoorDash互动。我应该与麦当劳互动。

但他们实际上所做的是,A,插入另一个步骤,B,以这样一种方式完全商品化所有这些提供商,最终它们将在一场令人难以置信的降价竞争中将它们全部摧毁,以成为这些提供商之一。因此,就像所有运营商都非常担心成为哑管一样,因此他们购买了内容业务,这就像即将出现另一轮这样的情况,

Uber将害怕被所有这些人工智能公司抽象化。因此,它将做更多的事情来让你使用Uber。结果会变得非常奇怪。或者它会涨价。或者它会涨价。或者它会为人工智能系统涨价。因此,如果你通过人工智能预订Uber,费用会更高。

比你自己在应用程序中预订并查看Uber Eats广告要高。是的,这只是应用程序商店税的下一代版本。我认为我们只会看到很多这样的事情发生。每次每个人都与我谈论这些代理时,谷歌尤其处于非常有利的地位,因为他们运行Chrome。

他们运行搜索,以及他们在同一组版本中发布的深度研究预览,它就像,帮我研究一个主题。它会提供一个研究计划,然后它会在网上搜索有趣的结果,然后将该研究结果反馈给你。这只是困惑。

对。这只是另一个名字的困惑。而困惑正处于困境之中,因为它没有支付任何它正在使用来以这种方式搜索网络的来源。这就像,在某些时候,所有制作网站的人,包括我们自己,而且我觉得需要披露,该公司与OpenAI达成了某种曲折的协议,据我所知,这并没有真正产生结果。但是,就是这样。就像所有这些公司都会说,好吧,我们制作信息。

我们制作预订出租车或任何其他东西的界面。你必须付钱给我们,因为如果你只是把客户从我们这里带走,我们就会消失,机器人就会变得毫无用处。我认为这种经济现实将导致一些付款,无论诉讼是否导致付款或阻止机器人使用TXT。但它来了。它必须来了。

我认为,我认为它将遵循与其他一切相同的模式,就像Uber将独家提供给Copilot,DoorDash将独家提供给Gemini。就像,这部分在很长一段时间内都会很糟糕。是的。或者我们将,有人会想出如何进行黑客攻击以使其工作。

无论公司是否愿意。然后我们将面临一种完全不同的混乱局面。然后,新一代大学生将被Napster激怒。然后这就是我们为我的替代品Vendetta所做的准备,这将很棒。我们必须稍作休息,但要快速谈谈这个XR的事情。是的。好的。所以,你知道,Android,它是Android。想象一下,如果智能眼镜是一件东西。如果谷歌只是再次为它们做Android,那就是Android XR。基本上,谷歌已经从事智能眼镜这项工作大约

15年了,也许吧,尝试了很多东西。你还记得Daydream吗?Daydream是我今天偶然重新发现的一个我忘记的东西。Daydream确实存在。几百万年前,我为Wired写了一整篇文章关于它。我完全忘记了。但无论如何,所以谷歌宣布了Android XR的开发者预览版。基本上就是你想象的那样。它是一些谷歌应用程序和一些Gemini内容的沉浸式版本,基本上。所有这一切的基础

是你想戴在脸上的助手Gemini内容。这是一种大理论。他们有很多硬件合作伙伴。在过去的两周里,我一直在听那些想向你出售眼镜的每家公司说,我们正在与谷歌合作做一件我们还不能告诉你具体是什么的事情。那就是Android XR。所以从明年开始,我认为我们将开始看到真正的开发和硬件产品。看起来三星将成为第一家推出真正诚实的Android眼镜的公司。但是

很明显,苹果正试图成为你脸上的苹果,而谷歌很乐意成为你脸上的Android。我认为谷歌是否会制造硬件的问题非常有趣。谷歌已经制作了许多原型,并在本周向我们暗示它有兴趣让它们不仅仅是原型。如果你想做所有这些Gemini内容和Project Astra,就像你需要眼镜一样。如果,如果这个人工智能的未来,

每个人都在想象并试图向你推销的将会实现,那将是眼镜,它就是这样,我百分之百确信,我只是说这是十年后的事情,我们的一个孩子将在某个时候上八年级,他们正在进行八年级的华盛顿特区之旅,他们戴着眼镜,他们看着国会大厦说,这里发生了什么?美国历史上有哪些值得注意的事件?它是否说是一场叛乱,或者它是否说这是一天充满爱的一天,而两个八年级学生的答案是否不同

而这些公司正在争先恐后地走向一个未来,在这个未来中,他们将不得不回答这个问题,无论他们是否制造硬件。但你不是在描述互联网吗?就像,所有事情都是这样运作的。对,但是……而且,它是否正在毁掉社会?当然。但是,我不知道智能眼镜在这里是一个新问题。但你并没有真正体验……也许这比我想要的更虚无主义。就像,我本来想说不是每个人都在体验定制的现实。然后我想到了一代超级体验过这种现实的美国人。所以……

也许吧,但我只是,你可以构建,想要构建这些东西。然后在其之下是关于谁能够增强现实的非常深刻的问题。我们是否都体验到相同的现实?他们根本没有准备好。完全没有准备好。特别是当答案不同时。如果你在联想的一副眼镜上使用Android,而另一副眼镜上使用三星的Android,而三星的眼镜就像,这里有一个我们创造的第二个现实。它就位于谷歌的现实旁边。而且它里面有Bixby。就像,

它稍微明亮一些。我们必须休息一下。我们马上回来。是的。我只是,我需要在房子里走动一会儿。我们马上回来。Vergecast的支持来自《华盛顿邮报》。在这个世界上发生了这么多事情,区分什么是真实的,什么是虚假的可能具有挑战性。拥有一个值得信赖的来源来帮助你区分事实与虚构至关重要。这就是为什么你可能想查看《华盛顿邮报》的原因。

现在,你可以访问WashingtonPost.com/Verge,以每週仅50美分的价格订阅你的第一年。《华盛顿邮报》对各种各样的主题提供了大量且经过深思熟虑的报道。该报可以成为一个寻找关于国会山、经济、气候变化以及更多其他主题的深思熟虑的故事的好地方。我是《华盛顿邮报》的订阅者,我最喜欢它的一点是它的简洁首页。我每次都能快速了解新闻。

现在是注册《华盛顿邮报》的时候了。访问WashingtonPost.com/Verge,以每週仅50美分的价格订阅你的第一年。这比他们通常的报价便宜80%,所以这绝对是一笔划算的交易。再次强调,这是WashingtonPost.com/Verge,以每週仅50美分的价格订阅你的第一年。节目的支持来自Crucible Moments,这是红杉资本的一个播客。我们

在这个节目中,我们经常谈论塑造我们世界的科技公司,无论好坏,但这些公司是如何建立起来的,其故事往往令人惊讶,同样有趣。由红杉资本的Rulaf Bota主持,Crucible Moments揭开了科技史上一些最动荡和最具决定性里程碑的幕后故事。你可以深入了解决策过程,并从创始人本人那里听到一些科技界最有影响力公司的未经修饰的历史。

你知道YouTube最初是一个约会网站吗?听听即使在转型之后,创始人起初也很难让任何人上传视频。或者两个电气工程师如何决定从事基因学,并开发出Nutera突破性的产前检测。Robinhood如何在市场低迷时期重塑自我。现在收听Crucible Moments的新一季。你可以在cruciblemoments.com或你收听播客的任何地方收听。Verge Cast的支持来自AT&T。

使用AT&T Next Up Anytime获得新的iPhone 16 Pro是什么感觉?这就像你第一次拿起钳子,现在是你来掌管烤架了。这是无法形容的,就像你从未感受过的事情一样。所有令人垂涎的新可能性的期待,无论是制作完美的芝士汉堡,还是款待你的家人烤土豆,你都知道这将永远改变他们看待土豆的方式。

使用AT&T NextUp Anytime,你可以一次又一次地体验这种感觉。了解如何使用AT&T和最新的iPhone每年获得带有Apple Intelligence的全新iPhone 16 Pro,以及AT&T NextUp Anytime。AT&T,连接改变一切。

Apple Intelligence将于2024年秋季推出,Siri和设备语言设置为美国英语。一些功能和语言将在未来一年推出。零美元优惠可能不适用于未来的iPhone。Next Up Anytime功能可能随时停止使用。如有更改,恕不另行通知。适用其他费用、条款和限制。详情请访问AT&T.com/iPhone。

- Verge Cast的支持来自Life360 Tile Tracker。假期期间已经有很多事情要做,所以不用担心个人物品的安全岂不是很好?Life360的Tile Tracker可以帮助你消除一些压力,确保你随时知道你的物品在哪里。这样,你就可以将所有精力都放在深呼吸上,因为你要去拜访你的岳父母。如果任何东西丢失或被盗,只需拨打你的Tile,你就可以在地图上追踪它的位置。这让你全季都安心无忧。

Tile Tracker是第一个也是唯一一个带有SOS按钮的追踪器,这意味着你可以三次按下Tile设备中心的按钮,以谨慎地向Life360圈中的每个人发送SOS警报。与竞争对手不同,Tile不会通过通知向窃贼发出其存在的信息。因此,消除你假期的压力,确保你家人的最珍贵物品安全无虞。使用Life360的Tile Tracker让你的家人免受意外。

今天访问Tile.com,并使用代码VERGE获得15%的折扣。这是Tile.com,代码VERGE。好了,我们回来了。我的感觉是Bixby会说这是一天充满爱的一天。不再评论。我们真的应该做一个不同虚拟助手的政治倾向矩阵。

我觉得如果我坐下来思考五分钟,我最终会形成非常强烈的观点。Tay投票给了谁?是的。所以我的问题是,你想通过这种特定方式在X上走红吗?你就像,我们要从这个已经死亡的平台榨取最后一滴流量。这取决于不同人工智能的政治倾向图表。不,谢谢。

好的。还有更多人工智能新闻。本周发布了很多东西。OpenAI发布了Sora。iOS 18.2发布了chat,GBD集成,视觉智能。你想从哪里开始?让我们先从iOS 18.2开始。好的。我的意思是,它非常熟悉。我认为我们今天早上有一刻,我们就像,我们应该覆盖多少?因为人们已经看到了它。他们已经使用了它。它一直在测试版中。候选版本是上周发布的。

但它现在已经发布了。如果你有iPhone 16或更高版本,甚至iPhone 15 Pro,你都可以获得视觉智能,你可以获得Genmoji,chat GPT集成就在那里。乔安娜·斯特恩写了一篇非常有趣的专栏文章,她说,你通过说秘密词来调用chat GPT。如果你以一种方式询问Siri,你会得到一个普通的Siri答案。但如果你问Siri,写一个清单,chat GPT就是你的清单,这很有趣。我一直在使用这些东西,大卫,我认为你一直在使用这些东西

你怎么看?理查德以使用Windows Phone而闻名,所以他只知道。这是唯一的生活方式。我要说两件事。我认为第一,iOS 18.2最酷的一件事是能够更改各种事物的默认应用程序。例如,当你点击电话号码时,你可以更改它转到的应用程序。每个人都应该检查所有这些默认设置,因为如果你正确地设置了这些东西,你的手机就会好很多。这是Android一直比iOS做得更好的事情。感谢

偶尔会让欧盟监管机构感到困惑,从而促成此事。我认为chat GPT很有趣。我发现,当我提出复合问题时,它往往会转向chat GPT,对吧?就像我的问题有两种情况,或者有一个东西和一个修饰符,就像我前几天做的一样,它就像,如果我要求一个巧克力曲奇食谱,

Siri只会提取它。我不会再说那个词了,因为它刚刚激活了三台设备。但是,如果我要求一个巧克力曲奇食谱,也许味道会与我以前尝试过的不同,那么它就会转向ChatGPT。然后它是一个相对一致的体验。实际上,我喜欢的一件事是,当它转到ChatGPT时,它所带来的内容仍然看起来像

普通的Siri响应。所以,我认为,就像,我对正在发生的事情的心理结构非常混乱,以至于我不喜欢,但它的实际用户体验我认为实际上相当不错。是的。我的意思是,就而言,这是一种从Siri响应中获得更好答案的好方法。

所以你只是得到,我认为这在某种程度上是有效的。是的。就像,我对我的东西会一遍又一遍地转到ChatGPT的想法有什么感觉吗?当然。但如果你没有,那么摩擦应该消失,而且实际上并没有我预期的那么大的摩擦。所以我认为总的来说,这是一件好事。是的。我的意思是,再说一次,我一直将手机上的操作按钮映射到chat GPT语音助手。对我来说,这只是一个稍微快一点的版本。

带有更多烦人的动画。我实际上认为新的Siri动画太夸张了。我同意。我想念那个旋转的小球。现在它占据了我的整个手机屏幕,我不喜欢它。是的,它非常像爵士手势。它就像准备好体验一样。它就像我不需要发生这种情况一样。但这只是意味着加载需要花费更长的时间。对,然后你说话,然后它会为你填写单词。

有一些方法可以掩盖它有多慢,旋转的小球让它看起来很快。你知道进度条的设计大多是为了在第一部分运行得非常快,然后它们可以在最后运行得很慢,但你已经认为它很快了吗?这非常类似于旧的Siri所做的事情。现在它就像,一切都发光了,你可以看到世界。它就像,我不需要看到鼠标在轮子上跑,伙计们。只要让我知道什么时候有答案就行了。我认为这是对的。我实际上并没有

真的从未想过Siri会像旋转的Mac风格沙漏一样加载东西,直到它切换到这个。然后它拼命地让它看起来像一直在发生一些事情,因为它很慢。所以它就像,看看这些美丽的粉色和蓝色漩涡

直到它完成,它最终会完成的。它就像,好吧,这实际上就像在一个非常糟糕的系统之上的相当好的设计。是的。我会说,我的意思是,它再次是自然语言能力。这就是人工智能最擅长的。所以它比以前更了解我。然后是ChatGPT,我很熟悉。我不知道它是否在对我胡言乱语,但它都在发生,里面有一些防护栏。对我来说,那些我……

我认为那些现在Siri可以与Chat CBD对话的Apple intelligence功能并非如此。我认为这是基本要求,而且从一开始就没有它有点奇怪。我认为很重要的是图像游乐场、Gen Moji和视觉智能,对吧?手机变得多模态,它现在可以用图片进行内外交流。

但我喜欢Genmoji对我来说纯粹是愚蠢的。图像游乐场落后了50步,尽管这可能是它最安全的方式。是的。这似乎是故意的。视觉智能,你知道,它和我们正在讨论的一样。我们就像,看,这是一朵花吗?它就像,确实是。就像,

下一个转折点还没到。但也许我只是个讨厌鬼。好吧,A,你绝对只是个讨厌鬼。这当然是正确的。我的心情很糟糕。你是的。我能感觉到。我非常享受这个。你就像,如果一切都很糟糕,很觉醒,我讨厌它怎么办?看,我知道观点在哪里。我不知道。就像Genmoji这个东西,我真的很矛盾,因为我觉得我们一直在报道苹果关于表情符号的奇怪想法,就像The Verge的整个生命周期一样。

而且我认为我从未认真地发送或接收过苹果的奇怪表情符号,除了像嘲笑另一个科技记者一样。我认为如果,如果我只是制作了一个Gen表情符号并将其发送给我的妻子,我,

她会报警的。这将是一件非常奇怪的事情。等等,你的孩子有没有发现你可以按住照片中的一张脸并制作一张脸的贴纸?没有,谢天谢地。因为我的相机胶卷里充满了这些东西,或者它们在文件系统中的任何位置。就像无数的贴纸,左右都有。而且这些发送起来非常有趣,因为它们很可怕。当然。

但这非常像我们使用Apple Watch上的对讲机功能,而且我们是唯一使用Apple Watch上对讲机功能的人。我只是觉得所有这些东西,图像游乐场、Gen Moji,这对于很多其他人的产品也是如此,就像,我相信,所有的人工智能图像生成的东西在这个时候更像是一个模因而不是一个产品。我只是不知道,我不知道它们存在的实际原因,除了有人制作了它们。是的。

我不知道。理查德,我疯了吗?你每天都向你的朋友们发送Genmoji吗?我没有。不幸的是,我的家里没有可以运行Apple intelligence的设备。我可能永远都不会,因为我不想发送Genmoji。我不想这样做。使用Gemini 2.0,你也可以生成一些奇怪的东西。所以准备好。当你打开Instagram时,我只是想搜索一个帐户,哦,现在我在AI窗口中了。谢谢。我真的很讨厌这个。

但这很奇怪,因为我从未想过要生成表情符号。我不知道手机里是否存在所有表情符号,并且涵盖了我曾经有过的所有感受。但是,对于那些没有被这些表情符号涵盖的感受,

我没有和你联系。我只是没有考虑过。这不是一件迫切想从我这里表达出来的事情。我必须找到一只具有解剖学错误的多色斑马,来代表我现在的心情。我还没到那一步。我认为对于现在正在收听节目的每一位拥有Apple Intelligence访问权限的人来说,非常重要的是在他们的车里靠边停车,

发送该提示,然后发送它生成的任何内容。就像我,我,我在这档节目中发布了很多指示。让你的手机制作一只多色斑马。这是解剖学错误的。这表达了一种你不知道自己正在体验的感受,或者理查德刚才所说的任何东西。让我们知道它给了你什么。

我很想知道。我对此感觉良好。看,我认为最终苹果希望它看起来像手机非常强大,人工智能使得,无论它是否真的强大,人工智能都让它看起来比昨天能做更多的事情。对吧?现在你可以按下你的iPhone 16上的相机控制,看看一些东西,它会说,这是一朵花。你,它可以为你写作,我认为那些广告对它造成了巨大的损害,因为它

它看起来就像每个工作的人都像个混蛋。是的,每一个广告都像,嘿,笨蛋。它看起来不像个笨蛋吗?他们对这些广告有真正的问题,因为他们必须找到一些非常重要的事情,你必须发送消息,但也不那么重要,以至于你需要自己写。

那是什么?就像,你怎么,你怎么会发现你可能会被雇佣去做这件事?即使你像石头一样愚蠢,那个家伙把他的椅子从会议上滚出来总结任何滚回会议的东西。我明白了。这很有趣。是,是,呃,它引人注目,这是广告的目的,但它就像,哦,这太糟糕了。哦,

我想离开这个会议。就像,我不需要浪费我的时间。如果你没有阅读,嗯,你可以看出我们的会议是什么样的,呃,我只是说,他们让手机稍微强大了一些,但这个巨大的Apple intelligence时刻就在这里。

我不知道。这与每个人都在谈论的Chat GPT时刻不一样。就像,你的思想并没有扩展,因为消息通知比iOS 18.1好8%。如果很快就会有这样的事情,那将是代理。即使苹果也同意这一点,对吧?就像,你谈论他们开始构建到iOS中的那些密集型的东西,这将使Siri能够更访问应用程序,以便它实际上可以去,像,

获取信息并在这些应用程序中执行操作。这就是每个人都在努力构建的东西。如果有人以一种有用且不会引发文化战争的方式做对了,帕特尔,那将是下一件事,因为那些将是人们意识到,“哦,我现在理解了一件事,我可以要求它做一些有用和新颖的事情”的时刻。

我想要指出的是文化战争在AR中。它在视觉智能中。我明白了。App intents是有钱的,对吧?因为苹果指望一群应用程序开发者按照他们的说法去做,他们通常会这样做,因为他们的客户在iPhone上,他们在App Store中。并且说,你必须做App intents,就像他们对一群应用程序开发者说,你必须做应用内购买,这样我们才能获得30%的利润一样。这就是你获得Siri的方式。他们实际上可以使用你必须构建功能的应用程序。一群开发者会说不。

我不知道为什么DoorDash会同意这样做。答案必须是钱。而且,我,我,我只是不断地挑剔DoorDash。如果DoorDash的任何人想来告诉我,他们会很乐意让每个人取消他们的服务,这很好。但是,

我只是看看那部分,并将任何公司都加入到其中。看看Netflix。是的。如果你有自己的受众,你就不必参与。以及他们对Apple TV和Vision Pro所做的事情。如果你足够大,你可以说不。是的。所以我,我只是看到这种情况即将到来,但每个人都想构建这些代理,他们希望这些代理使用的系统不必配合。我们只是还没有解决这个问题。好吧。这就是18.2。人们明白了。让我们知道任何事情。发送给我们你多彩的情感斑马。

拜托。让我们谈谈Sora。Sora对我来说很有趣,因为它似乎并不伟大,但它足够好,以至于非常有趣。是的,这就是我对它的解读。我的意思是,我认为Sora非常奇怪,因为它

是OpenAI的另一个清单上的东西,就像,这太好了。我们甚至几乎不应该被允许发布这个。我们非常害怕,如果我们发布它,它会给世界带来所有这些灾难。然后就像这里一样,这是一个做体操的人,每次他们翻筋斗时,他们的身体都会爆炸成一千个方向。它就像,这是另一个让我觉得,除了让人们在互联网上发布它之外,这是否存在任何其他原因?我

我真的不知道。此外,它并不完全可用。他们很快就用尽了容量,并停止接受注册。是的,等等,你能向我解释一下这里发生了什么吗?我离开了互联网几个小时,在我离开的时候,它从Sora可用变成了Sora不可用。发生了什么?是的,这几乎就是发生的事情。这就像一次鞋子的发布。就像,哦,它出来了。现在它没有了。然后Sam Altman说,啊,你知道,我们只是低估了容量,我们会在某个时候开放它。

那么他们实际上有多少容量?他们可以支持多少容量来运行这个东西?我们不知道。你必须付费才能使用它。你必须拥有20美元或200美元的计划。如果你有每月200美元的ChatGPT Pro计划,并且你已经获得了访问权限,那么你可以制作长达20秒的1080p视频。所以,我的意思是,相当划算。我认为20秒的1080p视频每月只需200美元。

我不明白为什么每个人都没有两个帐户。每月200美元的ChatGPT Pro计划。我的意思是,你可以在ChatGPT上使用。这是他们刚刚宣布的。是的。你可以使用ChatGPT Plus计划,但这只有720p五秒钟。我的意思是,谁会这样做?那什么都不是。你不能用五秒钟的720p视频来破坏一个国家。不。

我的意思是,看,我看了Marques Brownlee关于Sora的视频。关于它最引人入胜的部分是,当他要求它制作一个科技评论视频时,它里面有他的植物,因为它显然在未经任何许可的情况下在他的视频上进行了训练。我们都在做什么,伙计们?就像,我不知道谷歌是否会提起诉讼,或者YouTuber是否会提起诉讼,但那场诉讼即将到来。仅凭这一点,那场诉讼就即将到来。我的意思是,是的,有很多……

明显的、清晰的、干净的证据表明,很多OpenAI都是建立在YouTube之上的。这相当可怕。此外,理查德,我要指出你忘记了20美元和200美元Chat GPT订阅之间的一个关键区别,那就是如果你支付更多,你可以下载没有水印的视频。哦,很好。如果你支付更多,你绝对可以破坏一个国家。那是……

值200美元。Marquez在他的视频中也说了一些非常有趣的事情,自从他说之后,我一直都在反复思考,我让它制作了一堆闭路电视录像,因为它太糟糕了,以至于人们会认为它是真实的。就像他故意生成了一些质量很低的录像,比如汽车在街上行驶,但却是黑白的监控录像。这非常有趣,对吧?因为它们是20秒的片段,没有声音。

而且人们在很多情况下会体验到很多颗粒状、低质量的片段,没有声音,他们认为这是现实,特别是,嘿,我们找到了一些监控录像,或者我们找到了一些Ring录像,或者任何东西。所以你可以付费来去除,

可见的水印,你付费给你的武术母亲,你只需裁剪它,任何东西。他们是否在做C2PA,即花哨的嵌入式水印?是的。OpenAI表示,使用Sora生成的视频将同时具有可见水印(如果你使用的是廉价版本)和C2PA元数据,以表明它们是用AI制作的。我们希望这能奏效

拯救文明。我会说我们已经写了很多关于C2PA和内容真实性倡议的文章。Jess Weatherbed做了令人难以置信的工作,只是试图理解它是什么,以及它将如何发挥作用,以及它是否真的对任何人意味着什么。而且每次我们写关于它的文章时,我们都会收到很多来自读者的愤怒的评论,他们深入研究了它,他们就像,这是一个彻头彻尾的骗局。就像这永远不会按照你想要的方式发挥作用一样,原因有很多。嗯,但这就是我们拥有的东西。

这就是为什么我一直写关于它的文章,因为没有其他选择。没有其他选择。这个元数据标准没有市场竞争。就像只有一个。谷歌已经选择使用它。听起来OpenAI也在使用它。Adobe也在使用它。平台必须开始使用它。

对。YouTube、Facebook和TikTok必须同意显示此元数据,但它们并没有一致地同意。苹果并没有选择在创作方面使用它。所以我们所有这些平台都在疯狂地构建自己的人工智能工具,并且完全没有动力指出哪些东西是用人工智能制作的。就像我,我只是不。

除了普通人之外,谁会从中受益,那么他们为什么要这样做呢?是的,我认为我们最终将走向一系列更封闭的平台,这些平台基本上保证你从真实的人那里获得东西,然后是开放的平台,在那里一切都是自由竞争的。也许这会很好。老实说,也许这很好,就像,如果我打开这个应用程序,

我知道这是一群好莱坞电影导演实际制作的东西。如果我打开这个应用程序,谁知道我会得到什么随机生成的人工智能垃圾。就像,也许这很好。也许这就是以这种方式打破互联网的东西,或者像导致这种碎片化一样。我只是,我不知道,但是,我们现在正处于一个点,呃,

我们过去使用的所有渠道都将完全融入人工智能生成的内容。我认为这种结果的唯一问题是,我认为这两个

呃,不同类型的平台之间的受众划分不会是你希望的那样。哦,我认为,是的。一个会很贵。是的。一个将拥有少量受众并花钱,就像那样。这,这似乎是正确的。但即使在TikTok上,我也看到视频,它就像一些愚蠢的东西。它就像,这里有一大波浪冲过一座建筑物,这很明显是真实的。然后所有的评论都像,这是AI。哦,是的。我们刚刚破坏了整个信息经济。是的,勒布朗从未被盖帽。那是AI。是的。

更多。有更多人工智能的东西试图启动。画布视图。那里发生了什么?

画布基本上是你能够做的稍微更具交互性的东西,就像如果你让它为你写一些东西,它可以在你正在进行的关于它的对话旁边显示它正在制作的东西。你可以与机器人实时编辑该东西。这就是Anthropic的机器人Claude一段时间以来一直在做的事情。我认为这实际上非常聪明,对吧?就像如果你允许这样一种可能性,也许……

生成几段文本是聊天机器人所能做的最好的事情。这实际上是一个相当不错的交互版本,就像你可以让它做某事,它会在右侧列中生成它。然后你可以,你可以来回与机器人互动,调整它并更改它,你可以对其进行更改。它变成了某种

交互式的东西,而不仅仅是消息块,这就是我们以前所拥有的。所有这些聊天机器人中的大趋势是,每个人都遇到了在来回的消息系统中你能做多少事情的限制。所以他们都在试图添加一些UI和一些功能,这些UI和功能感觉不像那样。

但仍然在那种基本的结构内工作。所以我认为在这种情况下,画布是一个好主意,无论你是在写东西、写代码还是其他什么。它已经,它已经测试了一段时间了。我没有听到很多关于它的消息,但我听到消息的人似乎都喜欢它。所以它看起来不错。你所说的关于所有这些产品的UI的事情对我来说非常有趣。就像,

Chat GPT是那个时刻,对吧?每个人都在谈论它。就像我的眼睛睁开了。我能看到彩色的世界。然后大约两年后,我们就像,实际上那个界面不是,但我们必须构建所有这些其他类型的产品才能使它有用。以及像聊天机器人本身会是什么样的军备竞赛?从根本上说,我认为它们将像苹果将它们纳入Siri一样被纳入操作系统。然后会有更多专门用于其他任务的机器人。这是我的猜测。

但看到他们改进它很有趣。我认为这可能是正确的。我的意思是,我认为我思考明年人工智能的方式是,过去两年就像朝着实际底层技术的收益递减点前进一样。我们到了那里,对吧?这些东西会不断改进。可能会有某种令人难以置信的物理奇迹改变所有这些东西的工作方式。但按照我们目前的道路,

这些东西会不断改进,但速度会比以前慢得多。所以现在的问题是,这些东西对任何事情有用吗?我们不必问这个问题,因为我们基本上已经为所有这些公司进行了为期两年的新奇体验。他们只是通过找到一些看起来略微新颖的事情来做,就取得了很长的路程。

仅仅是因为我可以拍一张照片并说,这是一朵花吗?它会说,是的,这是一朵花。这很新颖、很酷、很令人兴奋。我们正处于那一刻的结束。我认为你开始看到了,就像对所有这些东西试图做的事情以及它们是否真正好的幻灭正在到来,而且它就在这里。所以现在的问题是,

让我们假设这项技术明年不会获得数量级的改进。我们拥有的技术还能做什么,这是个问题。好的,这是我对此部分的最后一个答案。我见过的最有用的人工智能是Reddit构建的Reddit Answers。

它允许你搜索Reddit,而无需通过Google。它里面有人工智能。所以它会总结一堆Reddit帖子。因此,当你搜索任何东西时,它会向你显示一堆Reddit答案,但会用人工智能对其进行总结。这可能是迄今为止最好的东西。这可能是有史以来最好的人工智能功能。我没有使用过它。Jay Peters使用过它一段时间,并且我认为,他对它的体验有点复杂。但是能够用你提出的问题来调查整个Reddit的想法

听起来很棒。即使在Google搜索中,它也不太好用,Google搜索与Reddit达成了非常昂贵的协议来获取数据,因为它只是,它只是没有以相同的方式编译它们。但是,如果我可以很快地说,好吧,Reddit上的每个人都认为你应该买什么婴儿用品?就像,这些信息存在于Reddit中。如果它能够以一种有效且有意义的方式去实际编译所有这些东西,那么它就是一件好事。

太棒了,伙计,我会一直使用它,好吧,现在我已经说了,我同意这非常好,当然,提供的例子是Reddit认为1月6日发生了什么,呃,呃,Jay提出的一个例子是第一次带婴儿飞行的小贴士,非常好,就像一个完美的Reddit查询一样,对吧,而且老实说,我想要从Reddit体验中获得的是,给我5000个关于这个的故事

对。所以它总结了每个人的故事。答案是考虑安全座椅,乘坐头等舱。一些父母发现头等舱的额外空间很有帮助。可靠的。酷。我个人发现我的私人商店对我们的宝宝非常有帮助。在起飞或降落时喂他们。顺便说一句,这是经典的建议。然后带很多零食和饮料来让你的宝宝保持忙碌。它就像,好吧,这只是东西。好的,等等。

这很有趣。我可能会立即收回我刚才说的一切。因为如果你向下滚动到下一个屏幕截图,即Google搜索,Google搜索中的预览内容要好得多。让我读给你听一些这些内容。它说在登机前更换尿布。不要先登机。

好建议。系在安全座椅上是婴儿飞行的最安全方式。好建议。婴儿需要坐在安全座椅上。婴儿还需要在整个飞行过程中由你抱着。这似乎令人困惑。你抱着安全座椅?抱着安全座椅。带一些消毒湿巾来清洁婴儿将接触的飞机区域。带一个你可以用来在飞机上换尿布的轻便垫子。所有这些都比这些东西更有用。顺便说一句,我可以说我们没有发现最有用的小贴士是

与Max一起,那就是带五包不同颜色的便利贴,让她尽情发挥。哦,这很好。

我的只是零食。我们买了,我想说,40种不同的零食。这不是一个育儿播客。我只是说它很有趣,对吧?因为如果你获取世界上的信息库并阅读它,其中有很多个人的经验,这些经验对于这种没有答案的事情来说是有用的,然后你试图将其塞进这是正确答案的形式中,你最终会得到把婴儿放在椅子上。

但这就是我们在Apple intelligence中遇到的问题,例如通知摘要。通知已经被总结了。撰写帖子的那些人已经将其写成供那些没有真正关注并且时间不多的人阅读。他们以一种方式安排它。他们被点赞是因为他们写得很好,并且他们让你获得了所需的信息。你不需要总结它们并从某一行中提取更多价值。你需要整个东西。我们做错了。

我的意思是,这是持续的……这并不完全是语境崩溃,而是……

只是纯粹的像最低公分母主义的人工智能,那就是如果你获取所有东西,然后试图将其塞进两句话中,你将得到两句非常无趣的话。我认为我们从其他人那里看到的一些东西,例如我认为谷歌的Notebook LM做得很好,基本上它会去寻找东西,然后只给你一堆来源,对吧?就像我从这个Reddit中想要的东西不是

段落中的标准答案,我想要一堆链接,就像你说的,尼拉,这里有10个,就像你说的,尼拉,这里有10个最受喜爱、最具争议和最有趣的回复,我们曾经对这个问题得到过回复,哦,我的上帝,我尝试过这个,它有效。这就是你正确地做这件事的方式,而不是说,这是12000个Reddit帖子的粗略总结。这就是太多这样的服务试图做的事情。是的。也就是说,我认为Reddit是……

这是我看到最多机会的地方,因为Reddit非常庞大,对吧?你可以花很多时间听Reddit上每个版本的每个东西,并且有一个工具可以帮助你更好地完成这项工作,这很有趣。我只是它。是的,这只是一个例子。我相信还有其他的,但Reddit的光荣之处在于,它是一群人告诉你他们的经历。很少有正确的答案。

对。它就像,我将综合来自所有这些人的所有这些信息,他们告诉我关于任何事情,或者只是谈论他们的粉丝群或任何东西。这让我感觉自己是社区的一部分。它让我感觉,嗯,它让我感觉自己是社区的一部分。它让我感觉自己得到了认可,就像,我也可能有一些经验。不是我需要它。我只是把她塞进安全座椅里。呃,好的。我们必须休息一下。我们将回到闪电轮。伙计,这,这是一个充满动作的闪电轮。我们马上回来。

Verge cast的支持来自Stripe。支付管理软件并不是你的客户经常考虑的事情。他们看到你的产品,他们想购买它,然后他们就购买了。

这大概是最复杂的情况了。但在这一过程的底层,还有许多非常复杂的事情正在发生,为了让这笔交易成功,这些事情都必须顺利进行。Stripe 处理金融基础设施的复杂性,为企业主及其客户提供无缝的体验。例如,Stripe 可以确保您的客户在购物时看到他们的货币和首选支付方式。因此,结账永远不会让人觉得像是一件苦差事。

Stripe 是一个支付和账单平台,支持全球数百万家企业,包括 Uber、宝马和 DoorDash 等公司。

Stripe 帮助无数初创企业和老牌公司实现了他们的增长目标,在他们的使命上取得了进展,并接触到更多全球客户。该平台提供了一套专门的功能和工具来为各种规模的企业提供支持,例如 Stripe Billing,它可以轻松处理基于订阅的收费、发票和所有经常性收入管理需求。了解 Stripe 如何帮助各种规模的公司取得进步,请访问 stripe.com。网址是 stripe.com,了解更多信息。Stripe。

取得进步。

《The Verge Cast》的赞助商是家得宝。马上就要过节了,无论您是计划旅行还是做东道主,额外增加一层安全保障总是一个好主意,这有助于让您安心。现在,在家得宝的帮助下,您可以通过智能家居安全产品方便地保持连接和保护。家得宝提供各种各样的产品,让您可以轻松控制和自动化您的家。拥有 Ring、谷歌、Wyze 等顶级智能家居品牌。

从具有 4K 监控功能的智能家居摄像头到可以通过智能手机操作的门铃,家得宝应有尽有。无论您是专家还是刚接触智能家居技术,家得宝都能帮助您找到适合您和您家的产品。访问家得宝的在线或实体店,购买您的智能家居产品,让您在这个假期安心无忧。因为智能家居始于家得宝。《The Verge Cast》的赞助商是 Polestar。

Polestar 正在努力推出新一代电动 SUV,这种 SUV 依赖于高度集成技术,以至于您会忘记它的存在。他们从 Polestar 3 开始,这是他们的豪华电动 SUV。Polestar 3 具有空气动力学外观和斯堪的纳维亚极简主义内饰。

它能够在短短 4.8 秒内从 0 加速到 60 英里/小时,每次充电的 EPA 估计续航里程可达 315 英里。Polestar 3 甚至允许您根据驾驶需求在性能模式或续航模式之间优化动力系统。您还可以告别杂乱的仪表盘,因为这款车会显示您想知道的一切,而不会显示您不想知道的东西。

您甚至可以让 Google 打开您最喜欢的播客(我们希望是这个),并沉浸在 Bowers & Wilkins 的 3D 环绕声中。Polestar 3 拥有很多优点,因此,如果您是一位不想在宽敞舒适和跑车的灵活操控之间做出选择的驾驶员,那么这款车可能适合您。您可以在您当地的 Polestar 空间亲自试驾。在 Polestar.com 预订 Polestar 3 试驾。

谢谢。

Glam Bag 是精选的最佳彩妆、护肤和护发产品,均由 Ipsy 的专家精心挑选。每个月的送货都会带来新鲜的选择,包括 Benefit、e.l.f.、Bare Minerals、Dry Bar、Makeup Forever 等顶级品牌,以及更多其他品牌。Glam Bag 中的产品价值远高于订阅成本。因此,这是一次高端的美容体验,价格却不高。

在这个假期,您无需花费时间研究才能找到一份让您的特殊人士满意的礼物。相反,您可以继续用 Ipsy 给他们带来惊喜和快乐。他们可以在任何时候兑换订阅,谁知道呢,他们可能会在 Glam Bag 中找到他们下一个最爱的产品。Ipsy 是月月带来快乐的礼物。在 ipsy.com/gift 以低至 50 美元的价格赠送三个月的美容礼物。

♪♪♪

好了。我们回到闪电轮。Liam,闪电轮的赞助商是谁?本周的闪电轮由 AWS 的新型生成式 AI 助手 Amazon Q 赞助。哦,它太棒了。我们开始添加收银机音效了吗?我认为我们只在第一次你要求音效的时候加了,但如果你想让它成为常规的事情,我们可以……

我觉得我们最近在一集节目中因为要求我们没有提供的音效而惹上了大麻烦。另外,如果你想做一个 Nilay 被现金淋湿的 Genmoji 并把它发给我,我很乐意接受。就在我们情绪化的斑马旁边。好了,闪电轮。David,你本周写了关于这个的文章。YouTube 在电视和客厅的增长速度仍然很快。这是怎么回事?是的,我想从统计学上来说,如果你……

正在收听这个播客。我甚至不知道该用什么词了。如果你正在体验这个播客……

呃,你很有可能正在客厅的电视上观看我们,呃,如果你正在观看,你好,这只有在你用一些破旧的侧光 LCD 观看时才会发生,我仍然爱你,你应该实际观看它,实际上应该观看几次,是的,在你的所有不同电视上观看它,只是为了检查分辨率差异,我会说,嗯,但基本上,YouTube 本周发布了一堆关于其客厅内容增长速度的统计数据,呃……

每月有 4 亿小时的播客观看发生在电视上。体育内容大幅增加。他们推出了一项我认为很酷的新功能,它被称为“一起观看”,呃……

呃,他们基本上发现很多人都在观看体育赛事,同时收听某人在直播中进行评论。他们现在正在将这些内容融合在一起。因此,创作者将能够在他们正在观看的内容之上进行自己的评论。他们从体育赛事开始,但也明确表示这将扩展到其他内容。例如,我与之交谈过的 YouTube 客厅内容产品负责人 Kurt Wilms。

特别提到,比如,苹果主题演讲怎么样?那里有很多创作者想谈论它并评论它?这只是我们可以提供的一件事,您可以获得所有这些不同的评论流。我认为这非常酷。我相信苹果对此会有一些非常有趣的看法。是的,可能会出现什么问题?谁会对世界上每部电影的新评论感到生气?但是,呃……

更广泛地说,YouTube 现在在电视上非常流行,我认为在过去一年中,它经历了这种转变。我非常关注这家公司。他们过去常常将电视视为人们观看 YouTube 的另一个地方。而现在,他们真的将其视为 YouTube 的主要平台。他们正在为电视行业开发功能。

这可以说是第一次。例如,他们有这个“节目”功能,您可以将大量视频放在剧集和剧集中,这使其感觉更像是一项流媒体服务。他们正在做“一起观看”的事情。他们正在做大量工作来同步您的手机和电视。YouTube 总是以某种方式想要成为 Netflix。我认为我们开始看到它朝着更高级、更高端、更以电视为中心的方向发展。

他们相信他们可以在不破坏 YouTube 在其他地方的产品的情况下做到这一点。但这种张力对我来说感觉非常真实。我认为这真的很吸引人。是的。我可以快速谈谈 YouTube 吗?我们在过去几周已经足够多地谈论我们的业务了。我不想过度讨论。但我本周在网站上发表了一篇文章。很多人抱怨我们的 YouTube 视频和网站不允许您点击标题转到 YouTube。每个人都认为这是我们的错。

因为出版商希望您留在网站上,这是有道理的,但是

对人们来说,这是有道理的。因为从很久以前开始,互联网上的每个 YouTube 视频,你都可以,你,你将鼠标悬停在其上,点击标题,它就会带你到,尤其是在手机上,你想打开 YouTube 应用。你有很多事情想做。我,我希望人们知道 Verge 非常支持链接。我们到处都有链接,比如主页上一直都有链接。嗯,这不是我们的错。这是 YouTube 决定禁用这些链接。如果我们想重新启用它们,我们就必须减少 YouTube 视频的收入。您可以阅读完整的故事。呃……

我只是非常生气,我花了几个月的时间说:“你能重新启用这些链接吗?”最终的答案是坚决不行,除非我们选择完全不使用 YouTube 或减少收入。我并不是业务方面的负责人。也许业务方面会做出不同的决定。但我当时想,这太糟糕了。我只是要告诉大家这件事。所有 YouTube 的人都对我做了一个非常悲伤的表情。如果互联网又回到了每个出版商都有自己糟糕的定制视频播放器的时代,我会非常生气。

无论你对 YouTube 有何看法,它都是一个不错的视频播放器,而互联网上充斥着糟糕的视频播放器已经很久了。顺便说一句,这些链接在 2016 年之前一直有效,而且我们赚的钱更多。一切都很好。然后在今年年初,他们更改了它,理由是“删除他们的品牌”,他们认为 YouTube 的链接算作品牌。这很愚蠢。

这很愚蠢。让我告诉你,在过去的两个半月中,我有多么任性。答案是坚决不行。我想,我要写一篇文章。我还在这里。Vimeo 能解决这个问题吗?当然可以。好吧,这是一个非常奇怪的问题。我对此很着迷。Instagram 将允许创作者在不关注他们的人身上测试短片。所以,像

Adam 和 Sarah 制作的这个视频真的应该去看。作为一个社会学文献,它非常有趣,它展示了 Adam 如何看待 Instagram 创作者如何看待 Instagram,比如从这个角度观看这个视频。

他说:“我知道你们很多人在上传短片时会感到压力,因为它不会有好的表现。所以现在我们将允许您上传短片。我们不会向任何关注您的人展示它。我们将向不关注您的人展示它,这样您就可以在将其发布给所有人之前了解它的效果。”这就像,这不是你应该对你创作的作品的感受。对吧?就像我要在向关注我的人展示之前对我的视频进行焦点小组测试,这是一件奇怪的事情。

这是正确的。我认为,如果您正在制作广告,您经营着洗车业务,比如,“我的洗车业务会做得更好吗?因为我制作了……”也许这是有道理的,但这就是我的意思。Adam 认为每个人都在制作商业视频。

他们试图优化其覆盖范围,而不是在 Instagram 上制作内容。Richard,你对此有何看法?这对我来说非常有道理。我认为它解释了,就像你说的那样,它解释了 Adam Mosseri 和 Instagram 如何看待世界,特别是我们从 Threads 中看到的内容。您可以发布一篇文章,它会通过陌生人传播开来,但

但不会被关注您的人看到。尤其是在 Threads 上,通过不赞成您所说内容的陌生人传播开来。它非常非常擅长识别不喜欢您所说内容的人,并确保他们看到您的帖子。

但这只是他们看待它的方式。好的,所以你制作了一些你希望被任何人看到的东西,随机的人,而不是你的社区,因为如果你想要的话,你会在你的频道中评价他们。——不,但他们说你不想让关注你的人失望。所以我们会用不关注你的人进行焦点小组测试。然后你可以决定这些数据是否让你有信心向关注你的人展示。

也许我认为这很有趣。我想,这确实是社交网络有史以来发布的最具新颖性的功能之一。非常有趣。我认为你无法相信关注你的人来判断你的内容是否优秀的想法。这是一种非常奇怪的思考方式。这可能会永久降低你在算法中的排名。这就是我的意思。就像我说的,当我说从 Adam 如何看待创作者如何看待 Instagram 的角度来看这个视频时?它纯粹是商业化的。

这就像,你作为创作者想要的是在我们的算法中表现出色。所以这里有一些工具可以帮助你在算法中表现出色。这就像,实际上我作为创作者想要的是创作艺术。

这些是不同的东西,截然不同的东西。这听起来比我的本意更愤世嫉俗,但我愿意,我会非常肯定地说。对赚钱感兴趣的人比对创作艺术感兴趣的人多。哦,是的。但这就是我认为这些平台所处的状态。我认为创作者平台就是这样商业化的。人们想要赢得它们。这是一个功能。而且你知道,他甚至在视频中说,我们与创作者一起制作了这个。就像我们收到了很多反馈,我们一直在与创作者合作,嗯……

但那里发生的一切都具有非常商业化的东西,这与……这对我来说是一个照片分享网站,让我与我的朋友们交流。是的。去看视频。这里有一些非常 Instagram 式的东西,我发现它非常吸引人。Richard,就像你说的那样,这对我来说意味着你……

总是处于在 Instagram 上失去一切的刀刃上。就像在 TikTok 上,你制作的一切都像是在老虎机上新拉一次杠杆一样,对吧?Instagram 比 TikTok 更关心谁关注你以及你关注谁。TikTok 只想将内容塞进算法中,看看什么有效,你可能会随机走红,有时你不会。Instagram 让你构建一些东西

对你作为创作者来说更容易理解。但如果你连续制作两个你的观众不喜欢并且没有回应的视频,你的吐司也没有回应。这就是每个创作者都害怕的事情,如果你错过一次,它可能会毁掉你的一切。而这就是 Adam Asari 基本上所说的,是的,这是真的。所以我们将提供更多工具来确保你永远不会这样做。这很奇怪。是的。奇怪的。呃,说到这,它可能会在一瞬间消失,TikTok 输掉了它的官司,呃……

挑战一项将迫使其自我禁令或被出售的法律。Lauren Feiner 撰写了关于该案判决的文章。很复杂,但法院基本上表示,国会做出了国家安全决定。我们不会推翻它。许多复杂的宪法第一修正案问题。我们可能会在以后的指标集中讨论它们。但是,

美国候任总统唐纳德·特朗普在接受 NBC 新闻 Kristen Welker 采访时被问到这个问题,采访长达一个半小时。我将只阅读这段引言,因为特朗普的话很多。我在我的竞选中非常成功地使用了 TikTok。我有一个名叫 TikTok Jack 的人。他非常有效,很明显,因为我赢得了 30% 的青年选票,这是他没有做到的。

做,但无论如何。我只是想说 TikTok Jack。无论如何,TikTok Jack,给我们发邮件。我需要了解你的一切。然后他说:“我使用 TikTok。所以我不能,你知道,我不能完全讨厌它。它非常有效,但我不得不说。如果你这样做,意思是禁止它,其他东西将会出现并取代它。也许这不公平。法官实际上说的是,你不能拥有中国公司。他们有权禁止它。如果你能证明中国公司拥有它,这就是法官实际上所说的。

她必须跟进。她说:“你会保护 TikTok 吗?”他说:“我将努力做到这一点,以防止其他公司成为更大的垄断企业。”他特别指的是 Facebook。他经常抱怨说,如果 TikTok 被禁止,Facebook 将成为一个更大的垄断企业。然后在竞选期间,他显然对一群年轻人说:“我会保护 TikTok。拜登想禁止 TikTok,我会保护它。”在我看来,这是一个巨大的让步,对吧?他只是说,我不想让 Facebook 成为垄断企业。不是,我不会保护 ByteDance 拥有美国的 TikTok。

而且我,我正在打赌。我认为我们已经做了无数次了,David,比如谁会购买 TikTok,因为这是出路。出路是他为亚马逊、沃尔玛或赛百味购买 TikTok 谈判达成协议。呃,他可以说他拯救了它。我做了一笔伟大的交易来拯救 TikTok。你为我感到骄傲吗?我正在做我所说的我会做的事情。而且我,我只是,你可以观看剪辑。我们在网站上发布了它。感觉这非常像他正在打开的大门。

我的意思是,这是逃生舱,对吧?这是他在这件事结束时最接近双赢的局面。他获得了美国优先的胜利。他让 TikTok 仍然存在。他可以,比如,用刀刺扎马克·扎克伯格。时间不多了。禁令将于 1 月 19 日生效。TikTok 已向最高法院提起上诉。我们将拭目以待。值得注意的是,1 月 19 日是 1 月 20 日的前一天,也就是他上任的日子。所以……

等等,Neil 和我多次公开表示我们认为会发生什么。Richard,你现在必须预测 1 月 19 日会发生什么。哦,TikTok 实际上变成了一个名为 TalkTik 的新应用程序。它不会由中国拥有,它将由马来西亚等地拥有。但是,你知道,由一家非常神秘的公司拥有,这家公司碰巧获得了大量资金。谁知道它来自哪里。

呃,下一个,Chris Welch 评论了 Sonos Arc Ultra。他说硬件很棒,特别是来自 Mate 的新型换能器。呃,这是一家致力于制造更小换能器并产生更多低音的公司。喜欢这些。应用程序仍然有点,有点东西。Richard,你认为呢?呃,我不知道。我的意思是,它是 Sonos,他们仍然存在应用程序的问题,他们搞砸了并让每个人都生气。所以,呃,进展如何?中等。我会说答案是中等。

嗯,但我要说的是,作为一款条形音箱,它看起来非常酷。如果我,Chris 基本上是说,这值得升级,从一个昂贵的条形音箱升级到另一个昂贵的条形音箱几乎是不可能的,没有人会这样想。就像我是一个喜欢购买扬声器的人,我从来不会想,“我应该升级条形音箱”。就像,呃,而 Chris 认为它值得升级,这很有意思。所以希望,希望这开始好转。呃,这是本周的大新闻。

呃,通用汽车关闭了 Cruise 机器人出租车服务,解雇了一批员工。Cruise 的前首席执行官直接将通用汽车称为一家愚蠢的公司,这很棒,但感觉像是使用了傻瓜,我非常喜欢。傻瓜是一个令人惊讶的有力、刻薄的说法。我不知道 David,在这个世界里有很多行动。很明显,通用汽车是起起伏伏的。你认为这是怎么回事?

我认为这只是开始看起来像所有这些汽车公司都在技术革命上走得太远了,对吧?人们认为电动汽车和自动驾驶汽车将很快出现

非常快,它们将立即成为主流,并将成为一项大业务。每个人都对机器人出租车这个想法感到非常兴奋,因为这样你就可以从你自己的车辆中获得一个非常有趣的、多元化的业务。就像你可以看到他们是如何到达那里的。

但我们还没有到达那里。而且,除非你是特斯拉,人们不断给你股票价格的钱,让你对从这里走向何方有奇怪的想法,否则你仍然基本上经营着一家汽车业务,它不会获得更高的利润率,它不会变得不那么复杂。

你仍然必须制造人们现在正在购买的东西。感觉这些汽车公司一个接一个地开始说,好吧,我们做出了这些巨大的未来赌注,这些赌注并没有像我们想象的那样迅速实现。我们只需要退出它。我还认为,比我更密切关注这个领域的人认为,特别是对于这个案例,有一些奇怪的事情正在发生,通用汽车处理这件事的方式表明,Cruise 内部还发生了其他事情,嗯……

它基本上只是突然切断了电源,当你是一家如此投资于 Cruise 的公司时,这是一件非常奇怪的事情。但宏观层面的事情实际上对我来说是有道理的。只是每个人 10 年前都做了一个赌注,他们认为这个赌注将在 5 年内实现。现在看来,这可能更像是 25 年。我认为很难像 Google 一直以来在 Waymo 上亏损那样亏损。是的。对。我的意思是,这只是 Google 的说法,我们将一直亏损,直到这件事能够通过凤凰城。对。

好吧,我们将一直亏损,直到我们能够通过奥斯汀。这就像……是的,通用汽车根本没有那么多钱。是的,这不是一回事。Richard,你是将量子计算列入此列表的人。谷歌发布了具有突破性成就的量子计算芯片。告诉我为什么这件让 Richard 开心。因为其他大多数事情都没有。我完全理解量子计算。实际上,我了解它的一切。量子计算芯片……Richard 目前既在这里,也不在这里。

正如我多次说过的那样,我的硬币,RJCC 硬币是量子锁定的。它始终处于启动、铸造和预铸造状态。这就是它的工作原理。这就是量子的工作原理。这就是我们在 RJCC 硬币这里所做的。我们将在 Willow 上这样做,因为它可以在 5 分钟内完成一项任务,而超级计算机需要 10 个七百万亿年才能完成,这可能是我们生活在模拟中的证据。嗯……

或者多元宇宙,也许是,也许不是。我真的不知道这些词是什么意思,但它发生了。他们有一个芯片,他们正在做一件事情。现在他们正在尝试寻找,基本上,既然他们已经做了这件事,他们正在尝试寻找一些你实际上会找到用途的东西,以便他们可以证明它的速度有多快。因为现在,他们可以做的一切都是理论上的。答案是破解加密。

RJCC 硬币。这就是将会发生的事情。你已经加入了。它是量子的。你已经参与其中了。你已经拥有它了。我有三件关于这件事的非常简短的事情要说。首先,每个人都应该阅读 Google 做的研究论文,因为即使是 Google 自己研究人员也基本上认为,我们所做的事情很酷,但我不知道我们在这里做了什么。这就是量子计算。是的,他们就像,我们做了一个惊人的……

前所未有的数学计算,没有人关心。它与现实世界无关。就像他们,他们说我们做到了这一点令人惊叹。我们不知道我们为什么要这样做,也不知道它实际上实现了什么。然后他们说,我们在这里解决的主要问题和真正的突破是,我们让它犯的错误更少了。是的。就像,想象一下,如果你的电脑就像,有时当你尝试移动文件时,就像……

它只是爆炸了。但现在我们的电脑这样做的情况少了。它仍然这样做。它非常好。更少。我只是说,量子计算的主要用途将是以特定的方式破解密码学。

你准备好了。是的。你准备好了。但第三件事是,他们非常随意地说,这可能是我们生活在模拟中的证据。这就是它的结尾。他们只是,他们不再处理这个问题了。他们只是说出来。好吧,这是最后一个,这是纯粹的证据。我们现在生活在模拟中。你可以在亚马逊上购买现代汽车了。这很奇怪。你可以,这很奇怪,在亚马逊上看到标价 67,000 美元的东西。

但没有一键购买。按钮是“立即开始”。然后你就会被踢到经销商那里。我觉得我们必须买一辆车来测试经销商是否真的会配合。等等,这不太令人兴奋。所以我真的希望某个亚马逊仓库里……全是汽车。那是 Carvana,对吧?有自动售货机。是的。汽车自动售货机。这是存在的。我认为他们只是在与现代汽车进行一些定价游戏。对。

Nilay、David和The Verge的Richard Lawler讨论了AI新闻中重要的一周。首先,他们回顾了谷歌Gemini 2.0发布的最新消息,并试图弄清楚Project Astra和Project Mariner是否会变成人们使用的产品。他们还讨论了OpenAI发布(和未发布)Sora、新的Reddit Answers工具以及iOS 18.2的新功能。最后,在闪电轮中,他们谈到了YouTube、Instagram、TikTok、Sonos和Cruise。他们也谈到了,也可能没有谈到量子计算。因为现在这是可能的。进一步阅读: 谷歌的AI进入其“自主时代” Gemini 2.0:谷歌新的旗舰AI模型有哪些新功能 谷歌的AI智能眼镜更接近现实 谷歌新的Jules AI代理将帮助开发者修复有bug的代码 谷歌正在测试帮助你在游戏中使用的Gemini AI代理 谷歌构建了一个可以为你进行研究的AI工具 Android XR_Keyword OpenAI终于发布了Sora iOS 18.2现已推出,增加了ChatGPT集成和更多Apple Intelligence工具 ChatGPT的并排“画布”视图现已向所有人开放。 Reddit的新AI搜索工具可以帮助你找到Reddit答案,而无需使用谷歌 YouTube在客厅电视上的增长速度仍然很快 Instagram将允许创作者在随机用户身上测试实验性短片 特朗普似乎会同意出售TikTok TikTok未能通过第一修正案来拯救自己 Sonos Arc Ultra评测:不要称之为回归(至少现在还不是) 谷歌揭示具有“突破性”成就的量子计算芯片 亚马逊与现代汽车的在线汽车“经销商”现已上线 YouTube的AI配音功能现已提供给更多创作者 在潘通的全棕色派对上寻找色彩 Adam Mosseri关于推出试用版短片 来自WSJ:iOS 18.2评测:苹果承诺给我们的AI

<raw_text>0 对,现代汽车设定价格,亚马逊设定价格,经销商只负责交付汽车,每个人都分一杯羹,都很开心。但仍然有汽车经销商参与其中。我向你保证,在某些时候,他们会说,我们已经给这辆车加价了。我们给轮胎充了氮气。所以现在要额外加6000美元。这就是汽车经销商的做法,对吧?如果有人想在亚马逊上买车并告诉我们结果如何,我非常想知道。如果你只想给我一张65000美元的支票,这样我们就可以在亚马逊上买车了。

我们也会接受这笔钱。但我真的很想这么做,因为我想看看经销商是否会配合。这太奇怪了。很奇怪。如果你通过亚马逊买车,亚马逊会给你一张2300美元的礼品卡。这是未来,伙计。这有点像减税,但它不是。奇怪的是,这辆车只能在Kindle上使用。

但我希望他们能够连接起来,带一辆拖车,这样我就可以在亚马逊上看到别人的Mercur XR4 Ti,然后我就说,是的,立即购买。然后它第二天就送到家门口,我不得不解释一下。

这就是我们需要做的。他们把整件事都带给你,然后送货员把钥匙交给你就走了。我的表弟在新泽西州绝对是冲动地买了一辆车,带了一辆拖车,然后一辆80年代的梅赛德斯就开进了他的车道。他妻子说,这是怎么回事?但你绝对可以冲动地买一辆车,带一辆拖车。这是真实发生的事情。好了,我们得走了。理查德,这是一个很棒的节目。感谢你的到来。

我想提一下一个故事,这也许是我这个月最喜欢的故事。我们的创意总监Kristen Radke和我们的摄影师Amelia Halliday-Krails参加了潘通年度色彩发布会,该颜色被称为摩卡驼鹿色,也就是棕色。所以他们参加了一个棕色的派对。克里斯汀很害怕,因为她那天不小心穿了棕色衣服。是的。

但后来她到了派对。其他人也都穿着棕色衣服。这就像一个完美的Verge故事。一切都很好。去读那个故事吧。照片很棒。就是这样。这就是VergeCast。摇滚乐。这就是本周VergeCast的全部内容。嘿,我们很乐意听到你的声音。请致电866-VERGE11。VergeCast是The Verge和Vox Media Podcast Network制作的节目。我们的节目由Liam James、Will Poore和Eric Gomez制作。就是这样。我们下周见。

那是aws.amazon.com/Q。

本集的支持来自AWS。AWS生成式AI为您提供工具,让您能够以全球经验最丰富的云的安全性和速度来推动业务发展。