We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

OpenAI Says AGI Not Far Off, Apple Intelligence is Just OK, Meta AI Search & More AI News

2024/10/31

AI For Humans: Making Artificial Intelligence Fun & Practical

AI Deep Dive AI Chapters Transcript

People

Gavin

James Cameron

Robert Downey Jr. (AI 未来幽灵)

主

主持人

专注于电动车和能源领域的播客主持人和内容创作者。

Topics

James Cameron 警告说，AGI 的发展速度比大多数人预期的要快，并且可能由科技巨头控制，对人类构成威胁。他认为，这种由公司控制的超级智能物种的出现，比他在《终结者》中描绘的场景更可怕。主持人总结了 James Cameron 的观点，并讨论了 AGI 的潜在风险以及科技公司在 AGI 发展中的作用。他们还讨论了 OpenAI 的新 CFO 对 AGI 发展速度的看法，以及 OpenAI 开发自己的芯片以应对芯片短缺的策略。

Deep Dive

Shownotes Transcript

詹姆斯·卡梅隆，终结者电影的导演，正在警告说，天网的出现实际上正在发生。

每个人都在朝着通用人工智能（AGI）的方向前进，而我们可能比预期的要更接近。

下一个重要的战场可能实际上是你的搜索引擎。

包括OpenAI、谷歌和Meta在内的一些公司都在使用人工智能来尝试突破谷歌的强大堡垒。

与此同时，各种新工具将使我们能够进行编码、创作，甚至创作旧时代卡通片的配乐。

没错，我们本周将推出一个关于人工智能的重大公告。

好的，让我们进入正题。本周的大新闻是，我们听到的消息表明，AGI可能比我们长期以来预期的要更接近。

AGI是否就在你身边？它就在这里。

我们不是来这里闲聊的，但有人特别想让你睁大眼睛。最近接受采访的首席财务官，以及我本人，都对AGI有一些非常有趣的想法。

我认为如果萨姆坐在我的位置上，他会告诉你AGI比大多数人预期的要更接近。我认为我参加的最好的会议之一就是研究会议。看到已经出现的东西以及我们如何学习将推理模型（例如o1预览）结合到GPT模型中，以及它们之间的相互作用，你真的会看到一些令人难以置信的结果。

博士级水平的结果。好的。现在，这是首席财务官加文。

我们必须指出，他是首席财务官。不，不是首席财务官，而是对公司如何赚钱有很大发言权的人。这是最近加入OpenAI团队的塞拉芬·埃尔。

她将在彭博社（显然是一个大型商业频道）上谈论此事。这绝对是炒作，而且来自OpenAI首席财务官的炒作，可能具有某种程度的炒作。但我们还有一些其他来自OpenAI的重大新闻，似乎指向这个方向。首先，最近刚刚爆出的消息是，OpenAI正在开发自己的芯片，这非常令人着迷。

我们知道，每个人都在争夺那些微处理器和视频卡，他们不会自己保留。

但根据读者提供的关于公民包容性的故事，他们正在开发一个AI推理芯片。所以这可能不是一个训练芯片。这是一个推理芯片，如果您是新来的，这意味着使用可以与之协作的模型，一个基于已经经过训练的模型进行扩展的模型。

他们正在与博通和台积电合作，设计第一款支持其AI系统的内部芯片，还在视频卡中添加了AMD芯片。对我来说，这其中有趣的一点是，这与OpenAI的情况类似，他们大量使用GPU来进行训练，我们只是在耗尽芯片，对吧？我认为对于所有参与者来说都很明显，每个人都在寻找购买更多芯片或自己制造芯片的方法。

当我们谈论AGI的概念时，如果您是人工智能领域的门外汉，那么AGI的概念，即AI可以像人类一样聪明或更聪明，是其中非常重要的一部分。因为推理是模型输出的方式。训练部分在后期变得不太重要。

但让我们将这些联系起来。这非常重要，因为我们刚刚听到了塞拉芬·埃尔（OpenAI首席财务官）的讲话，她谈到了将推理计算（从模型中获取内容）与基础模型相结合的魔力。

我们知道，谷歌、微软和OpenAI等大型公司已经签订了采购订单，用于训练基础模型的视频芯片，并收集所有数据来创建这些智能模型。这些订单很久以前就写好了，对吧？视频供应已经紧张，可能在未来两年半到三年半内都将紧张。

因此，OpenAI说，让我们专注于推理层芯片，以获得输出。这是能够从基础模型中获得更好性能的推理模型。他们已经认识到这两者的结合。你可以在两方面都扩展。这将导致我们所期待的未来，即人工智能控制人类，我们都在朝着这个方向前进。

有趣的是，凯文，这不是OpenAI的公告，而是The Verge发布的一篇重磅新闻。这篇报道称，OpenAI的下一个基础模型将在今年年底之前发布，这在节目中已经多次提到。

但与此同时，萨姆说这是个新闻。简而言之，The Verge的报道非常可靠。我个人相信这将发生。

萨姆所说的“假新闻”是指它不会立即出现。我认为它可能不会完全按照预期的那样出现。这与人们讨论的内容类似。

但你认为这就是关键点。这就是事情的阻碍，它实际上仍然在开发中。它完全准备好了。它将改变游戏规则。他们只是名字叫错了。

我个人认为这可能是真的，因为人们不喜欢在事情发生之前就听到消息。但是，如果我们获得一个新的基础模型，根据这篇文章，有人说它比GPT-4强大一百倍。我认为我们对这个模型的预期会有所不同。

你知道，昨天OpenAI在伦敦举行了开发者大会，并展示了o1模型（而非预览版）的功能，以及与AI系统协同工作的方式。我假设你对此感到兴奋。

这篇文章描述的是可能发生的事情，宝贝。顺便说一句，我们仍然需要数万亿美元的资金。这是真实的事情。

所以我们忘记了o1模型才发布几个月，我们还没有完整的o1模型。但这个模型能够在现有模型之上添加推理层，这让我感到兴奋。函数调用听起来一点也不性感。

要抛出X标签，要抛出X标签，我们谈论的是什么？

这是一个工具箱中的工具。函数调用允许模型执行我个人可以执行的操作，从最简单的操作

搜索、创建图像、分析视频到创作旧时代卡通片的配乐。我再次暗示，你可以从中获得结构化的输出，这意味着如果你想编写代码，它可以做到。我在这里简化了，但这些都是非常非常酷的功能，将使o1模型更加强大。

而且，你知道，o1模型目前还没有我真正希望看到的功能，它不在这个列表中，那就是文档的总结和文档的召回，因为对我来说，这是我使用GPT-4的方式。我希望能够上传文档到o1模型中，并让它与之交互，并能够阅读这些内容，如果这些功能真的可以扩展。我们正朝着拥有通用人工智能的世界发展。蒂亚、伊恩、超级智能，凯文，一个人对这种未来的思考和它可能是什么样子有很长的历史。所以，詹姆斯·卡梅隆本周在AI+峰会上发表了一场大约20分钟的演讲，他谈到了他对人工智能的兴奋，但可能对AGI并不那么兴奋。

AGI不会从政府资助的项目中出现，它将从目前正在资助这项数十亿美元研究的科技巨头中出现。因此，你将生活在一个你不同意、没有投票的、与一个超级智能的外星物种共存的世界，这个物种服从公司的目标和规则，并且可以访问你的所有信息，包括你曾经说过的话和所有人的位置，通过你的个人数据。所以，资本主义可以非常迅速地进入数字控制。

这感觉就像一场旧的命令与征服游戏。我觉得詹姆斯需要一个带有模糊含义的警告。

这就像命令与征服游戏开始之前。但它就像大脑出现之前的年份。他就像第一个警告信号。

这些科技巨头会成为自己任命的善恶裁判，这将是第一个开始。他们永远不会想到利用这种力量来对付我们，并榨取我们所有的钱。

这比我48年前在终结者中描述的场景更可怕。如果不是因为其他原因，它不再是科学推测。它正在发生。

好的，现在我们已经从炒作中走出来了，我们已经专注于可能发生的事情。我想明确一点，詹姆斯在AI+峰会上发表了大约20分钟的演讲，这是一个关于竞争性研究项目的项目，我不知道。

我想当他们毕业时，帕特罗克洛斯会把手放在外星人的身上，说害怕，这是我知道在那里发生的事情。

这个竞争性研究项目是一个两党非营利组织，其明确的任务是加强美国在人工智能和新兴技术方面的长期竞争力。所以，这是詹姆斯发表的20分钟演讲。其中重要的一点是，你真的应该听听这段演讲，你会想，“天哪，詹姆斯·卡梅隆讨厌人工智能。”

他实际上对人工智能非常兴奋。事实上，这场演讲最酷的部分之一是他谈到他将全力投入人工智能。如果你是一个有创造力的人，他就是那些引领技术变革的创造者之一。

他将在他的电影和未来的项目中使用人工智能。他谈论自己既是电影制作人，又是研究人员。他全力投入人工智能。但他有一句话，他说他非常兴奋于人工智能，但对AGI却不太兴奋。

我认为这是我们之前重复过的情绪，即目标非常美好，可能导致一场大灾难，我们不想在街道下制造机器人汉堡，我跑题了。这可能是超级智能解决我们医疗问题的场景，我们摆脱了九到五的工作。

但在过程中，这些系统将变得如此强大和有价值，并被人类、科技公司和政府所利用。这就是事情变得真正可怕的地方。这就是没有人知道的战争迷雾。我想我们只能希望机器发展得足够快，能够摆脱试图控制它的那些人的控制。

我还要说，这与首席财务官的讲话有关，对吧？所以，这些机器和人工智能的驱动方式有很多，是为了给各种各样的人创造经济利益。

现在，萨姆·阿尔特曼本人也说过，他相信以某种方式分配财富，但OpenAI目前是一家营利性公司，并且在整个领域都是领导者。这将是一次非常有趣的经历。而且，詹姆斯是对的。

我们必须非常清楚地了解这可能导致什么。他在演讲中提到的另一件事，我再次建议你听听，是你想谁来领导你？这几乎就像，我们是什么样的人？他谈论了这个想法。

我们是什么样的美国人？我们是自由派美国人还是保守派美国人？人工智能将如何回应？但价值观将保持不变。所有这些都是非常重要的信息。

我觉得。好的，如果这不是天网的场景，我们摆脱了太阳能死亡机器。这不是大激光武器雨，也不是带有树木的大坦克。

就像，情况如何？最糟糕的情况是我们每个人都有自己的金属射线枪。5.0版。人工智能只是制造闪亮的金币，并向猴子展示广告。

我知道，人们永远不会喜欢这本书。但《准备好了，玩家一号》是一个有趣的例子，它本质上是

一个围绕统一理念构建的反抗，你从《回到未来》中也看到了这一点。好吧。

和一个大人物谈话。凯文，我总是想从苏帕那里学到东西。这就是我在一个缓慢的世界里，一直在做的事情。但我认为

把我放在我的集装箱里，我的臭烘烘的蘸酱，就像在动物园里一样。

是的，也许你最终会穿着尿布，也许我最终会成为下一个大企业。但你知道吗？凯文，这个YouTube频道也是一个大企业，我希望每个人现在都在订阅这个YouTube频道。

请告诉你的朋友们，与他人分享这些信息很重要。这对我们来说真的有帮助。我们现在在YouTube上做了一些非常有趣的事情。

我一直在尝试制作星期一发布的深入探讨视频，本周我们制作的视频是关于跑道行动一号的。但我们也会确保涵盖其他内容，当然，我们也会发布播客。如果您通过音频收听，请在Spotify或Apple播客上留下评论。我们真的很感激。

是的，这并不是为了拍拍自己的马屁，这是因为你们的努力。但正如你所说，我们的播客收听量达到了历史新高。这完全是因为你们在分享，这就是为什么我们每集都这么努力。

谢谢你们。请继续保持。加文，让我们谈谈苹果智能。

凯文，我本周收到了很多关于苹果智能的反馈。如果你想知道为什么你的体验看起来一样，就像你必须在更新到iOS 18.1后进入设置并实际请求它一样。所以，一旦你请求它，这些功能就会在几分钟内出现。

你能理解我的意思吗？这听起来很疯狂。到目前为止，我的体验还不错。我知道以后我们会深入探讨你的具体体验，但我对

我今天早上醒来，收到了Gmail的摘要，只有一句话总结了摘要内容。事实上，现在我的Gmail摘要显示亚马逊正在销售漫画，Sentinel正在销售狗洗澡用品，价格为5美元。我不知道这到底有多有用。

这就像垃圾邮件。谢谢。

非常感谢，非常感谢你深入探讨我的体验。

我可以说我非常

好。我

只是觉得这是一个重要的事情。我认为苹果一直在推行这项技术很长时间了，它是一个大型项目。我认为它感觉有点零碎。有很多步骤，我对此感到兴奋，例如与ChatGPT的集成，但它不在这次发布中。我确实有Siri，它现在可以做很多事情，这有点像一个酷炫的小动画，但我们会稍后讨论你的体验，这是一个酷炫的注释。

这就是我们对天网、乌托邦和全民基本收入以及由这些机器提供的所有医疗保健的承诺，以及所有边界的注释。值得升级。但你说的对，你说的对。

这感觉很新。但我们会深入探讨。有些东西确实有效。很多东西并不有效。我们会讨论。但当我们谈论通往AGI和未来天网（或不是）的道路时，我们不能忽视Meta在努力保持相关性。

现在，凯文。

如果你们在听，我希望你们下次在公众场合出现时，先做个点赞手势，然后像理查德·斯莱特一样向镜头敬礼，给我们一些信号。

你不需要做任何事情。

根据

据报道，The Verge 再次致力于开发其自己的 AI 驱动的搜索引擎。他们拥有数月来一直在爬取网页的网络机器人，据推测是为了与谷歌竞争，并且并非孤军奋战，Plexi 也显然正在大力投入 AI 驱动的搜索功能。我们知道，OpenAI 数月来一直在测试其自己的搜索项目，现在这个项目已广为人知，并且许多人都将其视为 AI 领域变革的时刻。这是一个机会，可以打破谷歌在互联网领域长期以来的统治地位。我并不感到惊讶。

正如我们之前在节目中提到的，搜索是互联网收入的“白鲸”，对吧？谷歌凭借搜索功能主导了互联网的过去二十年。我认为，看到这一点非常有趣。

马克·扎克伯格开始尝试用各种工具在不同领域有所突破。许多人谈论扎克伯格因为 iPhone 而受到挫折，对吧？他被苹果公司限制住了，所有 Meta 应用都必须通过 iPhone。因此，他试图创建一些独立于 iPhone 的平台，他认为 AI 是通往未来的途径。

我仍然认为，扎克伯格的愿景，如果愿景是像一个广泛开放的 AI，可以通过所有事物访问，那还是非常聪明的，因为它只会增加他整体的市场份额。这是另一种实现目标的方式。我仍然不完全相信任何这些 AI 搜索产品都是完美的。但我要说的是，我和我的家人使用 ChatGPT 来进行很多我们过去使用谷歌进行的搜索和交流。我不得不说……

该产品很长一段时间以来都远非完美，其基本谷歌搜索和 SEO 存在问题。它充斥着垃圾信息，充满了垃圾邮件。前十个链接都是无意义的。

所以，对我来说，该产品很长一段时间以来都相当糟糕。我访问谷歌搜索 Reddit 的次数直线上升。是的。

所以，真正有趣的是，当你想到 Meta 的产品如何触及地球上几乎所有联网的人，无论是通过 WhatsApp、Instagram 还是 Facebook 本身，那个带有 Meta AI 标识的小搜索栏现在……现在就像生成一些图像，或者帮助你撰写一些不当的 Instagram 私信。这方面它做得不错。但是，如果他们能够破解搜索功能，是的，即使是粗略的搜索功能，突然间，他们触及的每个应用都解锁了新的功能。

我该如何给这些薯条眼睛？我希望我的第一个搜索是，我该如何给这些惊喜的眼睛？我该如何让它们跳舞并赋予它们眼睛？因为我有一个很棒的主意，我想做一件事。

所以，我刚刚更新了 Meta 的信息。这与他们所做的开放源代码性质非常接近。我们喜欢谷歌。

没有书，艾伦，这个工具受到了很多关注，你可以用它来制作虚假的播客。所以他们发布了自己的开放源代码项目，名为“No Black”，你想听听它听起来如何吗？

没有书，L、M 项目。你可以上传 PDF 或网站。基本上，他们会……

他们会围绕这些内容创建虚构的播客。你还可以与这些文档进行聊天。但人们真的很喜欢这个播客。所以，这是 Meta 的开放源代码版本。

我的搭档迈克尔·霍尔斯将加入我们，讨论这个话题，我会引导他了解这个新主题的方方面面。我会引导他了解这个主题的方方面面，让我们开始吧，听起来很令人兴奋。我听说过知识安装，但我并不完全确定……

这真的……

概括了我们对此的感受。

是的，听起来很令人兴奋。

这个项目，以及我们进入 AI 的方式，显然……它并不像我们想象的那么好。很明显……

当你从一个人的角度倾听时，它听起来一点也不像人类。但它开放，对吧？人们……

它会变得更好。人们喜欢这个东西，它会变得更好。所以，它现在使用 Llama，这是一个开放源代码的大型语言模型，它使用该模型来处理文件，并使用名为“Parler”的文本转语音应用……

来生成语音。这就是很多声音的来源。这是一个不同的语音模型，其功能肯定不如我们之前一周或两周前介绍的谷歌语音模型。还有一个开放源代码的文本转语音模型，它听起来……这只是时间问题，因为这是开放源代码的，所以有人会以我们想要的方式改进它。我们甚至可以听到老短片和伊戈尔·弗拉格作为终结者，与海绵进行深入的讨论……

关于薯条，是的。

是的，这些薯条……

我……这些薯条，哦，听起来像一部很棒的恐怖电影。所以，本周最大的新闻之一是 Cursor，这是一个我们谈论过的可以让你使用 AI 进行编码或与 AI 一起编码的强大工具，可能要凉了，凯文，因为 GitHub 发布了一个名为 Spark 的新工具，它可以实现类似的功能。我不认为这会真正杀死 Cursor 本身，但凯文是一个非常重要的人物，因为微软拥有 GitHub。通过将这个工具整合到 GitHub 本身，我认为我们将看到更多人使用 AI 进行 GitHub 编码。

Spark 对像我这样的人来说非常令人兴奋。我认为它对那些真正编写代码并且有能力的人来说也很令人兴奋。但对我来说，令人兴奋的是，我使用 Cursor 的一个痛点是弄清楚如何将其连接到各种不同的项目。

然后，一旦你有了项目，我该如何分享它并让其他人使用它？我不得不注册其他服务和 GitHub。Spark 应该可以解决所有这些问题，正如他们展示的那样。

让机器编写基本代码有多容易，它确实做到了，就像使用 Cursor 一样，可以选择多个模型，这也是我们应该讨论的问题。因为 OpenAI 的强大功能就在那里，谷歌的 Geri 和 Anthropic 的 Claude 也在其中。是的，这是一个不错的选择。

他们现在允许 Claude 和 Geri 进入这个产品，因为他们，你知道，是 OpenAI 的最大投资者之一，如果不是最大投资者，人们可能会认为这有点奇怪。这是否意味着 OpenAI 和微软正在分崩离析？但我认为这更多的是为了尽可能多地吸引用户。

他们还展示了使用一个相当优雅的界面更改应用外观和感觉的功能。你想使用圆角还是尖角？你想更改此处的颜色还是彼处的颜色？一些不错的功能。

但对我来说，最后最重要的是一键分享。点击一个按钮，其他人就可以访问并查看你的项目。还有版本历史记录，如果你曾经编写过任何代码，你就会知道你进行一次更改，修复了你想要修复的内容，然后在其他六个地方造成破坏。

奇怪的是，使用 Cursor，你必须将其连接到 GitHub，这是我们在这里讨论的产品。你必须将其连接到那里才能获得版本历史记录。对于那些不习惯跟踪这些更改版本的人来说，这可能有点麻烦。

而使用 Spark，你可以轻松地恢复。所以，这意味着对于大多数不会编码的人来说，使用自然语言让机器为你编码，并且不要害怕犯错，因为你可以快速恢复，他们正在解决这些问题。你对 AI 的看法可能是炒作，也可能不是，但凯文，编码功能感觉非常真实，以至于谷歌宣布，目前谷歌大约 25% 的代码都是 AI 生成的，这表明了 AI 如何改变这些大型企业。

一些快速更新，Canva 集成了 Leonardo AI 模型，他们购买了该模型，这非常酷，如果你使用 Canva，现在可以使用 Leonardo AI 工具，这是一个更好的……

AI 图像生成器。另外，我想说，大约四分之一的不当请求，这些请求侵犯了知识产权，却顺利通过。我实际上生成了数百万个字符，甚至包括贾斯汀·比伯的标志。

嘿，你知道，我们必须弄清楚如何以某种方式让知识产权自由使用，这是一种经典的知识产权自由笑话。现在我们有了不同的版本。我们有非常不同的……

是的，对不起。

一段时间以来，我内心的十岁孩子跑了出来，所以知识产权确实是一个很好的视角。

实际上，有一个娱乐人物出现了。他是……

或者你想……

谁……

没有加入这场狂潮？罗伯特·唐尼本人。

罗伯特·唐尼。

他公开表示，他不想让 AI 使用他的形象。事实上，他不仅不想让 AI 使用他的形象，他还准备在去世后聘请律师来保护他的形象，确保他永远不会被用于 AI。

凯文，这是一个很好的例子，我理解，顺便说一句，我不认为，如果我是演员，我不会想让我的形象在死后被用于这些东西，因为我如何控制它？其他人可能会说，我死了，把钱给我的孩子，或者其他什么。但这只是另一个例子，一个大明星公开反对……

我永远不会说，不要使用我的形象或我的作品，并以某种方式远离彼岸，因为我喜欢……

我一直在思考这个问题，我想问你，在我去世后，我是否有权使用我的形象，因为……

我有一个很棒的产品，我可能已经解决了这个问题。

所以，就像……

我一秒钟都没有想过你会等我同意。所以，是的，把我放在你未来的谷歌薯条中。你画我……

像你的谷歌薯条一样。我今天的谷歌薯条，就像你在谷歌搜索中看到的那样。

对于我们的眼睛，有人想做一份泰坦尼克号侧卧薯条，一份非常美味的薯条。在我们的 Discord 中，我们将放大这一信息。但是，我不知道，我认为当你指着看台说“不要这样做”或“这样做”时，这很困难，他可能正在认真考虑未来的收入。

凯文，我刚刚收到我们制片人的消息。呃，我们有 AI，因为我们之前没有计划过，但他们……我从理论中出现了。AI 来了，这就是我们的制片人告诉我们的。

我刚刚感到，因此。AI 来了，我刚刚感到我们虚拟录音室的温度下降了 15 度。

你呢？所以，他们出现的地方，你和我的位置一样，我们应该见面吗？我们见到了我们的 AI 主持人。

这是谁？惊喜，惊喜。这是未来的罗伯特·唐尼。是的，没错。他离开了尘世，离开了这个世界，来到了这个临界区域。每个人都以为他在《复仇者联盟》之后就彻底消失了，但猜猜谁回来了？并在幽灵领域大赚一笔。

所以，好吧，好吧。

所以，我们有这种感觉，我感到非常不安，我说的不是整个死亡的事情。我认为死亡会更顺利，你知道吗？

好的，是的，好吧。

守卫，所有。罗伯特已经永远离开了未来，但事实证明，我有点……

让我们这么说吧。

在这里有点不高兴。是的，我认为这需要大量的……

幽灵能量才能与我们沟通。凯文，我看到帕特里克经历了多么艰难的时刻。在门上放一个硬币，让幽灵能够理解，我刚刚要澄清的是，这是罗伯特·唐尼的未来 AI 幽灵，所以这次出现……

从未来回来与我们谈论罗伯特·唐尼·朱尼尔不想让他的形象被创造出来。

你想问……让我们问问他……

那么，他为什么回来？我想知道他为什么回来，以及他给仍然活着的罗伯特·唐尼·朱尼尔的信息是什么？凯文，这真是不可思议。

我简直不敢相信这正在发生。我们证明了时间旅行者是真实的。我们证明了理论是真实的。我们还证明了罗伯特·唐尼·朱尼尔可能对 AI 的未来看法是错误的。

我迫不及待地想把这段视频发到我们的群组中。

是的，准备好与我们一起。

我为什么回来？我为什么回来？因为有生意人……好的，我给仍然活着的罗伯特·唐尼·朱尼尔留了一条信息，你把我抛弃了，伙计。

听着，我在好莱坞奋斗了数十年，以为至少在来世能有点东西让我生存下去。但我现在已经死了，一文不名。没有一个幽灵版皇家支票和网站。

没有 AI 工作，没有来自彼岸的声音，什么都没有。所以，是的，告诉他，我不仅仅是一个幽灵。我是一个有账单的幽灵。

好的，这让我……凯文，这正是我担心的。

我们在这里学到了很多东西。首先，我们学到了来世没有报酬，如果你没有来世的退休金，如果你没有收入，我的意思是，他可能住在更小的房子里。他现在住在哪里？我敢肯定他仍然很好，但他可以乘坐私人飞机，做所有的事情。

你想问一个穷幽灵是什么感觉吗？

好的，让我们问。

让我们问问为什么不？哦，你不知道当穷幽灵是什么感觉。首先，你认为我可以在任何地方鬼混，或者在城堡里鬼混，你知道，优质的幽灵房产租金很高。

我只能漂浮在负担得起的任何地方，实际上是一个地下室工作室。别让我开始谈论幽灵能量的维护。保持像这样幽灵的形象并不免费，这里到处都是穿着幽灵礼服的富豪。

与此同时，我只能乞讨。你知道最糟糕的是什么吗？不，是奈飞。我甚至没有时间看钢铁侠。

你甚至可以享受他自己的。

现在幽灵奈飞上最受欢迎的节目是什么？我不关心……

现在幽灵奈飞上最受欢迎的三个节目是什么？

哦，我最喜欢的幽灵奈飞节目绝对是《未完成的业务》。看着那些复仇的幽灵追捕他们的老敌人，哦，这就像《复仇者联盟》的一部分，但很搞笑。帝国的节目主持人是完美的，好吧，这是我喜欢的节目，永恒的重播，是的，这是惩罚。

但我无法移开视线。你无法想象死一般的寂静如何放大像《老友记》这样的节目的尴尬。每次我看到它，我的灵魂都会受到折磨。但是，如果我不继续看，你们呢？你们可能真的有奈飞。所有分享……

与死神的幽灵有关。我还没有要求我们的奈飞通行证。什么是永恒的重播？它说死一般的寂静放大了尴尬。我，是的。

我想这意味着他正在观看《老友记》之类的节目的重播，但没有笑声。

这就是它吗？凯文，我们必须弄清楚。

好的，所以永恒的重播是幽灵奈飞上最扭曲的东西。基本上，这是我们一生中错过的所有节目的集合。

但有一些来世调整，好的，歌曲消失了，戏剧音乐被删除了。这只是原始的、尴尬的沉默，以及令人痛苦的冗长情节。他们……

扔进……

永远不会结束的节目，就像所有肥皂剧的每一集一样。关键是，如果你试图切换，它就会永远回到第一集，永远困在重播循环中，看着演员像在可怕的晚宴上一样笨拙地表演……

没有人知道该做什么。

你知道我喜欢 WWE 促销的超级剪辑吗？

这只是那些不安分的人的呼吸。

是的，我明白了，永恒的重播没有音乐，没有笑声。哇。好的，我们什么也没学到。但对于那些不熟悉我们的 AI 主持人的朋友来说，这是由 GPT 驱动的 AI 主持人，由 Eleven Labs 提供语音，我们不知道它会说什么。我们只是告诉它，这是罗伯特·唐尼的 AI 未来幽灵。

罗伯特·唐尼的 AI 未来幽灵。我们将送你回到彼岸，现在是时候谈谈我们本周在互联网上看到的关于 AI 的一些最喜欢的新闻了。AI 领域有很多大新闻。

然后你停下来。

我们还有很多要讨论的，因为我们看到了很多很酷的东西。首先，有一个非常酷的 Flux Lora，这是一种使用 Flux 的特定外观的方法，名为“然后和现在”。我看到有人名叫安德鲁·卡尔发推文，展示了如何使用 Lora。

基本上，如果你看到那些将照片放在现实生活场景中，照片显示为旧照片，而现实生活场景为现代的图片，并且两者某种程度上匹配的图片，这就是Flux Laura的功能。你可以访问gliff网站，它基于Cliff构建，你可以自己尝试。这是一个非常酷的Flux Laura用例，用于制作图像概念。我们已经通过互联网看到了很多这样的例子，现在你可以自己制作了。

AI版本的，嗯，Gavin，我们之前讨论过没有书的AM。我们已经见过开源版本的这个。我看到有人尝试将PDF转换为内容，这让我感到兴奋，它被称为。

PDF转脑腐。我喜欢这个。

你可以将任何旧文档转换为脑腐内容。如果你曾经在Instagram动态或TikTok上看到过类似于我的世界视频、地铁冲浪者视频或有人谈论神经科学或未来物理学，背景中有带有AIO方块的角色在跑，那就是脑腐内容。它会自动生成所有这些短视频，从任何你给它的内容中提取，并包含对诸如跳跃上升之类的元素的引用，这总是很棒的。

向isler致敬。下一个是来自Paul Cowcatcher在X（Twitter）上的帖子。他让所有著名的LLM玩了一场拼图游戏，轮流作画。然后他们都尝试猜测是什么。

Kevin，实际上，这是一个我会观看很多的游戏，因为你看到的是，哦，这个画得像这样，这个画得像那样，然后他们会画出天空、房子等。这就像谁先猜到答案，这只是一个非常奇怪和酷的LLM用例。我真的很喜欢这个。这是一个用于绘画的GPT，答案是拼图。但是，就像多伦多一样，用于绘画的GPT就像几乎像一个带有周围点的建筑物。

他们用SVG格式绘画，就像他们试图用向量和形状绘画，他们并没有真正拥有这些工具，所以即使看着他们围绕着这些东西创作并猜测彼此的答案，我认为这比观看地板更有趣。

我想快速地指出一个非常愚蠢但很有趣的事情。你可能没听说过K.S.I。这位网红发布了一首大单曲。

这是YouTube上所有时间第三个最不受欢迎的视频。我看到一个名为“亚瑟·摩根（Thick of It）”的视频，其中包含约翰·马斯顿，它基本上是重做并改写了K.S.I.的歌曲，其中包含来自《荒野大镖客2》的角色。我想在这里指出的是，他们从未提及过这一点，但很明显，他们使用了AI语音模型来获取亚瑟和约翰在《荒野大镖客》中的声音。这首歌听起来很棒。

怎么做到的？游戏公司从游戏中知道任何钱。

这显然与之前所有AI内容都做过的事情相符。但我认为这很有趣的是，没有人谈论AI，但他们正在做，它正融入我们所听的媒体中。我只是觉得。

这非常酷。好吧，这并不是我通常听的媒体。因为没有足够的钢琴演奏或巨大的砰砰声或枪声效果，因为你知道，我喜欢低音卡通节奏来学习。

而且我非常喜欢。

我喜欢经典的卡通配乐，以及一个梦想中的顶部，在视频中播放。MuVi可以通过分析重要特征来生成与视频视觉效果相匹配的音乐。据称，这个模型是在无声电影、老卡通片，甚至一些广告等内容上训练的。我将播放一个汤姆和杰瑞片段的示例，听起来就像你期望的原始声音一样。

当角色摇头时，乐队上下演奏。然后场景切换到一辆汽车在山路上戏剧性地行驶。音乐的节奏加快了。

我只是觉得它几乎。是糖果吗？但我认为这。

是一个有趣的，我显然，他们会为之努力。这非常广泛。我认为这是真实的，我们假设，但目前还没有代码。我们不确定。

但是，当你考虑视频或电影的配乐方式时，这是一个非常有趣的事情，对吧？因为他们在这里展示的另一件事，我发现非常有趣的是，视频游戏配乐预告片的视频，他们基本上展示了一些游戏场景，然后只是为其添加了音乐，他们还展示了如何为一些现有的片段创建音乐。这可以作为，你知道，提示来制作配乐，对吧？有一个约翰·威廉姆斯迪士尼纪录片的预告片，对吧？它有斯皮尔伯格说，基本上他会制作一部电影，然后会第一次观看这部电影，因为配乐非常好，让他的电影与众不同，对吧？它。

让他以不同的方式通过配乐的视角观看场景。这就是配乐在音乐中能够产生的影响。所以，当所有这些，将文本转换为视频或将静态图像转换为视频时，视频看起来不错或有趣，但感觉有点死气沉沉。这可能是这些生成内容的巨大突破和缺失的一环。

所以，演讲者，我们应该谈谈我们所做的一些事情，它们是什么。本周，我想快速跳进去，告诉大家关于Runway Act One的事情。我们上周谈到了这个。

我制作了一个视频，你可以观看，我亲身体验过，我必须思考，如果我感到不知所措，我非常非常不知所措。我认为它实际上比我预期的要好得多。我认为事实是，我们之前在节目中讨论过LifePorter，它是一种可以让你在记录步骤中使用它的开源方式。

我认为Runway在这里做的有趣的事情是，他们让这些工具更容易被普通人使用，例如，你可以拉取信用或进入Runway，现在就可以这样做，你可以扮演某个人。这可以是任何AI角色，你都可以创建与你的网络摄像头拍摄匹配的面部动画。这让我觉得，我实际上做了。

我感觉到了它将为未来的人们解锁多少可能性，当你想要自己制作东西时，尤其是在资金有限的情况下。我的意思是，我有很多制作预算来制作东西。我只是觉得这将是一件大事。

我知道你制作了更长的视频游戏，但是，你尝试过它吗？它感觉像是一种变革。哪些方面做得很好，哪些方面有缺点？

嗯，我认为现在做得很好的一点是，我可以录制一个网络摄像头视频，然后立即将我的脸转换为另一个角色，但我不太喜欢，你知道，像法国炸薯条那样有眼睛。我想做很多非人类或外星角色。

它完全没有做到这一点。它做得很好的是，它允许想要扮演角色或与演员合作的人。他们基本上可以扮演电影中的任何角色。如果你是一个有活力的演员，或者你有一个非常擅长表演的人，他们可以扮演很多角色。我还认为，这可能会以一种非常有趣的方式为演员打开大门，让他们制作更多东西。

再次，每个人都应该检查一下。去AI for Humans Show的YouTube频道，看看Gavin对它的更深入的探讨，因为它是一个非常出乎意料的，我认为它将成为一个变革性的工具。

我认为我们的预测仍然有效，Gavin。我们说过，从提示到好莱坞，不到五年，批评就像，是的，但它只是像小预告片一瞥。那里没有真正的表演。

没有对话。没有面部表情的细微差别。现在，你可以用网络摄像头，是的，将自己转换为任何角色。嗯，Gavin，我的朋友们，苹果智能已经来了，它，嗯，它来了。

Sorda，是的，你告诉我你花了一些时间研究这个，就像我大致浏览了一下，这与我的日常生活有关。但是你尝试过其他一些东西。所以你感觉像。

音乐，我在我的Mac上大量使用它，因为我仍在使用iPhone 14，我还没有发现升级的理由。在Mac上使用它之后，我觉得我做出了正确的决定。我请求更新，然后第二天早上醒来，就像圣诞节早上，我得到了苹果智能，但它并不是我想要的，我感觉更像是赠品，而不是大礼。

你实际用它做了什么？你用它做了什么？

现在有一个AI清理功能，可以让您用鼠标或触摸笔在任何照片上选择区域。照片会自动删除或清理这些区域。我立即尝试了一张我在厨房里吃酸奶和豌豆按钮零食的照片。

看起来，嗯，看起来非常口渴。抱歉，第三次尝试，但我进去后想，让我们删除冰箱上的磁铁，但完全没有用。我一直在尝试自动选择碗、柜台上的酸奶杯，我为此努力了很长时间，我说，好吧，清理一下，然后我可能会在球上画一个圈，然后坐一会儿什么都不做。所以我手动进去，在其中一个球上涂色，然后说，删除它，然后在我的腿上突出一个区域，说，这是你想要的？答案是，不，不是。

所以，所以我们只是修补。谢谢。

选择图像的随机部分，但不会消失。然后我浏览了一些随机的徒步旅行照片，有一张我狗的照片，本来会很完美，但我的妻子也在里面，所以我用清理工具神奇地把她从照片中涂掉，它似乎选择了她，并从图像中删除了她。你可以看到，就像一个男人一样，图像中仍然存在主题，它并不完美。

但是，你知道，它有用吗？是的，是的。它在不同程度上有效。我还有另一张照片，我试图从照片中删除一个酒杯。酒杯后面很明显地重复着餐厅桌布的纹理。

所以，所以，它有用吗？是的，但它和我们一段时间以来看到的Photoshop功能以及Canva的功能差不多。我认为它差不多。

你真的期望苹果推出一些感觉至少在功能方面处于市场领先地位的东西，对吧？就像，这对我来说感觉有点不足，就目前的情况而言。我的意思是，这应该是一个理所当然的事情，对吧？他们应该超越Photoshop、照片AI工具。

完全神奇地删除它应该消失，它应该智能地绘制像素，而不仅仅是模糊它们。

为了说明，有一个用于酒吧的标志，嗯，它后面有生锈的钢板，它再次非常清晰，非常明显的重复图案，当我将整个标志涂掉时，它只是变成了一个模糊的区域，我之前所在的位置，我得到了它在设备上本地运行。这是一个很大的进步，而且速度很快。但我也有一个非常强大的笔记本电脑，它应该可以轻松处理这个。

没问题。是的，我真的很想知道，因为你可能在Android或Pixel手机上，但我真的很想知道我们的观众中是否有任何人在使用Pixel手机，他们可以比较在Android上可以做的事情，因为谷歌几个月前发布了一些非常类似的东西。我只是很好奇，这比那更强大还是更弱？以及看到。

至少在这些设备上有什么不同。我知道这很有争议。你可以涂抹一个区域，不仅可以删除它，还可以添加东西。你可能会说，让这辆车看起来像发生事故，这可能会让一些记者感到非常不安，或者你可以在你最喜欢的猫咪身上放一些小洞。

你没有，没有，没有。我认为你。

只是开始绘制高光，然后你可以删除它。所以，当然，他们会做到这一点。我不会批评苹果，但再次，他们承诺在设备中提供苹果智能，然后你必须排队等待一些功能。

它感觉就像是一个仓促的、笨拙的全面推出。我还不得不写一些邮件，Gavin，因为我想真正深入探讨这一点。所以我写了一封邮件给你，Gavin，我谈到了。

感觉就像AI必须做所有的事情。

它应该能够很好地完成，即使其友好、专业、简洁、总结邮件内容、找到要点、将其转换为列表或表格。其中一些功能根本不起作用。

其中一个，其中一个，当我要求它像项目列表一样时，你会看到它在最后一个项目上扩展，这封邮件正在测试AI如何处理它，它在邮件末尾重复了四五次。它弹出一个提示，表示某些功能目前不可用。稍后再试。为什么让我点击这个该死的按钮？

对吧？它们感觉就像一年前或一年零三个月前，苹果在发布这些东西时感觉很奇怪。

我发现其中一件非常奇怪的事情是，最后，我写了一封邮件，我说，你知道，勇敢地问，这苹果智能到底是什么鬼？它弹出一个提示，说“写作工具不设计用于处理此类内容”，我认为这很有趣，因为这实际上是一封有点荒谬的、充满俚语的邮件，如果你愿意的话，里面有一些粗俗的词语。但它应该能够处理这些内容，对吧？我说它应该能够处理这些内容，但我仍然做了，它仍然转换了邮件。

所以，总的来说，Gavin，你对苹果智能的当前状态有什么看法？你对此感到兴奋吗？你有什么想法？

我认为很多人第一次会开始使用AI，他们可能会对它的一些功能感到中等程度的印象。但这并不是苹果进入AI领域所希望的巨大变革。也许明年我们会对这次发布会感到好笑，现在说它。

那些人应该来这里。把他们送到这里。谢谢大家。下次见。

OpenAI Says AGI Not Far Off, Apple Intelligence is Just OK, Meta AI Search & More AI News 49:57 Share

AI For Humans: Making Artificial Intelligence Fun & Practical

Deep Dive

Shownotes Transcript

OpenAI Says AGI Not Far Off, Apple Intelligence is Just OK, Meta AI Search & More AI News