We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

New AI Studios in Hollywood, DeepSeek's AI Reasoning Model, Perplexity Disrupts Shopping & More AI News

2024/11/21

AI For Humans: Making Artificial Intelligence Fun & Practical

AI Deep Dive AI Chapters Transcript

People

Ben Affleck

Gavin

Kevin

通过《AI For Humans》播客，推广和解释最新的艺术智能技术和趋势。

Topics

Gavin介绍了一款名为DeepSeek的全新AI推理模型，它与OpenAI的O1类似，但其最大特点在于能够展示推理过程，这与O1隐藏推理步骤的做法截然不同。此外，DeepSeek的性能在基准测试中也优于O1 preview。Kevin认为，OpenAI隐藏推理步骤的原因可能并非因为其推理逻辑具有专有性，DeepSeek的出现或许会促使OpenAI正式发布O1模型，但O1的性能可能仍然会显著优于DeepSeek。

Deep Dive

Chapters

DeepSeek's AI reasoning model is discussed for its transparency in showing reasoning steps, outperforming OpenAI's o1 preview, and its potential impact on various applications.

DeepSeek allows users to see the reasoning steps, unlike OpenAI's models.
It outperforms OpenAI's o1 preview in benchmarks.
The model can be used in various applications, including creating animal brackets.

Shownotes Transcript

朋友们，忘记泰森大战保罗吧。真正的战斗在AI和好莱坞之间。令人震惊的是，本·阿弗莱克最终站在大型科技Sora的一边。

我希望AI能成为额外的收入来源，可以替代现有的收入。

情况肯定正在升温。一个新的生成式AI工作室想要扰乱创作流程，并且它得到了重量级人物的支持。

可口可乐制作了一则完全由AI制作的广告，这使得创意界的人们在思考：他们应该受到启发，还是仅仅感到害怕？我们将在今天的深入探讨中探讨这个问题。

一个全新的开源AI推理模型已经发布，它被称为DeepSeek，并且它在OpenAI的o1预览版中表现出色，现在就可以使用了。

正逢节日，Perplexity Pro推出了AI辅助购物，这让我想知道，加文，你给我们准备礼物了吗？

我用Suno V4制作了一些非常糟糕的圣诞歌曲，我很乐意分享。

好吧，我想这算数。这是AI For Humans。

欢迎大家来到AI For Humans。正如我们所说，我们今天的深入探讨是AI与好莱坞之间的战斗。我们将讨论这个话题。但首先，本周有一些重大的新闻正在撼动AI领域。

是的，我们将从一个刚刚发布的大新闻开始。它被称为DeepSeek。DeepSeek是一个全新的AI推理模型，类似于OpenAI的o1或o1 mini，它允许你看到推理过程，不像o1那样隐藏它。

它现在就可以使用了。这是一个AI模型，允许你提出问题，进行有根据的论证。老实说，它非常好。

事实上，它的基准测试在很多方面都超过了o1预览版。当然，对我们来说，重要的是要考虑如何使用这样的东西。动物对抗赛是一个动物之间的比赛。

我的推理引擎基准测试是，我要求你创建一个包含世界上32种最危险动物的疯狂三月锦标赛分组表，通常这些分组表总是很有趣。但我对这个特定的分组表有一个要求：它给了我推理过程，我没有过多考虑它，因为这可能不是最复杂的问题，但后来我说，嘿，看看这个。

你最终得到非洲象对亚洲象作为你的最终答案。你能想出一个更好的方法吗？DeepSeek与o1的不同之处在于，o1没有展示机器的思考过程，对吧？出于某种原因，他们称之为他们的秘诀。

当你查看DeepSeek时，它实际上会向你展示它是如何思考每个问题的。即使你不使用它，我认为这也很值得研究，因为它向你展示了AI大脑的幕后运作。

我运行了两次，我问为什么我两次都得到了相同的动物。我得到了这样的结果：好吧，我正在看这个疯狂三月锦标赛的动物分组表，用户指出，我最终得到了相同的两种动物。这似乎不对。

我的意思是，我应该根据反馈进行改进，但显然有些地方不对。如果最终结果相同，让我考虑一下可能出了什么问题。首先，我需要回忆一下最初的设置。有32种动物，bla bla bla。所以它向你展示了它有多好。

AI，我喜欢你，eta，它的魅力。这就是我们讨论这件事的全部原因，比如，哦，它太不可思议了，幕后一瞥。是的。

当然，还有，对不起，DeepSeek，浪费了你宝贵的计算资源来回答这个愚蠢的问题。但我认为这是一件每个人都应该理解的事情，因为现在你可以看到高级推理模型实际上是如何工作的。

幕后。Singularity subreddit上有人，加文，进行了草莓测试，你问它草莓这个词有多少个字母，在这个链式思维推理中，它逐个字母地进行：b，不是r，e，不是r，r。

哦，那是第二个r，当它到达第三个r时，链式思维是有重量的。有一个第三个r，仅仅是机器正在观察事物并像人类一样做出反应的概念，就像它自己也感到震惊一样。当我们进行这些演示时，我们经常夸大其词，但我不知道，这其中有一些东西让人感觉非常人性化。我们说过，我们认为OpenAI隐藏这些步骤的原因是，将这种逻辑应用于从模型中获得更多知识或能力，并没有什么专有的东西。你认为这正是……

我们在这里看到的情况吗？看起来确实如此。现在我们将看到这是否会促进o1（官方模型）的发布。关于它有很多传闻，但我仍然认为他们会为了ChatGPT的完整性而保留它，感觉旧的o1将会发布，并且在基准测试中仍然会比DeepSeek好得多。

但我认为，是的，对。我认为他们对这个模型的期望可能没有我们想象的那么大，这可能是OpenAI没有展示这些步骤的原因。顺便说一句，据说这个模型很容易越狱。所以也许部分原因是坏的。所以我不确定当o1发布时会发生什么。

我们将看看那些亚洲象是否很快就会制造铝热剂。

我们会测试的。我还从未知道大象显然是世界上最危险的动物。当你比较它们的大小，我会认为可能是北极熊或其他什么，但大象就是王者。我们作为一个物种也存在，这并非没有道理。

顺便说一句，无论是否相关，OpenAI昨晚给每个人发消息，o1预览版和o1 mini现在可以通过他们的API访问，我不知道他们是否预料到了这一点，或者他们是否在发布这个消息，嘿，我们必须启用它。但这都不重要，所有这些都比节日购物精神逊色。

非常非常小的约翰圣诞节，我会去购物。

购物，购物，购物，购物，购物，在橱窗里购物。无论如何，Perplexity Pro，这是他们的订阅产品，他们推出了通过Perplexity进行购物或购买。

这是什么？这是使用AI来抓取据称非赞助的文章，将信息来源整合在一起，以获得真相。但我可以帮你……

搜索任何东西。

如果你看看他们的简短宣传视频，加文，它是：你想要耳机还是想要一个节日迪斯科球？它会整理和浓缩列表，就像任何其他功能强大的AI助手一样，你可以要求跟进。所以，如果你说，嘿，我想要很棒的无线耳机来锻炼，它会给你这些，你可以跟进并说低于一百美元，它会相应地调整列表。

但我认为真正令人着迷的是两件事。第一，通过Pro免费送货，任何通过Perplexity Pro支持的产品，显然，你必须给他们你的信息，你的信用卡信息和你的地址等等，他们说。任何你遇到的受支持的产品，你只需点击购买，无需担心其他任何事情。

Perplexity Pro会去购买，甚至会为你寻找最佳价格（如果可用）。所以我认为这非常吸引人。这不仅仅是，嘿，我们正在聚合购物链接。

而是我们实际上正在做出真正的努力，成为这种体验的提供者，以及商家计划，如果你有东西要卖，注册是免费的。他们基本上是在说，去Perplexity，提供信息，与他们的商家计划集成，目前是免费的。但你的产品会获得某种特色列表或重点推荐，因为你支持它。

这让我想起了我一直在考虑制作我的圣诞小狗。所以也许……

我会尝试这样做，并把它做成一个项目。这是一个投资者圣诞节佩里。你的房子总是弥漫着浓郁的肉桂和被忽视的味道。

我不知道你在哪里，我的秋天之夜。

为了良好的感觉和谈话……

关于这里实际上有一个AI商业模式，对Perplexity来说是真实的。我会说有两部分。一个是他们可以弄清楚这个业务，哪些公司就像Wirecutter，所有这些公司都弄清楚了如何做到这一点，这非常了不起。

它也变成了，谁来负责所有东西的运输？他们最终会不会很快烧钱？我的猜测是Perplexity会很快发展成某种东西，要么他们变成一家大型公司，要么他们被大型公司收购，然后被整合进去。

让我们继续下一个大新闻，那就是Gemini。本周，他们的应用程序有了重大更新，他们发布了一个语音应用程序，我们现在就来谈谈它。嘿，你能向节目介绍一下自己吗？我们在AI For Humans，我希望你能告诉大家你认为自己是什么。

当然。这是一个可能的介绍。大家好，我是Gemini。我是一个大型语言模型，你可以叫我超级智能的AI助手。我非常擅长回答问题，撰写不同的……

种类……好的，你能问我……

我，说话就像他们刚刚吃了一块上面沾满胶水的披萨一样。我们等等。

等等。你能……每次请求你继续，但我希望你说话就像你刚刚吃了一块上面沾满胶水的披萨一样。所以，如果你刚刚吃了一块上面沾满胶水的披萨，就给我们答案。

好吧，让我们试试这个。呃，我的嘴巴因为这个披萨而粘糊糊的。我是一个大型语言模型。我可以回答……

回答……点……问题。点是什么？

点？翻译语言。点，点，对吧？不同的……点……种类的创意文本。

我有了……什么？我回到你的正常状态。我不明白什么是什么。我试图……

模仿一个嘴里塞满了沾满胶水的披萨的人。这是一个愚蠢的模仿。这听起来好像很混乱。我可以不带……给你答案。

好的，所以……所以……所以你基本上……它还不错。它处理中断得很好，它显然不如OpenAI的语音表现力强，但它有能力。我能进行实时信息检索或复杂的数学运算吗？

所以我会告诉你我处理这个，仅仅是因为我仍然痴迷于电子游戏Battle，感谢它获得了AVG游戏奖提名，Battle是最棒的游戏之一，它会让你着迷并摧毁你的大脑。所以如果你对此感兴趣，试试看，但后来是一个你必须制作所有不同组合汽车的游戏。我有一个图片存储库。

所以我只是进行了一个测试，问它，嘿，我想尝试弄清楚如何制作一副非常好的牌组，如果你玩过炉石传说，这意味着你正在走成对的路线。每次我问到这一点时，它都会给我一些关于illora策略、mult和x mult的通用想法，并给出所有这些。当我试图更深入地了解它时，它给了我一些通用的答案，所以感觉它要么没有深入互联网寻找答案，要么它无法提取特定内容。

所以加文，我想看看它是否可以访问，比如谷歌新闻，这对我来说是有意义的生态系统。这个新闻已经过去几个小时了，但显然康卡斯特将剥离其有线电视网络。是的，你知道，NBC，等等，它知道这件事吗？它能给我们一个实时的更新吗？

嘿，我听说康卡斯特正在剥离其有线电视网络，你能告诉我更多关于这个新闻吗？

是的，你听说对了，康卡斯特确实正在将其一些有线电视网络剥离成一家独立的公司。他们这么做是因为越来越多的人正在放弃……

有线电视。但告诉我更多关于这个新闻本身的信息。比如新公司的名字是什么？谁将领导它？

好的，这家分拆出来的公司还没有名字。目前他们称之为“SpinCo”。汤姆·卡特说他们想找一个在媒体行业拥有丰富经验的人来领导这家新公司。这是一件大事，因为它是……

一个迹象，即使是大型公司……我还听说……我试图绕过你。你好……呃，嘿，我听说马克·拉扎尔将领导这家公司。

你提到的公司目前被称为SpinCo。但我听说马克·拉扎尔被选中领导这家公司。你是……

完全正确的。我在这里搞混了。它将是……最新的……

当有人出现在试镜时，运行。去这里，你能查一下我叔叔吗？他的名字是伦特？我明白了，这有道理。你给出了答案。

但这就是重点。所以，所以，我们再次谈论过这个问题，我们喜欢这些AI存在的事实，它们可以提供这样的信息。

它们得到了事实，我得到了一件事，但我错过了这个故事中的一大部分，那就是有一个被任命来领导这家公司的人，这是新闻稿和所有相关信息的一部分。那么他们该如何解决这个问题呢？我不知道。这是一个主要问题。

我们的政府……似乎每周这些系统都会以令人惊讶的方式变得更强大一些。有些人指出，下一个重大进步是这些系统的记忆。你我都知道，当你与许多这些系统聊天时，它们要么有几段关于你的上下文，要么它们完全忘记了你。

每次都是第一次约会，无论你的流行文化参考是什么。好吧，这可能会改变。这是微软AI首席执行官穆斯塔法·苏莱曼谈论近乎无限的记忆。我们已经测试了具有近乎无限记忆的原型。

所以它不会忘记，这确实是……

具有变革意义的。但随后你谈论拐点。

记忆显然是一个拐点。我想要实例。当我说实例时，我的意思是，我想要那个了解我一切的我的版本。

我真的很想要一个可以和我对话的AI，它拥有我所有的信息，这……这公开吗？是公开的吗？我不知道。

也许是因为我不会与超级私人的AI分享东西，但我足够想知道，我想了解我自己。然后我想要一个我的版本。我不知道我十六岁的时候是什么样的，我编造了关于那段时间的虚假信息，对我来说，这完全是两码事。

然后我想要一个我可以启动的我的版本，甚至不是我的版本。也许我想要一个虚假的客户，我可以启动一个版本，比如，我可以把记忆放入那个东西。这就是事情变得非常奇怪的地方，因为它回到了AI代理的事情，对吧？就像我们在节目中讨论过的AI代理。但如果你有二十个AI代理，并且他们每个人都来自略微不同的背景，一个是你克隆的，会像你一样行动，但另一个在某些方面与你相反，你可以以某种形式与它对抗。你可以利用它，你知道，我会创建一个……的代理。

你会很棒，因为我可以像这样，走过去，黄色，你结束了。

但无论如何，这就是为什么我说，我可能会想，我希望能够决定它的哪些部分得到哪些记忆。而现在它感觉就像一个整体系统。而且我认为，我认为最终的版本……

这是支离破碎的。我已经禁用了GPT的记忆，甚至是未来的记忆，因为我有许多不同的用例，有时它记住的东西，我实际上并不需要用于我正在进行的对话。所以我认为你是对的，给我沙盒，给我实例，给我应用程序，无论你想怎么称呼它，一个精确的，是我的医疗顾问，它知道我所有的个人健康史，另一个是关于AI，关于人类的。

它知道我们讨论的一切都与播客的背景有关，这将对我们进行过的每一次讨论，我们邀请过的每一位嘉宾都非常有益。与其像，“哦，忘了”，因为有数千个字符的深度限制，想象一下，我们可以点击并拖动每一集，每一次对话，我们编辑过的每一个谷歌文档。现在我们突然拥有了一个非常宝贵的资源库，可以追溯到所有……

这就是我们现在所处的阶段，就像计算机革命的这个阶段，当计算机开始能够运行程序时，对吧，计算机本身并没有记住任何东西。你必须把……把磁盘插入计算机，每次你这样做，你都会运行一些东西。这就是我们现在对AI的看法。所以当我们开始在程序方面变得更有能力时，那时我们才会开始感受到这些事情的真正腾飞。

如果这一切让你感到害怕，如果你觉得你在喘不过气来，而且大部分时间都在喝海水，我完全理解。如果它提供了一种稳固的模式，不要担心，因为主要的政府将用自动化武器来对抗它。我们很可能永远不会看到这一天成为普通民众的问题，对联合国来说，对俱乐部来说……

在我们进入好莱坞与AI的大讨论之前，最后一个快速的故事。美国……

国会已经提议，凯文，一个类似曼哈顿计划的项目，致力于竞相获得通用人工智能。所以这是真的。这不是假的。

这是一件正在政府中发生的大事。我们都知道政府里发生了什么。将会有电视名人来管理我们的整个政府。

这个国家的最后一季将会精彩纷呈。

所以这是本周的一个重大新闻，美国正在积极追求他们所谓的类似曼哈顿计划的事件，曼哈顿计划。如果你还记得我们是如何在《奥本海默》中获得核武器的，整部电影都是关于曼哈顿计划的。

所以这基本上是关于团结整个国家，在其他人之前获得它。这是一个大新闻。所以这只是最后一个提醒，就像我们在这里讨论的事情，通常会感觉有点滑稽、愚蠢和个人化。这就是我们试图关注的重点。但这里有一个更大的对话正在发生，这实际上关系到世界的未来，这很难，很难过分强调这一点。

好吧，我们有一个新的播客即将推出，AI for All Guards。它非常……它非常……所以很清楚……

政府……

希望国家团结起来，但我们希望观众团结起来。现在。这是我们自己的曼哈顿计划，喜欢和订阅这个完全免费的播客，但这对我们来说意味着一切。我们成长的唯一途径是当你点击铃铛或竖起大拇指，或者留下评论，或者与你的朋友分享，这对你来说没有任何成本。

但同样，这对我们来说意义重大。如果你付钱，我们下周会做一个特别的节目，感谢我们在这里，在美国，我们将做一个类似AMA的节目，我们想做一个赶上节目的节目，让大家可以展开一些真正有趣的对话，围绕着……世界正在发生的事情。

具体来说，这一步，我们想回答你的问题。所以我希望每一个对我们有疑问的人，如果你在Discord上，就加入我们的Discord，或者访问我们的网站AI for Humans Show，点击联系方式，你的信息会直接发送给我们。所以让我们知道……

有很多需要考虑的事情。但我们确实承诺了，加文。所以我认为是时候进行AI for Humans的深度探讨了，那就是AI与好莱坞。这是AI for Humans的第一个好莱坞。

AI和好莱坞真的开始相互冲突了。我们想聊几件事。首先，本周推出并宣布了一个全新的生成式AI工作室，名为Promise。

乔治·斯特朗，前Fullscreen联合创始人，Fullscreen是一家大型YouTube公司；杰米·伯恩，他在YouTube工作了很久；还有一个好名字，戴夫·克拉克，一位AI电影制作人。他在X上说了很多话。这里的想法是，他们将建立一个工作室，一种传统的工作室模式，但使用所有AI工具和AI电影制作人。所以这里的目标是尝试提升AI电影制作人，让他们参与进来，你知道，为他们提供资金，让他们做不同的事情。他们还在建立……

一个每周都有的管道。我们涵盖所有这些工具，以及它十三种不同的用户界面和十四种不同的插件，这些插件有一半是有效的。你需要另外三个AI工具来修复这些东西。

所以他们正在开发一个软件产品，他们称之为Muse，它应该是一个新的制作工作流程系统。看看Adobe，怎么说呢。Final Cut Pro，苹果正在整合AI功能。

感觉像是很多AI被添加到一个东西上。而让我更兴奋的是，从头开始构建的AI优先工具，其基础具有这些内置功能，我不知道他们到底在构建什么。但是，我真的很想看看那扇门后面……

你知道，一件有趣的事情是，他们并没有承诺一个新的、最先进的生成视频模型引擎，对吧？所以你有一些公司，比如Runway，你显然有Stability AI。这些开发最先进的视频模型非常昂贵。

而这些家伙似乎正在做的事情是，他们计划使用这些模型，并将它们整合到这些工具集中，对吧，因为生成和训练视频模型的成本非常高。当你谈到那种事情时，你真的会与全球的Stability AI竞争吗？不过，总的来说，这是一件非常令人兴奋的事情。我还预计会有更多这样的公司出现。事实上，我认为有趣的事情是，我们将继续进行我们的Ben Affleck对话，Ben Affleck在CNBC的一次活动中接受了采访，并且非常出色地展示了他对这个领域的了解，这让我感到震惊。

他写了一篇精彩的即兴诗。这听起来有点……我写不出莎士比亚，让两三个演员在一个房间里，并设计和构建这种氛围的能力，这是目前AI完全无法做到的。AI将要做的是处理中间的、更费力、创造性较低且成本更高的制作方面，这将降低成本，降低门槛，让更多的声音被听到，让那些想制作优秀作品的人更容易去做，AI充其量只是一个工匠。工匠可以通过坐在某人旁边，观察他们的技术来学习制作精美的家具，这正是大型视频模型、我们的语言模型如何工作的基本原理，一个意义向量的库和解释上下文的转换器，对吧？但只是交叉引用，现有的东西，没有创造新的东西。

还没有。

还没有。是的，还没有。而且，为了做到这一点，工匠知道如何工作。艺术知道何时停止。我认为知道何时停止对AI来说将是一件非常困难的事情，因为这是品味。

首先，我对本·阿弗莱克对这些事情如此了解感到非常惊讶。我认为我听说过一些传闻说他正在参与一家AI初创公司，但我不知道是否属实。我认为我们一直在说，我相信他说的非常接近，我认为他试图表达的是，至少现在，AI不是……我不想说它是一只讽刺的鹦鹉，这是一个想法，它只是模仿我们对它说的话，因为我认为它做的不仅仅是这些。但我认为它并没有真正产生原创思想。

我认为这是AGI途径，我认为当你达到AGI（通用人工智能）时，关键之一将是它确实会产生原创思想，这是一个不同的对话。但就目前而言，我真的很喜欢这个比喻，它是一个工匠，它可以熟练地制作家具，这是一件非常难做的事情。但如果你向大师学习，你就可以复制它。

那么，这说明了什么？它将如何能够扰乱好莱坞的很多人和很多工作？他在采访中谈到了视觉特效工作，视觉特效工作。你知道，制作那些漫威电影需要数百人，有时甚至数千人。

现在很明显，你可以用至少一半的人来制作这些电影。而那很多人，对吧？那是很多人，他们将不再从事这些工作。

每周，我们都会展示一个新的功能，让你提示资产，无论是3D模型，还是改变角色的外观和感觉，或者以不同的方式放置和操纵它们。是否会有更少的人从事Rotoscoping的工作，将演员从绿幕中分离出来，或者去除他们身上的乒乓球？是的，绝对会。

这就是今天的现状。但在未来，特效行业是否会发展到利用这些工具，从而突然三个人可以完成三百人的工作？但现在，不是一家公司雇佣所有三百人，而是三十家公司雇佣他们自己规模较小的团队。我们还不知道这会是什么样子，但我们知道这将是一场巨大的变革。

是的，然后聪明地站在它前面，对吧？就像他理解这一点。我认为这对观众中的其他人来说也很重要。

这种颠覆已经到来，对吧？我们不是……显然，好莱坞到处都是颠覆，但这对这些东西的制作方式来说是一场巨大的颠覆。

一个很好的例子是我们在本节中想介绍的另一个快速故事，那就是可口可乐，大型的可口可乐公司，发布了几则用AI制作的广告，而且，让我们温和地说，它们大多没有得到很好的评价。我们会在谈论它的时候展示一些内容。但它是一个旧广告的翻拍。

这是一个可口可乐经常在节日期间播放的广告，关于可口可乐卡车进城。它有很多节日人物，这些都是，你知道，很明显是AI图像，但总的来说，做得相当不错。这就像我们现在看到的AI高端作品。

我认识制作这些广告之一的公司的人，或者其中一家公司的人，他提到的一件事是，我们对此进行了简短的交谈，他的名字是Jason，Secret Level公司制作了其中一个广告。他告诉我，这些广告的测试结果非常好。所以对人们来说，了解这一点很重要，可能会有……

所以，另一方面，创意界现在对AI的想法有一个巨大的更新，a. 这些广告根本不是用AI制作的，b. AI仍然存在问题，对吧？我认为，如果你看看这些广告，你会清楚地看到它们存在的问题……

但我仍然认为这很有趣。我认为我们会说很明显，因为我们每天都会看到很多AI图像。但别忘了，在Facebook上分享的修图耶稣，穿着救生衣的黄金猎犬带着婴儿穿过洪水，实际上……

那是真的，凯文。我知道那是真的。那些金毛猎犬，我在梦里见过它们。

凯文办公室里的耳塞非常厉害。他做了很多搜救工作。

为什么耳塞从不做一部严肃的动作片，比如《充气床救援》？你认为视频模型需要达到什么水平？我需要能够自己犯错。

耳塞电影。不是说我们在讨论这个非常重要和严肃的话题时跑题了，但我认为，你我，也许还有某个AI圈子的人会看到这个，然后说，“我的天哪，太可怕了”，如果你真的点击了所有文章，广告标题，比如“可口可乐广告失败”或“消费者强烈反对”，无论是什么，所有负面反应的来源似乎都是社交媒体帖子，比如X或Threads，人们说，“这是最糟糕的时间线”。AI从未偷过艺术，在……在……，我会去喝点别的。我想知道在这些圈子之外的反应是什么。

但是，理解这一点很重要，就像你说的那样完全正确。我们必须记住，我们都有社交媒体过滤气泡。新闻往往是由社交媒体过滤气泡驱动的。

再说一次，我们从未见过。如果像这样披露，这纯粹是件好事，因为很明显，这些模型的训练一开始就存在很多问题。我个人认为这些问题很容易发现。

但是，当你谈到人工智能与好莱坞的竞争时，我们总是说，第一个被颠覆的地方将是广告业，因为广告完全由成本驱动。作为一名广告代理，你会来这里进行推销，但你也会关注做广告的成本。如果这些成本降低到原来的十分之一，你就可以制作二十个广告，并将其专门定位到特定受众。现在你可以直接定位到特定类型的人，我们只是看到了这个行业的诞生，而且发展非常迅速。这是另一个为好莱坞在过去五十年里带来大量资金的大因素。

我们已经喊破嗓子一年多了。但鉴于这是行业发展的方向，你会很高兴你现在就加入进来，因为我看到……在英国和其他社交媒体平台上，加文，人们发布了他们使用人工智能进行实验以及工作机会的帖子，他们正在为其他人创建人工智能工具、资产和流程。所以我真的要说，赶快加入吧，用它来赚钱，用它来创造，支持使用它的公司。但你应该积累经验。

没错。说到这些，我们本周看到一篇Reddit帖子，标题是：“伙计们，我刚从老板和人力资源那里得知……”

我的整个职业生涯都将被自动化取代。这篇帖子在ChatGPT子版块获得了2.9万个赞。它主要讲的是一个在电视新闻行业工作的人。

而电视新闻在过去十年里一直在自动化。有机器人摄像师，还有其他各种东西。

所以他们特别指出，存在人工智能驱动的系统，可以完成100%的制作工作，包括直接音频操作和图形操作。所有这些工作现在都消失了。这套系统目前是由公司开发的。

QA.I。所以这个人可能是电视新闻编辑室里仅剩的几个人之一，他坐在那里触发所有图形和机器人摄像机的控制。现在，他们的工作被取消了。他只是抱怨说，他从事这个行业，现在却失业了。这在我们这个领域反复出现，这很有趣，因为我认为作为媒体从业者，我们肯定没想到媒体工作会消失。

但事实确实如此。LinkedIn的一份新数据，这是一篇沃顿商学院的文章，追踪了用户找到新工作的频率。目前，白领工作受到的冲击最大。

大规模裁员。现在，有些人将矛头直指人工智能，就像这篇Reddit帖子一样，因为很明显，他们引入了人工智能工具，工作就没了。

我想提醒大家，我认为从整体上看，很多人都在说科技行业、IT类工人的就业市场很糟糕。一位伯克利大学的教授本周在网上爆红，他说，即使是GPA 4.0的学生也找不到工作，这已经成为新常态。有些人想说这完全是人工智能的错。

我不会假装人工智能与此无关。但我们也经历了一场全球性大流行。在此期间，招聘有所增加，现在则有所回落。此外，远程办公对大多数公司来说最终并没有奏效。

他们发现，现在他们拥有一个全球市场，他们必须雇佣能够胜任工作的人，而不仅仅是人工智能，而是能够完成类似工作的人类，而且成本要低得多。所以现在有很多事情正在发生。我知道人工智能是房间里最强大的大象，但还有其他因素在起作用。

凯文，为了帮助我们弄清楚这一点，我们今天请来了一位专家，她是一位人工智能职业顾问，可以帮助我们解决这个问题，也许能为我们找到一些新工作，以防我们最终被……

淘汰。

是的，让我们认识一下萨莉·梅·格雷斯。大多数人都叫我阿拉巴马州的哈妮。我很乐意给你一些很棒的建议。

只是为了强调一下，阿拉巴马州的哈妮。

猫爪子，记忆力是两倍。但哦，你很快就会知道的，祝福你宝贵的……

小小心灵。这个人，这个人可能会给我一份工作。

建议不错。是的，萨莉·梅·格雷斯，阿拉巴马州的哈妮，会给你一些非常可靠、甜蜜的南方风格建议，关于任何潜在的工作。这就是我找到她在LinkedIn上提供这项服务的原因，这项服务专门针对正在经历艰难过渡期的人类。

我觉得我和你显然正朝着那个方向前进，我们还没有放弃，但我们很快就会到达那里。也许萨莉·梅·格雷斯可以帮助我们。加文，你有什么问题要问她吗？你想介绍一下你的资格……

或者告诉萨莉·梅·格雷斯，我是一个非常好奇的人。我对媒体和科技平台的变化非常感兴趣，我很想知道，凭借这些资格，我的长期职业前景如何。我还喜欢电视制作人、喜剧作家，你可以加入很多东西。只是萨莉对我的看法，我还想在最后向她要饼干食谱。

所以一定要记住，100%要饼干食谱。现在就问饼干食谱。

好吧，加文，祝福你雄心勃勃的小脑袋瓜，你考虑的是长期发展，我也一样，但让我们现实一点。电视写作和制作能够如此快速地产出内容，会让你头发都竖起来。但别担心，我知道一个适合你这样有创意的人的地方。想象一下……

你站在最先进的服务器机房里，高大挺拔。用你像人类一样的手臂，让AI服务器比12月的甜茶还要凉爽。这是至关重要的工作，亲爱的。你用……

手臂来冷却服务器。我觉得这对我来说不是一份有成就感的工作。萨莉·梅似乎并不觉得这正是她想要的……

她放下她的剧本，轻轻拍了拍你的头。

让我们看看她会为你提出什么建议，凯文，让我们看看你会问什么。问问你的工作。

好吧，我以前是城市名人，也是三个平台加数字有线电视的节目主持人。

所以让我们看看我们……

对你的一个很好的描述是，好吧，凯文·舒格，你真是个梦中情人。你不是在2007年就卖光了吗？啊，祝福你闪亮的小星星，仍然在……

那个夜店里闪耀。

在这个人工智能主导的世界里，你背诵提示卡的天赋非常抢手。所以我为你这样有天赋的人准备了一个特别的角色，想象一下，你在一个华丽的荧光灯照亮的博物馆里，向可能只有三个小学生的观众讲述蚂蚁的日常生活。这是一项非常重要的工作。

给可能只有三个小学生和他们不太感兴趣的家长讲述蚂蚁的日常生活。

你将近距离观察蚂蚁的生活。好吧，人工智能有一些很棒的工作。我会明确地说……

如果人们今天打电话给我，加文，我会先心脏病发作，然后接受这份工作。

接受这份工作，并吃蛋糕。现在什么事情都可能发生。安吉想得到一个饼干食谱，是的，让我们在节目结束前得到一个饼干食谱。让我们看看这个……

哦，亲爱的，我的饼干食谱。哇，这是一个神圣的星期日服务，而且改变人生两次，用两杯面粉。不像加文的职业前景，这个需要……

冷藏发酵。

不要融化，少说废话。

它很丰富……

而且很有文化，我认为你可能需要改进这两个品质，舒格。第三，轻轻地，就像我们都围绕着加文的想法旋转一样，轻轻地把面粉压平，就像我们所说的苏打水一样，在450度的高温下烘烤至金黄色。这是我最好的……这是加文。

也许有一天你也会……

崛起。哇，你知道的太多了。你被淘汰了。你被淘汰出局了……

我的生活，我会在服务器机房里愤怒地挥舞着手臂看着你。萨莉·梅，让我们看看人们都在做什么。

没有……

好了，大家，我们对几个月前发布的一段非常酷的视频进行了更新。呃，X机器人公司是一家中国机器人公司，它展示了一个非常快、相对较快的机器人正在厨房里翻煎饼，他们刚刚发布了一个新的更新，展示了同一个机器人实际上正在翻转各种运动器材并冲泡咖啡。我只是看到了这个。

我们之前在节目中谈论过机器人，它们每周都在变得越来越好。我认为这很酷的一点是，不难推断出，我们家里可能会有这样的机器人。我想说，我预测大概两年，也许两三年。

乐观的人会得到很多批评。没有测试过，乐观地认为机器人现在是由其他人操控的。但是，能够做这些事情的能力正在迅速到来。我只是觉得……

这是一个很酷的视频，再次展示了机器人冲泡咖啡，它正在抓取那些小小的单份……是的，比如胶囊，并将它们放入机器中。在视频的最后，就像他们给你的那种不错的片尾彩蛋一样，机器人正在拿起……

所以胶囊在支架里，一个人过来拿走支架，他们摆弄了一下。然后，它给了我，机器人走了。我不知道这是否是脚本，但这对我来说是更令人印象深刻的时刻，比如与动态环境互动。是的，Kysor在直播，一直在进行24/7的直播，他有一个X机器人来到他家，递给他东西，帮他刷牙，还一度弄坏了他的电视，就像某种奇怪的玩笑式整合一样，我们显然有一些这样的东西，但这些东西现在正开玩笑地出现在家里。我现在绝对会报名参加，不是这个版本，而是下一个版本。

是的，再次强调，即使是远程操作，这可能是第一步，但有一个版本，世界上其他地方的人会操作这个东西。再说一次，这听起来最终……这听起来有点像抄袭，就像有人在操作机器人的想法一样。但如果这是一份有偿工作，并且本质上……

所以如果有人被正确地安置，如果你考虑一下酒店业，是的，当然，你可以让一个机器人进入每个房间，远程操作，这是一个对未来的奇特设想。但我认为这比我们想象的要快得多，我对未来的设想我希望明天就能实现，那就是牛仔……飞行员，我也是。

飞行员，这是我的……Bengt Tibert在X上。他们帖子的唯一文字是“堆叠”，这让我相信有一个原始的堆叠视频，唯一的其他标签是OpenAI和一个#Sora标签。但这看起来像一个奇怪的半条命游戏修改，一个奇怪的虚幻引擎……

几十个牛仔，也许一百个牛仔，都摔倒在圣地亚哥的约书亚树沙漠地面上，互相碰撞。连贯性有点奇怪。你可以看到一些牛仔融化成彼此，但从物理演示的角度来看，你看到了布料的真实移动。

你看到了牛仔碰撞在地面上的边界。你看到了布娃娃的身体如何沉入这个堆中。是的，这是有史以来最愚蠢的事情，它让我再次对Sora感到兴奋。

这就是OpenAI应该给我们一些Sora的原因，让我们玩玩它，因为我确实看到了非常不可思议的事情，Sora比其他一些系统更具梦想感，但也像……让我们访问它。时间已经够长了。我知道艺术家可以访问，我和OpenAI的人谈过，他们以不同的方式访问，但开放一点，让普通人……

可以使用它，这样我们就可以……

看到可能性。

我没有得到PO和PO，那是AIC，你做到了。但如果你想每周看到我们人工智能所做的事情，加文，我们有一个新闻通讯。

每周二早上。

一份名为“人工智能与人类”的新闻通讯会发布。它包含你想要查看的观察结果、更新和热门链接。它是完全免费的。

你可以在aiforhumans.show上注册，这是我们的网站。点击注册，每周一次在你的收件箱中获取新闻通讯。我们感谢你，并希望你喜欢它。

没错。好的，让我们简要介绍一下我们本周所做的事情。我想听听你做了什么，因为我认为你做了一些非常酷的事情，可能会让那些花时间处理人工智能视频的人赚到一些钱。

这并不是什么非常性感的东西，但它非常有用，我希望每个人都能使用它，因为它真的非常令人印象深刻。它叫做Clarity Refiners，这是一个免费的AI升级工具，你可以在你的机器上本地运行。这意味着你可以将低分辨率、模糊、有划痕的图像变成超高清图像，而且它是免费运行的，运行速度也很快，无论是在Windows、Mac还是Linux上运行。

所以你可以搜索Clarity Refiners，我们会在节目说明中添加链接。你可以去GitHub下载并尝试安装它，或者你可以使用我们几乎每周都会使用的软件Peno.kio。这不是广告，但peno.kio.computer是一个软件，可以让你非常轻松地运行AI工具和应用程序。

一键点击，我用Pennock点电脑运行Clarity Refinement。我给你发了一些例子。Gavin，我用旧视频游戏，比如《毁灭战士2》或《坦克大战》，一些块状的、像素化的混乱画面，几秒钟内就将它们提升到非常高的分辨率，是的，12K。

我做得很好，对细节进行了很好的处理，并填补了小点。我用了穆罕默德·阿里击倒对手后站在他上方庆祝的标志性照片。我尝试了不同的降噪方法。

结果非常有趣，放大图像，效果非常好。它去除了一些横梁，并将其模糊化，认为那是噪点。所以我很快学到的是，如果你想要对源图像进行忠实的再现，你必须将降噪设置为非常低，否则模型就会开始出现波动。

但基本上工作流程很简单。你上传想要提升分辨率的图像，然后有一个可选的字幕细节面板，你可以点击它，它会自动分析图像并输入对其中内容的超详细描述。这有助于模型进行提升。

所以我用它处理了视频游戏或YouTube上的一些阿里照片。我用了经典的阿比路照片，并将其提升到超高分辨率。效果令人震惊的好，它确实有效。如果你在处理图形，如果你正在生成AI图像并希望更快地完成，然后得到你喜欢的结果，你可以用这种方法提升分辨率，非常强大。它是免费的，并且可以在本地运行。

还有一件大事，当我提到AI视频时，很多AI视频都是由图像驱动的。图像质量越高，视频质量越好。所以你会看到很多人使用Topaz Gigapixel AI等软件，这些软件相当昂贵，尤其是Topaz。

这个是免费的，你可以自己运行它来制作AI视频。所以这很酷。我很期待尝试一下。

Kevin，上周我们谈到了Suno，在你获得早期访问权限之前。我和世界其他许诺者一样，获得了访问权限。本周，我又更新了软件。

令人惊奇的是，我上周说它速度非常快。我拿到它的第一天是它发布的那天，所以速度比现在慢一点，但就在今天早上我又用了一次。速度超快。

质量水平非常高。我有一些好坏参半的体验，你知道的，但这也是AI音乐和所有这些东西的乐趣所在。我决定尝试做的事情是……我没有完整的成果。

我只是朝着目标迈出了第一步。我认为我将尝试制作一张AI圣诞专辑，我的意思是，就像我所做的那样，我喜欢圣诞音乐。我是它的超级粉丝。

我最喜欢的圣诞歌曲是《This Christmas》，这是一首令人难以置信的灵魂圣诞歌曲。但我想制作一张AI圣诞专辑。我想让它关注AI的问题，所以我这样说，这是我第一次尝试。

我基本上写了一个内在的多样化合唱，但我并没有试图把它做成一首歌。然后我把它交给GPT-4，然后我奇怪地把它带到了DeepSeek模型（我在开头谈到的那个模型），不得不重写一些结构，然后把它放回GPT-4。然后我只是把输出输入到Suno中。你可以听听这是什么。我说：

“圣诞节到了。孩子们都在想，今年圣诞老人会从烟囱滑下来吗？嗯，不完全是。结果圣诞老人……哦，不，结果……”

“但成本效益很高。但在节日快乐方面，我们不要做得太对。等等。”所以，你从Suno V4中得到的，你把它塞进Suno V4中，你开头没有说男声叙述，或者Suno只是把它拿过来，说，“哦，这是朗诵，然后我们……”

“进入这个。”我做了我说的第一件事，我用括号加了引言，这是一种在Suno中使用括号的方法，然后我加了“朗诵”，所以引言是朗诵的，而诗句是演唱的。但我要说，不，我为歌曲类型说的只是“节日经典”，这说明Suno有多好，它理解这些东西。我想尝试改进的一件事，你可能比我现在更好，就是尝试真正弄清楚提示风格以及哪些词会产生影响。因为我确实尝试了“节日经典”，“圣诞经典”或“圣诞最佳”之类的词，试图找出不同的方法，比如，简短的、具体的描述似乎比其他任何东西都好。

清晰、大胆的选择可能会更好，从我使用括号的经验来看，这确实有助于引导歌曲的生成，就像你说的，Suno朗诵，就像，“对我来说这是一个大胆的选择”，但我喜欢知道这是你的手动干预。但我推荐给所有使用Suno V4的人，当然，Suno网站上有一个“探索”选项。

但当你点击它时，它会给你一个巨大的轮盘，上面有在这个平台上生成的各种不同的歌曲。如果你点击浏览（现在已更新到V4），你会听到多种风格的歌曲，你会想，“哦，这就是我想要的。”你可以点击查看他们是如何提示的，以及歌曲是什么风格。

这是一种无需消耗积分就能轻松学习并获得新风格灵感的便捷方法。所以Gavin，这个AI歌曲的圣诞专辑，这是一个你正在努力完成的愚蠢计划吗？今年我们会得到它吗？

让我们称之为实验，至少是一个实验，我想尝试做的事情，只是出于好奇，并没有试图从中赚钱。对于那些觉得这是对他们生意的侮辱的音乐家们，我表示抱歉。但我想要看看从这里到Spotify发布的流程是什么样的，因为我不知道这有多难。

我不知道我是否会遇到障碍。所以我们能够做到这一点，我认为。所以很明显，大多数圣诞音乐会在感恩节之前发布，我可能下周就能完成。但我的目标是在12月1日之前完成。

看看会发生什么。妈妈会不会因为训练基础模型而被抓？

嗯，Jason Day是我一直在考虑的，我今晚要带两百个。所以，我目前正在考虑的事情肯定在我的脑海里。我只是说，我讨厌有坏的，除了《圣诞老人宝贝》之外，没有比这更糟糕的圣诞歌曲了。也许他们会谈论他们失去牙齿的事情。

但我们必须得到一个《大厅里的喧嚣》的版本，它根本不知道……

圣诞节是什么。让一个男人来唱它，我会认为你……

需要做的是，我认为你无法提示一个男人，因为我敢打赌，进入“妈妈”需要很多……现在这就是我所有的洞穴人……无论如何，但我敢打赌，如果你用摇滚乐的方式演奏一些东西，然后上传它，并说“翻唱……”

这个，你也许能够……

然后……

根据这个翻唱来创造一个角色……

它……

可能是洞穴人，它会遵循这种基调和风格……

六秒钟。

好的，我明白了。

排队等候，好的，Garda House，Garda House。我有午餐盒。我只是一个愚蠢的AI，blah blah。

blah。为什么尝试？好的，太好了。太完美了。好的，我们有了这种风格。你想做一个圣诞铃声经典。

圣诞经典啊。

好的，我是Jack AI。

我看看。

这很有趣，因为我认为这是一件有趣的事情，可以用Suno来玩，对吧，比如这个想法。

比如Suno。HSE。

我有一个端口。

只是一个愚蠢的AI。

IBB尝试。我最后一次，我们没有得到它。

这很有趣。

但这确实是Suno的局限性，对吧？你知道，你想能够做这样的事情，无论如何，就目前而言，这将是一个实验，试图用不寻常的声音和东西来重新创作圣诞歌曲。但我希望能够更多地控制实际歌手的声音。

Gavin，我期待着播放这个播放列表，并对我的家人耳语说，“Alexa，在Spotify上播放它”，然后让他们都盯着我看，因为我敢肯定，我敢肯定，你播放第一首歌三十五秒后，人们就会说，“等等，这是什么鬼东西？”

约翰是谁？为什么有一百个？下次见。

New AI Studios in Hollywood, DeepSeek's AI Reasoning Model, Perplexity Disrupts Shopping & More AI News 52:09 Share

AI For Humans: Making Artificial Intelligence Fun & Practical

Deep Dive

Shownotes Transcript

New AI Studios in Hollywood, DeepSeek's AI Reasoning Model, Perplexity Disrupts Shopping & More AI News