We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Will AI Surpass Human Intelligence in 2 Years?

2025/1/24

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

AI Deep Dive AI Chapters Transcript

People

AI Daily Brief 主播

Topics

AI Daily Brief 主播：OpenAI即将发布一款能够自动化简单网络任务的AI代理，未来还计划开发能够处理复杂编程任务的AI代理，以期开发出超越人类在大多数经济上有价值的工作中的AI通用人工智能。当前的AI编码助手效率低下，使用它们感觉像是在管理一群能力不足的实习生。苹果在AI战略方面落后于其他公司，其在AI方面的进展缓慢，应用案例有限，并且过于注重隐私。大型企业明年将开始尝试使用AI代理。大多数商业领袖预计AI将在未来两年内彻底改变他们的业务，但数据质量、风险管理和员工采用等问题是主要的挑战。Anthropic CEO Dario Amodei表示，Claude短期内不会推出图片和视频生成功能，因为Anthropic主要关注企业用户，并优先考虑企业级功能。Anthropic将在未来六个月内发布更高级的模型，并正在努力解决计算资源限制的问题。领先的AI实验室负责人预测，未来几年内经济将发生巨大结构性转变，现在就应该开始思考并为此做好准备。 Jason Liu：当前的AI编码助手效率低下，使用它们感觉像是在管理一群能力不足的实习生。 Ethan Malek：苹果在AI战略方面落后于其他公司，其在AI方面的进展缓慢，应用案例有限，并且过于注重隐私。 Dario Amodei：AGI将在2027年或稍后到来，这将需要对经济进行重组，但他认为如果每个人都面临同样的挑战，情况会更好。AGI的到来意味着人类生产经济价值的方式将不再有效，需要重新协商社会契约。他相信在两到三年内，AI系统将能够在所有任务上超越人类。美国需要保持在AI领域的领先地位，以应对来自中国的竞争，并有效管理自身模型的风险。

Deep Dive

Chapters

This chapter discusses OpenAI's new agent, Operator, designed to automate simple tasks. It also explores the development of a coding agent aimed at senior software engineers, potentially impacting the workforce significantly.

OpenAI's Operator agent is designed for simple tasks like booking flights.
The company is developing a coding agent for senior software engineers to handle complex programming tasks.
This coding agent aims to replicate a level 6 or senior staff engineer's capabilities.

Shownotes Transcript

At Davos, Anthropic CEO Dario Amodei shared bold predictions about AGI arriving by 2027. Discussions spanned enterprise AI's evolution, virtual collaborators, and the potential need for a global economic reorganization. With AI advancements accelerating, this episode unpacks key insights from the Wall Street Journal interview and broader implications for the future of work, global competition, and societal adaptation. Brought to you by: KPMG – Go to ⁠⁠⁠www.kpmg.us/ai⁠⁠⁠ to learn more about how KPMG can help you drive value with our AI solutions. Vanta - Simplify compliance - ⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw The Agent Readiness Audit from Superintelligent - Go to https://besuper.ai/ to request your company's agent readiness score. The AI Daily Brief helps you understand the most important news and discussions in AI. Subscribe to the podcast version of The AI Daily Brief wherever you listen: https://pod.link/1680633614 Subscribe to the newsletter: https://aidailybrief.beehiiv.com/ Join our Discord: https://bit.ly/aibreakdown

</context> <raw_text>0 谢谢。

欢迎回到 AI Daily Brief 头条新闻版，大约五分钟内即可获取您所需的每日 AI 新闻。朋友们，关于 OpenAI 代理的传闻已达到高潮，因为该公司正准备发布该代理。据消息称，该公司的运营商代理计划在本周发布。他们写道，运营商旨在帮助完成预订晚餐或预订航班等任务。从本质上讲，听起来它能够在网络浏览器中自动化简单的任务。

虽然这些用例可能属于我不断反对人们真正关心的一些用例，尽管你们中的一些人表示确实希望获得预订航班的帮助，但更有趣的消息可能是 OpenAI 为未来的代理发布计划了什么。该消息再次报道说，“……该公司正在开发人工智能来帮助高级软件工程师处理更复杂的编程任务，这是该公司尝试开发在大多数经济上有价值的工作方面胜过人类的通用人工智能的关键一步。”

目标显然是创建一个能够处理涉及多个步骤的编码问题的编码代理。这与 Sam Altman 在 1 月初写道的内容一致，他当时引用道：“我们可能会看到第一批人工智能代理加入劳动力队伍，并从根本上改变公司的产出。”

据报道，OpenAI 一直在准备与特定客户一起测试其编码代理的早期版本，因为他们试图使该产品尽可能有用。而直到现在，许多编码助手都是为了帮助初级和中级工程师，该消息写道，“……相比之下，OpenAI 正在开发的新编码代理针对的是高级软件工程师……”

它可能会连接到他们的代码库，以便它可以处理复杂的任务，例如代码重构（简化代码或使其更容易为人程序员理解的过程），以便他们可以更容易地修改它或防止在代码库中引入故障。它还可以帮助识别和减少代码库中的重复代码。消息来源称，目标是复制 6 级或高级员工工程师的水平，这种程序员的水平有望能够从管理人员那里获得广泛的指导，然后独立设计新的应用程序、功能和系统。

开发人员和 AI 顾问 Jason Liu 表示，这种级别的代理将具有清晰的、可证明的投资回报率，并可以提高 OpenAI 赢得企业业务的能力。刘反思了与当前一代编码助手合作的经历，他说：“我做的每件事都需要七个小时，感觉我最终只是变成了 10 个笨拙实习生的经理。”目前，我认为许多人只是屏住呼吸，等待着看看 Operator 究竟是什么样子。再说一次，了解 AI，在你收听本节目时，它可能已经发布了。

接下来是头条新闻，Databricks 正式完成了我们之前讨论过的最新一轮融资，筹集了 100 亿美元的股权和另外 50 亿美元的债务。

新的公告显示，Meta 作为战略投资者参与其中。在上一周的采访中，Databricks 首席执行官 Ali Godzi 表示，他的公司一直在与 Meta 的 Lama 团队密切合作。目前尚不清楚 Databricks 是 Meta 的客户，还是反过来，或者两者都是。无论哪种方式，继去年投资 Scale AI 之后，这都是 Meta 在人工智能领域进行的另一项重大投资。Rehar Jark 写道，此举可能表明 Meta 正在开始考虑其大型语言模型工作以外的更多 B2B 用例。

转向手机领域，三星发布了其旗舰移动手机 Galaxy S25 的最新版本，该版本配备了 Google Gemini 助理的集成版本。更新后的助理现在是原生多模式的，能够跨多个应用程序完成复杂的任务。您可以与助理进行对话，还可以添加图片或视频作为参考。三星表示，在接下来的几个月里，他们将添加屏幕共享和实时视频流功能。

谷歌举例说明了该功能，称用户可以要求 Gemini 搜索高蛋白午餐创意，然后将其保存到 Notes 应用程序中。这里的关键点是，助理可以根据单个提示跨最多两个应用程序执行这些多阶段任务。从某种程度上来说很简单，但这仍然是人工智能助理成为一种新型界面而不是仅仅是信息工具的一大步。

对许多人来说，这只是围绕苹果人工智能战略的另一个大问号。Ethan Malek 教授写道：“过去几周似乎确实挑战了苹果的人工智能战略。实验室正在展示能够在手机上运行的先进代理模型，有些是在本地运行的，而苹果似乎陷入了长期计划中，即发布非常有限的设备上人工智能功能，这些功能很快就会被淘汰。苹果似乎大力押注缓慢的人工智能发展、狭窄的用例以及隐私对用户至关重要。到目前为止，这些似乎并不是事情的发展方向。”

我从来不会完全排除苹果，但是，他们确实需要追赶一些东西。不过，就目前而言，这就是今天的 AI Daily Brief 头条新闻版的全部内容。接下来是主要剧集。今天的剧集由 Vanta 提供。信任不仅仅是赢得的，更是被要求的。无论您是正在进行首次审计的初创公司创始人，还是经验丰富的安全专业人员正在扩展您的 GRC 计划，证明您对安全的承诺从未像现在这样重要或复杂。这就是 Vanta 的用武之地。

企业使用 Vanta 通过自动化超过 35 个框架（如 SOC 2 和 ISO 27001）的合规性需求来建立信任。集中的安全工作流程可以将问卷调查完成速度提高 5 倍，并主动管理供应商风险。Vanta 可以帮助您启动或扩展您的安全程序，方法是将您与审计员和专家联系起来，以快速进行审计并建立您的安全程序。此外，由于整个平台都采用了自动化和人工智能，Vanta 可以为您节省时间，让您可以专注于公司建设。

加入超过 9,000 家全球公司（如 Atlassian、Quora 和 Factory），他们使用 Vantage 实时管理风险和改进安全性。

在有限的时间内，该受众可以在 vanta.com/nlw 获得 1,000 美元的 Vanta 折扣。即 v-a-n-t-a.com/nlw，可享受 1,000 美元的折扣。如果 2025 年人工智能有一件事是明确的，那就是代理即将到来。垂直代理购买行业水平代理平台。

每个功能的代理。如果您正在运营大型企业，那么明年您将尝试使用代理。鉴于这有多新，我们所有人都会回到试点模式。那是

这就是 Superintelligent 在今年年初提供新产品的原因。这是一项代理准备和机会审计。在短短几周内，我们会深入研究您的团队，了解哪些类型的代理适合您进行测试，需要哪些类型的基础设施支持才能做好准备，并最终获得一套可操作的建议，让您准备好弄清楚代理如何改变您的业务。

如果您对代理准备和机会审计感兴趣，请直接与我联系，[email protected]。在主题行中加上“代理”一词，以便我知道您在谈论什么。让我们让您成为人工智能市场最具活力部分的领导者。您好，AI Daily Brief 听众。快速休息一下，分享一些来自 KPMG 最新 AI 季度脉搏调查的非常有趣的发现。

您是否知道 67% 的商业领袖预计人工智能将在未来两年内从根本上改变他们的业务？然而，并非一切顺利。他们面临的最大挑战包括数据质量、风险管理和员工采用等问题。KPMG 处于帮助组织克服这些障碍的最前沿。他们不仅仅是在谈论人工智能，他们正在凭借切实可行的解决方案和实际应用来带头。

好，

欢迎回到 AI Daily Brief。最近围绕 AGI 和超级智能、变化速度以及一切如何加速进行的讨论和对话很多。当然，现在，达沃斯世界经济论坛年会正在举行，如果没有什么别的，这是一个很好的机会，可以看看商业和政治界的许多领导人物如何看待此刻的世界。

本周早些时候，《华尔街日报》与 Anthropic 首席执行官 Dario Amadei 进行了对话。这是一次广泛的对话，其中既包含了一些关于 Anthropic 的现状和未来方向的要点，也包含了一些关于这些更大问题的问题。在本集中，我们将深入探讨该对话中一些最有趣的评论以及它们是如何被感知的。

现在，让我们从对话中获得的一些关于 Claude 业务方面的细节开始谈起。采访者 Joanna Stern 竭力想获得一些关于何时推出新模型的信息，但收效甚微。她询问的一个功能是网络访问，Dario 说这将在“不久的将来”到来。他还讨论了一种双向语音模式，该模式将“最终”到来。有趣的是，当 Stern 向 Amadei 询问照片和视频生成时，他说这些内容明确不在路线图上。

实际上，他说 Anthropic 并不认为这些对于企业用户来说是关键功能，而这些功能是针对消费者的，并且，“我们的大部分业务都面向企业，因此企业重点关注的事情通常会优先考虑。”当您查看 Anthropic 相对于其竞争对手在企业大型语言模型方面的市场份额变化时，这一点就说得通了。在 2023 年至 2024 年期间，OpenAI 在企业的市场份额下降了 16%，而 Anthropic 的

Anthropic 的市场份额从 12% 翻了一番，达到 24%。现在，有趣的是，他们如此明确地表示他们不认为照片和视频生成对企业来说是关键，但这可能也仅仅反映了一个事实，即即使是像 Anthropic 这样资金雄厚的初创公司也无法同时处理所有事情。现在，Stern 和《华尔街日报》可能最感兴趣的是 Anthropic 是否会在未来几个月发布更高级的模型。他的回答是肯定的，他唯一给出的时间范围是在未来六个月内。

当谈到 Anthropic 的严格使用限制（这是 Twitter 上经常出现的抱怨）时，他基本上说他们正在努力解决资源限制问题，但目前，获得计算资源需要等待名单，这确实是一件棘手的事情。

他还表示，去年的收入增长了 10 倍，接近 10 亿美元，而且增长速度没有放缓。接下来的对话是关于代理的。Dario 抓住机会试图稍微重新构建对话。他将 Anthropic 即将来临的代理称为“虚拟合作者”，他说：“我们想到的是一个能够在电脑屏幕上完成虚拟人能够完成的任何事情的模型，你可以与它交谈并赋予它任务。”

也许这是一个它需要一天时间完成的任务。你说你要实现一个产品功能，它会编写代码、测试、部署代码，与同事交谈，编写 Slack 消息，发送电子邮件。就像人类一样，该模型会去做很多事情，并偶尔向你汇报进度。

现在，我理解为什么在这个领域工作了很长时间的人有时会对“代理”一词的过度使用和炒作感到不满。我还认为这根本就是一个失败的论点。对人们来说，代理现在意味着人工智能无需我的参与就能为我做事。他们没有考虑自主性和技术细微差别的程度。我认为试图让人们使用不同的术语或更细致的术语是一场失败的战斗。

无论如何，即使在 Amode 的估计中，虚拟合作者版本的代理也可能意味着工作岗位的替代，这也是他被问到的一个问题。Dario 指出，每当机器最终自动化某种类型工作的 90% 时，人类工人就能利用最关键的 10% 来获得巨大的效率提升。

他还讨论了以替代模式部署企业人工智能与以补充模式部署企业人工智能之间的区别。Amadei 提到了研究表明，补充性人工智能部署会导致更高的生产力增长。当然，这导致了虚拟合作者的这种说法。我之前多次谈到过这个问题，我还会继续谈论它。我认为企业不可避免地会考虑并询问代理如何替代整个类别的任务，这可能会影响工作岗位。但我也认为，将会有巨大的社会压力和新的规范形成，

这将给这些公司带来很大的压力，迫使他们以这种补充的方式思考，而不是纯粹的替代方式。

然后采访谈到了大问题。Amadei 说，他仍然相信 AGI 将在 2027 年或稍后到来，也就是两年后。在思考社会学意义时，他承认 AGI 可能会需要重组经济。他说：“唯一的好处是我们都会在同一条船上。我实际上害怕 30% 的人类劳动被人工智能完全自动化的那种世界。这将导致被取代的群体和未被取代的群体之间发生令人难以置信的阶级战争。如果我们都在同一条船上，这将不容易，但我实际上感觉好多了。”

我们将不得不坐下来认识到，我们作为一个技术文明已经达到了这样一个点：存在巨大的丰富性和巨大的经济价值。但是，将价值分配给人类的方式是通过生产经济劳动，这种想法是无效的。我可能经常听到我谈论的另一件事是重新谈判社会契约的想法，而这只是对这个想法的进一步证据和不同的表达。

在达沃斯举行的另一场采访中，他说：“我从未如此确信我们即将拥有强大的 AI 系统。在过去几个月里，我在 Anthropic 内部和外部看到的东西让我相信，我们正在朝着在两到三年内在每项任务上都超过人类的人类水平系统迈进。”这没有什么新鲜事，但重复这一点很重要，因为它引出了问题，正如 Johnny Miller 在这里提出的那样，“真诚的问题，你是否考虑过根据这种情况调整你的生活轨迹？”

Punch Bowl 技术记者 Ben Brody 写道：“无论这有多少炒作，无论时间线最终有多长，这都是我们生活中最具破坏性的东西。我说这话是因为我是特朗普在华盛顿特区的记者。”现在，我不会过多地谈论它，但他也被问到了新政府的问题。实际上，他避而不谈，说 Anthropic 是一个政策行为者，而不是政治行为者，并明确表示他们关心的问题是与中国的竞争。

尽管他承认这确实很棘手。他说：“领先于中国，这正变得越来越困难，这给了我们缓冲，让我们能够应对我们自己模型的风险。如果我们领先，我们就会陷入这种两难境地：如果你放慢三个月来减轻我们自己模型的风险，那么中国就会超越我们。我们不想一开始就陷入这种情况。”你可能还记得，他最近在《华尔街日报》上合著了一篇文章，名为《特朗普可以保持美国在人工智能方面的优势》，这篇文章是关于继续支持甚至扩大拜登政府实施的出口管制的必要性。

Will AI Surpass Human Intelligence in 2 Years? 14:22 Share

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

Deep Dive

Shownotes Transcript

Will AI Surpass Human Intelligence in 2 Years?