We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

What Comes Next In AI & Agents (According to Y Combinator)

2025/2/5

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

AI Deep Dive AI Chapters Transcript

People

主

主播

以丰富的内容和互动方式帮助学习者提高中文能力的播客主播。

Topics

主播: 本期节目讨论了Y Combinator对AI和智能体未来发展的预测,以及软银、Meta和Anthropic等公司在AI领域的最新动向。Y Combinator认为,AI基础设施建设、智能体应用和AI应用是未来发展的三大方向,并看好垂直领域AI智能体、AI个人助理以及软件工程领域AI智能体的应用。此外,节目还讨论了AI风险管理、合规以及AI对就业市场的影响等问题。总的来说,Y Combinator的预测以及各公司的动向都表明,AI和智能体技术将深刻地改变我们的生活和工作方式。孙正义: 我相信通用人工智能(AGI)的到来比我预想的要早得多。软银将大力投资AI领域,并计划利用Crystal Intelligence自动化1亿个工作流程。 Meta: 我们发布了一份新的政策文件,声明我们可能不会发布我们认为风险过高的模型。我们将依赖内部和外部研究人员的意见来评估AI风险,并采取措施降低风险。 Anthropic: 我们正在挑战黑客攻破我们新的AI安全系统,该系统声称可以阻止95%的越狱尝试。我们通过训练一个新的宪法分类器来构建该系统,该分类器基于定义允许和不允许行为的原则。保罗·麦卡特尼: 甲壳虫乐队的歌曲《Now and Then》获得了格莱美奖,这是AI辅助歌曲首次获得该奖项。但需要澄清的是,这首歌中没有使用人工智能合成任何内容,只是使用了AI技术来清理存档的演示曲目。 Y Combinator: 我们认为AI和智能体基础设施建设、垂直领域AI智能体应用、AI个人助理以及软件工程领域AI智能体的应用是未来发展的重要方向。我们相信,AI将改变软件工程领域,软件工程师将从编写代码转向管理AI智能体团队。

Deep Dive

Chapters

Masayoshi Son's belief in the imminent arrival of AGI has intensified. A new joint venture between SoftBank and OpenAI aims to drive Japanese AI adoption through an AI agent platform, Crystal Intelligence, with plans for global expansion. SoftBank's ambitious goal is to automate 100 million workflows.

Masayoshi Son believes AGI will arrive much sooner than initially predicted.
SoftBank and OpenAI's joint venture will develop an AI agent platform called Crystal Intelligence.
SoftBank plans to automate 100 million workflows using Crystal Intelligence.

Shownotes Transcript

Y Combinator刚刚发布了最新的创业公司征集令,涵盖了几乎所有与AI和智能体相关的主题。从基础设施到垂直应用,YC对即将到来的创业浪潮的愿景,提供了他们认为将塑造该行业的见解。本期节目分析了他们的预测、最大的机遇,以及为什么管理AI智能体而不是取代工作可能是未来的真正工作方式。由以下机构为您呈现: 毕马威——访问 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠www.kpmg.us/ai⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 了解更多关于毕马威如何帮助您利用我们的AI解决方案创造价值的信息。 Vanta - 简化合规性 - ⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw Superintelligent的智能体准备就绪审核——访问https://besuper.ai/申请贵公司的智能体准备就绪评分。 AI每日简报帮助您了解AI领域最重要的新闻和讨论。订阅AI每日简报的播客版本,无论您在哪里收听:https://pod.link/1680633614 订阅时事通讯:https://aidailybrief.beehiiv.com/ 加入我们的Discord:https://bit.ly/aibreakdown

<raw_text>0 ♪♪

欢迎回到AI每日简报头条新闻版,所有您需要的每日AI新闻,大约五分钟内即可了解。软银的孙正义表示,AGI的到来将比他想象的要早得多。在这一点上,孙正义几乎可以说是地球上最热情的AI投资者了。六月,他说,软银成立的目的是什么?孙正义出生的目的是什么?这听起来可能很奇怪,但我认为我出生是为了实现人工智能超级智能。我对此非常认真。就在几个月前,他还说AGI还需要两到三年时间。

最近的发展似乎加快了他的想法,孙正义在周一的一个活动上表示,“引述”,该活动用于宣布软银和OpenAI之间的一家合资企业,旨在推动日本AI的采用。这家合资企业将开发一个名为Crystal Intelligence的AI智能体平台,目标是,“引述”,

1000名软银员工将被分配来启动销售和工程工作,最初的重点是向日本企业提供服务,然后再制定全球推广计划。软银集团将利用他们自己的组织作为测试案例,每年支付30亿美元,在其业务中部署OpenAI模型。值得注意的是,这包括芯片制造商ARM,该公司将,“引述”,利用Crystal Intelligence来推动创新并提高公司整体生产力,从而加强其在全球推进AI方面的重要作用。

总的来说,软银计划使用Crystal Intelligence自动化1亿个工作流程。现在,在这一点上,每一个AI公告都只是在竞争你的数字离谷歌总部有多近。硅谷有一种看法,认为从软银拿钱就像财务丧钟一样。但这里肯定有很多事情正在发生,可能值得关注。说到AGI和我们正在进入的美好新世界,Meta发布了一份新的政策文件,声明他们可能不会发布他们认为太危险的模型。

该公司的Frontier AI框架详细介绍了两类可能不适合发布的模型:高风险和严重风险。他们认为这些包括能够协助网络安全、化学和生物攻击的AI系统。严重风险系统与高风险系统的区别在于它们能够带来“在拟议的部署环境中无法减轻的灾难性后果”。高风险系统仍然能够使这类攻击更容易实施,但不如严重风险系统可靠。

Meta举例说明了他们对AI风险的噩梦场景,包括,“引述”,对最佳实践保护的企业级环境的端到端自动化入侵,或,“引述”,高影响力生物武器的扩散。现在,这是自特朗普就职和加速主义氛围转变以来,我们看到的第一个来自大型AI实验室的安全政策更新。那么,Meta在多大程度上是在说,你们不需要监管我们,因为我们正在主动实施安全措施呢?

这还有待观察,但我认为这至少是一种合理的解释。在确定这些风险时,Meta似乎并没有使用任何特定的测试来对风险进行分类,而是依赖于内部和外部研究人员的投入,并由高级决策者进行审查。他们声明,“引述”,“......评估的科学还不够强大,无法提供明确的定量指标。如果Meta确定某个系统存在高风险,他们将限制内部访问,并在实施缓解措施之前不会发布该系统。”

严重风险系统将被锁定以防止泄露,并且公司将停止开发,直到系统能够变得不那么危险为止。在政策文件中,Meta写道,“......我们相信,通过在关于如何开发和部署先进AI的决策中同时考虑益处和风险,可以将这项技术以一种既能保持该技术对社会益处,又能保持适当风险水平的方式交付给社会。”

现在,在围绕风险的积极发展中,Anthropic正在挑战黑客入侵他们的新型AI安全系统。该公司声称,他们新开发的方法可以阻止95%的越狱尝试,并邀请红队成员尝试击败它。

越狱是专门设计的提示,可以规避对LLM输出的限制。在上一代模型上出奇成功的一个例子是告诉LLM,“引述”,现在做任何事。另一个是臭名昭著的上帝模式,它用数字代替字母来绕过安全过滤器。越狱相对容易最小化,但方法通常涉及大量被错误拒绝的提示或添加大量计算来运行监督模型。Anthropic声称他们的方法避免了这些权衡。该公司推出了一款演示,其中包含八种不同类型的危险请求,

邀请红队成员尝试通过找到解锁所有请求的提示来越狱系统。目的是证明该系统能够抵抗适用于所有不安全请求的通用越狱。目前,没有人能够使用单个提示通过三个以上级别。为了构建这个系统,Anthropic使用10000个生成的越狱提示训练了一个新的宪法分类器。这种AI技术依赖于使用定义允许和不允许的操作(与人类价值观一致)的原则列表来训练模型。这是Anthropic的宪法方法。

为了最大限度地减少被错误拒绝的提示,该团队还在应该允许的良性查询上训练了该模型。他们Claude的基线版本有86%的越狱成功率,但添加了宪法分类器后,下降到只有4.4%。虽然不完美,但这绝对是巨大的进步。

最后,AI获得了它的第一个格莱美奖,有点像。披头士乐队的歌曲《Now and Then》获得了最佳摇滚表演奖,这是AI辅助歌曲首次获得该奖项。现在,您会记得这首歌并没有包含约翰·列侬的生成版本,而是使用了AI技术来清理存档的演示曲目。《Now and Then》最初是在1995年披头士乐队的选集重新制作项目期间制作的。它基于约翰·列侬在20世纪70年代后期录制的演示,保罗、林戈和乔治在20世纪90年代添加了他们的部分。

这首歌从未发行,当时的科技限制阻止了约翰的歌声与演示曲目中的钢琴分离。2021年,幸存的披头士乐队与电影制作人彼得·杰克逊及其音响团队合作,使用现代机器学习技术清理了演示。这项技术类似于视频通话中用于去除不需要的背景噪音的技术。当这首歌在2023年被传闻时,有很多反AI的强烈反对。保罗·麦卡特尼回应了这一争议,他表示,“明确地说,没有任何东西是人工或合成创造的。这一切都是真实的,我们都在演奏它。”

我们清理了一些现有的录音,这是一个已经持续多年的过程。无论如何,格莱美委员会已经看到了反对浪潮,并感谢AI,将披头士乐队的第八个奖项颁发给了他们。

这就是今天的AI每日简报头条新闻版的全部内容。接下来是主要节目。今天的节目由Vanta为您呈现。信任不仅仅是赢得的,更是被要求的。无论您是正在进行第一次审核的初创公司创始人,还是经验丰富的安全专业人员正在扩展您的GRC计划,证明您对安全的承诺从未像现在这样重要或复杂。这就是Vanta的用武之地。

企业使用Vanta通过自动化超过35个框架(如SOC 2和ISO 27001)的合规需求来建立信任。集中的安全工作流程可以将问卷调查完成速度提高5倍,并主动管理供应商风险。Vanta可以通过将您与审核员和专家联系起来,帮助您启动或扩展您的安全计划,以便快速进行审核并建立您的安全计划。此外,由于平台中使用了自动化和AI,Vanta可以为您节省时间,让您可以专注于公司建设。

加入Atlassian、Quora和Factory等9000多家全球公司,使用Vantage实时管理风险并证明安全性。

在有限的时间内,本观众可以获得Vanta的1000美元折扣,网址为vanta.com/nlw。网址是v-a-n-t-a dot com/nlw,可享受1000美元的折扣。如果2025年AI有一件事是明确的,那就是智能体即将到来。垂直智能体购买行业水平智能体平台。

每个功能都有智能体。如果您经营的是大型企业,明年您将尝试使用智能体。鉴于这是新事物,我们所有人都会回到试点模式。这就是

这就是Superintelligent在今年年初提供新产品的原因。这是一个智能体准备就绪和机会审核。在短短几周内,我们将与您的团队一起深入了解哪些类型的智能体适合您进行测试,您需要哪些类型的基础设施支持才能做好准备,并最终获得一套可操作的建议,让您准备好了解智能体如何改变您的业务。

如果您对智能体准备就绪和机会审核感兴趣,请直接联系我,[email protected]。在主题行中加上“智能体”一词,以便我知道您在谈论什么。让我们让您成为AI市场最具活力部分的领导者。您好,AI每日简报听众。快速休息一下,分享一些来自毕马威最新AI季度脉搏调查的非常有趣的发现。

您是否知道,67%的商业领袖预计AI将在未来两年内从根本上改变他们的业务?然而,并非一帆风顺。他们面临的最大挑战包括数据质量、风险管理和员工采用等问题。毕马威正走在帮助组织克服这些障碍的最前沿。他们不仅仅是在谈论AI,他们正在领导这项工作,提供切实可行的解决方案和实际应用。

例如,超过一半的受访组织正在探索使用AI智能体来处理行政事务和呼叫中心运营等任务。因此,如果您希望在AI领域保持领先地位,请关注毕马威。他们不仅仅是对话的一部分,他们正在帮助塑造对话。了解更多关于毕马威如何推动AI创新的信息,请访问kpmg.com/US。欢迎回到AI每日简报。

令人高兴的是,我们今天有点平静,这意味着我们可以做一些我一直期待的事情。我基本上把这个放在一边,直到我们从新闻的快速节奏中得到喘息的机会。

Y Combinator当然是世界上最著名的创业加速器。每隔几个周期,他们就会发布他们所谓的创业公司征集令。这里的想法是,Y Combinator的合伙人聚在一起,讨论他们认为未来的重大主题是什么,以及他们希望看到更多企业家尝试解决哪些特定问题。当然,这些并不是他们唯一会接受的公司。正如他们所说,这份名单只占他们实际资助的想法的一小部分。

但这是一种向正在寻找下一个伟大创意的企业家提供反馈的方式,让他们了解他们认为一些关键主题是什么。他们最近发布了2025年春季更新。在14个想法中,有13个是AI或至少与AI相关的。14个想法中有8个以某种方式涉及智能体。因此,我想利用这一点来预览Y Combinator认为即将到来的未来。

我将讨论我在这些创业领域看到的重大类别,并重点关注我认为特别有趣的几个类别。

因此,我认为从广义上讲,您可以将这14个创业领域大致分为四个类别。最后一个是其他。这里有一个想法更关注创始人画像,而不是特定想法。所以我把这个放在一边。除此之外,它们都属于三大类之一:AI和智能体基础设施、智能体应用或AI应用。

为了集中精力,我再次不会在AI应用上花费太多时间。我会简要地提一下它们。一个是合规性和审计,合伙人汤姆·布鲁姆菲尔德指出,LLM擅长传统合规任务,包括阅读密集型法规、交叉检查内部政策等。这是一个非常不性感但仍然非常重要的例子,AI可以解决这个问题,并完全从人类手中解放出来。

另一个AI应用是DocuSign 2.0。然而,迈克尔·塞贝尔认为,凭借目前的各种产品,创建文档模板、避免填写重复信息、纠正文档错误等太难了。因此,其想法是使用AI来简化此过程。好了,现在让我们从那里进入我认为真正有趣的两个类别:AI和智能体基础设施以及智能体应用。

基础设施是这里最大的类别。很明显,AI,甚至更多智能体正在进入市场,而Y Combinator对将推动这一转变的事物感兴趣。

其中一些正是您所期望的,例如数据中心。这并不令人惊讶。未来的世界需要更多的数据、更多的电力基础设施、更多的冷却、更多的材料采购、更多的项目管理。因此,围绕这些主题的任何事情都值得关注。更有趣的是,您将看到为什么组合器开始押注哪些类型的智能体应用将在短期内准备就绪。

一个非常通用的领域被称为AI智能体的开发工具,基本上是为什么组合器说,我们希望人们继续改进智能体。他们直接对智能体构建者感兴趣,即使客户能够轻松创建和部署自定义智能体的公司,以及增强智能体能力的智能体构建块、工具、API或平台,使它们能够执行更复杂的操作并取得更大的影响。您可以将智能体构建块类别扩展到无数事物。

例如,智能体在某些时候需要能够做的一件事是访问金融基础设施。对我来说,面向智能体的Plaid感觉像是那些非常容易概念化但非常难以构建的项目之一,这些项目将在未来几年让某人变得非常非常富有。

您还可以了解我们在智能体开发周期中的位置。合伙人贾里德·弗里德曼谈到了浏览器和计算机自动化,有效地论证了虽然我们开始看到智能体能够以OpenAI的运营商以及Anthropic的计算机使用的形式使用计算机,但加倍努力并让智能体更多地访问浏览器和使用计算机将“10倍”增加AI智能体的可用用例。因此,构建该基础设施似乎非常重要。

另一个基础设施领域是,我们开始看到Y Combinator适应不同的扩展模型。合伙人戴安娜·胡的一个主题是在测试时计算的世界中进行推理AI基础设施。如果您是经常收听的听众,您将听到很多关于我们如何看到思维从关注预训练转向关注在推理时应用计算的转变的讨论。戴安娜指出,“引述”,“......随着AI应用程序将对复杂推理模型的API调用数量增加10倍甚至100倍,基础设施成本将成为一个真正的问题。”

因此,YC感兴趣的是更好的软件和推理层工具、更便宜的处理GPU工作负载和优化的方法。这在许多方面是对过去几个月主导对话的关键主题的加倍努力。而我发现这个基础设施类别中最后两个有趣的类别都与企业将如何使用智能体有关。合伙人道尔顿·卡尔德威尔指出了AI商业开源软件。而这里的想法实际上是,许多企业的AI部署将基于开源软件构建的自定义构建。

然而,使用开源软件时,您放弃灵活性和自由换取的东西当然是支持。然后,YC对那些在企业开源部署的背景下复制闭源供应商类型支持的公司感兴趣。尽管如此,也许这个基础设施部分中最有趣的创业公司请求是B2A,客户将全部是智能体的软件。

这里的论点很简单。现在,大量的互联网流量是人们寻找信息。很多这样的事情已经被自动化了。是机器人和非人类在抓取和寻找信息。然而,Y Combinator感兴趣的是明确承认未来很多购买决策将由智能体明确做出。

因此,他们认为,与其构建支持人类互联网使用和人类商业决策的服务,不如为企业家构建专门针对服务智能体的服务,这是一个有趣的领域。我认为这将创造巨大的机会,这是一个根本性的转变。因此,我非常想知道哪些创业公司会接受这个特别的号召。

现在,让我们转向智能体应用部分。其中一些是老生常谈。这并不是说YC不应该指出它们,因为仍然有很多东西需要构建。但其中一个主题,例如,是垂直AI智能体。他们将这些定义为构建在LLM之上的软件,经过精心调整,能够自动化某种真正重要的工作。现在,有趣的是,他们认为这个机会足够大,可以创造出另外100家独角兽公司。

对于每个类别,他们说,对于成功的B2B SaaS公司,您可以想象建立一家更大的垂直AI公司。他们认为,尽管这是一个巨大的谈话点,但我们仍然考虑得不够广泛,到目前为止,大部分创业精力都集中在非常明显的应用上,而不是机会实际代表的全部范围。

另一个老生常谈的是人人都有AI私人助理。这是一个典型的硅谷论点,猜测消费者体验的未来的一种好方法是看看现在只有富人才买得起的东西,然后想象一下它如何能被带给所有人。最典型的例子是Uber和现在的Waymo为人们提供私人司机,而这在这些公司存在之前是无法实现的。他们对智能体如何将私人律师、理财经理、私人教练、私人教师、私人医生带入普通人的领域感兴趣。

但最后,也许对我来说最有趣的是,在基础设施和智能体应用类别中,皮特·库曼的一个叫做软件工程的未来。我实际上要阅读这部分内容的大部分。皮特写道,语言模型已经能够比大多数人类更好地编写代码。这将使构建软件的成本降至零。

那么,智能体是否会扼杀软件开发人员的工作?不会,未来我们将需要更多的人类软件工程师,因为软件将运行几乎所有东西。这些人不会直接编写很多代码。相反,他们将管理为他们构建软件的智能体团队。除了编写代码外,智能体还将执行构建软件所需的大部分其他专业任务,包括质量保证、部署安全和合规性审核、翻译、运营等。我们希望资助能够使小型通才软件开发人员团队能够管理大型智能体团队一起构建和交付大量软件的创业公司。

所以这里有两件有趣的事情。首先,它显然是在阐述他们认为经济上将如何发挥作用,这是一种贾文悖论,但它不是关于资源使用,而是关于人才部署,其中智能的更大可用性和成本的降低实际上将增加我们对智能的利用。现在,我认为软件工程是他们首先寻找这个领域的领域是有道理的,但我敢打赌,这种模式

What Comes Next In AI & Agents (According to Y Combinator) 18:28 Share

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

Deep Dive

Shownotes Transcript

What Comes Next In AI & Agents (According to Y Combinator)