We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Google's AI Co Scientist and the True Power of Multi-Agent Systems

Google's AI Co Scientist and the True Power of Multi-Agent Systems

2025/2/22
logo of podcast The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

AI Deep Dive AI Chapters Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
Meta公司可能进军企业级AI市场,其潜力巨大,并可能正在秘密开发企业级AI工具。Salesforce正在与微软、甲骨文和谷歌谈判云计算交易,以运行其AI应用,并大力押注Agent Force。DeepSeek公司正在考虑首次进行外部融资,并正在考虑来自阿里巴巴和中国国有基金的投资,需要决定是专注于研究还是发展营收业务。Together公司最新一轮融资估值达33亿美元。2025年,企业将广泛采用AI智能体,需要进行AI智能体实验。Google的AI联合科学家展示了AI如何推进科学发展,以及多智能体系统的兴起,其项目展示了未来多智能体系统的模板。Sam Altman认为AI将显著加速科学发现,而AI的科学发现能力不仅仅依赖于模型本身,还依赖于多智能体系统的协作。Google的AI联合科学家是一个协作工具,旨在帮助专家收集研究资料并改进工作,而非自动化整个科学流程。Google的AI联合科学家旨在发现新的原创知识,并提出新的研究假设和方案,使用了多个专业智能体,包括生成、反思、排名、进化、邻近性和元审查智能体,并使用“锦标赛”机制对研究假设进行比较和排名。Google的AI联合科学家取得了显著成功,证明了AI加速科学研究的潜力,成功地提出了治疗急性髓系白血病的新型药物,识别出了治疗肝纤维化的新型靶点,并提出了解释细菌基因转移进化机制的新假设。多智能体系统将在未来几年得到广泛应用。

Deep Dive

Shownotes Transcript

今天在AI每日简报中,谷歌的AI共同科学家展示了不仅是科学研究的未来,也是多智能体系统的未来。在此之前,头条新闻是元宇宙AI是否会进入企业?AI每日简报是一个关于AI最重要新闻和讨论的每日播客和视频。要加入讨论,请关注我们节目说明中的Discord链接。

我们今天首先关注围绕Meta及其AI战略的一些有趣的阴谋。这是我一直密切关注的事情。我认为很多人都在想,Meta是否会试图在企业或公司领域竞争,或者他们是否只想拥有消费者AI,或者至少是消费者AI的基础和底层?

当然,Meta的核心是一家消费公司。Facebook、WhatsApp、Instagram,这些都是触及全球大部分人口的消费产品。即使他们与企业的互动也大多以向他们出售广告位来向消费者销售商品的形式出现。然而,Llama非常有趣,因为作为平台和美国开源AI领导者的先锋,Llama在企业领域拥有巨大的潜力。所以我一直在想他们是否会进军这个领域。

去年11月,Meta挖来Salesforce的Clara Shi,这使得事情变得更加有趣。她曾是Salesforce AI的CEO,加入Meta后明确地开始组建一个新的团队,为企业构建AI工具。加入Meta后,听起来她去招募了一群来自公司各地的员工,他们曾在一些关键产品上工作过。

现在的猜测是他们究竟打算做什么。信息指出的一件事是,去年他们发布了一个名为“公共参议员参与总监”的职位,负责“从零开始组建和领导一支高绩效团队,推动在联邦、州和地方政府机构中采用安全和变革性的AI解决方案”。有趣的是,就在发布该职位之前,Meta也开始允许其AI模型被美国军方使用。

目前,一切仍然非常保密,但你开始看到那种暗示他们可能会在企业领域进行更大尝试的泄密和阴谋。当然,从超级智能的角度来看,这是我们密切关注的事情,因为它绝对会成为一个参与者,并改变大型企业公司考虑其AI和代理战略的计算方法。

说到大公司,显然钱能说明问题,因为尽管多年来一直抨击微软和其他大公司,Salesforce现在正在与微软、甲骨文(他们基本上是为了颠覆这家公司而设计的)和谷歌就处理其AI的云计算交易进行谈判。

Salesforce总裁兼首席工程官本周早些时候在一次采访中表示,他们正在与微软、谷歌和甲骨文进行高级谈判,一项交易价值在未来几年超过10亿美元。Salesforce显然希望租用服务器来运行其客户管理、AI代理和其他应用程序。显然,如果你一直在关注Salesforce,那么Agent Force是该公司的重点。坦率地说,对我来说非常清楚的是,Benioff正在押上整个农场来赌Agent Force及其未来。

10亿美元当然不是小数目,但微软能否克服Benioff一直在大肆宣扬Copilot有多糟糕的事实?准备好爆米花,因为这将会变得有趣。转向初创公司领域,有点像,我不太清楚你会如何看待DeepSeek,因为它来自一家价值数十亿美元的对冲基金。但无论如何,DeepSeek作为一直在发布让每个人都兴奋不已的模型的实验室,显然正在考虑首次筹集外部资金。

这似乎是基于报道,既是机会考虑,也是约束考虑。因为它来自这家量化对冲基金,所以到目前为止它不需要筹集外部资金,但它现在的用途如此之多,以至于可能需要增加资源。该信息报告称,他们已经收到来自阿里巴巴以及许多中国国有基金的许多主动联系。其中包括中国的主权财富基金以及他们的全国社会保障基金。

更广泛地说,听起来他们正在试图考虑他们想要在多大程度上继续专注于研究并在该级别上竞争,而不是建立一个基于其产品成功的创收业务。在这个阶段,DeepSeek正式加入了对话。他们是这场AI大战中的一个参与者。我认为他们在未来几个月采取的许多下一步行动将告诉我们他们在战斗中想要占据什么位置。

最后,另一个AI独角兽轮融资。Together在其最新一轮融资中估值跃升至33亿美元。Together称自己为AI加速云,并且高度关注企业。本轮融资由General Catalyst领投,Salesforce Ventures、NVIDIA以及Aramco的风投基金也参与其中。

现在,Together在之前就已经是独角兽了。他们去年以12.5亿美元的估值筹集了1.06亿美元。但在短短几个月内将估值翻三番并非易事,尤其对于一家没有构建自己基础模型的公司而言。无论如何,这就是今天的AI每日简报头条新闻版。接下来是主要剧集。今天的剧集由Vanta赞助。信任不仅仅是赢得的,更是被要求的。

无论你是正在应对第一次审计的初创公司创始人,还是经验丰富的安全专业人员正在扩展你的GRC计划,证明你对安全的承诺从未像现在这样重要或复杂。这就是Vanta的用武之地。企业使用Vanta通过自动化合规需求来建立信任,涵盖35多个框架,如SOC 2和ISO 27001。集中的安全工作流程可以将问卷调查完成速度提高5倍,并主动管理供应商风险。

Vanta可以通过将你与审计师和专家联系起来,帮助你启动或扩展你的安全计划,以便快速进行审计并建立你的安全计划。此外,由于平台中使用了自动化和AI,Vanta可以为你节省时间,以便你可以专注于发展你的公司。加入超过9000家全球公司,例如Atlassian、Quora和Factory,他们使用Vanta实时管理风险并证明安全性。

如果2025年关于AI有一点是明确的,那就是代理即将到来。按行业划分的垂直代理、水平代理平台、基于代理的平台。

每个功能的代理。如果你正在运营一家大型企业,你明年将尝试使用代理。鉴于这有多新,我们所有人都会回到试点模式。

这就是为什么Superintelligent在今年年初提供了一款新产品。这是一项代理准备情况和机会审计。在短短几周内,我们会深入研究你的团队,了解哪些类型的代理适合你进行测试,你需要哪些类型的基础设施支持才能做好准备,并最终获得一套可操作的建议,帮助你做好准备,弄清楚代理如何改变你的业务。

如果你对代理准备情况和机会审计感兴趣,请直接联系我,[email protected]。在主题行中输入“agent”一词,以便我知道你在说什么。让我们让你成为AI市场最具活力部分的领导者。

欢迎回到AI每日简报。今天,我们将讨论一些我非常兴奋深入探讨的事情。一方面,我们正在讨论AI以及它将如何推进科学,这是一个重要的主题,事实上,也是AI领域一些领先参与者的主要动机之一。但我们还将讨论多智能体系统的出现,即代理如何走到一起,每个代理都有其各自的目的,并协调起来做更大的事情。

当我看到这条新闻并看到谷歌分享的内容时,我不只是看到了一些非常酷的科学进步,尽管我当然也看到了这一点。我还看到了未来几年将变得绝对普遍的那种多智能体系统的模板。

现在,在我们开始讨论谷歌的公告之前,让我们看看Sam Altman对科学发现和AI的看法。我对AI感到兴奋有很多原因。我们之前稍微触及过这一点。就个人而言,我最兴奋的事情是这将对科学发现产生什么影响。我相信,如果我们能够加速科学发现,我们就能在一年的时间里完成10年的科学研究,然后有一天在一年的时间里完成100年的科学研究。这将对生活质量产生什么影响,例如解决我们最紧迫的问题,应对气候变化,

使生活在各个方面都变得更好,治愈疾病,这将是一份不可思议的礼物。我认为AI最终将实现这一点。这是一个非常大胆的声明。这是Altman和其他人经常说的话。当然,对许多人的问题是,好吧,但是怎么做呢?因为有一点很清楚,那就是目前的LLM大军并没有自己进行科学发现。那么,这是关于底层模型,它们只需要更聪明吗?还是关于其他什么?

好吧,在回顾了谷歌的这项新公告后,看起来这不仅仅是关于模型。这是关于使用模型的特定代理如何协同工作。本周早些时候,谷歌在其公司博客上发布了文章,今天,谷歌正在推出AI共同科学家,这是一个基于Gemini 2.0构建的新AI系统,旨在帮助科学家创建新颖的假设和研究计划。

研究人员可以指定一个研究目标,例如,更好地了解致病微生物的传播,而AI共同科学家将提出可检验的假设,以及相关已发表文献的摘要和可能的实验方法。AI共同科学家是一种协作工具,可以帮助专家收集研究成果并改进他们的工作。它并非旨在自动化科学过程。好的,这是概述,但真正有趣的是他们在较长的博客文章中实际解释了所有这些内容。

首先,从一开始就很清楚,机会的一部分来自模型新的长期规划和推理能力。

目标非常雄心勃勃。他们写道,除了标准的文献综述、总结和所谓的深度研究工具之外,AI共同科学家旨在发现新的原创知识,并制定可证明的新颖研究假设和提案。那么它是怎么做到的呢?谷歌写道,为了做到这一点,它使用了专门代理的联盟,包括生成、反思、排名、进化、邻近性和元审查。

在他们最简单的图解中,他们展示了三个要素。首先是测试时计算,这是支持推理模型的新方法。然后他们展示了这个小组或团队的各个代理,他们都有不同的功能,由一个主管代理组织,所有这些当然都在一位科学家的领导下。最后,他们进行了一场研究创意竞赛,展示了新创意是如何提出、评估和改进的。所以让我们更深入地了解这些具体的代理。

首先当然是科学家。科学家指定用自然语言表达的研究目标。谷歌还指出,他们可以提出自己的想法和建议,并通过聊天界面进行互动,以指导整个过程中的系统。在科学家输入研究目标后,将配置研究计划,然后AI共同科学家多智能体系统生效。

首先是生成代理。生成代理包括文献探索和模拟科学辩论。在每一步中,每个代理都会引入一组新的研究假设,这些假设被放入他们所谓的排名代理锦标赛中。

谷歌这样描述这些锦标赛。研究假设比较和排名与科学辩论在锦标赛中进行。限制和顶级胜负模式被总结并作为反馈提供给其他代理。这使得研究假设生成的质量得到迭代改进,创造了一个自我改进的循环。关键在于,这种锦标赛风格的排名和审查以及不同观点的竞争发生在每个代理步骤中。

好的,首先我们有生成代理,然后我们继续进行反思代理。反思代理进行完整的网络搜索审查、模拟审查、锦标赛审查以及他们所谓的深度验证。接下来是进化代理。它的工作是从其他想法中汲取灵感,然后进行简化并进行研究扩展。最后是邻近性检查代理和元审查代理,它们最终形成研究概述,并将其发送回科学家以获得反馈。

所有这些都由主管代理组织,主管代理在不同的专门代理之间分配资源。因此,我们在这里不仅看到了共同科学家的框架,还看到了多智能体系统如何为各种不同问题工作的框架。

在他们如何决定哪些是最佳想法方面,谷歌写道,AI共同科学家利用测试时计算扩展来迭代地推理、进化和改进输出。关键的推理步骤包括基于自我博弈的科学辩论,用于新颖假设的生成,用于假设比较的排名锦标赛,以及用于质量改进的进化过程。他们继续说,自我改进依赖于从其锦标赛中得出的ELO自动评估指标。

由于它们的核心作用,我们评估了更高的ELO或ELO等级是否与更高的输出质量相关。他们发现确实如此。因此,虽然所有这些听起来都很酷,但在这些早期测试中实际结果如何呢?

好吧,首先,当专家评估来自AI共同科学家的想法时,他们发现这些想法与其他模型相比,具有更高的新颖性和影响力潜力。但他们还在药物再利用、提出新的治疗靶点以及阐明抗菌素耐药性背后的机制等现实世界实验室实验中对它们进行了测试。因此,在药物再利用方面,这基本上是关于采用现有药物并寻找超出其最初预期用途的新治疗应用。

谷歌将AI共同科学家应用于“协助预测药物再利用机会”,并发现AI共同科学家提出了急性髓细胞白血病的新型再利用候选药物。谷歌写道,随后的实验验证了这些提议,证实建议的药物在多种AML细胞系中以临床相关浓度抑制肿瘤活力。

接下来,他们转向比药物再利用更复杂的识别新的治疗靶点。他们专注于肝纤维化,AI共同科学家鉴定了具有显着抗纤维化活性的表观遗传靶点。他们再次取得了很大的成功,甚至表示这些发现将在斯坦福大学合作者领导的一份即将发布的报告中详细介绍。

最后,在他们的第三次验证测试中,他们试图提出假设来解释与抗菌素耐药性相关的细菌基因转移进化机制。对于这项测试,研究人员指示AI共同科学家探索一个他们的团队已经进行了新发现但尚未公开的主题。虽然这里的术语如此密集以至于我甚至不会深入探讨,但这个的TLDR是AI共同科学家能够独立地提出一个

已经取得但尚未公开的发现。这就是三个非常深刻的成功案例。这使得Ethan Malik教授说,我们开始看到AI将如何加速科学研究。这令人难以置信地令人兴奋。然而,正如Rohit在这里指出的那样,更有趣的是,这是一种使具有工具的多个LLM在实践中真正发挥作用的方法。

我非常非常兴奋地继续关注谷歌在这个特定研究领域以及谷歌AI共同科学家方面能够做什么。但我同样兴奋地看到,更广泛地说,这些类型的多智能体系统能够真正部署并完成真正有趣和新颖的事情。我认为2025年甚至2026年的大部分时间都将花在关于特定任务或特定工作流程的非常离散的代理实验上。但真正有趣的是这些多智能体系统。谁知道呢,也许这会比我想象的更快发生。

目前,这就是今天的AI每日简报。下次再见,和平。