欢迎回到AI每日简报头条新闻版,所有您需要的每日AI新闻,大约五分钟内即可看完。
我们今天首先关注一些融资新闻。游标开发商AnySphere即将完成一轮新的融资,这将使该公司估值达到100亿美元。彭博社报道称,Thrive Capital预计将领投此轮融资,增加其在该公司中的持股比例。现在,有一段时间以来,Cursor似乎是AI创业热潮中的大赢家或至少是领导者之一,但这些数字确实说明了其成功的空前程度。
假设这笔交易达成,Cursor将从其B轮融资实现4倍的增长,B轮融资于去年12月以25亿美元的估值完成。而那轮融资本身也比其A轮融资增长了6.5倍,A轮融资于8月以4亿美元的估值完成。
收入增长真正说明了问题。据报道,Cursor在8月份的年化收入为2000万美元,到12月份增长了5倍达到1亿美元,目前年经常性收入(ARR)已达到1.5亿美元。目前的市销率为66倍,高于B轮融资时的25倍。
也就是说,对于那些有胃口的人来说,即使从历史上看风险投资的历史,也很少有机会投资这种类型的增长。AnySphere在其旗舰产品推出仅18个月后就实现了1亿美元的年经常性收入。这使他们处于极其稀有的领域。
大多数Cursor爱好者都对这笔交易感到兴奋。Linear首席执行官Kari Sarenin写道,增长显示了将设计良好且有目的的AI集成到现有产品范例中的力量。AI原生空页面加聊天框的方法可以奏效,但它往往远离专业人士和企业实际需要的实用工作流程。关键是,与许多代码生成工具不同,这款工具是专门为开发人员设计的,用于将AI集成到其现有流程中。
与此同时,一些人对市销率持怀疑态度。Autograph首席执行官Hari写道,我知道很多工程团队已经开始转向其他工具。66倍的年经常性收入市销率对于增长率来说是合理的,但这并不是年经常性收入。更像是试点收入。我希望Cursor的创始人、员工和早期投资者能够获得一些二级市场收益。最终,简而言之,Cursor现在非常热门,投资者更关心的是进入市场而不是过度支付。
继续关注这个炙手可热的代码生成主题,谷歌DeepMind的两名顶级研究人员推出了一家致力于开发下一代代码代理的新公司。该公司Reflection AI于上周末秘密成立,宣布获得2500万美元的种子轮融资和1.05亿美元的A轮融资。红杉资本和CRV领投种子轮融资,而Lightspeed Ventures和CRV领投A轮融资。
Reid Hoffman、Scale.ai首席执行官Alexander Wang、SV Angel和英伟达都参与了投资,使该公司估值达到5.55亿美元。两位创始人之前曾领导过Gemini的强化训练,并帮助创建了AlphaGo,AlphaGo当然是突破性的AI,第一个在围棋比赛中击败人类专家。该公司的目标是创建自主编码代理,创始人希望这将成为通往超级智能的道路上的一个步骤。
该公司首席执行官Misha Laskin表示:“……这是我们十多年来一直在思考的问题。我们的团队率先开发了强化学习和大型语言模型,我们认为现在是时候将这两项进步结合起来,并构建一个实用的超级智能,它将在计算机上工作。”Reflection已经拥有付费客户,这些客户来自拥有大型编码团队的领域,例如金融服务和科技行业。在这个阶段,该产品专注于取代编程中最繁琐的工作,例如迁移软件数据库和重构代码。
Lightspeed合伙人Rivieres Jane表示:“我认为这并不是要取代工程师的工作。我认为更多的是,工程师不再做苦力活,他们将成为监督大量自主代理的架构师。如果您对这种思维方式感兴趣,请查看我大约一周前发布的关于代理工作的奇异博士理论。”
转向大型科技公司,苹果公司承认AI Siri不会很快到来。Daring Fireball的John Gruber报道了这一消息,发布了公司发言人的声明,声明写道:“Siri帮助我们的用户找到他们需要的东西,并快速完成任务。仅在过去六个月中,我们使Siri更具对话性,引入了诸如键入Siri和产品知识等新功能,并增加了与ChatGPT的集成。我们还一直在努力开发更个性化的Siri,使其更了解您的个人环境,以及能够在您的应用内和跨应用为您采取行动。”
“交付这些功能所需的时间比我们想象的要长,我们预计将在未来一年内推出这些功能。”该博客的作者John Gruber评论说,这是一个周五式的“哇哇”悲伤长号新闻发布。他补充说,从字里行间来看,他的感觉是AI Siri被推迟到明年的iOS 19,而不是今年推出。彭博社在内部消息来源的帮助下,更强有力地报道了这一消息。他们声称,“AI部门出现了新的动荡”。
老实说,鉴于他们落后得如此惊人,那里应该出现动荡。彭博社此前曾报道称,为了争取在今年推出Siri的新版本,苹果公司正在努力修复错误,但他们现在报道称这些努力没有成功,并补充道:“在最新延迟之前,软件主管克雷格·费德里吉和其他高管在内部表达了强烈担忧,认为这些功能在内部测试中无法正常工作或按广告宣传的那样工作。”苹果AI部门的一些人认为,对这些功能的工作可能完全被取消,苹果公司可能不得不从头开始重建这些功能。
然后,这些功能将被推迟到苹果公司希望在2026年开始推出的下一代Siri。彭博社还收到了一份于周五发布给AppleCare支持人员的泄露备忘录,该备忘录写道:“……如果客户询问这些Siri功能的时间安排,请重申我们预计将在未来一年内推出这些功能。”请记住,AI Siri几乎是最新款iPhone的核心销售宣传,这意味着对于许多提出问题的客户来说,这将不是一个特别令人满意的解释。
作为计划不按计划进行的最终承认,苹果公司显然已从YouTube上撤下了iPhone 16的广告。该系列广告以用户要求Siri说出几个月前与他们共进晚餐的人的名字、回忆和总结一次推介会以及创建生成式视频回忆为特色。苹果智能在首次发布广告九个月后,完全没有这些功能。太残酷了,伙计。我不是在反对这家公司。我使用的所有产品基本上都是苹果产品,但他们必须团结起来。
无论如何,目前,这就是今天的AI每日简报头条新闻版的全部内容。接下来是主要内容。今天的节目由Vanta赞助。信任不仅仅是赢得的,更是被要求的。
无论您是正在进行首次审计的初创公司创始人,还是经验丰富的安全专业人员正在扩展您的GRC计划,证明您对安全的承诺从未像现在这样重要或复杂。这就是Vanta的用武之地。企业使用Vanta通过自动化超过35个框架(如SOC 2和ISO 27001)的合规性需求来建立信任。集中的安全工作流程可以将问卷调查完成速度提高5倍,并主动管理供应商风险。
Vanta可以通过将您与审计师和专家联系起来以进行审计并快速建立您的安全计划来帮助您启动或扩展您的安全计划。此外,由于平台中使用了自动化和AI,Vanta可以为您节省时间,让您可以专注于公司建设。加入超过9000家全球公司(如Atlassian、Quora和Factory),他们使用Vanta实时管理风险并证明安全性。
在有限的时间内,本观众可以享受Vanta的1000美元折扣,网址为vanta.com/nlw。即v-a-n-t-a.com/nlw,可享受1000美元的折扣。目前正在发生巨大的转变,从使用AI来帮助您完成工作
到部署AI代理来为您完成工作。当然,在这种转变中,有很多复杂之处。首先,在这些看似数千个代理中,哪些实际上已经准备好投入使用?哪些可以做到他们承诺的事情?除此之外,哪些代理实际上适合我的工作流程?什么可以与我们目前的工作方式集成?这些是超级智能代理准备情况审计的核心问题。
我们构建了一个语音代理,可以扩展到您的整个团队,映射您的流程,更好地了解您的业务,找出您目前在AI和代理方面的现状,以便提供真正适合您和您公司的建议。
我们专有的代理咨询引擎和代理功能知识库将为您提供行动计划、建议和具体的后续行动,这将帮助您迈出进入新的代理员工世界的新一步。要了解有关Super的代理准备情况审计的更多信息,请发送电子邮件至[email protected],或直接给我发送电子邮件,[email protected],让我们为您设置我们一生中最具颠覆性的技术。欢迎回到AI每日简报。如果
如果您想了解DeepSeek对AI行业集体心理的影响程度,那么过去几天围绕Manus进行的对话提供了一些非常有趣的见解。
DeepSeq当然从根本上改变了人们对中美AI之间关系以及美国AI公司发展速度的看法。换句话说,认为它太慢了。它还真正强化了让普通用户都能使用最先进的推理模型在公众认知方面将有多么重要。DeepSeq暂时领先于ChatGPT和App Store的部分原因是他们在这个免费级别上提供了对先进推理模型的访问。
当然,DeepSeq成为一个超越AI构建者的时刻的另一个原因是,他们仅用550万美元就训练了这个模型。
这个消息恰逢华尔街试图弄清楚AI基础设施是否被过度建设,主要调整最终即将到来之际。显然,这些问题仍未解决。与此同时,人们更加密切地关注来自中国的东西,不仅是为了看看它落后多少,而是为了根据其是否可能拥有完全不同和更先进的东西来判断。这就是Manus发生的时刻的背景。
周末,一个名为Manus的新代理完全病毒式传播。该项目的Discord用户激增至13.8万,一些人报告说邀请码在中国社交媒体平台上的售价高达数千美元。演示展示了一个能够执行以下任务的计算机使用代理:从头开始构建网站、计划旅行、分析金融市场并生成报告、为教师设计互动课程,以及
以及比较保险单和协助业务采购。在病毒式传播的演示视频中,创始人Yichao-Pik Ji表示:“Manus不仅仅是另一个聊天机器人或工作流程。它是一个完全自主的代理,弥合了构思和执行之间的差距。我们认为它是人机协作的下一个范例。”Manus团队还声称在Gaia基准测试中排名第一,在AI自主性、问题解决工具使用和网络交互方面击败了所有竞争对手。一旦人们上手使用,好评如潮。
事实上,我认为用“屏息”来形容人们最初谈论这个话题的方式是合适的。The Rundown的Rowan Chong写道:“我认为中国的第二个DeepSeek时刻到了。这个名为Manus的AI代理现在在中国疯狂病毒式传播,可能只是时间问题它就会登陆美国。它就像深度研究加上操作员加上云计算相结合,而且非常好。”
现在,正如我们稍后会提到的那样,Rowan也明确表示这不是任何形式的有偿推广。他继续说道:“我们注意到Manis在The Rundown上获得了一些关注,并在今天早上的新闻通讯中对此进行了报道。发布后不久,一位联合创始人联系我们并提供了一个邀请码。所以我放下早上的工作并试用了它。”Rowan的测试包括创建关于他自己的传记以及基于该传记部署网站。他说,这些信息100%准确,信息更新至今日。然后他还尝试了许多其他测试。
Dean Ball写道:“称Manus为DeepSeek时刻是错误的。DeepSeek是关于复制美国公司已经公开实现的能力。Manus实际上正在推进前沿。现在最复杂的计算机使用AI来自中国初创公司,仅此而已。”Bilal Sidhu写道:“我测试了Manus AI。这是我体验过的最接近真正自主AI代理的东西。我迫不及待地想让这个东西可以使用Premiere和Photoshop等桌面应用程序。它低调地感觉像是婴儿AGI。”
Menlo Ventures的Didi Das写道:“Manus,这款每个人都在谈论的新AI产品,值得炒作。这就是我们承诺的AI代理。深度研究、操作员、计算机使用、可爱、记忆。顺便说一句,可爱是一个代码生成器,如果您想知道的话,它已经变得非常流行。”Didi继续说道:“我要求它对特斯拉股票进行专业分析,它在大约一小时内完成了大约两周的专业级工作。”
最有趣的推文之一来自McKay Wrigley,您可以看到他在整个推文中越来越兴奋。他开始写道:“观看我第一次使用Manus的14分钟演示。它好得令人震惊。现在想象一下,在两到三年后,它的智商超过180,永不停歇地工作,速度快10倍,并且由数千个群体运行。AGI即将到来。预计会有快速进展。”
他继续说道,
然后他后来继续说道。好的,在进一步使用后,我加倍下注。如果OpenAI发布一个名为DeepTask的等效产品,并每月收取1000美元的无限使用费,我会在两秒钟内付费,根据我首选的技术栈从最新版本创建完整的研报和规范。WTF。接下来,他写道,好吧,我开始有点害怕了。我可能低估了这一点。LMAO,它正在根据最新的文档编写逐字的逐步指南,其中包含所有内容的代码。
最后,他写道,毫不夸张地说,我对这件事非常认真。我认为这段经历改变了我的一些世界观。这基本上是我想象中体验AGI的80%。我以为这将是虚拟产品,现在我却陷入了生存危机。现在McKay还指出,幕后是Claude 3.7 sonnet。换句话说,Maneth并没有发明我们尚未接触到的新模型。几分钟后,当我们更深入地进行分析时,这将变得很重要。
Brian Romley总结道:“我们刚刚从聊天AI时代转向代理AI时代。中国的DeepSeek R1 AI时刻震撼了世界,现在我们有了Manus时刻。但如果这是Manus时刻,那实际上意味着什么?”
在我看来,Manus时刻(如果我们称之为Manus时刻的话)并不是关于中国赶上美国或中国超越美国。相反,它是关于人们看到真正代理体验将是什么样的第一次表达。代理当然是在AI的这个阶段每个人口中出现的每一个词,但我们仍然非常非常处于其能力的初期阶段。
我们能够接触到的代理类型体验,特别是OpenAI的深度研究,确实已经开始让一些人了解它们将会有多么不同。在很多方面,我认为将Manus视为深度研究并不准确,但它适用于所有事物,而不仅仅是研究。这里真正重要的一点是,创新并非如我所提到的那样与底层模型有关。而是关于这些部分是如何组合在一起的。
Ethan Malek教授写道:“……当前前沿的大型语言模型非常好,即使是制造它们的实验室也没有完全探索它们的能力。对神秘的新大型语言模型等待太多,对我们所拥有的东西推动太少。”我认为这是对Manus这里发生的事情的非常准确的描述。Manus已将这些大型语言模型嵌入到一个UI中,该UI允许它们真正推动,既可以被其操作员推动,也可以推动自己实现更多目标。
Aidan McLaughlin写道:我认为这是一个非常重要的观点。从现在开始,我们将与之交互的大量内容将是一个体验或数据包装器,它位于底层模型之上。
许多感觉最具创新性和解锁性的东西,并不是因为模型性能的提高,而是因为用户体验的具体组合方式。.005seconds写道:“整个Manus AI事件展示了许多人已经内化的内容。”
这些模型已经达到AGI级别。最后一步是如何很好地构建感知、上下文记忆和for循环。如果您认真对待在AI领域构建任何东西,您需要立即将此内化。模型将变得更好、更智能、更密集、更快、更便宜、多模式、更大的上下文、更准确。明年每个令牌的成本将下降90%。没有可能使用成本或能力使大型语言模型的体验变得不可行的,这种情况将在12个月内持续下去。您不应该使用今天的能力进行构建,而应该使用明年的能力进行构建。
疯狂的是,你甚至不需要这样做。当前的模型被严重低估了。我们目前正在经历AI开发中的人类创造力不足。我们构建包装器的速度不够快。用户体验、上下文管理、内存集成、工具使用。这些是你的护城河。
我认为这就是重点。当您开始深入研究并超越第一波分析时,您还可以找到像AI for Success这样的平衡点,他们写道:“在尝试使用Manus的过去三天后,我的诚实意见。以下是优点和缺点。优点是它对互联网进行的研究以及它生成的报告令人难以置信。它能够在幕后运行脚本来执行任务令人印象深刻。它创建的实现任务的计划结构合理,这就是最终结果如此好的原因。但缺点是?它很慢,但我猜他们可以扩展。它可以使用更长的上下文窗口,这将大有帮助。”
由于上下文问题,它在处理编码任务时会中断。有时第二次迭代效果不佳,它只是停留在网络搜索或某些任务上,难以控制。最后,编码能力不错,但仍然落后于Sonnet 3.7。最终,这些都不重要,对吧?关键是,人们正在对一个不像深度研究那样受约束的代理助手将带来什么样的感觉有一个心理上的突破。
现在,谈到病毒式爆发,Manus显然足够聪明,能够理解DeepSeek已经创造了一个人们等待另一只鞋落地的情况。换句话说,人们正在等待所谓的下一个DeepSeek。关于这在全球地缘政治和竞争性讨论中所说的内容,可能还有很多需要解释。但我认为,当事情来临时,Manus时刻实际上与中国无关。它与DeepSeek 2.0无关。相反……
它是关于真正的多用途代理1.0。这不是DeepSeek时刻,而是ChatGPT时刻,人们以一种在看到它之前无法想象的方式体验了可能性。对于你们所有在外面的人来说,疯狂的是,这仅仅是一个开始。我预测,仅仅几个月后,我们现在称之为Manus的代理将显得古色古香、几乎没有自主性、计划不成熟,并且与我们正在使用的代理相去甚远。
但我们总是记得那些最初的时刻。对许多人来说,这正是Manus刚刚给予他们的东西。如果您使用过Manus,请告诉我们您的看法。Spotify和YouTube评论均已开放。不过,目前,这就是今天的AI每日简报的全部内容。下次再见,和平。