今天在AI每日简报中,我们终于了解了GPT-5将会是什么样子。在此之前,在新闻头条中,Anthropic预测了一些严重的收入增长。AI每日简报是一个关于AI最重要新闻和讨论的每日播客和视频。要加入讨论,请关注我们节目说明中的Discord链接。♪
欢迎回到AI每日简报头条新闻版,所有您需要的每日AI新闻,大约五分钟即可看完。事实证明,Anthropic预计未来几年将实现极其快速的增长。正如我们之前讨论的那样,这家初创公司目前正在争取投资者,并为此分享了一些相当令人瞠目的预测。
根据《The Information》获得的泄露文件,该公司的基本情况是到2027年收入达到120亿美元。这将比去年的数字有大幅跃升,去年的数字估计约为6亿美元。他们还给出了一个乐观的预测,显示该公司到2027年收入将达到345亿美元。这将代表着对OpenAI的巨大追赶,OpenAI去年的收入是Anthropic的五倍,但仅仅(此处应加引号)预测2027年收入为440亿美元。
现在,我认为,比预测本身更有趣的是他们认为增长将来自哪里。该公司在过去一年中经历了显著增长。他们2023年的年收入约为1亿美元,月收入从去年1月的800万美元增长到12月的8000万美元。推动这一增长的一个重要因素是AI编码工具的普及,特别是Cursor的使用激增,许多人(如果不是大多数人)通过它使用Cloud 3.5 Sonnet。
无论出于何种原因,该模型似乎只是在编码助手方面首选的模型。这显然是目前AI的一个巨大的、巨大的用例。
关于这笔收入将来自何处,Anthropic表示,他们预计到2027年API收入将达到200亿美元,是OpenAI当年API收入预测的三倍。即使在其基本预测中,他们的API收入也超过了OpenAI的API收入。就融资细节而言,Anthropic似乎正试图以580亿美元的估值筹集20亿美元。
尽管如此,目前这些公司都在烧钱。Anthropic预计今年将烧掉30亿美元,这将大大少于去年的56亿美元。这些公司对未来的看法很有趣。另一个与Anthropic相关的新闻是,该公司首席执行官达里奥·阿莫代伊敦促人工智能研究人员加快对人工智能的理解。
本周早些时候,他称巴黎人工智能峰会错失良机,并敦促,“鉴于技术发展速度,需要对几个主题给予更多关注和紧迫感”。关于他的评论,有趣的一点是他试图摆脱将人工智能政策描绘成一方面是安全,另一方面是机遇的斗争的二分法,正如副总统J.D. Vance当然已经阐述的那样,而是有效地主张加速研究和思考治理方面的问题。
也就是说,他不是希望减缓技术发展速度,而是希望加速围绕技术的所有事情。在一个面向开发者的分会场活动上,他说:“这绝对是一场竞赛。这是一场关于使模型更强大的竞赛,这对我们来说非常快,对其他人来说也很快,而我们的理解必须跟上我们构建事物的能力。”
暂时转向大型科技公司,即使是到目前为止有些令人失望的苹果智能功能也无法在中国iPhone用户中使用。这是因为中国要求苹果与其在iPhone型号上的本地制造商合作,而他们一直在选择该合作伙伴。他们最初显然选择了百度,但该公司难以将其大型模型适应iPhone使用。随后,他们审查了许多公司,显然包括DeepSeek和字节跳动,但最终决定与阿里巴巴合作。
他们当然希望这能推动销售额增长。在上个月的财报电话会议上,首席执行官蒂姆·库克将中国销售额下降11%归咎于缺乏苹果智能功能。关于苹果的另一个有趣的新闻。根据长期关注苹果的内部人士郭明錤的说法,苹果公司正在“探索其未来智能家居生态系统中的人形和非人形机器人”。他说,这些产品可能仍处于概念验证阶段,因此最早也要到2028年才能实现量产。
虽然许多机器人公司都在争论人形与非人形设计的优缺点,但苹果似乎有不同的想法。您可能在上周看到苹果分享的一个演示视频,其中展示了一盏机器人台灯。借鉴皮克斯的风格指南,这盏台灯具有类似人类的动作和姿态。演示显示,当一个人在桌子上移动书本时,台灯会跟随,而用户也可以挥手引起台灯的注意,并示意它指向墙壁。
在随附的研究论文中,苹果将其描述为非拟人化设计。其逻辑是,一个像人类一样对姿势做出反应的机器人可以比语音命令提供更自然的UX。
最后,我们今天总是关注公司如何尝试将芯片内部化。在这方面,Meta正在洽谈收购韩国芯片初创公司Furiosa AI。据福布斯报道,这项收购最早可能在本月宣布。Furiosa由前三星和AMD员工于2017年创立。他们开发的推理芯片可以加快Meta模型的性能。Furiosa声称其RNGD芯片的每瓦性能是英伟达H100的三倍。
就是这样。这就是今天的头条新闻。接下来是主要内容。今天的节目由Vanta赞助。信任不仅仅是赢得的,更是被要求的。无论您是正在进行首次审计的初创公司创始人,还是经验丰富的安全专业人员正在扩展您的GRC计划,证明您对安全的承诺从未像现在这样重要或复杂。这就是Vanta的用武之地。
企业使用Vanta通过自动化合规需求来建立信任,涵盖35多个框架,例如SOC 2和ISO 27001。集中的安全工作流程可以将问卷调查完成速度提高5倍,并主动管理供应商风险。Vanta可以通过将您与审计师和专家联系起来以进行审计并快速建立您的安全计划来帮助您启动或扩展您的安全计划。此外,由于平台中使用了自动化和人工智能,Vanta可以为您节省时间,让您可以专注于公司建设。
加入超过9000家全球公司,例如Atlassian、Quora和Factory,他们使用Vantage实时管理风险和改进安全。
在有限的时间内,本观众可以获得Vanta的1000美元折扣,网址为vanta.com/nlw。即v-a-n-t-a.com/nlw,可享受1000美元的折扣。如果2025年AI有一点明确的事情,那就是代理即将到来。按行业划分的垂直代理,水平代理平台。
每个功能的代理。如果您正在运营一家大型企业,您明年将尝试使用代理。鉴于这是多么新颖,我们所有人都会回到试点模式。
这就是为什么Superintelligent在今年年初提供了一项新产品。这是一项代理准备情况和机会审计。在短短几周内,我们将与您的团队深入探讨哪些类型的代理适合您进行测试,您需要哪些类型的基础设施支持才能做好准备,并最终获得一套可操作的建议,让您准备好弄清楚代理如何改变您的业务。
如果您对代理准备情况和机会审计感兴趣,请直接与我联系,[email protected]。请在主题行中加上“代理”一词,以便我知道您在谈论什么。让我们让您成为AI市场最具活力部分的领导者。您好,AI每日简报听众。快速休息一下,分享一些来自KPMG最新AI季度脉搏调查的非常有趣的发现。
您知道吗?67%的商业领袖预计人工智能将在未来两年内从根本上改变他们的业务?然而,并非一帆风顺。他们面临的最大挑战包括数据质量、风险管理和员工采用等问题。KPMG处于帮助组织克服这些障碍的最前沿。他们不仅仅是在谈论人工智能,他们正在通过切实可行的解决方案和实际应用来引领潮流。
例如,超过一半的受访组织正在探索使用AI代理来处理行政事务和呼叫中心运营等任务。因此,如果您希望在AI领域保持领先地位,请关注KPMG。他们不仅仅是对话的一部分,他们正在帮助塑造它。了解KPMG如何在kpmg.com/US推动AI创新。
好了,朋友们。基本上在整个2024年,一个大问题是何时才能获得GPT-5或至少GPT-4.5?
当ChatGPT于22年11月首次推出时,仅仅几个月后我们就得到了GPT-4,然后在整个2023年,GPT-4一直领先于其他人,大多数人都预期,随着世界其他地区在2024年初赶上GPT-4,OpenAI将再次凭借GPT-5或至少GPT-4.5领先一步。
当然,这从未发生过,相反,我们在年底得到了一种实际上不同的模型方法,OpenAI称之为推理模型。我们得到了O1的早期版本,OpenAI开始在Reddit AMA等地方表示,他们真的将加倍努力开发推理模型作为未来的方法。
现在,在此期间,我们得到了数百万个不同的名称,GPT-4.5、GPT-5、Orion、O1。看来奥特曼和OpenAI已经决定,在复杂性和混乱方面已经足够了。他们只想真正透明地说明事情的走向。
在本周三,奥特曼在X上写道:“我们希望更好地分享我们预期的路线图,并更好地简化我们的产品。我们希望人工智能能够为您服务。我们意识到我们的模型和产品已经变得多么复杂。我们和您一样讨厌模型选择器,并希望回归神奇的统一智能。”顺便说一句,模型选择器是顶部的东西,现在有GPT-4-0、带计划任务的GPT-4-0、01、03-mini、03-mini-high、01-pro模式、GPT-4-0-mini和GPT-4。
回到萨姆,他写道:“我们将接下来发布GPT-4.5(我们在内部称之为Orion的模型)作为我们最后一个非思维链模型。换句话说,作为我们最后一个非推理模型。之后,我们的首要目标是通过创建能够使用我们所有工具、知道何时长时间思考或不思考以及通常对非常广泛的任务有用的系统来统一O系列模型和GPT系列模型。”
在ChatGPT和我们的API中,我们将发布GPT-5作为一个集成了我们许多技术(包括O3)的系统。我们将不再将O3作为独立模型发布。ChatGPT的免费层将获得对标准智能设置下的GPT-5的无限聊天访问权限,此外,订阅者将能够在更高水平的智能下运行GPT-5,而专业订阅者将能够在更高的智能水平下运行GPT-5。这些模型将包含语音、画布搜索、深度研究等功能。
好了,这就是具体的更新。第一个回应也许是对这个并没有真正澄清事情的戏谑式玩笑。彭博社的乔·魏森索尔写道:“OpenAI知道它的模型产品对人们来说令人困惑。未来,OpenAI将通过GPT-4.5 Orion(最终的非思维链模型)和GPT-5(包括O3在标准和专业智能层,具有语音画布搜索和深度研究功能)来简化它。”尽管如此,这里还是有两件非常重要的事情。
首先,我们终于在几周内就能获得GPT 4.5,这是人们真正期待的事情。是的,推理模型已经开启了新的功能,但是非推理模型仍然有很多事情做得更好,但是人们仍然希望看到性能的提升。
此外,关于模型选择器是一种糟糕的用户体验,并希望简化它,我认为这本身就是正确的,即使对于非常了解这一点的人来说,也必须为每个不同的任务选择这些不同的模型,这并不是一个很好的体验,尽管它确实为您提供了很多精确的灵活性以及能够针对不同的提示测试不同的模型。但是,转向简化也反映了ChatGPT在其主流吸引力方面的定位。
ChatGPT现在是美国访问量第六高的网站。它是一个主要的消费产品,而不仅仅是企业产品。它具有“洁柔”式的品牌,对许多人来说,人工智能实际上就是ChatGPT。这就是他们所说的AI。这种简化的推动表明,这是一个他们真正希望确保能够理解并充分利用这些核心工具的受众。
我认为,所有级别的订阅者都将能够访问最先进的模型,而不仅仅是付费的用户,这证实了这一点。你必须认为,“只需工作”的想法也与DeepSeek的发布有关,DeepSeek的应用程序(包括其得出结论的方式的透明度)变得非常流行,甚至取代了ChatGPT在App Store排行榜上的位置。请记住,在DeepSeek应用程序中,用户会看到一个功能强大的推理模型,其性能远远超过他们在使用ChatGPT免费层时的体验。
然而,转向技术方面,我认为从战略上讲,这有一些非常有趣的地方,尽管我认为这一举动并非出乎意料。当首次推出O1时,它非常明确地被呈现为AI模型的一个独立分支。这不是GPT-4.5。这是不同的东西。至少当时,其意图似乎是继续同时沿着这两个分支发展。
现在,对于那些密切关注的人来说,不久之后,这似乎朝着不同的方向发展,就像我说的那样,Reddit AMA似乎表明该公司比以前的方法更关注推理模型。当然,所有这一切背后都隐藏着一个问题,即预训练作为一种扩展策略是否已经达到了瓶颈。
谷歌的Gemini 2.0 Pro是过去几个月发布的唯一一款没有推理功能的旗舰LLM,它并没有显示出性能的飞跃。GPT-4.5或XAI的Grok 3可能会证明这个论点是错误的,但这可能是这些实验室只是决定他们正在接近其预训练扩展能力的极限。这使得这些推理模型或测试时计算模型成为未来模型改进的新型大型扩展向量。
同样,对于那些密切关注的人来说,他们已经尝试过为不同级别的订阅者提供不同级别的测试时间计算,从而提供不同级别的模型性能。具体来说,O3 Mini具有低、中、高三种智能设置,对应于更长的推理时间。
许多人的一个问题是体验的整合。在讨论GPT-5将成为一个统一模型的想法时,节目的朋友Swix问OpenAI的凯文·惠尔:“在GPT-5中,GPT和O在幕后仍然是独立的模型,你正在制作一个模型路由器吗?或者它们将以更实质性的方式统一起来?”凯文回答说:“统一。”
这正是Swix一直希望看到的。他说:“我觉得最糟糕的时间线是其他人似乎正在走向的时间线,那就是训练不同的模型并使用模型路由器来创造AGI的表象。GPT-5似乎正在进行O5+GPT-5合并,而不仅仅是推理器与非推理器的简单路由器。如果发布更多细节,这将是令人兴奋的架构工作。”
这里也有一些非常有趣的技术挑战。自动为给定的查询选择最佳推理时间,而不是将此选择留给用户,这需要一些设计。Meta最近在这个主题上做了一些学术工作,尽管即使这似乎也相当初步。
现在,OpenAI的模型可用性似乎也发生了转变。再一次,这感觉像是反映了来自其他公司(包括Deep Research)的压力。直到最近,最新的模型大多都受到订阅的限制。事实上,对于他们的一些高端功能(如深度研究),这些功能甚至被限制在每月200美元的专业层。相应地,
在回应有人说深度研究对他们来说每月价值1000美元时,奥特曼昨天评论道:“我认为我们将最初为ChatGPT Plus提供每月10次使用,为免费层提供每月2次使用,并打算随着时间的推移扩大规模。对某些用户来说,它可能确实值每月1000美元,但我对每个人都能用它做什么感到兴奋。”基本上,这似乎表明,未来,该公司将努力尝试在至少在经济上稍微合理的情况下,让每个人都能访问最先进的智能,即使不是全部。
有些人喜欢这种情绪。谷歌AI工作室产品负责人洛根·基尔帕特里克写道:
因此,正在进行2.0闪速思考。然而,DeepRider AI的Garrett写道:
大概正确地整合GPT-5意味着实际上能够同时处理这两个用例,但这确实反映了对推理模型优先于其他所有事物的担忧。然而,这显然是正在发生的事情。伊桑·马莱克教授写道:“似乎越来越多的证据表明,不是推理器的LLM将会消失。OpenAI的明确声明、关于该主题的学术研究、Gemini 2.0 Pro以及显然Grok 3似乎都被其推理AI表亲超越的事实等等。”
对于那些没有密切关注的人来说,这并不重要。他们只会知道AI变得更好。这就是我们得到的更新。有趣而令人兴奋的事情。就像我说的那样,我是那些非常兴奋地获得实际的GPT-4.5并查看它如何改进我们拥有的许多日常用例的功能的人之一,这些用例不需要推理方法。当然,一旦可用,我们将深入研究、测试并与您分享我们的发现。
不过,现在,这就是今天的AI每日简报。一如既往地感谢您的收听或观看。直到下次,再见。