NVIDIA's Nemotron model family represents a significant step in democratizing AI development by offering models in three sizes for various use cases, from edge device inference to frontier model tasks. These models are fully open-sourced, with text-based models fine-tuned from Meta's LLaMA, enabling competition on price and accessibility across agentic AI applications.
Project Digits is a compact AI workstation that delivers a petaflop of AI compute, capable of running inference for models up to 200 billion parameters. Priced at $3,000, it makes high-performance AI prototyping and fine-tuning accessible to data scientists, researchers, and students, effectively placing an AI supercomputer on their desks.
NVIDIA has released blueprints for AI orchestration, designed to guide agents through specific tasks and coordinate multiple agents. These blueprints, developed in partnership with companies like Langchain and Llama Index, aim to make agent deployment faster and more efficient, addressing complex workflows such as code documentation and video analysis.
NVIDIA's video analysis blueprint enables high-quality video analysis 30 times faster than real-time, with applications in industrial process monitoring and defect detection. With over 1.5 billion enterprise cameras globally recording 7 trillion hours of video annually, this technology can significantly reduce losses from undetected defects and improve operational efficiency.
NVIDIA is expanding beyond chip manufacturing by offering a comprehensive ecosystem for AI development, including agent models, orchestration tools, and hardware like Project Digits. This shift aims to make AI deployment frictionless across industries, driving demand for NVIDIA's AI chips while positioning the company as a leader in AI innovation.
Anthropic's $60 billion valuation, up from $18 billion, reflects investor confidence in its enterprise market share growth and potential to compete with OpenAI. Despite trailing OpenAI in revenue ($875 million vs. $3.7 billion), Anthropic's focus on enterprise adoption and future model advancements has driven its valuation surge.
The U.S. government's comfort level with AI infrastructure investments in the Middle East is crucial due to the region's strategic position between the U.S. and China. Investments like Microsoft's in G42 highlight geopolitical tensions, while deals like the $20 billion data center investment by an Emirati billionaire in the U.S. underscore the importance of private sector-led infrastructure development.
Microsoft's $3 billion investment in AI infrastructure in India, coupled with plans to train 10 million people in AI, aims to accelerate AI adoption and skill development in the country. This aligns with India's growing role as a hub for AI innovation and reinforces Microsoft's commitment to global AI diffusion.
NVIDIA's AI chips are improving 30 times faster than Moore's Law, driven by innovations across architecture, chip design, system integration, and algorithms. This rapid advancement is critical for reducing inference costs and enabling broader AI adoption across industries.
NVIDIA's open-source approach, exemplified by the Nemotron model family, is likely to accelerate the commoditization of AI models. By offering competitive pricing and accessibility, NVIDIA is driving a price war among AI labs, making advanced AI tools more widely available and fostering innovation across the industry.
在今天的AI每日简报中,英伟达首席执行官在CES上宣布了AI代理时代已经到来。在此之前,在新闻头条中,Anthropic公司以600亿美元的估值筹集了新的资金。AI每日简报是一个关于AI最重要新闻和讨论的每日播客和视频。要加入讨论,请关注我们节目说明中的Discord链接。
欢迎回到AI每日简报头条新闻版,所有您需要的每日AI新闻,大约五分钟即可看完。不出所料,AI公司巨额融资的趋势似乎将持续到2025年,最新一轮融资似乎是为Anthropic公司准备的。
据熟悉这轮投资的人士透露,该公司正在讨论以600亿美元的估值筹集约20亿美元资金。这轮融资似乎由Lightspeed Ventures领投,代表着其估值的大幅跃升。该公司上一轮融资的估值为180亿美元,由Menlo Ventures领投。基本上,自从OpenAI在10月份进行巨额融资,估值达到1570亿美元以来,这些大型基础模型公司的融资就一直很活跃。
最初,我们看到Anthropic的估值在400亿到500亿美元之间,但随后Elon的xAI的估值也达到了这个水平。我当时认为,仅仅基于市场力量,Anthropic的估值可能会因此而上升。
事实证明,情况似乎确实如此。Anthropic的收入肯定落后于OpenAI。OpenAI的收入约为37亿美元,而消息人士称Anthropic的年化收入约为8.75亿美元。然而,值得注意的是,Anthropic在企业购买方面显著增加了市场份额。它显然正在从OpenAI那里抢走一些业务,因此投资者可能押注的是其发展轨迹而不是当前状态。
当然,Anthropic和OpenAI之间最大的区别不仅仅是它们的企业销售额,还在于ChatGPT在目前很大程度上与消费者的AI同义,这也体现在它们的收入数字上。很多讨论都是关于Anthropic将如何使用这笔资金。Chubby写道:“我的意思是,很好,但Anthropic也该是时候发布Opus 3.5或4中的推理模型了。Sonnet 3.5很好,毫无疑问,但OpenAI现在似乎占据了优势。”
总的来说,人们感觉模型更新方面下一个可能出现变化的是Anthropic,但当然,我们必须拭目以待。一些人认为,这个估值实际上让OpenAI看起来像是一项更好的投资。Dolly Bolly写道:“Anthropic的估值是OpenAI的三分之一,这使得OpenAI看起来像是一支长期投资。”最终,我仍然认为,只有极少数公司是能够真正竞争AGI及以后的公司,而由于这一点,它们的估值实际上是没有上限的。
接下来,2025年的另一个重要主题当然是基础设施建设,这也具有重要的地缘政治意义。
一个重要的问题是,美国政府对美国公司投资和与中东地区合作的舒适程度如何。海湾国家实际上位于美国和中国之间,与双方都有着牢固的贸易关系。这已经成为一个争议点,在微软对G42的少数股权投资等地方加剧。因此,看到当选总统唐纳德·特朗普宣布了一项反向交易,一家海湾公司在美国投资数十亿美元,这很有趣,
在昨天马阿拉歌庄园的新闻发布会上,房地产开发大亨哈桑·萨瓦尼说:“当特朗普在11月当选时,这对我和我的家人来说是个好消息。我们已经等了四年,才能大幅增加在美国的投资。”
根据公告,萨瓦尼计划投资200亿美元在美国各地建设新的数据中心,特朗普表示,他实际上承诺至少投资这么多,他说:“他们可能会投资两倍甚至两倍以上的资金。”多阶段投资的第一阶段将集中在亚利桑那州、伊利诺伊州、印第安纳州、路易斯安那州、密歇根州、俄亥俄州、俄克拉荷马州和德克萨斯州建设设施。
现在,为了了解规模,微软打算今年在AI数据中心上花费约800亿美元,其中一半将部署在美国。这笔交易似乎在某种程度上象征着特朗普打算如何处理AI基础设施政策。特朗普社交媒体账户上流传的一个想法是,任何在美国投资10亿美元的人,其环境法规和许可审批都将被快速处理。目标似乎是让私营部门投资者能够取代并超过政府补贴,例如通过《芯片法案》。
在最近的一次采访中,山姆·阿尔特曼讨论了为什么这个计划是合理的,他评论道:“特朗普政府确实有机会做一些比《芯片法案》好得多的后续工作。我认为《芯片法案》并没有像我们任何一个人希望的那样有效。我非常同意特朗普总统的一点是,在美国建设东西变得多么困难。发电厂、数据中心,任何此类东西。我理解官僚主义的累积是如何发生的,但这对整个国家都没有帮助。”
来自阿联酋亿万富翁的这笔投资也回应了微软总裁布拉德·史密斯的呼吁。史密斯在上周发表的一篇博客文章中说,美国最重要的公共政策优先事项应该是确保美国私营部门能够继续顺风顺水地发展。他还呼吁关注向盟友和朋友出口美国AI,特别是通过与海湾国家的伙伴关系。
说到基础设施建设,在我们离开之前还有两个简短的故事。微软计划在未来两年内在印度投资30亿美元用于AI和云基础设施。首席执行官萨蒂亚·纳德拉周二在班加罗尔的一个活动上宣布了这项计划。他说,该公司还将为印度1000万人提供AI培训。纳德拉说:“我们今天宣布的基础设施和技能投资重申了我们致力于将印度打造成为AI第一的承诺,并将有助于确保全国各地的人们和组织广泛受益。AI在印度的普及率令人兴奋。”
与此同时,亚马逊网络服务公司表示,计划投资至少110亿美元以扩大在佐治亚州的基础设施。该公司在一份新闻稿中写道:“AWS很荣幸能够扩大我们在佐治亚州的业务,以帮助推动AI等下一代尖端技术的发展。”这一声明是在该公司承诺在印第安纳州建设数据中心投资110亿美元仅仅八个月后发布的。有趣的是,佐治亚州正在悄然经历AI基础设施的繁荣。根据GovTech的一份报告,去年亚特兰大都会区的数据中心建设增长了76%。
我预计今年我们将听到很多这样的基础设施建设故事。但就目前而言,这就是今天的AI每日简报头条新闻版的全部内容。接下来是主要剧集。今天的剧集由Vanta赞助。无论您是启动还是扩展公司安全计划,展示一流的安全实践和建立信任比以往任何时候都更加重要。
Vanta为ISO 27001、SOC 2、GDPR和领先的AI框架(如ISO 42001和NIST AI风险管理框架)自动化合规性,为您节省时间和金钱,同时帮助您建立客户信任。此外,您可以通过自动化问卷调查并使用客户面对面的信任中心展示您的安全态势来简化安全审查,所有这些都由Vanta AI提供支持。
包括Langchain、Leela AI和Factory AI在内的8000多家全球公司使用Vanta来展示AI信任并实时证明安全性。了解更多信息,请访问vanta.com/nlw。网址是vanta.com/nlw。
如果2025年AI有一件事是明确的,那就是代理即将到来。按行业划分的垂直代理、水平代理平台、按功能划分的代理。如果您经营的是大型企业,那么明年您将尝试使用代理。鉴于这有多么新颖,我们所有人都会回到试点模式。
这就是为什么Superintelligent在今年年初提供了一款新产品。这是一项代理准备情况和机会审核。在短短几周内,我们将与您的团队深入探讨哪些类型的代理适合您进行测试,您需要哪些类型的基础设施支持才能做好准备,并最终获得一套可操作的建议,让您准备好了解代理如何改变您的业务。
如果您对代理准备情况和机会审核感兴趣,请直接与我联系,[email protected]。请在主题行中加上“代理”一词,以便我知道您在谈论什么。让我们让您成为AI市场最具活力部分的领导者。欢迎回到AI每日简报。本周是拉斯维加斯举行的盛大的CES展会。这对于特别是消费科技公司来说,是一个展示其最新创新以及未来发展方向的机会。
这是一个有点奇怪的活动,因为每年都有大量的人参加,而且总有一些有趣的公告,但它从来都不是一些改变世界性公告的中心。我不知道为什么,但这并不是人们选择在一年中发布他们最大公告的地方。也许只是时间问题。一月是一个有点奇怪的时间。尽管如此,今年的大型主题演讲来自英伟达的黄仁勋,而且宣布的内容如此之多,以至于在一个节目中很难讲完。
尽管如此,我们还是会尝试。简而言之,英伟达正在攻击AI的几乎所有垂直领域,包括机器人技术、自动驾驶、代理、消费设备等等。
事实上,这些公告范围如此广泛,至少有一家出版物称之为英伟达的“苹果时刻”。黄仁勋演示的核心是这一声明:AI代理时代已经到来。对于那些没有观看的人,我已经上传了一张他展示的精彩幻灯片的图片,这张幻灯片显示了一个向上向右的图表,该图表贯穿了感知AI、生成式AI、代理AI到物理AI。
在代理AI下,他提到了编码辅助、客户服务和病人护理。基本上,黄仁勋将AI领域描述为随着代理上线并为完全机器人化的世界提供垫脚石而进入一个陡峭的指数曲线。从短期来看,他说:“AI代理是新的劳动力。未来,每家公司的IT部门都将成为AI代理的HR部门。”
黄仁勋还提到,英伟达的AI芯片正在改进,“比摩尔定律快得多”。他说,目前的芯片模型比上一代快30倍,并补充道:“我们可以同时构建架构、芯片、系统、库和算法。如果您可以做到这一点,那么您可以比摩尔定律更快地发展,因为您可以跨整个堆栈进行创新。”他解释了为什么这对努力实现盈利的AI行业如此重要,他说:“摩尔定律在计算历史上如此重要,因为它降低了计算成本。”
同样的事情也将会发生在推理领域,我们将提高性能,因此推理成本将会降低。您可能还记得我们昨天关于山姆·阿尔特曼如何说OpenAI每月200美元的订阅实际上并不赚钱的讨论。演示本身获得了好评如潮。
Salesforce首席执行官马克·贝尼奥夫激动地发帖说:“我很少被首席执行官的主旨演讲如此吸引和鼓舞,以至于它能吸引我的注意力长达两个小时。但黄仁勋不知疲倦的精力使他成为资深和真正的首席执行官中最鼓舞人心和有远见的领导者之一。”
他能够在交付我真正想购买的令人惊叹的产品的同时进行创新,这真是了不起。在经营一家伟大的科技公司方面,这是一堂真正的大师课。我特别被他对AI演变的框架所打动,从感知到生成式,再到代理式,最终到物理式。真正鼓舞人心。英伟达宣布的产品和服务的巨大范围同样令人叹为观止。因此,即使我刚才说过,总的来说,CES并不是发布重大公告的地方,但这确实是一个全面产品发布。
现在,就我们的目的而言,鉴于演示的主题,我认为最重要的产品是英伟达的第一个完整的代理模型系列。名为NEMOTRON,这些模型有三种尺寸,可以涵盖从边缘设备推理到需要前沿模型的任务的用例。去年,英伟达抢先预览了70B版本的NEMOTRON,它在代理任务上的性能优于OpenAI和Anthropic的同类模型。新的模型系列也将有两种不同的类型。
一种是用于语言任务的基于文本的模型,另一种是针对物理AI项目优化的基于视觉的模型。这些模型令人印象深刻地完全开源,文本模型基于Meta的Lama模型的微调。这意味着英伟达将在价格上与涵盖代理用例全谱的模型竞争。作为一个完全的旁注,我们在这里可以进行非常长时间的关于AI模型商品化的对话,这种感觉只会在这个代理时代加速。除了模型系列之外,英伟达还发布了一套AI编排蓝图。
这些旨在指导代理完成特定任务,并可以帮助协调多个代理。英伟达已与几家AI编排公司合作,构建将在英伟达企业平台上提供的蓝图,包括Langchain、Llama Index和Daily。Crew.ai创建的一个示例处理代码文档,以确保存储库易于导航。另一个示例是一个PDF到播客的蓝图,它产生的结果类似于谷歌的Notebook LM。
英伟达Omniverse和模拟技术副总裁Rev Liberadian说:“有很多话要说,但基本上,这里的目标是让代理真正发挥作用,并尽可能快速部署。”
共享的更令人印象深刻的蓝图之一允许代理分析视频。集成的服务复杂管道可以比实时观看快30倍地提供高质量的视频分析。这在使用AI更新系统和使用这种新颖能力设计新流程方面都具有广泛的极其有价值的应用。最容易实现的目标是监控工业流程。目前全球部署了超过15亿个企业摄像头,每年记录7万亿小时的视频。实际上只有一小部分被分析。
与此同时,制造商每年因产品缺陷而损失数万亿美元,而这些缺陷本来可以使用AI增强的摄像头更早地发现。这只是一个具体的例子,但您可以立即看到直接的有形投资回报率。
英伟达的另一个重要公告是一款小型AI工作站,名为Project Digits。这款设备的尺寸与Mac Mini或一本精装书差不多,包含该公司的Grace Blackwell硬件。黄仁勋表示,这款设备“运行整个英伟达堆栈。所有英伟达软件都在此运行。这是一个位于您桌面的云计算平台。如果您愿意,它甚至可以是一个工作站。”该设备可以用作运行英伟达基于Linux的操作系统的独立计算机,也可以插入主要的Windows或Mac PC。
它可以输出每秒千万亿次浮点运算的AI计算能力,用于原型设计、微调和运行AI模型。英伟达声称,单个单元可以为高达2000亿个参数的模型运行推理。虽然不足以运行Meta的Lama模型的最大版本,但足以在本地运行中等规模的现代LLM。两台设备还可以联网,为参数高达4050亿个的模型提供推理。该设备将于5月份上市,价格为3000美元,虽然这使其成为一款专业级产品,但对于人们来说肯定并非遥不可及。
黄仁勋说:“将AI超级计算机放在每个数据科学家、AI研究人员和学生的桌子上,使他们能够参与并塑造AI时代。”
英伟达还推出了一系列AI游戏工具。其中包括一个可以管理直播Twitch流的自动化制作代理,以及AI驱动的游戏内机器人。在汽车方面,英伟达已经为自动驾驶揭示了新的硬件和软件平台,以及大量的合作伙伴关系。从丰田到优步的公司都将使用英伟达的技术来增强其自动驾驶能力,该技术现已获得严格的欧洲监管机构的认证。英伟达还与Aurora和大陆公司合作,到2027年大规模部署无人驾驶卡车。
还有一个具有视觉功能的桌面助手,配有一个非常令人印象深刻的渲染化身和语音模式。所有这些都没有提到基于Blackwell架构的新系列消费级GPU和在同一晶圆上具有72个Blackwell处理器的新的数据中心芯片。超级芯片确实令人惊叹。黄仁勋看起来像美国队长一样,拿着这个东西像盾牌一样穿过舞台。现在,就回应而言,《神经元》通讯称之为英伟达的“苹果时刻”,并评论道:“还记得当把个人电脑放在每张桌子和每个家庭时改变了世界吗?”
英伟达或多或少地试图用AI超级计算机做同样的事情。对我来说,很明显,这一点已经持续了一段时间了,英伟达显然正在运行类似于2010年代初谷歌的策略,他们将重点从一件事转移到尽可能多地捕捉相关的垂直领域。
如果英伟达能够实现这一庞大的路线图,它将拥有一个可用于AI开发几乎所有用例的竞争平台,从语言代理到工业机器人。他们还大力依赖开源,这可能会在AI实验室之间引发一场大规模的价格战。所有这一切当然都推动了英伟达的核心业务——销售AI芯片。他们的战略简而言之是什么?让AI在生活的方方面面尽可能无摩擦地部署,以将AI芯片的需求推向顶峰。
现在,有趣的是,其影响似乎在华尔街迷失了。彭博社在标题为“英伟达在发布后发布幻灯片,让投资者想要更多”的新闻报道中报道了这一事件。我认为这完全是对发生的事情的误解。英伟达的股票昨天下跌了6%,但我认为这更多地与无关的宏观经济冲击有关,而不是投资者不喜欢黄仁勋在拉斯维加斯所说的话。事实上,股票分析师至少有点不太短视,
高盛写道:“在拉斯维加斯发布的一系列公告至少突出了该公司在硬件和软件方面以行业领先的速度进行创新的能力,以及其强大的合作伙伴和客户生态系统。”最终,这就是一次揭幕。英伟达一直在逐渐从一家仅仅是芯片公司转变为一家AI优先的科技巨头,而这次演示中这一点再清楚不过了。我们将在这里结束。然而,这就是今天的AI每日简报的全部内容。一如既往地感谢您的收听或观看。直到下次,再见。