We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Amazon Gets In On AI Foundation Model Game with Nova

2024/12/5

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

AI Deep Dive AI Chapters Transcript

People

Google云产品管理高级总监Barklay

主

主持人

专注于电动车和能源领域的播客主持人和内容创作者。

亚

亚马逊CEO Andy Jassy

Topics

本期节目主要讨论了亚马逊公司在其AI基础模型领域的最新进展，包括Nova系列模型的发布以及在训练芯片和AI超级计算机方面的投入。Nova系列模型涵盖了文本和多模态模型，旨在提高速度、降低成本并增强推理能力。亚马逊还宣布了其新一代训练芯片Trainium 2和Trainium 3，以及与Anthropic合作设计的AI训练超级计算机Rainier。这些举措表明亚马逊公司正在积极参与AI基础模型的竞争，并致力于在该领域取得领先地位。 Google的视频生成模型Veo在企业就绪性方面进行了改进，提高了视频分辨率和长宽比，并对物理效果有合理的理解。然而，该模型也存在一些局限性，例如物体消失和重现以及物理错误。亚马逊CEO Andy Jassy表示，亚马逊一直在开发自己的前沿模型，并认为这些模型对用户也有价值。 Nova模型在价格方面具有竞争力，尤其是在Nova Micro和Nova Light方面。Nova Light是具有多模态输入的最便宜的模型。Nova Pro的价格比GPT或Claude 3.5低，性能也更高。然而，Nova模型在编码基准测试中的表现相对较弱。

Deep Dive

Chapters

The chapter discusses the advancements and limitations in AI video generation, focusing on Google's latest models and the broader implications for business and content creation.

Google's VEO and IMAGE3 models are integrated into platforms like POOCHAPT and used by companies like YS International for marketing content.
Video generation models are currently limited to short clips and have issues with consistency and physics.
2025 is expected to see more advancements in video generation, especially for advertising and social media.

Shownotes Transcript

亚马逊通过推出Nova在AI基础模型竞争中迈出了重要一步。该产品在AWS re:Invent上宣布，Nova系列包括旨在提高速度、成本效率和高级推理任务的文本和多模态模型。同时，亚马逊还探讨了其在训练芯片方面的进展以及与Anthropic共同创建的大型新AI超级集群Rainier。由以下公司提供支持： Vanta - 简化合规 - ⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw RocketMoney - https://rocketmoney.com/aibreakdown

订阅新闻通讯：https://aidailybrief.beehiiv.com/ 加入我们的Discord：https://bit.ly/aibreakdown

<raw_text>0 今天，在AI每日简报中，亚马逊进入了基础模型游戏。在此之前，头条新闻是谷歌Veo向更多客户推出。AI每日简报是一个关于AI领域最重要新闻和讨论的每日视频播客，欢迎加入我们的讨论，所有的Discord链接都在我们的节目说明中。

回到每日简报的头条补充，您需要的所有每日AI新闻大约在五分钟内。我们认为2024年的一个大主题将是视频生成，某种程度上，这一趋势已经开始，随着Sora的预览，真正重置了人们对可能性的期望。

尽管Sora并没有推出，至少没有以广泛可用的方式推出，但我们从Runway获得了很好的更新，他们的Genre、Luma Labs、Dream Machine、Pek A，现在谷歌正在向Vertex客户推出他们最新的视频和图像生成模型，分别称为Vio和Image 3，处于私密预览阶段。这些模型完善了谷歌的Genii产品，专注于Vio视频模型。谷歌表示，Cora已经将其功能集成到他们的Poo Chapt平台中，而Orio的拥有者模型YS International正在利用它与代理合作伙伴创建营销内容。

该模型于四月首次亮相，能够输出六秒的视频，分辨率为10N、D、P。用户可以添加生成的视频操作系统，包括更改摄像机运动，等待AP的长时间访问，谷歌云产品管理高级总监Warn Barklay表示，这一切都是为了确保“企业准备就绪”，他补充道。

自Veo宣布以来，我们的团队已经增强了硬件，以改善企业客户的模型，针对文本AI。到今天为止，您可以以720p和69横屏或9:16竖屏的宽高比创建高清晰度视频，类似于我们如何改善其他模型的能力，例如在Vertex AI上的Gemini。我们将继续为Vio技术做这件事，Vio对提示的理解相当不错，掌握了一些物理知识，包括动力学。

该模型还支持对视频特定部分的批量编辑，并能够将镜头串联成更长的项目。然而，他们也表示，反映了今天AI对象的局限性，在Vio视频中，物体会在没有太多解释或一致性的情况下消失和重新出现。Env O经常在物理上出错。

在许多方面，当前的视频生成状态完全取决于您可以用它做什么。您有大量创作者正在推动短片制作的边界。但从商业角度来看，这是一项技术，可能在广告、社交媒体方面已经准备好进入主流，但在较长的电影内容方面尚未成熟。

尽管如此，随着这一更新，似乎很明显2025年将会有比2024年更多的视频生成。接下来，我们一直在关注最近的FTC对微软的调查，似乎他们与OpenAI的交易显然是FTC官员对微软竞争对手询问其影响的关切之一，具体来说，FTC正在询问微软与OpenAI的交易。

FTC正在询问竞争对手有关微软如何销售OpenAI注入的Copilot，以及它在哪里以及如何将OpenAI的模型转售给其Azure云计算平台上的开发者。他们继续提问，暗示FTC正在调查微软在云计算市场的主导地位是否给公司带来了不公平的优势。AI软件的销售。

当然，这是一种非常流动的情况。我们有一个新的管理层即将上任，许多人认为，尽管下一个FTC主席提名尚未宣布，但很可能对大型科技公司的监管会比Linnea Con丈夫时期少得多。尽管如此，根据信息，微软的一些最大竞争对手引用相信他们可以说服特朗普政府继续审查该公司。

更重要的是，当然还有埃隆·马斯克在该管理层中的顾问角色，他一直是微软与OpenAI交易的激烈批评者，甚至在对OpenAI的诉讼中实际起诉了微软。说到OpenAI，该公司刚刚聘请了首位CMO，这个人是来自Craft to Space的另一位难民，Kate Roh是Coinbase的前CMO，代表着OpenAI在构建其海洋甜品SAR A E S中的最新重大招聘，A C F O Kevin Wal担任首席商务官，尽管截至目前，他们尚未聘请A C T O来替代我。

Mali K的推文无法更兴奋地展示AI如何造福全人类。祝贺Kate，祝好运。OpenAI现在我们有一个稍微长一点的北方主要剧集，所以我们将在这里结束头条新闻。

感谢您一如既往的收听。现在是时候进入主要剧集了。今天的Epo de由Rocket Money提供。

我们即将迎来新年的开始，这是一个完美的时机来整理。设定目标，优先考虑重要事项，对我们许多人来说，这将是财务健康，感谢Rocket Money。这些目标，尤其是与金钱相关的目标，感觉是可以实现的。

Rocket Money将您的所有订阅集中在一个地方，帮助您轻松取消那些您可能不再需要的订阅。您实际上正在为Rocket Money支付的费用，Rocket Money还将您在不同账户上的所有支出汇总在一起，以便您可以清楚地跟踪消费习惯，看看您可以在哪里削减开支。Rocket Money是一款个人财务应用，帮助您找到并取消不需要的订阅，监控您的支出并帮助降低账单。

您可以增加储蓄。他们的仪表板为您提供了所有账户的支出清晰视图。您可以轻松创建个性化预算，设置自定义类别。

您可以查看每个类别的每月支出趋势，以确切了解您的钱去向何处。Rocket Money甚至会尝试为您谈判降低账单。他们会自动扫描您的账单，以寻找节省的机会，然后您可以要求他们进行谈判。

他们将处理客户服务，以便您不必这样做。Rocket Money在安全方面拥有超过五百万用户，总共节省了五亿的订阅费用，帮助会员每年节省高达740美元，使用所有应用程序的高级功能，取消不需要的订阅，更快地实现财务目标。使用Rocket Money，访问rocketmoney.com。

今天的AI简报就是Rocket Money。访问rocketmoney.com/aibreakdown。今天的剧集由Vanta提供，无论您是在公司启动安全程序，展示顶级安全实践并建立信任比以往任何时候都更重要。

Vanta自动化合规性，适用于ISO 27001、SOC 2、GDPR和领先的AI框架，如ISO 42000和NIST AI风险管理框架，节省您的时间和金钱，同时帮助您建立客户信任。此外，您可以通过自动化问卷和展示您的安全态势来流式传输安全审查，建立面向客户的信任中心。所有这些都由Vanta提供支持，全球超过8000家公司，如LangChain、Lea AI和Factory AI，使用Vanta来展示AI信任，实时改善安全，了解更多信息，请访问vanta.com/nlw。

今天的剧集由Super Intelligent提供，您是否曾想过一个完全专注于AI如何与您的公司相关的AI每日简报？您的公司是否在AI采用方面遇到困难，无论是因为您正在努力找出哪些用例能带来价值，还是因为正在发生的AI转型仅限于个别团队、部门和员工，而无法改变整个公司？Super Intelligent开发了一种新的定制内部力量测试产品，通过分享来自您公司内部和外部的最佳AI用例来激励我们的团队。

可以将其视为一个AI每日简报，但仅针对您公司的AI用例。如果您想了解更多，请访问besuper.ai/partner并填写信息请求表。我对这个产品非常兴奋，因此我会亲自尽快回复您。那就是besuper.ai/partner。

欢迎回到每日简报。亚马逊在与AI领域的基础模型关系方面经历了漫长而有趣的旅程。我们在过去一周讨论过几次，并注意到他们的许多战略是对ChatGPT发布的反应，坦率地说，ChatGPT远比他们计划发布的版本要好得多。

事实上，他们将原本计划用于ChatGPT等效产品的名称Bedrock转变为AWS服务，以帮助企业客户确定使用哪些模型。从那时起，他们加倍努力与Anthropic的关系，并真正专注于他们的基础设施建设及其训练芯片。但显然，他们并不满足于不参与基础模型游戏，因为在今年的AWS re:Invent上。

该活动的最大公告是推出一系列名为Nova的新专有模型。该系列包括四种尺寸的Aleem Microlight Pro和Premier Nova Micro，作为仅文本模型，旨在优化速度和成本，Nova Light是一种低成本的多模态模型，能够快速分析图像、视频和文本输入。Nova Pro被描述为一种高能力的多模态模型，具有最佳的准确性、速度和成本组合，适用于广泛的任务，而Nova Premier是亚马逊最强大的多模态模型，旨在出色地处理复杂推理任务，并作为最佳教师用于蒸馏模型。

该系列还包括一个图像生成模型和一个视频生成模型。每个模型都声称在各自领域处于最先进水平。所有Nova系列的模型现在都可以在AWS的Bedrock模型库中使用。

预计Premier将在明年初到达，亚马逊首席执行官Andy Ji表示，我们继续致力于自己的前沿模型，这些前沿模型在过去四到五个月中取得了巨大的进展。我们认为，如果我们能从中找到价值，您也可能会发现价值。我们不知道这些模型有多少参数，但根据它们的描述，它们似乎与领先实验室的最新一代模型系列相符。

上下文窗口也与竞争对手的模型相当，但亚马逊承诺明年将为某些模型提供超长的200万token上下文窗口。所有Aleem模型都支持使用文本、图像和视频进行微调，以及模型安装画布。图像模型与竞争实验室的领先模型相当。

尽管如此，视频模型感觉有点像预告版，仅支持六秒的视频，生成大约需要三分钟。亚马逊表示，能够生成两分钟视频的版本即将推出。质量在提供的演示视频中似乎达到了标准。

然而，到目前为止，用户生成的视频质量差异很大，从足够好到极其糟糕。接下来，Nova系列将推出一个语音到语音模型，预计在明年第一季度发布，以及一个预计在2025年发布的任何到任何模型，基准测试似乎首次显示出竞争力。

亚马逊声称，Real在跑道的Genre Alpha和AB测试中表现优于，视频质量的61%通过率和视频一致性的71%通过率。没有APP似乎至少与CD 3.5和GPT 4.0竞争，在某些领域声称我们的表现。谈到基准测试时，我认为重要的一点是，理解这些基准测试时，可能更有价值的是将其视为竞争范围，而不是确切的细节。

如果您这样看待它，Nova Pro就是包括Claw 3.5、Senate GPT 4.0的经典模型。U.S.的技术领袖Ocken Veteran指出了我们表现的一个有趣领域，评论说，新发布的Nova Genee模型在代理和多代理基准测试中的出色表现是一个令人兴奋的方面。

不过，抵消这一点的是，Nova在编码基准测试方面似乎缺乏。AI企业家Ban Do Ready在Live Bench上进行了自己的测试，发现没有进一步的改进，排在领导榜的后面。她写道，基准测试每月变化的好处在于它不能被操控。在我们最新的11月挑战中，亚马逊的Nova核心低于Lam 70B，略好于High Co，这个模型没有变化。

领导者显著地，尽管它似乎出乎意料地快速，预测性地在3.5上看到，O在线仍然位于列表顶部。尽管如此，值得注意的是，在AWS re:Invent上，Nova的价格竞争力被有些忽视。Nova Micro和Noble Light的价格均低于Gami 1.5 Flash和GPT 4 Mini，使它们成为主要实验室中最便宜的模型。

Nova Light还以多模态输入的最便宜可用模型而著称。这两个模型的价格如此接近，以至于区分似乎在于速度，Nova ICR RO比Gami 1.5 Ash快约10%，而Nova Light的运行速度相似。EGPT 4.0仍然比其他模型快。

Nova Pro的价格约为GPT 0或Claw 3.5的三分之一，并且在价格上略低于Cloud 3.5 High Co，性能得分却高得多。所有这些的净结果是，亚马逊的内部EMS现在便宜，适用于许多用例。Lamon Index的首席执行官Jerry Lewis表示，亚马逊的Nova应该在成本生产的前沿和中心进行宣传，而不是让我去挖掘黑客或新线程，这是一个巨大的价值主张。

亚马逊通过推出Nova在AI基础模型竞争中迈出了重要一步。Nova系列在AWS re:Invent上宣布，包括旨在提高速度、成本效率和高级推理任务的文本和多模态模型。同时，亚马逊还探讨了其在训练芯片方面的进展，以及与Anthropic合作创建的一个巨大的新AI超级集群Rainier。由您带来： Vanta - 简化合规 - ⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw RocketMoney - https://rocketmoney.com/aibreakdown

订阅新闻通讯：https://aidailybrief.beehiiv.com/ 加入我们的Discord：https://bit.ly/aibreakdown

<raw_text>0 Nova是朝着更便宜的模型迈出的令人兴奋的一步，这些模型在上下文、窗口性能和多模态方面可与最先进的技术相媲美。虽然S已经取得了长足的进步，但在重复循环中使用它们的一个重大问题是成本，尤其是在多模态代理流中。总体而言，如果你只是想用一句话理解IT，这次公告的最大收获是，亚马逊已经从跳过这一代MS转变为坦率地全面参与竞争模型的完整阵容，警告教授Eth Molex总结道。

然后根据统计数据，似乎亚马逊的Novo是一个具有竞争力的前沿模型。这使得GPT四个模型、GPT四个O Gami 1.5 Cloth、3.5、Greg 2在3.2和可能在美国模型一年的基础上得以完善。

而且，另一个问题是，考虑到Jesse在过去四到五个月中谈论的进展，似乎暗示我们在夏季赶上了其他实验室，这种情况也为越来越多的观点提供了可信度，即在模型方面可能并没有特别强的动机。下周，与亚马逊在眼部芯片训练的相关公告小组将现在在AWS上普遍可用，用于训练和推理。该公司还宣布了一代新的芯片训练，预计将在明年晚些时候推出，用于训练Mum 2芯片。

亚马逊在速度上实现了四倍的提升，相较于第一代，坦率地说，第一代几乎没有被采用。他们声称，Mum 2推理的训练可以在Meta Lama 4 5B模型上提供三倍更高的令牌生成吞吐量，相较于其他云提供商的产品。在他们的公告中，亚马逊声称“训练Mum 2在当前一代基于GPU的EC2实例中提供30%到40%的更好性价比”，显然是指视频H100 AWC O在Garmin声称训练三将比第二代快两倍，并提供40%的能效，Garden今天表示，G P U上真的只有一个选择。

Amazon Gets In On AI Foundation Model Game with Nova 16:14 Share

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

Deep Dive

Shownotes Transcript

Amazon Gets In On AI Foundation Model Game with Nova