VO2 can produce 2-minute clips with resolutions up to 4K, which is 4 times the resolution and 6 times the duration of OpenAI's Sora. It excels in physics and user control, understanding cinematography techniques, and offers professional-grade video generation.
VO2 stands out for its understanding of physics, allowing it to handle complex tasks like cutting a tomato or shuffling a deck of cards, which other models struggle with. It also replicates professional cinematography techniques, such as camera motion and lens effects.
VO2 outperforms Sora in preference and prompt adherence, particularly in handling physics and generating more realistic videos. It also offers higher resolution and longer clip durations, making it a more advanced consumer-facing model.
Use cases include social media creations, advertising, establishing shots, B-roll, and drone footage, storyboarding, and brainstorming for filmmaking and business activities. These tools are also poised to disrupt traditional stock video libraries and ad production workflows.
AI video generation is dramatically reducing the cost and time required for ad production. For example, an entire ad for eToro was created in just one and a half weeks, a process that traditionally takes much longer. This democratizes ad creation for smaller companies and allows for real-time responses to cultural moments.
AI tools like Pika enable creative social media videos with effects like 'Cakeify' and 'Squish,' allowing brands to produce more engaging and unique content. This opens up new possibilities for creative expression and brand marketing on social platforms.
AI video generation could lead to a renaissance in filmmaking by lowering production costs and expanding creative possibilities. Models like VO2 can imitate cinematography techniques and understand physics, making them suitable for high-level professional productions.
谷歌已针对Sora推出了自己的更新视频模型Veo 2,并获得了好评如潮。NLW探讨了多个使用案例,从社交媒体到广告,再到B-roll、建立镜头及其他方面。 由以下公司提供支持: Vanta - 简化合规 - https://vanta.com/nlw AI Daily Brief帮助您了解AI领域最重要的新闻和讨论。 在您收听的任何地方订阅AI Daily Brief播客版本:https://pod.link/1680633614 订阅时事通讯:https://aidailybrief.beehiiv.com/ 加入我们的Discord:https://bit.ly/aibreakdown
<raw_text>0 今天的AI Daily Brief中,谷歌宣布了VO2,今天我们将讨论目前可用的最有趣的使用案例。AI Daily Brief是一个关于AI领域最重要新闻和讨论的每日播客和视频。要参与讨论,请在我们的节目说明中关注Discord链接。♪
大家好。在我们深入今天的节目之前,快速说明一下。主要节目“五个VO2的使用案例”相对较长。因此,今天我们只做一个主要节目,没有头条新闻。我们明天会正常回归头条新闻。但现在,让我们深入探讨一下人们如何在此刻真正从AI视频生成中获得价值。
欢迎回到AI Daily Brief。最近发生了一些非常有趣的事情,Riley Brown在推特上总结道,为什么感觉谷歌是每个人都在支持的黑马?
当然,他所指的是谷歌从产品角度重新找回了节奏。我们已经广泛讨论过Notebook LM,并将继续讨论,但今天的重点是VO,或者更具体地说是VO2,它确实从OpenAI的Sora那里抢走了很多风头。今天我们将讨论一下公告,然后深入探讨VO2和Sora所开启的一系列使用案例。
那么这次公告中包含了什么?首先,它包括VO2和Imogen 3,因此不仅是他们的视频生成模型,还有他们的图像生成模型,尽管我们的重点将放在视频生成上。VO2可以生成2分钟的剪辑,分辨率高达4K。这是Sora最大分辨率的4倍,持续时间是6倍,二者在面向消费者的模型中都是行业领先的。谷歌的一个重要卖点是改进的物理效果和用户控制。
特别是物理效果似乎是Sora的一个显著弱点。昨天流传的多个剪辑中,这一差异似乎很明显。该模型可以生成一双手切西红柿的画面,而这是Sora在这一任务上表现得相当糟糕。然后还有一段非常令人印象深刻的视频,展示了一副扑克牌被洗牌,Sovereign AI的Dennis Kardonsky称之为视频的图灵测试。
还有一段视频展示了一辆卡车在公路上飞驰,然后偏离方向驶向瀑布。顺便说一下,如果您是听众,我建议您订阅YouTube频道或打开Spotify,在那里您也可以观看视频,因为这一集绝对受益于视觉效果。无论如何,我们提到的这段卡车视频展示了一系列其他模型面临挑战的复杂物理问题。然后,当然还有经典的回顾,提到大约一年半前的威尔·史密斯视频,成功制作了一段一个人吃意大利面的影片。
显然,物理控制让人们感到最兴奋。AI设计顾问Marco写道,谷歌VO2模型最让我印象深刻的是它似乎真的理解物理。这是一个巨大的进步。另一个进步是能够重现专业电影摄影技术,比如复制相机运动和不同设备的外观。谷歌写道,VO2理解电影摄影的语言。要求它提供一个类型,指定一个镜头,建议电影效果,VO2都会满足。
要求一个低角度跟踪镜头,滑过场景中间,或者一个特写镜头,聚焦在一位科学家透过显微镜观察的脸上,VO2都能创造出来。视频基准本质上是主观的,但谷歌声称VO2在偏好和提示遵循方面优于Sora和其他竞争模型。该模型现在可以通过谷歌实验室的VideoFX平台使用,但您目前需要加入候补名单,这可能是最大的缺点。
因此,正如您所预期的,有大量与Sora的比较。Marques Brownlee写道,如果这些精心挑选的示例是真实的,它们看起来比我从Sora获得的任何东西都要好。企业家Bindi Reddy写道,谷歌正式扭转了对OpenAI的局面。您所要做的就是超越对方的公告并淹没对方。OpenAI希望在谷歌面前进行一次大规模的新闻周期,因为他们的搜索现在是免费的。然而,谷歌凭借视频和图像模型抢走了风头。
不过,我认为对于我来说,关于VO2或Sora哪个更好的讨论就显得不那么有趣,原因仅仅是因为它非常、非常短暂。对我来说,更有趣的是思考,考虑到视频生成的整体状态,包括不仅是Sora和VO2,还有Pika 2.0、Runway和LumaLabs,哪些使用案例实际上现在在线?
我想讨论的第一个使用案例是社交媒体创作。这正是Pika试图开辟的一个细分市场。例如,Pika预加载了一堆效果,比如这个Cakeify效果,您可以在这个视频中看到,它看起来像是天空中的热气球,但实际上是一个巨大的蛋糕。
还有他们的挤压效果,人们可以拍摄日常生活物体的照片,然后Pika会在一个明显用于社交媒体的视频中将其挤压。同样,还有一个“粉碎它”功能,一个“融化它”功能,一个“溶解”功能,看起来非常像《复仇者联盟:无限战争》中灭霸打响指时发生的事情。关键是,当涉及到真正创造性和酷炫的社交媒体视频时,我们现在绝对拥有工具来彻底改变您能做的事情。
当然,从商业角度来看,这意味着品牌现在可以进行更多创造性的社交媒体生成。
然而,社交媒体和广告之间的界限越来越模糊。Pierrick Chevalier结合了一些参考图像,包括一位女性、一罐红牛、一套特定的儿童耳机和一个霓虹灯游戏女孩背景,展示了品牌视频如何迅速组合在一起。他指出,我们才刚刚开始,他说,想象一下当我们实现100%物体一致性时的力量。而在广告方面,一些公司已经开始提前行动,完全依赖AI制作广告。
例如,上个月,eToro发布了一则完全生成的广告,展示了一只在时代广场中跳舞的熊和公牛。结果远非完美,尤其是动物跳舞的场景,物理效果远非完美。不过,更有趣的是,制作该广告的Doerr兄弟表示,整个项目从构思到最终剪辑仅用了一周半的时间。
在一周半内制作一整则广告的想法绝对疯狂,完全改变游戏规则。这并不意味着每个人都会在各种广告中使用AI,但广告制作成本的急剧下降必将改变该行业的运作方式。
这无疑将使小公司和品牌的广告创作民主化。视频广告可能会从需要广告代理和制作团队的东西,转变为实习生可以在几天内完成的工作。此外,制作速度意味着人们将能够以近乎实时的广告生成响应流行文化和文化时刻。
所有这些都印证了我之前分享的论点,即最能概括AI未来的词是“更多”。我们将会拥有更多的一切。毫无疑问,我们将会有更多的广告。广告将会更加个性化,更加贴近时刻,可能更加短暂,并代表更多的商业世界。
在时尚和生活方式领域,您已经看到了大量这样的情况。Flare AI是一个专门优化视频和图像模型以进行广告创作的平台。去年十月,他们展示了一个非常专业的商业广告示例,该广告是100%由AI生成的,针对Mulberry手袋。
专注于AI产品摄影和视频的Salma在X上也做了关于为化妆品牌创建广告的教程,同样完全使用AI。
无论您是运营领导者、市场营销人员,还是甚至是非技术创始人,Plum都为您提供了AI的力量,而无需技术麻烦。立即访问顶级模型,如GPT-4.0、CloudSonic 3.5、Assembly AI等。不要让技术阻碍您。查看Use Plum,即Plum带B,以获取工作流自动化未来的早期访问。今天的节目由Vanta提供支持。无论您是启动还是扩展公司的安全计划,展示一流的安全实践并建立信任比以往任何时候都重要。
Vanta自动化ISO 27001、SOC 2、GDPR以及领先的AI框架(如ISO 42001和NIST AI风险管理框架)的合规性,节省您的时间和金钱,同时帮助您建立客户信任。此外,您可以通过自动化问卷和展示您的安全态势,利用Vanta AI提供的客户信任中心来简化安全审查。
超过8000家全球公司,如Langchain、Leela AI和Factory AI,使用Vanta来展示AI信任并实时证明安全性。了解更多信息,请访问vanta.com/nlw。那是vanta.com/nlw。今天的节目一如既往地由Superintelligent提供支持。
您是否曾想过一个完全专注于AI如何与您的公司相关的AI每日简报?您的公司在AI采用方面是否遇到困难,无论是因为您在弄清楚哪些使用案例能带来价值时停滞不前,还是因为正在发生的AI转型被孤立在各个团队、部门和员工中,无法改变整个公司?Superintelligent开发了一种新的定制内部播客产品,通过分享来自公司内外的最佳AI使用案例来激励您的团队。
把它想象成一个AI Daily Brief,但仅针对您公司的AI使用案例。如果您想了解更多,请访问besuper.ai/partner并填写信息请求表。
我对这个产品非常兴奋,所以我会亲自尽快回复您。再次强调,访问besuper.ai/partner。今天的节目由Rocket Money提供支持。新年即将来临,这是一个完美的时机来整理、设定目标、优先考虑最重要的事情,对许多人来说,这将是财务健康。
多亏了Rocket Money,这些目标,尤其是与金钱相关的目标,变得可实现。Rocket Money将您的所有订阅集中在一个地方,帮助您轻松取消那些您可能忘记的订阅。Rocket Money还将您在不同账户上的所有支出汇总在一起,以便您清晰地跟踪消费习惯,看看在哪里可以削减开支。
Rocket Money是一款个人理财应用,帮助查找和取消不必要的订阅,监控您的支出,并帮助降低账单,以便您可以增加储蓄。他们的仪表板为您提供了对所有账户支出的清晰视图。您可以轻松创建带有自定义类别的个性化预算。
您可以查看每个类别的每月支出趋势,以准确了解您的钱花在哪里。Rocket Money甚至会尝试为您谈判更低的账单。他们会自动扫描您的账单以寻找节省机会,然后您可以要求他们进行谈判。他们会处理客户服务,以便您无需亲自处理。
Rocket Money拥有超过500万用户,已为取消的订阅节省了总计5亿美元,会员在使用所有应用的高级功能时每年可节省高达740美元。取消您不需要的订阅,并通过Rocket Money更快地实现财务目标。今天就访问rocketmoney.com/AIbreakdown。那是rocketmoney.com/AIbreakdown。
我们现在可用的第三个使用案例是建立镜头、B-roll和无人机镜头。这种类型的视频用于从广告到社交媒体内容再到专业电影的所有内容。大预算制作可以负担得起自己去拍摄,但在许多情况下,这种图像是从库存库购买的。这种商业模式在未来似乎非常可疑,因为Vio和Sora在这些建立自然世界镜头方面已经非常娴熟。
AI和设计Marco用这种镜头制作了整个宣传片,展示了现在人们可以按需获得的令人难以置信的视频图像库。AI视频的第四个使用案例是故事板和头脑风暴。人们对Sora最兴奋的事情之一是他们在产品中直接构建了一个故事板时间线编辑器。
因此,您基本上可以规划出一整段视频序列,构成一个完整的故事。现在,最初我认为这将被电影制片人使用。但从长远来看,我不会感到惊讶,看到视频头脑风暴成为更广泛商业活动的一部分。
您可以看到内部团队进行视频头脑风暴,以规划他们的广告,即使他们与广告代理合作。您可以看到活动和市场营销团队规划和实验他们在大型贸易展上的活动设置可能是什么样子。
关于生成AI,最重要的一点是,我们很难不考虑一对一替代阶段。换句话说,理解它如何替代已经存在的事物。例如,我刚刚谈到库存视频库将面临困难,因为VO和Sora现在可以创建他们之前盈利的所有类型的内容。然而,我认为当尘埃落定时,十年后,更有趣的使用案例将是那些之前根本不可能的事情。
所以最终,我不知道贸易展和活动赞助规划是否会涉及视频故事板和头脑风暴,但我不会感到惊讶。
最后,尽管我们谈论了这些针对广告商、企业和社交媒体创作者的使用案例,但很明显,这将很快渗透到好莱坞和专业电影制作中。我们开始理解物理的事实,VO能够模仿电影摄影技术,这一切都意味着这些模型比以往任何时候都更适合在最高水平的制作中使用。
不过,最酷的是,这不仅仅是好莱坞能够接触到它们。由于制作成本的降低和创造力的扩展,可能会出现电影和视频讲故事者的绝对文艺复兴。正如谷歌DeepMind的研究工程师Andrew Marmon所说,“……我们将能够创造的世界。”