cover of episode S3E1丨阿拉丁神灯还是潘多拉魔盒?Sora很热,但无需神化

S3E1丨阿拉丁神灯还是潘多拉魔盒?Sora很热,但无需神化

2024/2/28
logo of podcast 泰度Voice

泰度Voice

AI Deep Dive AI Chapters Transcript
People
原瑞阳
朱珺
黄乐平
Topics
黄乐平:我认为Sora的技术并非革命性的突破,中文媒体对其的评价过于乐观,而英文媒体则褒贬不一。虽然在算法路径上有所创新,将视觉数据转换成patches的方式为行业提供了新的思路,但其目前仍处于发展初期,距离成熟和商业化还有一段时间。AI视频是未来的发展方向,但技术瓶颈和算力问题依然存在。从AlphaGo到ChatGPT,再到Sora,我持续关注人工智能在图像领域的变革,并对Sora在应用上的突破感到震撼。Meta发布的Llama 2开源模型,提升了模型的透明度,对行业发展有积极意义。 朱珺:Sora在技术上并非重大突破,但在算法路径上有所创新。其在3D一致性、长距离视频切换空间的一致性以及部分互动模拟方面有所突破,但它对复杂场景的物理原理和因果关系的理解仍有不足。Sora的出现是文生视频发展的重要一环,但并非终点。Sora在降低影视制作门槛和成本,缩短制作时间,丰富创作风格,帮助创意落地等方面具有显著的应用价值。在广告领域,Sora可以提升创作效率,满足定制化需求。在游戏领域,Sora可以应用于游戏角色和场景的开发,提高游戏的可玩性并降低成本。但Sora的商业化应用仍需时日,其大规模应用可能偏向2B。长期来看,Sora可能会改变行业的竞争格局,创意和故事将成为核心竞争力。 原瑞阳:本期节目围绕Sora,回顾了人工智能行业过去一年的重大进展,理性客观地探讨了Sora的商业潜力以及可以预见的未来的一些现实瓶颈。我们也讨论了如何防范利用文生视频技术进行造谣传谣和诈骗行为,以及欧盟在人工智能监管方面走在前列的新法案。我们认为,市场对人工智能产品的期望值往往在极度乐观和极度悲观之间波动,需要客观理性地看待Sora的商业场景及其可能遇到的瓶颈。未来,人工智能赛点可能在视频编辑、AI与机器人结合、脑机接口等领域。

Deep Dive

Chapters

Shownotes Transcript

人工智能技术的发展一日千里。2月16日,OpenAI推出文生视频模型Sora,在视频时长、场景理解和物体一致性等方面实现重大突破,再次验证Transformer架构的极强拓展性,文生视频的热潮快速席卷科技圈和资本市场,生动逼真的细节和流畅的运镜转场也给影视、创意、游戏等行业从业者带来极大震撼,甚至被市场寄予“真实世界模拟器”的期待。

另一方面,OpenAI也同时承认Sora尚存缺陷和不足,批评和质疑随之而来,例如Sora尚且无法理解复杂场景的物理原理及其因果,有观点认为围绕Sora营销与炒作远甚于其实际的技术影响力,而算力和数据量的瓶颈依然限制其商业潜力,同时虚拟视频生成技术的快速发展为监管人工智能带来新的挑战。

Sora将“颠覆”视频行业吗?市场是否又一次对Sora寄予了过高的期待?本期节目邀请华泰证券研究所科技及电子行业首席分析师黄乐平和华泰证券研究所传媒行业首席分析师朱珺,希望尽量通俗地解释Sora背后的技术原理,并客观理性地探讨Sora的技术路线可行性与商业前景。本期也是【泰度Voice】春节后的第一期节目,今年泰度将继续关注最新鲜的科技热点和最重要的产业趋势,任何你所关心的选题,欢迎在评论区给我们留言。

聊天的人

华泰证券研究所科技及电子行业首席分析师 黄乐平

华泰证券研究所传媒行业首席分析师 朱珺

《泰度Voice》主编 原瑞阳

时间轴

07:56 相对中文媒体的积极肯定,英文媒体对Sora褒贬不一

08:25 基于diffusion transformer架构,技术上不算大突破

09:09 将视觉数据转换成patches,这一路径值得肯定

11:28 transformer能够理解文字,但能否理解视频?

18:21 Sora可以帮助好的创意更容易落地

24:48 Sora出现是文生视频中重要一环,但不是终点

28:04 用魔法打败魔法,AI的监管要依靠AI工具

33:57 目前的Sora类似chatGPT2.0,正式商业化尚需时日

37:05 为什么不是YouTube背后的Google先跑出来?

41:46 OpenAI的架构面临挑战,复制其成功不易

泰度小课堂

研报:《Sora-生成式AI又一重要进展》

作者:

黄乐平 S0570521050001 | AUZ066

余熠 S0570520090002 | BNC535

发布日期:2024年2月17日

风险提示:AI 及技术落地不及预期

研报:《Sora引领AI视频生成新纪元》

作者:

朱珺 S0570520040004 | BPX711

吴珺 S0570523100001

发布日期:2023年2月19日

风险提示:竞争加剧风险;监管风险;模型技术进展不及预期

制作团队

主编:原瑞阳

项目统筹:韦晔

制作:高海博

声音设计:杨啸天、陆佳杰

节目运营:小米粒

本节目录制于2024年2月23日,本播客不保证节目播出时援引数据信息的及时、准确、完整。

法律声明

本播客不是华泰证券股份有限公司研究报告(下称”华泰证券”)的发布平台,旨在为公众提供宏观、产业、市场热点解读,不构成华泰证券开展证券投资咨询业务或提供任何的投资建议、投资分析意见。本播客不构成任何合同或承诺的基础,不因任何单纯订阅本播客的行为而将订阅人视为华泰证券客户。任何读者在订阅本播客前,请自行评估接收相关推送内容的适当性,且若使用本播客所载内容,务必寻求专业投资顾问的指导及解读。

本播客内容可能涉及华泰证券分析师对华泰证券已发布研究报告的解读,或转发、摘编华泰证券已发布研究报告的部分内容及观点,完整的分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本播客内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。

就本播客内容涉及的嘉宾言论,华泰证券已事先提醒嘉宾其言论及信息来源应合法合规,不得泄露内幕信息、上市公司重大未公开信息或其他敏感信息,不得侵犯第三方任何合法权益。本播客内容中的嘉宾言论仅代表嘉宾个人意见,不代表华泰证券立场,也不构成对读者的投资建议。

华泰证券对本播客节目文字、音频、图片、链接等形式所载信息的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。播客内容所述意见、观点和预测仅作为音频录制日的观点和判断。该等意见、评估及预测无需通知即可随时更改。

在任何情况下,本播客文字、音频、图片、链接等形式所载信息均不构成对任何人的投资建议。订阅者不应单独依靠本播客内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。对依据或者使用本播客内容所造成的任何后果,华泰证券及节目嘉宾均不承担任何形式的责任。

本播客所有内容的版权均为华泰证券所有。未经华泰证券书面许可,任何机构和个人不得以任何形式转发、转载或部分转载、发表或引用本播客任何内容。

本节目由华泰证券出品,JustPod制作,小宇宙、喜马拉雅、苹果播客同步上线。