We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Vol.76 | 新模型Sora爆火！AI行业除了震撼还有隐患

2024/2/20

第一财经

AI Deep Dive AI Chapters Transcript

People

OpenAI

专

专业动画师

广

广发证券

播

播客节目

浙

浙商证券

Topics

播客节目: 本期节目探讨了Sora模型的实际应用效果、对科技圈、动画圈、影视圈等行业的影响，以及AI生成视频的潜在风险和担忧。Sora模型能够生成长达60秒、多机位、高度拟真细节的视频，展现出强大的AI生成视频能力，有望改变全球AI视频赛道的格局，并颠覆现有的内容行业。牛虻: Sora生成的视频在画质、细节、光影、色彩方面表现出色，足以用于前期镜头样板和与客户沟通，但对于更精细的内容调控（如色彩、光影、道具、人物动作等）还达不到客户满意程度，目前AI还不能完全替代人工。孟凡: Sora生成的视频帧率高、宽容度高，物体运动符合规律，但在逻辑性上存在问题（例如场景与提示词不符），精细度还不够，目前还不能直接用于影视作品，但可用于前期开发和概念设计。 OpenAI: Sora作为模拟器，存在许多限制，例如无法准确模拟物理效应、理解因果关系、混淆空间细节，以及难以精确描述时间推移等。这些问题是由于概率模式的逻辑硬伤所致。陈维忠、吴博、张含望: Sora存在因果关系推理问题，这是目前所有类似模型都存在的问题，未来可通过增加训练量和数据来改善，但无法根治；真正突破需要解决因果关系问题。玉刚: Sora可能对影视特效公司造成冲击，但同时也降低了视频制作成本，未来AI视频生态将发生巨大变化，影视行业可能演变成服务业。专业动画师: Sora的实用价值还有待观察，因为动画制作需要反复修正，AI目前还无法提供精雕细琢的作品。浙商证券: Sora短期内可提升图像和短视频制作效率，改变创意、生产和营销工作流；长期来看，将改变信息生产和分发环节，专业和用户生成内容都将广泛采用AI工具。广发证券: 高质量的训练数据和核心人才是AIGC大模型成功的关键，Sora创新性地采用了视频压缩网络时空补丁的方法。播客节目: Sora的商业化进程需要考虑技术局限性、版权合规、内容伦理等问题；AI深度伪造技术可能产生大量虚假音视频图像，需要采取措施识别和应对。OpenAI正在寻求资金以提高全球人工智能芯片产能，AI技术革命仍在继续。

Deep Dive

Chapters

Sora模型的出现引发了全球AI视频领域的震动，其生成的视频质量得到了认可，但同时也存在一些不足。例如，视频逻辑性有时欠佳，在处理一些复杂的物理现象和因果关系时存在问题。

Sora能够生成长达60秒、多机位、细节高度拟真的视频镜头
Sora视频在画质、画面细节、光影和色彩方面表现出色，可用于前期镜头样板和概念沟通
Sora视频存在逻辑性问题，例如人物反向奔跑、物体悬浮等
Sora帧率较高，计算能力强，影片宽容度高
Sora目前尚不能直接用于影视作品，但已足够震撼，可用于前期开发和概念设计

Shownotes Transcript

十分钟帮你理清一个正在发生的商业逻辑。 Sora 横空出世，科技圈又迎来一个王炸。 2月15日 OpenAI 发布了首个纹身视频模型 sora，可以生成长达 60秒多机位，具备高度拟真细节的镜头。 Sora 在 A I 生成视频方面彰显出的能力，可以说改变了全球 A I 视频赛道的格局，有望颠覆现有的内容行业。

各位听众大家好，欢迎收听本期的异彩播客。由 sora 引发的讨论仍在继续，同时对 sora 存在的问题研究也逐渐深入。本期我们就来聊一聊外界是如何看待 sora 的实际应用效果。

Sora 对科技圈、动画圈、影视圈等行业的真实影响有哪些？ A A I 生成视频未来到底值不值得我们担忧？目前 sora 所生成的视频内容得到影视行业人士的普遍认可，但其中的 bug 仍然存在。

Mr I novel 视觉预演工作室创始人、导演牛虻说， sora 视频中的画质、画面内容中的细节、光影、色彩都比较精细。对导演来说，在拍摄前期做一个简单的镜头样板是够用的对广告片拍摄来说，也可以用这种样板来与客户更好的进行概念上的沟通和确认。但如果涉及镜头的运动角度以及其他更精细的内容调控，比如色彩、光影、道具、人物动作等等，目前 A I 还达不到令客户满意的程度。

摄影专业人士孟凡对异才记者表示， sora 视频帧率较高，说明计算能力比较强，且影片的宽容度更高，如调色、细节表现、高速镜头展现等。在直观感受上， sora 模型产出的视频运进自然物体运动符合规律，但用 sora 生成的视频逻辑性会差一点，比如一段提示词为一个人跑步的场景中，主角在跑步机上反向奔跑。提示词为考古学家在沙漠发现塑料椅子的视频中，椅子呈现悬浮状态。还有像老奶奶吹蜡烛，火苗却不动等等。另一位纪录片从业者也表示， sora 还不能直接用于影视作品，因为它的精细度还不够，但确实已经足够震撼，完全可以用于前期开发，尤其是概念设计的部分宣传片从业者表示， sora 只发布了部分作品，并且还没有开放公共测试，能不能代替剪辑不确定。无论如何，这些工具最后都是为人服务的，人的个人感情复杂性的表达不可替代。

针对目前 sora 存在的不成熟之处， OpenAI 方面在作为世界模拟器的视频生成模型技术报告中表示， sora 作为一个模拟器，目前表现出许多限制，它并没有准确的模拟许多基本互动的物理效应，比如玻璃破碎、吃食物之类的互动等等。除此之外，还可能无法理解因果关系、混淆提示的空间细节，以及难以精确描述随着时间推移发生的事件等。多位人工智能领域专家对此表示，目前存在的问题都是因为概率模式的逻辑硬伤所致。广发证券倾向认为，在底层基础技术原理上， soa 并未有实质性的突破。

中科深智创始人兼 C E O 陈维忠认为， sora 因其并非严格的推理模型，目前还存在因果关系推理问题。但这个问题不是 sora 自身的问题，而是目前所有类似模型均存在的问题，类似于大模型普遍存在的幻觉问题，未来会随着训练的加强而得到改善。比远智能 C E O 吴博表示，通过加大训练量，增加训练数据与物理逻辑，该问题会逐渐得到改善，但无法根治。南洋理工大学副教授张含望说，想要真正突破最底层逻辑上的问题，因果关系是一条必经之路。如果不把因果关系加上去，大模型只是在进行强行关联。幸运的话，模型在回答问题时能够给出正确答案，否则就会胡说八道。事实上， sora 背后的学术原理业内都清楚，但是从原理到落地，中间隔着数据和模型两座大山，而这也是 OpenAI 不同于其他竞争对手的优势所在。

在 sora 所引发广泛关注中，除了对于质量和技术的探讨，还有外界对其即将带来的行业迭代充满好奇。就影视行业而言，得知 soa 视频发布后，时光矩阵联合创始人玉刚称自己的心态冰火两重天。一方面，对于影视特效公司而言，该消息算不上一个好消息。他的第一个感觉是，特效公司要死了吗？他还说，没有想过 A A I 视频会这么快发展到这个精度。原本以为起码还要 3到5年，结果从兔年春节到龙年春节，短短一年， OpenAI 实现了从文字生成文字到文字生成视频的迭代。但从另一个角度来说，作为导演看了 solo 之后拍视频做成特效并放到荧幕上，这部最贵的动态预演环节完全可以通过 A I 实现成本的节省。他预计未来 A I 视频生态将发生巨大的变化，影视行业或许将会演变成服务业，视频生产的概念也将发生变化。

对于这种 solar 颠覆行业的极端观点，一位专业动画师给出了不一样的看法。他认为除了作为展示 A I 潜力的范例作用之外， solar 的实用价值还有待观察。因为动画制作本质上是需要反复修正的过程，特别是在为客户服务时更是如此。目前 A I 还无法提供给客户一个精雕细琢的作品，只是一些粗制滥造的东西。这些细节看似挑剔，但他们正是客户对知识产权或产品所持有的态度。

浙商证券认为，短期内 sora 还有其他的同类产品可以大幅提升图像和短视频的制作效率，改变创意、生产以及营销工作流，提升短视频的产品生产力。但是，对于业态更加复杂的长视频和游戏，受限于模型，还无法准确理解因果关系以及其他技术难点，现阶段或许只能以提供美术灵感支持为主。中长期来看， sora 及同类产品将参与到改变信息生产和分发两大环节的进程当中，专业生产内容将广泛采用 A I 工具辅助生产，用户生成内容将借助 A I 工具逐步替代专业生产内容。同时， AI 生成视频工具的商业化进程也将逐步提速。

至于此次 sora 给行业带来的启示，广发证券表示，一方面，数据处理与存储方式是重要创新，不同处理方式可能带来 AIGC 效果的跃升。 Solar 创新性的采用了视频压缩网络时空补丁的方法，将不同分辨率、不同宽高比等所有类型的视频数据标准化处理，并且保留了原始数据的细节，这是 sora 能支持多样化的视频格式且实现视频效果明显跃升的基础。启示主要有两个，一、高质量的训练数据仍是 AIGC 类大模型成功的关键。 2、核心人才是 AIGC 推动的另大关键。这两点最终或将使得头部厂商强者愈强。另外需注意的是对 A 股相关 AIGC 应用公司而言，短期内从投资维度看， solo 的主题意义更为显著。

需要看到的是， sora 的商业化进程仍需观察。一方面，技术文档提到的当前局限性需逐步解决，另一方面，版权合规、内容伦理等课题仍是 AIGC 类应用需要克服的挑战，文生视频也不例外。目前， OpenAI 并没有透露训练模型涉及的视频数量以及其具体来源，只是表示所有训练材料均来自公开渠道或者是已授权的内容。除此以外，人工智能深度伪造技术可能会产生大量的虚假音视频以及图像。脸书母公司 meta 的全球事务总裁直言，无法一刀切直接禁止 A I 生成的内容在社交媒体传播，因为打地鼠式的做法总是会有漏洞存在。现在采取的做法主要是披露任何由 A I 生成的内容都需要打上水印告知看到的用户。不过如何识别不同平台生成的 A I 内容还是一大难点。

OpenAI 引发的技术革命还在向前。彭博社援引消息人士称，阿尔特曼正在寻求美国政府的批准，希望从中东筹集数10亿美元的资金，用于提高全球人工智能芯片的产能。好了，本期节目到此就结束了。你有尝试过 A I 纹身视频吗？你觉得 sora 的未来前景怎么样？会改变什么？欢迎来评论区留言，我们下期再见。

Vol.76 | 新模型Sora爆火！AI行业除了震撼还有隐患 08:39 Share

第一财经

Deep Dive

Shownotes Transcript

Vol.76 | 新模型Sora爆火！AI行业除了震撼还有隐患