cover of episode 普通人就能做出好莱坞级别的场景!未来谁是主宰?| 对话游戏引擎专家 Cafe 唐军华

普通人就能做出好莱坞级别的场景!未来谁是主宰?| 对话游戏引擎专家 Cafe 唐军华

2024/10/24
logo of podcast AI炼金术

AI炼金术

AI Deep Dive AI Insights AI Chapters Transcript
People
C
Cafe 唐军华
播客主持人
播客主持人,专注于英语学习和金融话题讨论,组织了英语学习营,并深入探讨了比特币和美元的关系。
Topics
Cafe 唐军华:3D 高斯技术是近年来 3D 领域的一次重大突破,它通过利用手机拍摄的视频,结合高斯算法,可以低成本、高质量地还原逼真的 3D 场景,这将极大地降低 3D 建模的成本,并使普通人也能参与其中。这项技术并非完全依赖 AI,而是结合了传统图形学的光栅化技术,在写实物品渲染效果上远超传统图形学,并能应用于电商购物决策等领域。未来,3D 高斯技术将与传统图形引擎混合使用,而非完全替代。这项技术对数据的需求量不算特别大,算力需求也低于大模型,但需要专业显卡。3D 高斯技术目前只解决了可视化问题,空间化和物理化问题还需要大模型的补充。这项技术有望解决数字世界统一度量衡的问题,并推动数字娱乐产业的快速发展,其市场潜力甚至可能超过游戏产业。 Cafe 唐军华进一步阐述了 3D 高斯技术在降低传统扫描资产处理成本和 AI 语义识别方面的优势,以及它与传统图形学工具链的整合潜力。他认为,3D 高斯技术的发展速度将远超传统图形学,并在 3-5 年内取得显著成果。他建议,基于 3D 高斯技术的创业公司,应该选择那些传统上缺乏 3D 技术但 3D 技术能够创造价值的领域,例如电商行业。 播客主持人:本期节目主要围绕 3D 高斯技术展开讨论,并探讨了该技术对数字娱乐产业的影响。主持人首先介绍了 3D 高斯技术的背景和意义,并与 Cafe 唐军华就该技术在动画制作、游戏开发、电商等领域的应用前景进行了深入探讨。主持人还提出了关于 3D 高斯技术与大模型、空间智能技术关系等一系列问题,并与 Cafe 唐军华就这些问题进行了详细的解答。通过对话,节目展现了 3D 高斯技术的巨大潜力,以及它对未来数字娱乐产业发展方向的影响。

Deep Dive

Key Insights

为什么游戏引擎成为制作动画片的首选工具?

游戏引擎被广泛用于制作动画片,主要是因为它们在创建3D资产和动画方面更为高效和方便。传统动画制作是一个体力活,需要大量的人力和时间,而游戏引擎可以大大减少这些成本和时间。此外,游戏引擎的实时渲染能力也使得动画制作更加灵活和快速。

数字娱乐产业的门槛和可能踩到的‘坑’是什么?

数字娱乐产业的最大门槛是成本。制作高质量的3D内容需要大量的资金,尤其是在游戏和影视产业。此外,找到合适的、有经验的3D程序员和制作团队也非常困难,这进一步增加了成本。如果产品无法在商业化上取得成功,这些高成本将成为巨大的负担。

3D高斯技术的核心特征是什么?

3D高斯技术的核心特征是显著降低成本,只需用手机录制视频,就能还原出价值数万甚至数十万元的场景。它允许普通人制作高质量的3D模型,帮助做出电商购物决策,且不需要人工标注模型的不同模块。3D高斯通过AI语义识别直接对模型进行拆分,大大提高了效率。

3D高斯技术如何帮助传统艺术生进入数字化世界?

3D高斯技术通过AI工具化,使传统艺术生可以更容易地进入数字化世界进行创作。例如,艺术家可以通过自然语言命令生成3D资产,然后通过AI赋予这些资产物理属性和游戏性。这不仅降低了技术门槛,还为艺术家提供了新的创作工具,使他们能够将天马行空的想法转化为现实。

3D高斯技术与大语言模型之间的关系是什么?

3D高斯技术主要解决可视化问题,而大语言模型则解决物理化和空间化问题。3D高斯在渲染高质量3D模型时,需要大语言模型来填补物理特性和空间特性的空白。例如,3D高斯可以生成一个玻璃杯的视觉效果,但大语言模型可以识别出玻璃材质并模拟其破碎的行为。

3D高斯技术在电商领域的应用前景如何?

3D高斯技术在电商领域的应用前景非常广阔。通过生成高质量的3D模型,消费者可以360度查看商品,提高购物体验和决策准确性。此外,3D高斯技术可以显著降低成本,使得更多商家能够采用3D展示方式,从而提升竞争力。

3D高斯技术的发展前景如何?

3D高斯技术的发展前景非常乐观。预计在未来3到5年内,3D高斯将迅速发展,成为数字娱乐和电商等领域的核心技术。它有望解决传统3D资产的标准化问题,实现跨平台的通用性,并大幅降低制作成本,推动整个产业的快速发展。

Chapters
本节探讨了游戏引擎在数字娱乐产业中的应用,特别是动画制作领域。嘉宾指出游戏引擎因其效率和可控性,成为主流动画制作工具,并分析了Vigo等新兴产品在商业化道路上可能面临的挑战。
  • 游戏引擎成为动画片制作主流工具
  • Vigo等新兴产品商业化挑战
  • 数字娱乐产品解决方案的重要性

Shownotes Transcript

新蛋糕我觉得永远是最赚钱的去抢老蛋糕的这个永远是最苦最累的活

确实是 3D 高师它会去改变整个产业很多的东西尤其是大家关注了什么元宇宙复制完生然后直播卖话这些才是真正 3D 高师的发展的一个最核心的区域并且它所带来的利润和整个产业的量的需求蛋糕的大小可能是不是未来会比游戏产业还要大

游戏产业或者说影视产业一直以来成本属于是它的最大最大的一个门槛因为你要想把画面做好这件事情就已经是很烧钱的一件事情烧钱的本质的背后就是认知

就是 DIT 其实本质就是 Transformer 的整个的底层的实现然后其实是 Transformer 实现了数字世界的统一的度量衡的单位就是 Token 核心的一个重点就是数字化的世界我们要想高速的发展统一度量衡就秦始皇证明统一度量衡实际上是非常非常重要的统一度量衡之后那么这个世界才能高速的爆发这个我觉得是一个很重要的一个观点了

大家好,欢迎大家来到 AI 练金术那么我们今天邀请来的同学叫做咖啡然后咖啡能不能简单自我介绍一下我不知道应该挑你哪段重点讲大家好,我叫咖啡唐君华我大概干了十多年的游戏产业一直在做游戏开发和游戏图形引擎开发然后曾经做过国产商业化引擎

大概带这个产品带到过三年时间的国产 No.1 吧后面就一直服务于法国育碧公司做一些 3A 有关的一些研究了所以如果要给你打广告的话是可以说你是国内做游戏引擎数一数二的人可以这样讲吗这个就有点太高调了还是就做过引擎开发吧

国内很少数做过自己研发过油气引擎并且现在在给大公司做油气引擎的人低调其实我关注到咖啡同学的话其实是在一个 IT 的场地

就是超声波的线下活动然后的话呢就在他听他讲说那 3D 的世界然后我们可以用 3D 的游戏引擎然后可以什么 3D 高斯啊什么的就可以把一个世界给搭出来听着就觉得非常的神奇就是因为我最近关注 3D 和 Diffusion 嘛然后听到他讲就会发现说原来还有一个强控制就是高所谓的可控制性的那个视频生成领域其实不就是游戏吗

然后就是一些 3D 资产啊什么的然后就听他讲着讲着就发现说哎游戏行业好像这方面已经积累了十几二十年的经验已经有大量的资产大量的那个算法啊然后人才啊甚至于已有的数据资产已经在那里了

然后就突然觉得这边是一个宝藏然后就拉了咖啡同学在请教所以他说我在 3D 方面的老师所以今天把他拉过来分享一下大家天天讲 Transformer, Diffusion 然后其实也有旁边还有一个另外的世界然后正在蓬勃的发展而且最近两年我听咖啡讲说其实这个领域有了非常重大的类似于 Diffusion 这么大的或者 Transformer 这么大的一个技术突破所以的话今天把他邀请过来

我先从一个很小的问题入手今年上半年有一个应用其实蛮火的叫 Vigo 把一个人可以换到另外一个场景里面唱歌跳舞什么的他们走的应该是一种类似于 3D 的路径把一些东西抽出来然后再放进去诸如此类的我看到他们最新的 PR 稿讲说未来要做游戏引擎

理论上是的

其实我个人理解游戏影行这个词其实有大量的这个歧义啊因为这个词有的时候就是大家理解是一个叫游戏这个 3D 图形影行这么一个工具但是有的时候我们又把它当成了这个数字娱乐产品

生产的一个解决方案就是它不只是要做那个程序员因为引擎是程序员写代码的工具嘛跟策划无关跟这个美术可能也无关嘛也管不着吧对但是实际上大家需要的是整个就是数字化娱乐产品的这种解决方案你比如说像这个中国的动画片现在整个中国的这个动画片产业

基本上 90%以上的公司都是使用 U15 来去做这个动画片了跟日本是完全不一样的日本完全是通过手工的方式去做的哪怕是现在有了这个 WELCOME 的这个画板能画了但是本质它其实也是说从这个用笔来画转换成这个数字的这个笔来画仅此而已个人理解就是说像 Vigo 这样子的一些产品的话它早期的时候更多的是一种对技术的一种宣发吧

我觉得它只能算是这个开发数字娱乐产品当中的其中一个环节我觉得 Vigo 目前的这个角度来讲很难被定义成一个比较完善的一个商业化的产品或者说适合就是一个公司去创业去做的一个比较明确的商业化的一个目标

所以那么往下推导下去比如说如果 Vigo 说它自己未来也要做这个类似于这个游戏影行的这种方案的话那我觉得这个公司还是有蛮道德的看头的但是可能啊可能我觉得它要遇到的这个问题会非常的多因为这家公司不是传统意义上面做这种数字娱乐产品开发的公司这中间还是有很多行业的坑可能要去填的

那这里面我引发两个问题一个小一点我先问你刚刚提到说动画片现在大部分是用游戏情作的

所以为什么大家用游戏引擎来做动画片呢是它创造这种什么 3D 的资产或者让人动起来比较方便吗我个人是这么理解一件事情就是动画片这个领域从它的这个发展就是在没有数字化之前大家会发现它其实本质是个体力活或者说是个量活

那么这个体力活这个量活的核心比如说我们要做一个一秒六十帧的这个动画那这个动画你就会发现它要的并非是你的创意而是说你如何把这六十帧这个

这个画出来那么当然他画出这六四针他也是需要一定的技术能力的但是核心的这个点其实是个量所以你会发现在两滴的这个动画的时候整个的那个产业早期其实是由中国这边大量的这种传统化油画或者是说画画领域没有找到很好工作的一群人在揭掉就是欧美或者说日本的这个单子

在后面的话就是变成了朝鲜和韩国别忘记朝鲜现在是很重要很重要的一个环节没错因为他们那边画画工地的人还是挺厉害的就传统化所以这个是两地的一个状态那么其实两地就是一个苦活累活嘛

那 3D 的状态为什么国内要用 3D 来做原因是第一国内整个的动画片领域虽然发展的也比较早并且也影响到了像龚奇俊这样子的一个大师不过早期的那帮上海上映的那帮非常厉害的人好像后面都去了迪士尼了所以导致中国的动画片其实是断代的断代完了之后就像非洲一样他们

没有经历过电话机时代上来就是手机时代中国的动画片产业其实也是同样的道理用 CG 动画片做起来动画片它速度比较快首先第一点大量的场面还有大量的人员其实都是从影视行业过来的他们对 3DMarkus 玛雅都非常的熟悉

所以相当于是无缝切换过来的嘛反而是传统的两逼的那群人那群老师去了因为去了迪士尼之后产生断代导致的然后我也跟上海你比如说像东方民族集团底下有一家公司他一年下来也有几个亿的流水吧做动画片的有

以后跟他们有过很多的沟通交流他们也觉得就是说想招聘到两 D 的人员太难了但是三 D 貌似因为中国游戏产业比较丰富还是很容易招到人的但是也只是说招到人而已想要把一些顶尖的人招过来对他们来说还是非常困难的一件事情所以大概是这样的一个行业形态吧

这是刚刚听你讲想到的一个小问题那个大问题就是你说因为他们比如说没有数字娱乐产业的经验所以一定会踩坑因为比如说像徐文浩你看也没数字连娱乐行业经验我也没有我们都是以前做什么工具做什么电商的

那假设我们现在想做一个比如说用 3D 或者 Diffusion 啊什么的我们做一些好玩的东西然后让大家可以在里面娱乐那你觉得我们会踩什么坑啊就是我们提前提前先预警一下就假设我们不是要做效率类的东西我们就是要做好玩的纯娱乐的搞笑的命啊什么这种这一类的东西你觉得我们会踩一些什么样的坑是我们现在看不见的如果说

你所做的这个产品 AI 的这个占比或者说 AI 创作的这个占比它占比是比较小的情况下那么你就会发现 3D 它有一个巨大的一个门槛我举个例子你比如说像我们整个的这个网页产业和这个 APP 的产业还有 AR VR 这个相关的产业都没有大规模的去铺出一些 3D 有关的这个产品原因就是 3D 的程序员和 3D 的整个的这个团队制作团队其实上

放在传统的开发的角度或者研发的角度来讲它是非常昂贵的如果你整个产品的商业化也就是说你的收入和你的支出你没有办法能够保障到一定的比例之上那你这个产品是很难真正一级产品做商业化的当然你说你做了 5R 我觉得肯定是没有问题的

你想要把它变成商业化这东西一定会涉及到成本的这个问题这个可能才是最核心的一个点就做 3D 很贵的意思吗非常贵不是很贵是非常贵大概是个怎么样一种贵法因为现在做 AI 我 token 也要给钱

然后我要做什么视频的话我要烧 GPU 也得给钱我们现在做 AI 的产品本身也成本意识比做互联网的时候已经强了很多假设我要进入到更 3D 一点是再会多两个数量级的意思吗我觉得这个不是说数量级的一个问题我说一个流程比如说我们现在要设计一个苹果然后放到手机上面让它去展示

那么接下来我们第一件事情可能要去找一个原画师那这个原画师给你画出一个两滴的这个苹果接下来完了之后可能我们这个两滴的苹果我们要去建模了那么建模也分很多种比如说我们按照育碧的这种 3A 游戏的方式去建模那可能就是这个苹果有可能就价值一两万一两万这个苹果比你买的苹果还要贵

那也有便宜的比如说 5000 块钱的 3000 块钱的那有些人比如说我收了你一两万如果你没有这个鉴别能力很有可能就是你给了一两万块钱给对面建模的人但是实际上他们用一些投机取巧的办法比如说用软件来生成这个法权贴图你会发现他给了你这些东西但是如果你没有这样的办法的话你会发现这个苹果并没有真正意义上面达到 3A 的这个标准

那么假设这一关我们过了那接下来假设我们对苹果还需要一个生长的一个动画比如说它是怎么从小苹果长成大苹果的接下来你要找一个动作的岗位把这个苹果然后植上这个骨骼然后做上这个骨骼的上面的动画那么你做好了之后还没有能用

你还需要放到比如说 Unity 或者 UE 里面去调整它的那个 Shadow 然后去看一看这个苹果在 Unity 里面渲染的效果是不是对的那么你在 Unity 渲染效果是对的不意味着你放到 UE 里面就是对的了那么这中间任何一个环节如果你进行反攻那么你前面的环节都得重新再来一遍很容易就导致出发生这样一个事情

所以一个成熟的团队可能他假设用一万块钱制作出来的这个苹果那么一个不成熟的团队他有可能最后这个苹果拿到你实际用的时候他可能中间来回的成本变成了三万五万甚至完全不能弄的东西你得重来一遍

这在游戏产业里面都是非常正常的一个坑吧也是算是挺大的一个坑这也是国内为什么大家会发现黑五空这样的一个产品实际上是非常值得大家尊重的一个原因因为你要想把画面做好这件事情就已经是很烧钱的一件事情了啊

烧钱的本质的背后就是认知所以说比如说我要拍一些因为有一些国产动画片看着也挺粗糙的如果我要拍一些那种东西就挺容易的如果我要做黑悟空这种光剑魔这方面的成本就是超乎想象的没错动画片其实也很贵的他们之所以便宜的原因是因为他们用了大量

可能不是那么符合行业标准的一些素材反正先凑合就先上吧能满足档期就可以了所以你会发现就是那些动画片里面的这些动作还有场景等等相关的光影也好

它可能虽然是离线式炫耀的可能还不如像 EA 啊暴雪啊或者玉碧这样子的一些实时炫耀的游戏可能画面还不如那些对我看到有一些爱奇艺上的动画片的话反正我刚刚那个上线之前在打那个刚把白衣袖式打掉在打那个

黑神话悟空确实我觉得它还没有黑神话悟空的游戏画面好那些大部分的那个国产的 3D 动画所以其实还是成本是一个就要做好其实是需要巨大成本的事情对游戏产业或者说影视产业一直以来成本是会是它的最大最大的一个门槛而且这里面的成本不是说你掏钱就可以了而是说你掏完钱了之后

你想找能够满足你的要求的人这群人在整个产业里面就非常的稀少他不是说你掏钱就一定能找到相应的人给你做的上一次的话那个我们组织了一个 meetup 专门讨论呃

那个 3D 和 Diffusion 生成方面嘛然后那次就在听你讲说其实你觉得在 3D 的领域其实也在发生重大的技术突破就有点像 Diffusion 和 GBT 这么大的技术突破我印象当中你说的是 3D 高斯嘛那这个突破它是一个可以把成本大幅度下降的一个重大的影响的事件嘛还是一个纯粹的学术突破还是一个真的有用的就是像 GBT 像 Diffusion 这么大的一个突破

我觉得是 3D 是做了一个很大的一个突破吧为什么因为我可能从 07 08 年就开始关注就图形学这一块然后大概是在 09 年的时候图形学上面由迪斯尼提出的 PBR 就是基于物理的这个渲染完了之后再到最近

我就没有发现什么这个图形学上面从底层从基础公式这种级别上面的一些改变了之前的整个游戏产业里面相关的论文也是比较少的但是自从我们这一波 Transformer 大模型开始左右就开始有人企图用这个大模型就是 Nerf

去证明就是确实我们可以用大模型这种思路来去实现这个渲染也就是说走了一条完全跟传统图形学不一样的一个路子至少从水月书上面证明它是 OK 的虽然它的那个整个这个性能比较差劲吧

但是这个 NERV 出来之后又有一个应该是一群法国海边的一个大学里面三个法国人加一个德国人我看的论评论文是这样的就是发出了一篇论文提出了 3D 高斯这个观点它从严格意义上面来讲并不是纯粹意义的 AI 渲染但是它提出了这个全新的这个高斯球的这种渲染模式

也是非常有意思的并且我觉得它的核心因为我们刚刚在聊 3D 的时候我一直聊一件事情

3D 可以把很多东西做好但是它的成本是很昂贵的 3D 高师的核心是第一你只要用手机录出视频完了之后这个视频的角度以及它的整个的清晰度足够的情况下那么我们是可以通过训练的方式去赡养出一个非常逼真的环境的那么这个整个过程不需要专业的人员参与

随便一个只要能摄影得好的人那么照一定的规范他就能够去还原出一个可能价值什么十万二十万甚至五十万的这么一个场景那么这件事情其实实际上是非常突破性的一个变化的了第二个事情的话就是说这篇论文

应该是 2023 年是 8 月份还是 9 月份左右发出来的截止到今天为止大概一年多一点点时间吧

就这么短的一个时间我看到了整个图形圈子里面大量的人去参与进去你比如说像 Unity 公司的三号员工就专门为 3D 高斯然后写当然这个人已经离职了他专门为 Unity 写了一个插件然后做了一些这种优化然后大家可以在图形引擎里面进行混合式的这种渲染

那不只是 Unity 了 U1 之类的影形也跟上了包括我们团队针对我们自己的影形我们也写了整个高斯的混合性渲染的优化让高斯进入到我们场景里面去了那么刚刚说的是成本我们再说渲染效果就 3D 高斯在写实的物品渲染的效果上面是远远超过

传统的这个图形学的那个真实程度是可以让普通人做出这种类似于电商购物决策的就是这两点上面我认为是突破性的我好奇答端问一句就是说让普通人做出电商购物决策这点是已经有现成的公司或者 demo 做到这一点了吗

您可以上那油管上面去搜一下有好多家公司已经提供相应的 APP 您可以照着那个 APP 下载然后去扫描你的眼镜或者苹果然后它会生成你的质量我目前也在跟一家国内的一家公司在合作可能就是看看 10 月份或者 11 月份也会对外公开一个 APP 要实现相应的这个效果就实际上普通人也可以做到

就是非常逼真的这种小物件或者说大场景的这种还原那我

我现在比如说我面前的这个麦克风意思是我拿着手机对着它比如说转一圈拍个视频就直接可以生成一个这个麦克风的 3D 资产然后可能只要几块钱人民币成本显卡是不是几块钱现在我不好说但是未来我觉得有可能会比几块钱更低的一个成本因为现场的算力现在大家都在去做而且重点是它非常逼真是你用传统的图形影形

需要经过大量专业人士才能得到的这个效果可能这个效果是差不太多的所以黑神话悟空那个我看到杨奇的采访是说他们开始是自己在搭环境嘛最后就干脆直接去扫描那些房子然后说然后那边那个采访他的人说就说这是不是一个巨大的成本和工程他说其实这样还比较省钱一点

他们用的是不是那就是类似的技术啊他们用的其实并不是 3D 高斯吧他们用的还是就是图片转 3D 的这么一些传统的方案那么这里面我可能要跟大家就是同步一个小小小的信息就是国内很多人都觉得做游戏一定是这个 3D 建模人员凭空来去建一个模型

这个做手游确实是这个样子的原因是我们需求的东西没有那么逼真或者说我们没有办法去支付这么高的一个成本所以我们大量选择的都是建模甚至是很多所谓的外包公司

它也不是从零给你建模比如说你需要一个船它就随便拿一个船来给你改改反正改到你满意为止反正合同签好只要改十遍我改到十遍就行了就交差了所以你会发现国内的很多游戏为什么没有那么精美就来源于这个原因那么整个 3A 产业里面

我们不管是场景其实都是扫描的比如说玉碧的这个信条的大革命里面就把巴黎圣母院花了大概三年的时间用最精准的激光扫描把整个巴黎圣母院精准的去建在了我们

的游戏当中去那么大家可以看到巴黎圣母院被烧了之后玉碧还专线了一些数据帮助政府去修复巴黎圣母院这是第一个事第二个事情就是相信黑五空的人大家都知道里面的蜘蛛精都是有相应的脸膜和体膜其实海外的 3A 游戏早就是这么做了

并且动作也是有专业人员来去做动补来去实现的所以这样反而会更加节省成本所以 3D 高斯的第三个特征就是来了本来我们产业用的就是扫描那么这些传统的扫描的这些资产是可以快速如果他们当时做得比较好的话是可以快速的去做高斯化的

那么它的成本也会降低了很多原因是传统的扫描是没有办法做语义的你没办法插到这种种种种环节比如说我们有一个城楼城楼上面有旗帜可能有壁灯也有墙壁上面的砖那么它扫描出来的一整个模型就会是一整个整体

那么我们后期模型人员需要自己手工看上面的物体手工进行物体识别把这个城楼这个城墙给拆成比如说灯和这个栅栏和这个可活动的区域这个砖头等等相关的东西

那么如果用 3D 高斯来去做的话我们是可以用 AI 来去做语义识别然后提前把这个物件给去拆分出来所以它会降低的成本会更多并且它的逼真度也非常好没有明白这件事情就是原本的它也可以用 AI 去帮它拆为什么只有 3D 高斯的才能用 AI 拆呢

原本的那个流程里面确实我们可以加上那个 AI 去猜但是现在基本上没有人去去演绎这件事因为原本的流程它已经定在那里了你去做当然可以但是你做好了之后然后你下一步呢因为传统的那个算法公式的关系所以你比如说你这个灯亮起来它实际上是用 Shadow 来去实现的

你可不可以用简单的语言给小白讲解一下说 3D 高斯是个啥这个技术是怎么实现的简单粗暴点理解大家可以

理解就是我们用相机针对现实的物理世界当中进行拍一堆的这个照片完了之后用某种特殊的这种高斯算法对它进行压缩然后因为我们有了现实世界当中的实际的光影信息并且是不同角度的光影信息

那么我们还原出来的光影信息一定比我们用 fake 版的这个数学公式还原出来的光影信息更加逼真因为一个是你用一个 fake 的公式算出来的光影信息另外一个是我直接得到答案比如说像你面前的那个麦克风它为什么是比如说是灰色的

那我们通过游戏隐形赡养的时候那我需要有大量的公司去赡养它但是使用高斯的话我红色采集就好了我不要管它为什么我采集出来的一定是最逼真的

粗暴的理解粗暴的理解了解我之前听你跟我就是讲完之后我还专门去问了一下那个 GBT 然后他给我的讲法是说他拍摄的时候他就会把他采集到的所有的点然后把用高斯算法把它变成一个一个概率球

然后所有的概率球拼起来的时候再去算那个最大概率平面然后就不是像以前的那个就是纯粹的相当于以前就三角形嘛对吧三角形四边形去拼起来这边的话就是无数个点然后每个点都是有一定概率概率的一个球然后那些球和球之间拼起来的话最大概率的那个面就会自然而然的出来他 GPT 这个讲解大概对吗对非常对也非常精准但是这个东西不好理解哈哈哈哈

我看到的时候其实会觉得非常之恐怖就是就概率球这个事情之前我只在微观世界学物理的时候学量子物理的时候看到过然后就觉得说难道这个东西跟量子物理里面那个东西好像也是有一定的概率然后就觉得说好像跟那个

就遇事不绝量子力学嘛就是啥不懂的东西好像都跟量子力学有点关系就很神奇我觉得你重点不要去理解那个概率球吧就是可能高斯球可能会更精准一点那个可能概率球这个你会把概率的那件事情作为这件事情的思考中心了

对但实际上不是是吧对因为高思求这个算法我在上一次跟 GuiGui 几个朋友在聊天的过程当中他说 3D 高思的这个算法并不是今天才被发明出来的他们当年在做那个摄像机就实体摄像机采集的时候曾经做过类似的一些算法和类似的一些做法具体的我可能得后面去问问他们了反正这个东西并不是今天才发明的一个东西是有过

前身的然后另外就是那个呃李飞飞他们最近很火吗在搞那个空间智能吗那这他们就搞个空间智能和你说的这个什么 3D 啊高斯啊这些东西是有关系吗是一回事吗还是没关系其实我觉得这是一个非常有意思的一件事情啊

目前我们看下来大模型已经可以把这个文字啊代码啊图像啊然后视频啊声音啊做得非常的好了然后并且他也把这个作为了一个数字化世界的一个基础单位 Token 就是把上面的所说的这东西全部都进行 Token 化了整个的这个李飞飞在做的这个空间智能

我认为约等于 3D 但是又不是 3D 我觉得它是 AI 发展的一个必然的现象原因是什么就是你比如说我们看看人类的发展比如说我们人类先是发明了文字然后有纸张可以写文字完了之后因为有纸张了那既然写文字那我还不可以画画画点画所以我们就从文字走向了画画对吧

那画画也这个静态的画也没有意思嘛那所以我们后面又发生了发明了这种留声机嘛就是可以把声音给记录下来对吧然后再到后面我们可能有这个无声电影慢慢又变成有声电影了完了之后我们又开始有这个两滴的这种游戏嘛坐着坐着然后我们走向了这个三滴的游戏这是人类的这个发展轨迹嘛那电脑

硬件的发展其实也是嘛比如说电脑硬件一开始电脑只能处理这个文字嘛只能打字嘛那大家就通过用这个字符然后去构建出类似于图片的东西比如说我们用有很多人用代码来去构建一个佛祖然后保障着自己代码不要崩溃嘛对吧

大家应该能让人看到这种梗吧然后在他后面那有人就想为什么不能用电脑来去处理这个图像呢后面就电脑就有了图像的能力完了之后既然有图像了当然我也要声音嘛然后有声音了之后我们就有电影嘛有电影开始就有两地的这个游戏再到三地的游戏吧所以我理解李飞飞所做的这个空间智能其实本质就是一个一个敬意词吧

然后并且我觉得他们应该是同一个回事也是说 AI 发展的一个必然过程因为 AI 也是像我刚刚所说的一样从文字再到代码再到图像再到视频再到声音那接下来我们要解决的问题都是这样子的所以我觉得这个是一个发展的一个必然的一个方向然后今天上午我跟徐文浩还在跟硅谷的

朋友在聊也是他们在做也是算空间智能吧现在大家看都统一到这个词汇下面了但是他们走的路线基本上我聊的大部分做比如说做视频啊什么的人因为视频也牵涉到 3D 嘛因为你至少你视角要动一下那这个时候基本上都统一到 DIT 路线了然后从这种呃

创业者的角度经常的一个观点是认为说既然我们有了 GBT 的这个教训就是说那其实就怼数据就好了嘛就不需要在中间搞一层 3D 你就把那个原始的 2D 的这种图像数据只要怼到足够然后多样性啊当然标注完那些报道搞得足够好

算力堆到够之后他自然会在里面他会理解这个世界的比如说一个 3D 的关系不需要显性的我们来搭一层所谓 3D 的这个东西就不就跟以前可能我们需要知识普普 NLP 里面搞很多有的没的那种东西才能够理解语言现在的话就 Transformer 全搞定了对吧那现在大家是有一种观点是说都统一到 DIT 了就没有必要搞 3D 了那你你你

你是很显然应该不同意这个观点吗来来来吵一吵我觉得是这样的最早的时候图片和视频它都是基于这个 United 的网络来去做的嘛

然后这个网络我们粗暴点理解因为今天也不是学术性的这种探讨我们粗暴点理解它就是为一个图形两 D 网络而生的设计了这么一个网络那么后续大家在上面缝缝补补做了很多比如说生成视频的事情你比如说皮卡软位早期也是 united 的也没有说直接到 DIT 里面到 Transformer 里面去嘛

所以后面还出现了什么 3DUnital 就是为了解决一些时序的问题还有 3D 就多一个纬度多一个轴的一个问题其实这里面都是逢逢不补的一件事情我觉得每个时代都会有自己的一些历史的一个目标 Unital 的早期是比如说为什么李飞飞是这个 AI 的窍目

是因为他定义奠定了整个的这个 AI 加图形图像的整个的这个识别的整块领域相关的这个基建和相关的整个的这个内容所以我个人理解 Unit 早期的这个目标就是告诉大家 AI 能干生成图片和视频的这个事情但是他干的好不好或者说他干的这个

实际对不对其实不是那么重要只要他能干就可以了你比如说像游戏里面我们游戏也有大量的这种 fake 的内容你看着像是那么回事其实背后都不是就是真实的这个物理或者是真实的这个图形渲染

大家统一到 DIT 我觉得这个话我可以换个话来去说就是 DIT 其实本质就是 Transformer 的整个的那个底层的这个实现嘛然后其实是 Transformer 实现了数字世界的

统一的这个度量衡的这个单位就 token 很好的去描述比如说文字代码图像视频声音物理甚至是最近 GPD4O 推出的这个所谓的思维链或者说思考模式吧等等相关的这个东西

所以我理解我们核心的一个重点就是数字化的这个世界我们要想高速的发展统一度量行就秦始皇证明统一度量行实际上是非常非常重要的所以我觉得不是大家统一到 DIT 的这个路线而是这个路线可能是最快的能让大家去

去统一度量衡的能让比如说我们在生成视频的这个过程当中比如说把它相关的代码或者相关的声音也能做同一个纬度的这个去生成而不是声音生成声音的图片生成图片的视频生成视频的那么这个时候才能为我们真正意义上面产品化打下的这个坚持的这个基础按照秦始皇的这个做法

统一度两横之后那么这个世界才能高速的爆发这个我觉得是一个很重要的观点了所以这不见得是矛盾的事情我不认为是一个矛盾的事情我认为是一件好事而且是非常非常好的一件事情你比如说现在很多投资者都在投纹身动作和纹身 3D

我觉得它们两个是一件事情你比如说你纹身动作你做了一个手挥舞的动作那不好意思你做手挥舞的这个动作你的手假设臂长是比如说 40 厘米

然后我的手臂长我是个小孩子我是 20 厘米的这个臂长那你的动作套到我这个小孩子的这个手明显就不合适嘛这个动作一定是错误的你这个动作配上我这个人怎么用嘛完全没法用所以你要想生成一个完全可用的一个模型

理论两者之间应该是共同去生成的你在生成动作的时候要考虑到我的臂长我的腿长还有我的整个的动作的协调程度还有我肌肉的程度你比如说一个 120 斤的胖子跟一个 220 斤的胖子身高有一样的情况下他的动作也不应该是一样的嘛

所以统一度量好像是非常重要的确实就是其实很多视频里面已经有 3D 了比如说它里面非常常见就是至少你会加一层深度的深度吗深度不就是又一个维度吗对深度图谷歌图对是的我觉得你们真的是搞技术的非常的温和我那天其实还在怂恿一个就是不是 3D 路线的人然后你在讲的时候我就说来上去找价值那天那个 meetup 结果他也没有送上去给你找你现在也是这么平和

哎呀搞技术的人好难吵起来其实我有很多很好奇的问题因为 3D 高斯这个事情其实也是

那个 Mars 前一阵介绍 Vigo 的时候我大概去看了一下但其实我对这个领域完全不了解因为这轮的大圆模型也好 Sable Diffusion 也好都是一个高度依赖海量数据的逻辑就是说我越有高质量的数据我的数据量越大通常意味着我这个模型的能力越强回到这个 3D 高斯 Splitting 这个领域

这个逻辑也是一样的嘛,它同样是一个我把那个叫传统的 AI 领域就叫 scaling 了嘛对吧,就是我只要去堆数据我就能获得更好的结果那 3D 高斯今天也是说我其实需要海量的这些照片和对应的比如说历史的 3D 模型去做这件事情

还是说他对数据其实没有那么饥饿其实 3D 高斯这个事情它跟 NERF 是有本质的一个区别的它本质并不是一个完全由 AI 大模型来去渲染的这么一个渲染模式它中间还是用了这个光三化也就是传统图形学里面的东西但我觉得 3D 高斯它就有点像我们这个图形渲法比如说最早的时候是有个叫干算法的

这个算法要做得非常棒但是它还是没有达到大家应用的要求直到出现了 Stable Diffusion 才大家统一的认可 OK 就是 Diffusion 的这个算法是可以做到就是大家的这个产业化和商业化的那 3D 高知是不是直接就是终点的呢我觉得未必

因为它中间只是解决了我们是否可以拿到游戏产业去应用的一个事情它跟 AI 它就除了这个训练的过程是用了一些 AI 的算法之外它在渲染的过程其实跟 AI 关系不大所以它对于数据上面的要求有但是不是传统意义上面大模型的这种 skill 它的核心在于通过一种非完全传统东西进行所谓的方式

然后达到了一个非常低成本低到你完全无法想象的一个成本然后并且他率演的这个质量非常高高到了也是说你一定要请到非常专业的这个 3D 图形演员或者说相应的这种美术制作人员才能做到的这个效果所以他的核心突破点实在在这而不是真正意义上面在 AI 那一块但是

因为它是一个基建大家应该听过 Amida 公司一直想推 OpenUSD 其实我是极度不看好 OpenUSD 的为什么因为 Amida 希望它成为整个产业的标准原因是在影视产业和游戏产业还有动画片的相关的一些产业还有包括传统的一些建模的那种比如说工业 CAD 的建模的产业

其实是非常非常割裂的每个产业的这些数字化资产是没有办法去做到通用的并且跨过去折损其大无比的

所以 3D 高师那么他很有可能我只是说很有可能他是能够解决掉整个数字化世界的统一度量衡的一个问题所以我为什么觉得他是一个核心发展的一个要点他很有可能会完成 NVIDIA 寄望于 OpenUSD 的这么一个历史的一个事件还有一件事情的话就是说关于老的资产

比如说现有我们所产业积累比如说迪士尼积累了大量的这种传统 3D 机 Mesh 的这些资产那么它也是可以反向进行 3D 的高斯化的那么 3D 高斯化完了之后我不知道大家有没有关注过一件事情比如说传统的图形学已经发展了好多年了导致很

很多实验室就是传统上面的一些实验室做学术研究的基本上已经不怎么关注我们图形产业了只有图形产业里面专有的一些公司才会去里面做一些研究那 3D 高斯现在是什么样一个阶段一些完全跟产业无关的一些实验室再去研究比如说 3D 高斯 BlendShip

其实就是大家所理解的虚拟人但是它是用 3D 高斯来去实现的你比如说像 3D 高斯如何画出更加逼真的头发类似于 Ameda 的海菲斯国内人比较喜欢叫海菲斯的其实就是一套设想头发的技术

我们现在看到的情况是说 3D 高斯这样的技术的兴起导致了大量的这种以 AI 学术为研究的一些但它核心可能不一定是 AI 而是说它用 AI 的方式加 3D 高斯的这种方式尝试去对整个物理世界的进行建模并且它的这个建模是远远超过所谓 EAUB 暴雪这些顶级的公司建出来的那些资产

而且它这些资产的价格极其廉价因为玉币一暴雪可能得到同样的效果需要支付比如说十万二十万的这成本那实验室里面的那套技术可能量化之后商业化之后可能真的是一块钱两块钱的成本所以是这一点上面导致我觉得它 OK 的理解那我其实还是有一个比较好奇的一个应用问题吧因为

在游戏的这些开发的过程中其实这些模型是整个演化管线中的一小部分通常是我需要在这个模型上还要做各种各样其他的应用那按照刚才的这个说法是说我今天三用 3D 高斯出来这个模型是可以无缝嵌入原来的演化管线吗还是说因为我用了 3D 高斯其实我连这个演化管线也需要重新考虑怎么去重建

或者说这个 3D 高斯的素材是我相当于又把它变成了跟原来的 3D 素材一样,进入我原来的研发管系就能去使用,还是说不是的,因为这个导师我的引擎也得去做改造,其他的比如说技术美术贴图这些都要我要他去做改造。

首先我先说一下就是说 3D 高斯跟传统图形隐形我认为在未来的几年内它肯定不是替代式的发展就是不是说我用了 3D 高斯我就不能用传统的这个 mesh 算颜了我觉得他们会进行混合式的这个算颜比如说我们有一些不具备有交互的这些场景完全就可以用 3D 高斯来去做一些替代了

那么第二点就是说你刚刚提到很好的一个东西就是说 OK3D 高是能不能进入到传统的工具链里面去我的答案是可以的但是现在整个产业还没有准备好

可以的原因是什么就是现在有非常成熟的算法可以把 3D 高斯进行 Mesh 化也就是生成传统的 3D 三角形的面那么因为 3D 高斯本质就是那个激光点云所以我们建立起了激光点云跟这个 Mesh 三角形的这个链接关系我们完全是可以用传统的 3D Mesh 的编辑器和工具去影响 3D 高斯的这个点云

当然实际做的时候肯定不是像我说的那么简单和轻松还是有大量的这种高收视球的方向角度等等相关的东西你需要去考虑的但是底层逻辑上面来讲它们之间是有关系的并且我们跟一个实验室合作当时他还在想我做的这个 3D 的高时人能不能驱动起来我就告诉他我说很简单你把那个 3D 高时人进行 mesh 化 mesh 化完了之后你把这个 mesh 绑上谷歌

完了之后你用传统的这个图形形的古人系统驱动这个面子的顶点然后再把这个顶点然后反向驱动到那个高斯的那个光点鱼上面去这样子你就可以形成一个

可以运动的一个这个 3D 高斯当然我这里讲的很简单实际上还是有一些工程学的问题需要大家去解决的但是实际上我们是已经成功做这个事了并且包括运动还有光照就是 Ameda 公司在做尝试如何把这个光线追踪的这些光照信息然后映射到整个的那个 3D 高斯场的能动序

所以我们看到的情况是整个产业非常兴奋在做一些极其落地就是这些论文一旦成功有可能马上就会变成生产力的这么一些工具和链条的上面的一些算法的突破那这些突破会可能会导致 3D 高斯的这个发展历程可能传统的图形学用了 20 年 30 年 3D 高斯我觉得可能就 5 年 8 年时间吧甚至有可能更好 3 年到 5 年时间就可以因为曾经有过一个科技博主问过

这个阿米达公司的 CEO 皮尹煌就是距离我们每一个像素都用 AI 生成的世界差距还有多少年当时我们的黄老板说是五到八年我

我个人认为也是五到八年的这个时间但是这过程当中可能像我这样子在这个产业的人就会去做这样突破所以这是我从业过来十多二十年里面最兴奋的一个时期吧因为它发生了巨大的一个改变

但是如果是这个逻辑我听下来说这个技术反而不应该说如果今天要做一个创业公司反而不应该选择说传统已经有比较完善的 3D 渲染的领域比如说游戏或者动画反而应该去像你前面介绍的说其实我应该放在一个原来完全没有 3D 但是 3D 又能创造价值的领域

比方说 e-commerce 就比方说电商因为如果是到传统的游戏领域的话你的上下游包括传统的这个上下游的依赖其实还在传统的引擎上就是你今天即使有高三级高四你想卖给玉币也好卖给黑悟空也好因为那个引擎其实还是用 Nreal 5

那其实你只有等到他们逐渐把研发管线切过来他们才有可能给你比较多的钱而且某种程度上大概率他也会变成一个他自己可以自建或者自研或者收购的方式去获得反而是听起来说应该给比如电商因为今天电商大家看到的都是图或者是预先拍好的视频

如果说直接是说我们把比方说一个 3D 建模可以去看 360 度角度去把玩或者看这个商品是不是反而更有价值或者说反而它的想象空间更大是的如果我们从商业化的这个角度来讲就是这个样子的包括我们公司内部也是说我们完成这个整个 demo 我们会跟国内一家非常

非常非常庞大的一家做电商的公司来进行合作原因是那家公司曾经在两年前找过法国玉币公司然后希望能够让这家公司给他解决电商的问题但是当时他们的他们公司的 CEO CTO CFO 然后什么 SR 部门的相关的负责人都到场了

但是我们当时是并没有讨论出一个答案的但是现在我觉得已经有这个答案了所以我们确实会去跟他们去合作并且这个其实不只是我们在做这个相关的事情吧我也看到了蛮多的这种

就是没有真正意义上面图层能力传统只是做这个无人机飞模型我不知道那个行业应该怎么说就是传统有大量的这种就用无人机飞这个景区然后生成 3D 建模的这么一些采集类的公司其实现在也在想干这相关的这个事情

当然他们只能够提供这个采集整套工具链和整套链条如何做得非常低成本化这个中间还是需要整个工具链的调整的新蛋糕我觉得永远是最赚钱的去抢老蛋糕的这个永远是最苦最累的活

确实是 3D 高斯它会去改变整个产业很多的东西尤其是大家关注的什么元宇宙数字软身然后直播卖话这些才是真正 3D 高斯的发展的一个最核心的区域并且它所带来的利润和整个的产业的

量的这个需求这个蛋糕的大小我觉得可能啊可能是不是未来会比游戏产业还要大那下一个问题我就比较好奇因为它其实也不是一个独占的或者独家的技术嘛它相当于是说其实也是去年有一个是相当于有研究的是大学或者研究机构会有 paper 出来那么理论上讲大家都可以去追随和复现它

第二个又听起来说它又不像大语言模型它有一个非常大的资本投入就像一开始你说的它其实不需要那么多数据

那回过头来那是不是意味着它的渗透或者会使用会变得更快或者说更多的人都能用比较小的小的机器来做这个事情因为回到大元模型今天其实大家不能去训击作模型的原因或者说没有人很多人进来去提供击作模型让击作模型竞争更激烈的原因其实是资本投入不足嘛

就如果说我用一台笔记本电脑的 4090 我也能去训大圆模型那么通常那么我相信今天一定会有更多的机座模型甚至有可能一些好机座模型就是完全开源或者效果比较好的那如果 3D 高斯它是依赖于最新的研究它对数据的

需求量又不是特别大它对算力的依赖又不是特别大那它会不会就跟未来变成大家做一个 APP 一样做一个安卓的 APP 一样变成一个非常简单的一个事情

就变成说他有一个海量的从业人员但是他其实并不能说因为我掌握了做 APP 的这个技术能力所以我在市场上能切到很大的蛋糕我这里面可能要纠正一下我说的是没有那么大的算力需求是指针对大模型假设大模型比如说我们需要的是万卡或者说是十万卡作为你一个做大模型的一个基础条件那可能 3D 高师他可能需要千卡

但是单纯的这个签卡也是专业卡的这个水平而不是普通显卡普通显卡你有可能一个杯子你可能就需要训练一个晚上或者说甚至七八个小时类似于这种它也不是 stable diffusion 的这种随便一个

就家用显卡你就能够满足的一个要求它只是相比大模型稍微要好一些而已这是第一件事第二件事情它中间有很多的东西实际上是跟大模型有挂钩关系的比如说只有这个可视化因为 3D 高速它只解决了一个事情就是可视化只解决了可视化的一个问题但是并不解决物理化

就空间化的这个问题比如说我现在拿的是一个玻璃杯 3D 高师只能说把玻璃杯的这个材质给他在视觉上面做到了极致他没有把物理特性给他做进去他更加没有把空间的这个特性和时间的这个纬度的这个特性给做进去比如说我现在拿到一个 3D 高师的玻璃杯我往地下一放理论上它砸到地板上面它应该破碎掉那它如何破碎它为什么要破碎的为什么能够破碎

那这个中间其实有大量的这种 gap 我们需要去填补的那这里面的填补一定是用大模型的能力去填补它的比如说我们要去识别处这是一个杯子那哪个地方它是玻璃材质的可以碎掉哪些地方它可能就是金属材质的在你找到地板的时候它只会有个凹坑它并不会碎掉也就是中间还是有跟大模型大量沟通连接的一个地方纯粹的 3D 高斯是没有价值的

但是如果三立高是能够建立起一个全新的

度量衡也就是说我们能够把 3D 资产把它真正意义上面变成资产化什么叫资产化比如说我现在比如说我这个游戏用的是 Unity 影形我做了一个模型然后在 Unity 里面我已经把它的这个视觉效果做得很好了并且衣服也会随着物理飘但是这个资产它仅限在这个 Unity 影形里面达到这样的效果你直接用到 U1 里面去

完全的得重来除了 Mesh 和贴图它是可以复用之外其他所有的东西约等于重做一遍所以整个产业其实数字化 3D 数字化的这个标准这个度量好像是没有建立起来的

所以我刚刚说的整个的所有观点是指有一家公司或者说有一群人能够把 3D 高师基于表现力这一块再额外再加上物理空间的属性这一块全部都补充结束完了之后它的产品才能做到我们刚刚所说的给到所有人都去使用我觉得李飞飞他们就在干相应的这个事情包括他们的很多官网大家也可以去看到去看到他们有相应的一些讲解吧

我不知道有没有回答你的问题啊大概是这样啊回答了回答了非常感谢那问一下就是你其实非常实干嘛那你现在是觉得 3D 高斯是一个靠谱的技术那如果你要马上用这个技术落地一个会让就比如说听这个播客的人都会觉得很惊艳的产品你大概会做个啥东西啊我个人觉得啊就是在

AI 时代如果我们按照 AI 时代的整个的我个人的理解我觉得我可能会去做一个 UGC 的工具我觉得 AI 时代它的一个特征就是说我们应该把很多 PGC 的工具变成普通用户都可以去使用你比如说现在在国内的投资人都会有统一有个想法你跟他聊 AI 的时候他会让你投 C 其实

其实投资人也没有很明确的去说出来为什么 AI 的工具或者说 AI 的产品应该是土系的我个人说一个我个人认可的一个原因吧就是 AI 大模型的这个发生导致了很多中间件消失比如说我们现在很多做中间件的这些公司你会发现有可能会被

GPT 去 OpenAI 公司做的某一个什么软件然后把它的整个的中间件所有的价值给打破掉如果你是直接生产出产品的话那就不会存在这样一个问题所以我们认为 AI 产品的核心是 UGC 化也就是 2C 化

那么我所在的这个 WallGBT 就是这么一个项目我们希望能够让大家像玉碧一样去帮助类似于像卡梅龙这样子非常有想法的人通过 AI 的方式去创造这个阿凡达的潘多拉的星球的这个世界

像黑悟空这样一个优秀的团队去创作这种 3D 的这种艺术的产品我觉得 AI 它不应该是一个抢蛋糕的游戏不是说我用 AI 透透的一个工具然后导致我跟别人去卷更多的比如说王总用药的游戏那我用 AI 去做王总用药跟腾讯竞争那是必然失败的

而是应该去创造一个全新的一个蛋糕比如说大家在未来不是只可以玩腾讯网易 EAUV 暴雪的游戏而是说有没有可能一群更有

想法更有理想的更有艺术追求的一群人他们去做出更多好玩的游戏然后或者说这种数字娱乐的这种产品然后给到大家 3A 级别的 Roblox 吗对可以这么理解因为 Roblox 已经向整个产业证明小朋友就可以做游戏了那么凭什么

艺术领域里面的那些大咖他们不能把他们脑子里面天马行空的一些想法然后去表现给我们呢我觉得这个点可能是很重要的一个事情我在上一波元宇宙的时期的时候我没有参与元宇宙那个时期的所有的内容但是

国内的四大美院里面其中的广美还有川美然后他们的一些教授还有在读的一些学生包括研究生就有找到我们然后跟我们说一个事我传统可能是画有画的画水彩画的画各种各样的这种画的

我发现就是疫情完了之后大家有一个数字化的世界了那我们这群作为传统的艺术生我们又如何进入到数字化的世界里面去创作的然后我当时就给他们开了好几堂册去了他们的美术馆然后跟他们待到一起我发现他们远比中国现有的整个游戏产业里面绝大部分的人都有想法

所以如果他们能进入到就破开这个产业的限制进入到游戏产业里面用游戏产业的这个工具链去创作哪怕是动画片或者说游戏这种产品那将会是一个非常恐怖的事情有没有可能就是比如说中国的文化输出就可以开始了我觉得这个是有可能的比如说其他的一些国家也一样他们有很多有很优秀的人但是碍于游戏的这个成本

就是这个研发成本太高了所以大家没有去做这个东西很好然后我最近看了 EAA 的一个演讲然后里面就演示了一些就是挺好玩的比如说两个人一边聊天一边说我要一个纸箱子的迷宫然后就出现一个纸箱子迷宫

然后说大一点然后他就变大了然后再说说我要两个角色枪战就给他们角色给他们五线他们挑然后他就说规定只能用手榴弹然后两个人就只能用手榴弹然后把箱子炸掉另外一个人就会掉下去你那个如果可以了就可以就相当于可以快速的大家 UGC 生成大量的 3D 资产然后加上 AI 那每个人就可以创造自己的游戏自己的世界了

然后视觉上的属性可能就是 3D 高斯然后 AI 又来给这些资产有物理属性然后再加上一些游戏性那这样子是不是就是一种嗯

高可控性的世界模型因为整个现有的这个演示我个人的角度来看的话它是一种 PGC 的能力 AI 工具化也就是说传统比如说你想干一件事情你干不了那么你就花钱把我招过去让我来干但是现在因为有了大模型你可以通过自然语言的方式把指挥我干活这件事情让大模型干了

我个人认为他只是把一个传统程序员策划能干的这些事情用自然语言去干了把 Photoshop 变得更好了并不是 UGC 对对对他只是一个工具化但大家有没有思考过一件事情什么游戏是只有 AI 时代才能做的在传统没有大模型的这个时代是干不了的这个事情有没有呢我们曾经内部就是开会就这一个话题开了一个一心一的会我们后面发现有

我举个例子比如说我们要做一个养女儿的游戏吧就是类似于日本有个很知名的游戏叫美少女木工厂传统我们做游戏的时候通常我们游戏公司由于成本的关系我们只会设计比如说三个或者四个女儿对吧那个女儿的长相应该是大差不差就类似那个样子的然后如果我们玩了第一遍它是长那样子第二遍还是长那样子但是如果我们现在有大模型了

我们每个人养的女儿都可以是完完全全不一样的比如说你今天老是给她吃巧克力那她是不是会长胖了那她长成多胖呢那就取决于你给她吃了多少蛋糕多少巧克力那你比如说这个女儿的性格应该是什么样子呢传统过去可能我们用行为数也就是绰号配表写在那里了所以她的性格总归是有限的

你只要玩下去一定会玩通关掉但是如果我们是叠加在大模型上面去那是不是

很有可能整个的女儿的性格是真实受到了你的整个语言或者说行为的刺激的所以我认为 AI 时代的世界模型的核心应该是我们可以去扩宽整个游戏的边界了有些传统游戏我们在设计的时候过去受到所谓的人工智能者

游戏领域一直都有讲人工智能一直都有讲 NBC AI Agent 这类的概念只不过当年由于技术发展比较慢我们用了行为数再到后面可能用了一些知识图谱的东西但是到今天的大模型绝对对游戏产业是一个巨大的变化所以我觉得纬度可以再提的再高一点

然后回到这个核心我觉得大家想聊的是这个是不是有一个完全由 AI 来驱动的这个游戏从它的制作到它的运作都是由 AI 来驱动的我们团队在做的这个 WordGBT 的这个核心

整个的核心就是你从研发开始就由 AI 来去驱动你的研发在运行的时候不是策划写实的配置表去控制你的世界而是有一个大模型来控制你的世界应该如何去发展如何去做我们人类可能作为一种类似于外星人观察者一样的稍微间接的去干预一下就可以了

我觉得这个可能是 AI 时代我们更加值得关注的一个东西这个大概是我们的一个终极的目标吧就我的 GPTT 的终极目标就是我们通过 AI 去创造一个世界帮助所有人像法国 UB 帮助卡梅隆创建潘多拉星球实时交互世界娱乐的产品一样我们希望帮助所有人都去做相应的事情

然后会比 EA 的整个的还要高一个层面的上面的东西吧然后有一个 Sam 发过一个 Twitter 然后说电影以后都会变成互动游戏而游戏都会变成难以好玩的难以想象的好玩的东西那其实你觉得那个难以想象的好玩的东西是不是就是你们要做的这个东西我觉得有这种可能吧就是以我对的这个数字娱乐的这个产业的理解根据马斯洛需求的五个层次

也许那个 Sam 所说的这个变得难以想象更加好玩的东西

应该是会跟自我这类精神的实现有关在我们现实的物质社会当中我们不大可能让所有人都达到最顶层的精神的追求比如说让所有人都享受当领导的这种感觉这件事情在现实社会当中明显是不可能的对吧因为当领导一定要有一堆的手下但意味着不是所有人都可以当领导不是所有人都可以当国家领导人但是

其实在数字化的这个世界是可以做到这个自我的这个实现的娱乐开心是游戏所能够提供的这种最低级的这种能力我曾经记得有一次跟一个朋友聊天聊到过就是因为中国的父母嘛其实在整个教育其实还是有一些欠缺的他说

他父母从来没有教过他什么是自信什么是勇敢他说他了解这个东西或者说学到的这个东西是从过去日本的一些游戏和动漫当中去体会和去感受到的那这个东西我觉得可能打游戏的人很多

我不知道是不是所有人都能够从游戏过程当中去感受到这些东西就像 3A 游戏为什么那么吸引人一样为什么大家会花大量的时间进去一样就像黑悟空大家能看到的是整个中国过去的整个多少年积累了下来的知识和文化大家是可以产生共鸣的

所以我觉得 Sam 所说的那个难以想象的好东西很有可能是这个比如说类似于什么灵魂伴侣比如说心有灵犀一点通类似这种词汇我不知道这种所谓自我实现的这种精神类的需求我觉得它是非常惊人震撼的有 AI 的加持可能会导致

我们产业的这个产品能够做到那种程度比如说你的一个有没有一种可能啊你的一个虚拟在游戏世界的一个女朋友可能比你现实的世界的女朋友还要更懂你现在不就已经大量的发生这种事情了吗早几天那个令雨升空有一天都超过了微信超过了抖音的那个排行

所以大家现在已经这种趋势已经发生了只是可能现在大家还是把它当做一个小众现象但是未来的话其实有可能像你讲的就是我们越来越多的精神诉求会从娱乐或者从游戏当中去获得因为如果根据那个比如说以前有一本畅销书叫游戏改变世界它里面其实有一个观点是认为这个现实世界是一种一个设计不良的游戏

比如说正反馈太慢了主要正反馈不及时之类的那如果说我们可以有一个更好的世界其实也挺好的最后上价值那上完价值之后我再把它拉回到一个特别特别俗气的一个问题就刚刚你讲的其实是我们要做这么大一件事情然后要创造一个更好的世界然后你现在肯定就是用靠谱的技术会来实现这个产品嘛

我们内部在最早期接触大模型的时候曾经用一周做过一个小 demo 这个小 demo 的

的目标就是我们只能用 AI 来生成资产然后所以我们用 AI 生成了一个 AVG 文字对话的一个游戏虽然它不好玩但是它所有一切的内容都是用 AI 来生成的其实这件事情对我影响是非常非常大的

所以我个人的感觉就是说 OK3D 图形可能是研发游戏的整个解决方案我们团队会讨论说在整个的这个游戏研发的这个工作流当中去如何使用 AI 来去颠覆它去改变它这个可能是我们的一个重点我们一直在思考这个 UGC 就是用户生产内容这个

最近 AI 这个进展一年下来也变化的非常大现在互联网非常的发达大家每天都有把这个 AI 的这个论文啊代码啊演示 demo 都公开嘛就像我们刚刚另外一位同学说的就是好像所有的技术都公开了但是

我觉得这里面你要想把公开的代码论文 demo 都实际应用起来它还是有些难度的所以可能我们会去开发一款非常快速的一个 UGC 的内容去把我们整个的产品的理念去做虽然不允许我做 WebGPT 但是我觉得 WebGPT 它终点版本可能是 V10 版本我现在总共可以先做个 0.1 版本我现在

我想说如果要想认识到大家的话我想说我可能会去做这么一个产品吧然后把整个的这个传统的工作流去改变到让大家更好地去理解我们如何去做出一款游戏或者说我们如何进入到一个全新的一个设计的就是如何设计数字化世界之

娱乐产品的这么一个流程里面去让大家先能用起来先能玩起来这个是一个核心点吧重新定义数字化娱乐产品的设计流程好的好的谢谢谢谢谢谢学到了很多好的好的谢谢咖啡然后也谢谢大家收听我们的那个 AI 炼金术啊大家也可以关注同名的公众号也可以把这个 AI 炼金术啊

的播客啊转发给转发朋友圈啊转发给你身边搞 AI 的同学们对吧难得有这么啊我们其实就把聊天聊天上传上来所以非常的朴实啊好那那个大家记得转发好拜拜谢谢拜拜好谢谢拜拜好谢谢咖啡谢谢拜拜拜拜

i can't seecan't you see that it's lovelythe world inside my headcan't you see that the world

优优独播剧场——YoYo Television Series Exclusive