我就认为未来就是一个新的物种只是这个物种变得十分的智能和能力很大我们现在看三万年前的人你说是不是一个物种我觉得很不一样了三万年前的山顶众人那个时候开始就人类有工具了石器时代有火炭但那个工具很 primitive 我们今天有手机有电脑有互联网但再过一百年看我们今天的这些手机互联网就我们看
三万年前的这个火一样的石器一样的而且这个进化速度会变得很好的哈喽大家好欢迎收听张小军商业访谈录我是小骏这是一档提供一手高密度信息的商业访谈节目
这两年啊人人都在谈论 AGI 但在可见的未来 AGI 到底是一幅什么样的画面针对这个话题我邀请了清华大学智能产业研究院院长前百度公司总裁张亚秦院士来聊聊
在他的脑海中人工智能会按照从信息智能到物理智能再到生物智能的图谱逐步的突破和实现 AGI 那在这种构想和信仰之下呢 AGI 呈现的是一个高度乐观的前景画面但这并不是人们预感 AI 进化的全部途径在之后的节目中呢我也会推出对 AGI 的另一种思考与隐忧那 2025 期待我们和 AI 共同进步
98 年底你当时回国加入微软中国研究院那个时候中国人工智能处于过什么样的状态咱们来聊一聊过去的人工智能 20 加 10 年那个时候我们做的东西和人工智能都有关系但都没有一个人叫人工智能所以那个时候人工智能基本上是出于东
东棉七八 98 年时候开复的在做语音识别和语音合成我在做视频压缩东江在做多媒体沈向阳在做自然语言视觉和图形学黄教授在做 NLP 在做自然语言这些东西你看现在其实最后都汇聚成为人工智能当时我们都没有把它叫做人工智能所以那个时候人工智能真正的发展是过去的十年真正成为一个真正有用的科学
过去还是一种探索期然后这个也是汇聚了各种各样的从机关机视觉的从视频的从自然语言的从语音包括从本身本际学习的一个大的融合当时亚运院是怎么把你们拉回国的当时我们也想自己回来微软正好要成立一个营运院在中国就回来
回来了一直也想回国这是一个好的机会因为是做科研的做研究的其实国内很多公司都想做自己的研究院做自己的实验室 Lab 你觉得微软的亚运院对他们能有什么样的借鉴吗对 因为那个时候比较早那个时候最大的一个挑战就是说在国内 在中国能不能做成一个世界一流的运营院当时并没有
你要想想三十年前那个时候就大部分的学校我和美国的科研水平差得很远包括我们培养的博士生做科研的方法科研的水平科研的成果对美国还有很大的一个差别
不像现在觉得那个时候能不能在国内做成一个世界一流的计算机方面研究院是最大的一个挑战而且别人其实有很多的问号要看美国的同事们大家并没有那个信心所以我觉得我们当时我们几个肯定有信心我们觉得一定是可以做成的微软对我们也有信心盖茨对我们也有信心研究院应该怎么设置目标对 我们研究院其实并没有一个量化的指标
我们当时就是要成为一个世界一流的计算机方面的一个营业这是我们很简单的一个那这个东西其实本身也很难去量化我记得我们在聊天的时候我开过聊天
还有包括当时我们的一个顾问这个叫 Roger Rally 是统领奖的获得者说怎么去衡量我们怎么知道我们是一流他说当你们在不问这个问题的时候不讲这个问题的时候你变一流了也就是说你自然而然就感觉到了
这个话后来我有更多的一个体会就是这次 CHI-GPC 出来之后我用的时候半个小时我就第一改我说这个 CHI-GPC 通过图灵测试然后图灵测试过去讲说我们经常也问这个问题什么时候我们就知道通过图灵测试了然后这个也是当时忘了应该是 Jim Gray 吧也是个图灵家他说当你通过的时候你就知道了这个也是就是当你这个东西也不要需要去度量它
但在人权我们当时成立的时候呢最重要的第一步是要招到一流的人才这人才包括不仅是国内包括从海外吸引一批年轻的顶尖的学生这个是最第一那么最重要的这我们心里做到第二个呢就是要制定一个长远的目标然后要做的东西以后对微软对产业对学术界要有大的影响力
第三个其实也是我们的想法但这个的话更多的是成为结果我们要培养出一流的科研人才我觉得三个大致的目标最重要的是要把研院做好做新人才做一个研究前面成立了两年三年我们 80%时间在找人
当年做微软研究院和今天您做这个 Air 这个研究院你觉得不一样在哪里对 现在做的话呢我觉得就我们需要去问我们能不能做成一个一个的营养因为中国我觉得已经这通过 25 年近 30 年的发展了
就已经有很多世界级的科研的成果世界级的人产了这个我认为是中国这二十五年到三十年的我觉得这个是从某些方面来讲就是比较容易了比做学容易多了首先我知道在清华这个大环境下我能招到好的老师我能招到好的学生那么这个时候可能更重要的是你怎么样去定研究的这个方向因为这个时候比较乱
过去其实我们都没有定方向过去我们的方向可能找到什么样的人做什么事他们爱干嘛干嘛对喜欢做什么就做什么我们有些地方比如想做这些事找不到这样的人找不到领域人物那你做不起来现在我们应该是每个方面都可以找到领域人物就是说你到底要选择做什么所以我们当时选择说做三个非常产业的
三个垂直的方向智能交通 IoT 和 AI 加 Life Science 其实如果讲起一个是机器人如果用今天的这个语言来讲的话一个是巨神智能一个是生物智能一个是边缘智能
还有智能体所以就基本上是大模型的方向在你脑海中这个基础大模型和上面的垂类大模型它们是什么样的关系为什么研究院不做这个基层的大模型最大的模型基础大模型本身把它象征成为一个生态的操作系统它是红像这里面你需要大量的算力大量的数据大量的场景这个地方它不是学校把
学校是很难做这个事比如说上万个需要砸钱需要砸钱而且需要很多具体的产品但我们做不做我们其实也做我们做的话不是自己做我们和企业一块合作用他们的资源去做
但我认为这个主要的它的创新不是 0 到 1 的创新更多的是 1 到 100 甚至 100 到 N 的创新它里面有算法创新那里面很多很多是工程的创新这个东西就是一个公司做的那美国也是公司做的学术界做的东西就是 Air 对我们来讲最重要的 No.1 是培养人才我们当时定了三个战略漏镜第一是要培养顶级的架构师和
CTO 为未来培养一流的技术领域培养人才是最重要第二是做科研第三是影响产业产业影响力影响力可以通过和现在企业合作也可以通过孵化新的公司
所以这个顺序很清楚我们在学校里面首先第一点是要培养人才这也是后面为什么我要回到学校的一个最重要的原因我觉得是这么多年看起来其实人才最重要有了人才之后别的也都有我们这个顶居人才还比较缺少相对于美国来讲像美国的大公司微软也好谷歌也好
Meta 亚马逊包括 Lady 这些公司有大量有国际思维大系统架构能力的这些领军人物国内的话也有但比较少所以我们希望通过通过 Air 因为 Air 我们这儿主要都是博士生把这些人的话打造成未来公司的 CTO 科技的军人物 AI 的军人物这是我们的
远及目标这是我们的漏尽网络目标这是我们的其中一个目标第二个就是本身要做一些大的科研的创新技术的创新科研成果第三个的话影响产业所谓什么叫智能产业应该我们的影响产业
顺序我们并不是说这个和当时微软医院的顺序不一样我们当时主要还是要做科研的所以说如果说 Air 和当年微软亚之间的区别的话呢很多地方很像包括我们的人有看比较资深的人的话一半上过来但是有几个区别就是微软的医院当年是微软的医院它是为一个公司做的它是为了公司的技术战略而服务的第二点它还不是学校所以它本身的第一目标不如培养人才
是培养了走了为别的公司做贡献了那这个至少那后来当然是做了是些好事但是当时主要还是要做科研那现在清华不一样清华我们 Air 的顺序第一点我们是要培养人才的第二点我们是面向整个产业的不是面向一个公司的整个中国的科研啊产业环境成熟了很多对不对
那你如果现在看就我们的学生的水平啊我觉得我最骄傲的就是我的博士生我们 Air 的博士包括我的博士生绝对是世界一流水平绝对不会比 MIT 斯坦福这些学校的差
您之前提到过未来 20 年在实现 AGI 的路上可能会逐步实现信息智能物理智能和生物智能能不能推荐一下就是您脑海中的这个 AGI 的路线图以及它是怎么跟你们现在选择的锤类模型相 match 上的我稍微倒来就是我一直认为现在新的这个智能新一代的人工智能是信息智能加上物理智能加上这个生物智能这个我讲了 10 年了我看
我在巴勒斯在這些會議上我一直在講一件事信息智能很簡單我們現在像 CHATGP 這樣的東西我們所有的文字我們的圖像
这些视频信息世界里面的智能那么物理智能就是把它用到无人车机器人现在讲的巨神智能用到基础物理的设施里面去这是物理智能包括 IoT 都算物理方面的智能就物理世界的智能那么生物世界的智能把人工智能用到比如说脑子接口像
像伊朗·马斯克的 Newer Link 然后把连到生物体连到生命体包括医疗手术机器还需要的研发这些
这三个不同的领域这些领域当然是相互有联系的但是它还是有不同的领域所以我认为的话就是在五年之内我们在信息领域信息智能方面可以通过图灵测试就可以达到廉价的水平五年之内五年之内比如恰吉米出来我就认为在文字方面基本上
那里面可能是什么但后面要加什么推理加上多模态 SORA 的话呢希望很快就出来 SORA 然后再过一段时间我认为在自然语言和自然内容我们生成的这些图片生成的视频就是可能和人生成是一样的年轻人我认为基本可以达到这些所以这个时候就是在信息智能方面能达到人类的水平
我们先来讲讲这个信息智能那信息智能这个中间它能改写整个现在的商业生态吗它会改变它整体来讲的还是现在的巨头就是现在的巨头你说商业对我一会儿再讲人工智能本身并没有改变商业的实质你开做什么还是做什么它就是把生产力大幅度的提高
它会有一些新的商业模式但是商业的本质并没有改变所以我们一会儿可以讲讲这个比如现在有了这个之后写 email 写文章方便了编程序
效率更高了然后你解数学公式它可以帮助你我是觉得在这个领域它会超过人它会超过数学家它会超过物理学家它会在智商方面会达到人类的水平我根本就讲到它是智力就你想想看就是一个人对吧你想想一个人他脑袋特别特别聪明这个时候他可以做很多事
他可以做很多事他可以解题他可以发明新的公式他可以写好的文章他可以画画做事都可以做所以这是一个人的基本的智商信息智能是我们大脑的智商但是他并你读再多书怎么游泳你还是
你还是不会游你还要在游泳的时候才会游对吧所以这个就是物理制度你还要物理制度你这里面比如你爱喝酒你怎么看书怎么聪明你不喝还是不行对吧
对吧所以它这个本身还是要和那个世界还是不一样的是的所以我觉得信息世界就一个人特别聪明读万卷书特聪明一个人智商很高什么都懂对吧什么都懂比一般人都懂在每个包括每个领域这是这个我觉得五年之内就能达到然后物理智能你刚才我讲物理智能还需要再需要点时间可能再需要比如说物理智能比较高的等级就是我们讲的人形机器人对
对那可能还需要十年的时间从现在十年从现在十年十年左右这十年是不是完全别人什么都厉害肯定未必他大部分的任务他别人就厉害了但是他第一个落地的是自动驾驶对我自己认为他第一个落地呢是无人驾驶因为无人驾驶呢是相对来讲比较可控的场所机器人呢它是个 open problem 自动驾驶它是个 close problem 我就做这件事可以做得特别好但我就是开车这件事
我不需要比如说机器人它要有常识
他要理解人的行为他要做很多复杂的环境而且环境都不一样你可以这样讲无人驾驶是一个开车的机器人是一个垂直领域的机器人是一个特殊场景的机器人他有脑子也有他的肢体对但他就做这件事你比如说你开车你开得好的一个开车的司机你不需要会写诗吗
你不需要有很高的智商你不需要会唱歌对吧你不需要会要懂生物你就把这些事做好就行了你不需要给工厂会焊接对吧你做这些事
但是这个人型机器人就通用机器人的话它就会有更多的要求这里面可能我讲我把它分成三种吧三种大的场景一种呢是家庭机器人一种呢是这个工厂机器人工业叫工业机器人一种呢是社会机器人社会机器人社会机器人我把它这是我自己的分类啊
家庭很容易理解对吧家里面照顾老人帮你做家务家庭的任务感觉太复杂且碎片对对对所以它很难嘛家庭经验可能是最难的一个东西是最难的对而且包括人行比人的安全家里的习惯就是比较难的一个东西
社会机器人呢是比如说我的警察比如我的保安比如我送外卖比如说包括可能开车这些都属于这种就是它的社会行为以后我们的警察可能需要一些真警察但是大部分警察可能就是机器人就做挺好的你的保安机器人保安可能比那个真道保安还好
但是可能需要他听人的安排听他是人的助理但是开车是开车以后多少年之后可能就开车的人就很少所以无人驾驶也是社会机器人对我把它都作为就是在街上跑的外面看到的和大家有很多的交互的是社会形态的机器人还有个机器人就是就是这个工业机器人比如说在危险场景的在矿山的在工厂里面的啊
就是做这些细活的这个相对于它是更好定义的这个比较好这个相对来讲因为它相对是比较那什么的就是确定目标的在固定场景确定场景但我们希望它的技术在后台的这些技术呢是通用的技术希望是通用的希望它可能前面不一样比如说它到了巨声到了边缘的时候不太一样那肯定是不一样的好
照顾老人机器人家庭工业社会都是通用的后来这个后面这个通用的这个后台就是一个大模型巨大的模型然后上面很多也就是我希望它百分之七十八十后台都是一样的那这个后面这个巨大的模型会是今天像比如说 OpenEye 这样的模型是的 是吧它这些模型比如要多模态它要从这个物理
物理世界学习东西然后再大模型把它变成智能然后最后做的时候还是要每个地方都一样但是后台基本上是一个大
同一个后台对因为你看所以通用品牌今天它那个大模型的架构和自动驾驶的架构还是两套架构他们现在是没有办法融合在一起的未来这肯定是会融合到现在他们在融合也对我们现在其实后台都是个大模型然后前面再有一个面向自动驾驶垂直模型那这个地方是在云端的然后在车上还有一个小的边缘模型所以
所以我把这种三个 layer 一个是分析像操作系统一样操作系统就这样操作系统也是一个云端的操作系统然后上面你有 superapps 然后放到手机放上面还有一个还有一个这个应用以后就比较 superapp 了对吧叫这叫 super 什么以后呢这个你可以叫你也可以叫 app 你也可以叫 agent 你都可以叫我也不知道叫什么对吧对反正就要完成一件事而且这些事可能会在不同领域是不一样的所以我因为这个不是大家的分法
我的分法其实是这样比如说你这个工厂机器人工业机器人我完全不需要人形对不对我反正能把我事做就行了但是家庭机器人最好是人形然后家庭也不一定全是人可能是狗可能是猫对吧你比如说可能我以后
比如说盲人啊我以后我一个机器狗带着我走就行了对吧就是我觉得就是就是说女性叫机器人了但是这个机器可以是机器 anything 为什么家庭机器人最好是人形呢因为它能做人的任务对吗对为什么人就是这个人形机器人和非人形有一个区别嗯
就是人形机器人在家里面比如说老人吧就是他和一个人形的他沟通他认为是个人他会更自然地去沟通和放一个电脑或放一个机器他沟通方式是不一样的而且以后的这个人形做的比如外形做的就像人一样啊
你可能看都看不出来那么这个时候你的交互就变得越来越自然你也可以跟他谈心他也是你的伴侣你也可以让他帮你做事他就变成你想管家一样也可以帮你照顾老人也可以帮你就是家里面需要这么一个狗短期可能挺难的所以是很难做的一件事另外就是为什么要人心激情人呢人激人因为我们现在这个社会我们包括我们的基础设施这个高度什么这都是给人做的
所以说如果是人间机器人的话他可以利用我们现在的技术实施比如爬楼梯或者是按什么按钮有些都是按照人的这个方式做的但这更多的是一种选择比如社会机器人来个警察警察如果太小你看了也不舒服太大也不舒服如果人行 A 你感觉是人在和你的交流就是 B
避免那个恐怖股效应对这更多的是一个一种社会进化你看到和一个同类对吧我一直讲我说十年之内呢我们可能机器人比人都多而且每个人可能自己都有一个你的机器人是你那个替身子的我觉得会的他可以去帮你做好多事是你的一个分身啊
但希望以后每个人一个分身太多就会造成一些问题的这个分身他本身并没有
他是从属于你的他听你话的他自己就不能那个什么这是个助理他就是一个助理他是你的他这助理可能十分聪明甚至比你都厉害但是他听你的话他属于家庭是工业还是社会都可以你如果这个在家庭就是家庭了你如果到工厂上班你工厂里面可能有一个是你的机器人是帮你做事的
包括你的这两个是不是一个人可能不是一个人我对此就算不同是一个不同的东西那社会机器人和家庭机器人这个哪个更难达到这个看情况都不容易都不容易
所谓的人形机器人都不容易最后他通用的人形机器人这个巨神智能的话这个需要很长时间所以我说十年嘛也就五年之后到十年慢慢一些形态一些可以但是呢要说我讲十年就这个意思但这里面比较相对我们已经证明的是
我刚从旧衣山回来旧衣山我坐那个 VIMO 谷歌那个 VIMO 感觉特别好开的比人也更丝滑而且
而且重要的就是现在旧金山市民他们都想做而且他们不认为这是什么新鲜接受了对对对今年罗布快跑我觉得在武汉还是遇到一些就是大家的不接受的公众还没有完全接受这件事情对因为现在显然罗布快跑安全性比这个有人驾驶要高至少十倍对吧很安全从来没有出过事然后同时的话开的也很好
但是由于时间比较短大家会有一些做的人都很喜欢你看如果做的人的话他们都评价很高但是大家把它当做一个新的东西所以我如果看一下就是中美阿波罗和美盟属于走的最前的真正已经看出你说这就是未来的无人驾驶但这个无人驾驶可能放到现代车里面也可以是新的一个无人车做一种出租车一种服务这是一个商业模式的问题能力已经有了
您怎么看就是马斯克代表那个 L2 加的那个自动驾驶路线和威慕代表这个直接是 L4 的技术路线马斯克也认为他的 L2 加能够上升到 L4 可以我觉得他可以上升到他还需要测试需要技术可能新的一些目前不行目前呢这个还是 FSD 还是不能做 Robotaxi 还要需要一些因为他设计也是有人的有人还是可以接管的
对它 45 分钟接管过一次对那 RobTaxi 永远不能接管的基本上就不能接管你里面连像它以后设计的轮子都没有方向盘都没有所以这个要求比较高但这能达到呢已经达到了所以说我觉得 Tesla 要做的话呢规模会更大因为 Tesla 它都会做起来以后车企都可以做到
车企以后都可以做到这个技术就是首先我觉得微博和百度阿波罗和罗欧快跑罗欧快跑是阿波罗的下面的一个产品产品对对阿波罗是那个平台嗯
所以这两个东西做得最早微膜当然做得更早就在中国和美国证明这无人驾驶是可行的技术是可行的这个我觉得就很重要然后这个时候大家就是看谁跑得快点跑得慢点商业模式怎么落地另外一件事看到那个曙光了那过去呢比如说两年之前我觉得还看不到
你知道会发生就大家像我是一直有信心的但是你告诉我什么时候发生什么时候发生我也不知道现在我觉得很清楚但如果车子能做的话他们自己本身就有车队那像 VIMO 或者是百度阿波罗这样的产品他们的商业模式会不一样吗就是最后这个赛道会属于谁这是特别好的问题就是以后的这个商业模式可能会有变化
但是你如果大致想一下就是有三种企业了一种企业是提供服务的还是提供服务的就像现在的滴滴包厢的 Taxi 是提供服务的运营商运营服务另外一种是坐车的
做整车的还有一个呢就是做车里东西的包括芯片像地平线这样的公司像 NVIDIA 这样的公司那有些公司还可能说我就做车我不做这个 Robotech 的服务有些我就做服务用别人的车这都会发生但你刚才讲得很好像那个 Tesla 说我什么都做
对吧 没有可能那也可以我的车我又就做服务又用我的车那也可以但这个大家就会有一些竞争但最后谁能胜出那就是要看谁能拿下这个市场最后也不会人家
也是会有很多家何小鹏就说他们做 L4 的技术但他们不会做 Robotaxi 的这个平台方是 他就选我坐车对吧我坐车我不坐运营对我觉得可能很多车厂说我不坐就像现在一样现在我坐车他现在他不坐
这个出租车生意对吧他只卖车而已这个我觉得以后还是会成为反正有三个东西一个是服务一个是车一个是里面的一些芯片啊原件啊为什么巨神智能是在今年这么火呀其实自动驾驶已经不是个新事了它做了十年了我觉得现在大家看到看到曙光了这里面有很大的一个很大的一个促进的因素啊
导火索就是大模型大模型出来之后呢这个使得我就先讲文人驾驶然后再讲巨声好文人驾驶呢有几个大的问题这么多年了
第一个的问题就是我数据量不够所以要测试数据量数据缺少第二个问题就是有很多 corner case 很多场景你安全问题碰不到你测试的时候它会有一个新的问题办法能力比较差第三个问题我的理工智能技术我的模型都是地图一个模型视觉一个模型
语言处理一个模型垂直垂直来点激光雷达又有个模型都是垂直碎片化碎片化碎片化然后把它拼成块然后又要感知然后又要把它融合然后又要去做规划又要决策就一块块的做了而里面好的规则又有人物智能的算法神经元的算法又有很多的固定的规则反正拼的很乱很乱嗯
大模型出来之后呢就帮助我们把这几个问题快速地把它不能讲完全解决吧这些三个大的挑战让我们很快地就加速了解决这些问题第一点比如说数据不够我生成实际上可以生成很多数据我给你真实的数据可以生成很多数据所以它让这个整个的模拟就是说我们的仿真速度变得很快第二点我很多场景没有但是我大模型本身它有很好的范化就是一个常识我们的
大模型会有常识也可以通过模拟器里把这常识学到所以他好多次也没碰到我但他很容易就解决了第三个就是很重要我们先做端到端对所有这些模型我都不管了但是箱子放在一块一个输入一个输出出来了对吧顶多用一些规则来兜底所以说这个时候就把这三个大的挑战一下就我不能想完全解决至少缓解了很多快速的大幅度的加速了整个
同性价值的开发的程度所以马斯克那个端到端模型其实是一个让大家看到曙光那个很重要的产品对对他从 B1V 用这个
我们也在做我们都在做但是我觉得它很快就用到了我们现在开始也用了但是这个我认为就是大模型出来之后加速了改变了整个这个生态过去我们也想用但是没有这样的那种现在这个大模型出来之后我们就可以做这件事所以这个是一个都用了 transformer 就过去一会儿用的什么 convolution 的客户一会儿用的这个
RAM 一会儿算法都不一样这是上一代人工智能深度学习第一代和第二代区别它是对不同的输入就有不同的算法不同的输出输出再去融合现在我就不管它是什么都是同样的 transformer 同样的东西来处理所以 tokenizedtoken based 这个是我人家史
这是文化对军人正样的军人智能你如果看咱们讲机器人吧机器人也是机器人所碰到问题基本上是类似的问题就是刚才讲机器人里面数据更少机器人因为他每个垂直机器更少机器人里面还有一个就是说他过去的模拟数字空间模拟东西他一般是用比如强化学习的学家讲啊
他用一个环境用一个智能体他就学习然后找策略这个策略就用到实体用了之后你发现经常不 workto real to same 不 work 那现在呢这个其实和大模型关系我们自己做的一种叫 RSR 就是把真实世界和物理世界都一般都连在一块这样的话你就加速就等于我在模型世界做的我在数字世界空间做的这些学习空间运用上
加速它的落地这个叫世界模型你可以讲是世界模型你可以讲构建了一个世界模型我把它叫 RSR 就是 Real to Sim to Back to RealReal 就是真实的东西我从真实的场景我把它分析变成模拟世界变成数字世界的东西 R to Sim Simulation
SIM 的时候那我就可以用各种 AI 生成的工具比如说 Stable Diffusion 什么高深 Splitting 各种各样的工具现在新的生成 AI 的工具我生成很多东西然后我和真实学联络块联络块之后我等于我在在数字空间学的东西玩得很软就把这个弥补了数据不足的问题有点像在无人驾驶有点像
它像是积累了一堆的常识然后再逛第三个就是很重要就是你懂一个大的常识一个大的模型在哪这个大模型因为过去我们最大的问题是机器人听不懂你说他不懂你在什么意思他听着读你的一字他不知道你后面什么意思没有这个常识没有理解力他没有理解力对对对
他也不太会推理有了这个之后呢你就等于通过大模型大模型成像大大是吧你可以指挥前面那个机器了所以这是一个大的跳跃就是由于大模型出来之后又有了常识比如说这个什么比如我现在一个家庭记忆人这样讲我跟他说话你帮我去把这衣服脏衣服拿下来帮我送到干洗店洗好然后帮我拿回去
就这么一个东西那这个机器人做起来太难了过去现在我觉得就相对比较容易因为他给我这个 CHAT GPT 或者 GPT 项目的情况听了之后我知道什么意思我分演示和动作去指挥他加了个脑子加了个脑子就现在多了个脑子了而且这个脑子是过去最难的东西就是机器人里面最难的东西
就每个东西对他来讲都是一个大的挑战现在等于我有一个很自然的人机对话我这个大模型的理解我说什么东西然后把它分解东西让他去做去车怎么开大家都知道但是机器人怎么动作就是他的落地会更难一些机器人这样的就是你看你做什么机器人的场景就特别的特别的碎对吧
你比如我做早饭的机器和我扫地不是一回事你也不能都那什么就每个地方你希望后脑大脑是一样的后台都是一样的只是前面不一样而已
过去的做法可能就扫地了就是完全一套东西和我做饭的完全没有关系或者我洗衣服的或者是我焊原件的或者我做质量检测的或者我开车就没关系每个都是一个专用的现在不是现在我其实后面都是样子只是前面前面不一样嗯
我就像个人一样的我这个人什么都可以干我这个人本身我上了学一个基本的常识基本的智能有了之后呢我可以去学车开车去我也可以去学扫地学我也可以学这个都可以学但我还是内人对吧我不需要每次换个脑子就是说今天开车这个场景是相对确定的
其他的工作还不好说对对对但有些东西挺难的机器人往往就他像开车很简单有开车反正就开个车车子都固定就在这个方面开车本身他要很精确要很安全但是他就那件事要做好一件事做好但我这个机器人的话呢比如说我过去开玩笑说机器人会开车不可以开门然后开不了门或者说开了门进去我找不到开不了那个
微波炉或者是开了之后它不知道怎么关反正就是类似这种事情就是那种小的细节东西你不能每个地方都设置是一个新的算法过去早的时候就用规则来做的现在不是现在他就是一看他就学会了学会之后你放什么他都可以开他也知道你这地方需要一堆大件比如他给你拿了茶拿茶就热的给你热的小心就类似这种事情他就学会了就有了这个所谓的常识嗯
这厂长哪来的就是大模型里面来的你不需要每个地方都教他过去都是一个规则一个规则那有多少规则一步一步地教现在你不用教他学会之后就有机会了就像人一样学会之后他学会之后自己就推理我想吃点东西他如果了解你的话就说这下会爱吃香蕉这时候老吃香蕉他可能就在房间里面找到香蕉给你拿来吃或者他比如像吃饭的时候我不吃羊肉他点的时候就不给我点羊肉类似的东西厂长才会有的他不需要每个地方去记你知道吗
它就像个人一样它会移解你直到你的这个最基本的常识今天落地自动驾驶和后面的巨神智能分别的难点是什么这个难点的话呢还是所以说我认为信息世界会简单一点就是你只要有个手机有个电脑但这个地方的话就是你和你的部署场景它本身的周期会很长难点会很大比如说无人车你首先路上能开无人车啊
有政策法规的问题也有你怎么样和友人吃了这个博弈的问题因为这个物理场景所以要打造一个世界模型我做实际世界我不需要打造一个物理模型
这个是比较难的机器人一样的机器人我比如说我的机器人是送外卖的就像你讲的轮足就送外卖那我要怎么上下楼我怎么开门就这些东西它都是不一样的这个地方需要更复杂一些它的细节的问题更多对 这个细节问题就是每个场景需要更多的落地的时候需要更多事儿
就是这样就像你上学你比如你上课就书本就够了对吧大模型信息就是读书读了书我很聪明我总结出这些道理来我可以会说但做的时候你还是要去做的嗯行官理路要做事的时候你还是需要还是需要有 skills 嗯
那机械人等于就是你怎么样去落地的也是数字世界和物理世界怎么能交互在一块每个地方是不一样的有些可能简单有些可能就难点那今天看信息智能如果做大脑的机会好像就是该去的公司都已经去了
所以没有创业公司的机会了自动价值也都做了对对对我不能这么讲信息里面也有不同的也有垂直的信息比如说我有一个就是做横向但里面我可能是做比如生成图图线的我这里面可能是写程序的当然写 code 的这都还有一小垂直行也有嗯嗯
自动驾驶呢我今天不可能再说我要做一个自动驾驶的公司对自动驾驶我认为都做了八年谁啊我说他们都做了十八年十年其实都已经长好了很长时间了对自动驾驶所以现在你看这些公司慢慢起来了对吧
Logo 快跑做的比较领先你看小马智行 V-Ride 叫什么文远智行文远智行文远智行你看那芯片什么地平线这些经验我觉得这些公司开始就上了一个台阶他们上市了然后呢有产品了有服务了大家已经开始认可了
所以我觉得未来的这五年他们会有很好的发展性但这公司确实是需要很长时间的任何一个东西你要做好的话是需要蛮长时间的一两年一般做不出来机器人一样今天现在做的公司做人形机器人可能十年之后才能做成八年十年之后才能做成他可能是
倒回到那个自动驾驶十年前的状态从今天我不能讲机器人我就讲人性机器人就最难的那个部分因为简单度工业机器人有很多对 有很多但是就是我说所以我为什么说十年到 AGI 在物理学那个时候就变成了一个 stream
我可以看到家里面就会有你买个就 work 你不需要那什么了现在开始有一个养老基金人开始有了但那个东西我觉得还是处于科研状态科研这种尝试状态现在你看我们做了一个基金人公司周虎岳做的叫求职科技 Discover robotics 那个做的挺好了但他做的你看他的客户都还是科研教学机构或者小公司在用这种东西
它不是直接给最后的它没有给最后用户的可能有一个小的是给小孩用的小孩玩这个机械人他从小孩到大学研究机构都会做但他还是给这些最工具去用的它不是一个主流的目前没有变成主流的比如家庭也好社会刚才我讲的三种还没有变
做自动驾驶的车企直接开始做机器人会更容易吗里面很多共性最后可能还是看你怎么落地技术方面来讲的话有很多共性机器人整体来讲的话要稍微更复杂一些就学东西可能更多一点但是呢做无人驾驶是需要更精益一些因为比如说机器人有些机器人他
可能速度很慢比如学习讲做早餐吧做早餐它这个整个速度慢点快点没关系那你开车不行了开车你在多少多少这个毫秒钟犯错就不行了要求不一样所以每个地方不太一样但这里面后台的东西其实都是一样首先你要首先你也需要一个感知模型你要感知感知的环境对吧
然后你要理解然后你要有 actionvisionlanguage 和这个 action 这个 model 还是有的嗯再往后生物智能呢
生物智能就需要先更长远因为生物智能比如我们的大脑和这个连带块通过或者植入或者非植入其实我更看好非植入的看好这个用传感器用比较更好的更敏感的传感器包括一些新的这些机器和大脑的一些接口新的就进化得很快
能在有生之年看到吗可以可以我认为 20 年之内可以实现 20 年之内所以这个时候以后你可以看到我们的大脑就被完全拓展我们大脑拓展有几个维度一个拓展是我们的记忆基本上是无限的我们的这个存储都不用记了第二点就是它会让我们真的变得特别更聪明我们比如说一开始可能更多的还是用
治病比如说我盲人他这个可以去刺激哪一块的 neuron 或者是我听不见我可以刺激我的整个的 hearing 的 neuron 然后或者是我残疾人他怎么样去把你这部分的神经大脑的中枢神经帮你去
连通帮你去修复一开始的治病包括老年人健忘症小孩的多动症自闭症像这种东西我觉得慢慢先是这样但到了后来它就可以拓展你的拓展你人的智能正常的智能它都可以拓展
那么这个需要蛮长时间的这里面也有一些伦理的问题也有一些未来就怎么样我们归世界和探世界的共存的问题它不是个身外之物这种它可能跟人更密切连在一块那我们有可能在我们有生之年把自己的生命留给归集世界对吗 possible 这个东西就是一个有一个哲学的问题也有一个信仰的问题
我觉得是有可能我不认为我们的人工智能目前可以产生意识可以但是呢我认为我们的人的大脑可以和就是我们的归基和探积生命可以连在一块这是可以的
然后可以让人生活的更聪明更加健康寿命更长是不是会永生我不知道但肯定寿命会但寿命长是归基的长不是碳基的长是因为归很长归是基本上可以很长一长对不对它可以延长碳基生命它可以延长碳基生命对帮我们延长我们的碳基生命好
这是怎么做到的你比如说我的器官都可以换掉大脑可以更好的更健康现在很多人去世比如说是癌症就是老年的 mental disease 老年这些疾病这些病可能以后都会治好我相信不管通过药物也好或者通过这种都可以治好
我不相信会有一个新的他自己会产生什么意识自我意识新的灵魂这我不相信为什么这个你不相信他聪明到一定程度不就应该能产生意识因为我们人怎么产生意识我们都不知道这个动作是个信仰问题但是我们现在人也有意识了
我们加了一个东西对吧这东西让我们变得更聪明更健康生命更长这个是有可能的前段时间我采访那个以太坊的 Vitalik Buterin 他讲了一个观点还挺有意思的他说他觉得未来生物和龟的技术会合并在一起
因为他觉得这个是我们人类唯一可以参与的 super intelligence 否则的话就是一个单独的计算机比我们都聪明它会主宰这个世界这是另外一个话题了我觉得这个就未来的世界未来的这个生命体我讲三种振动的融合对吧我就讲这个是数字物理和这个生物的融合
而且归基和探积是会融合的被融合但有意识的还是我们的探积这是目前我们对探积的意识是我们的一个理解因为归基目前再多的算力再多的数据本身和意识并没有关系或者说我们没有办法去创造我们不懂的东西或者说我们不懂我们不能创造的东西这个是
Richard Feynman 但人这个又跑另外一个话题就是到底我们未来的这个物种人类会怎么样我认为未来就是一个新的物种
这个新的物种控制还是我们的人类只是这个物种变得十分的智能和能力很大这个物种会控制我们人类不我说还是被人类所控制还是我们那个延伸就这样想一想我们现在看三万年前的人你说是不是一个物种我觉得很不一样了
三万年前的山顶动人但那个时候呢开始就人家有工具了石器时代有火但那个工具很 primitive 但我们今天呢有手机有电脑有互联网但再过一百年看我们今天的这些手机互联网和这个 PC 就我们看
三万年前的这个火样的石器样的而且这个进化速度会变得很快人类这个进化速度你看挺有意思的人类到 hunting 到了农业社会这两千年三千年没什么变化人类的这个整个的生活方式没有太大的变化
真正变化是我认为最大变化是过去的三百年在工业革命之后首先人的有了能源有了体力延伸然后第二个变化就是信息社会那么现在经历了另外一个就是人的智力在快速地去拖延人的进化速度就不是大耳其实在这个征集期出来之后人的进化就不是自然进化不是大耳闻的时候这个进化
它是一种非线性进化现在是指数性进化进化速度很快所以我讲一百年也许三十年我们看今天的人类我们这些东西都是很简单的
但那个时候就是一个新的物种它比现在的聪明的特别多太多了但是呢还是人在控制它是硅和碳结合的它可能不是只是碳因为你看你靠碳积我觉得很难实现 30 年换一个物种对 你怎么定义物种你比如今天你看猿人你说它是不是新物种都是但是完全不一样对吧和一样你一看一下现在不需要 3 万年可能 30 年 100 年 30 年可以实现变成一个全新的东西
你们能够想一下十年后我们的这个社会会是什么样十年后不会有什么变化我觉得十年之后呢其实我觉得我们现在想象的好像实现就实现很多车就是无人的了这个会实现这个会看到很多车是无人你可以看到开车的人会变少
人不会变少开车的人会变少吗开车的人变得很少十年后时间会变得少就是会比现在少很多很多人选择不开车包括现在比如在大城市年轻人选择不买车他就无国之乎大大很方便对对对那时候可能很多人选择他就可能自己不开车了
三年之后可能你看到有人开车就像现在有个马车一样新奇的东西你现在去纽约纽约现在还有马车你去纽约改个马车挺新奇的以后三年之后真的你看到个人开车就是这样的然后以后可能人开车需要特殊批准然后需要拍照制对禁止你为什么人要开车这些事你看挺有意思三年前电梯里面还坐人的还是帮你运营的对
对吧那现在你看电梯有没有人没有人但是也有地方有人的我后来发现英国电梯它对这种服务你看起来就很新鲜的这是一个高端服务高端的一个服务所以它最后会不会有人反而变成一种很特殊的场景就像手工制品一样然后你会看到很多机器人真正进入家庭你家里面都会有机器人有机器人就像今天的冰箱一样电视一样的这机器人可以帮助你保安安全家里面
不在的时候他可以看看你窗户没关啊这地方有没有被别人出啊可能以后买车的钱就花在买机器人上是吗因为你不用买车对我觉得这都会实现包括我们教育方式都会彻底改变教育啊我们医疗啊现在在做 AI hospital 就无人医院实验但是这些东西我觉得现在我们做的事好多都会变成现实但是呢就是人的这个不会有一个彻底的变化
30 年会有变化 30 年只有我们人的寿命会大幅度的增加
会不会永生我觉得可能不会但是我们每个人可能会 100 岁 100 岁可能就是常态有些人可能会到一半 50 岁那这会带来社会结构性的变化这个能推演吗这个我就不知道但我觉得会结构的变化比如人以后肯定是工作时间越来越少刚刚公演革命之舞我每天工作 7 天后来变成 6 天我出国的时候我忙 6 天了
回来就是五天了现在欧洲一些地方已经四天了然后呢以后我觉得人可能一周工作一天别的时间他就做自己喜欢的事但并不是很多人失业我得说不是说有些人工作七天别人失业然后六个人失业是就社会的生产力会大幅度提高社会结构会变化人类会 age and population 会
会长寿自然出生率会降低人会变少人寿命长了人数整个可能不一定变少但是新的人数会变少啊
现在已经是一个大的趋势你如果看的话相对比较发达的国家人口都在变少人的整个的 medium 寿命的 medium 可能是 80 岁现在是 40 岁我不是讲或者平均平均或者讲个 medium 所以以后 80 岁的人可能还是青年人壮年人这都会变的这很有意思而且以后年老人可能身体也会很好这些疾病慢慢慢慢就会被治愈包括不管是身体的疾病还是大脑的疾病
那还是应该尽早找到自己喜欢干的事要不然怎么度过这么漫长的人生工作时间还减少了您会给现在的学生什么样的建议吗你会告诉他现在科技发生什么样的变化教育会发生什么样的变化那你们应该怎么去年我给金管学院毕业典礼有一个
这个半小时的演讲这里面就是给讲未来的学生给他们一些建议讲到这个人工智能带来的一些挑战带来的机会谈到呢就对他们的建议这里面有几个建议这个建议其实和我这些人讲因为我在哥伦比亚大学给他们的毕业也是大致的 message 我觉得就是这个人工智能实在来了之后我们的教育我们的人才未来的这些这个素质
整点讲的话就是我们现在的以后我们的教育方式就是多了一个东西现在是学生老师以后多了一个东西就叫 AIAI 我都在建议我说我们以后每堂课有一个教授人的教授还有一个 AI professor 这个 AI professor 他应该像助理似的但是 AI professor 可能懂得比教授多多
学生也可以给他教过也可以问他问题所以以后很重要一个学习的方式不是说我要背不是说我要就是要刷题重要的是怎么问问题你现在一看 CHI-GP 这项东西它
他给你的回答和你问的问题的水平很大的关联你要瞎问问的虽然他有万大一统你要问的特别好他会给你特别深的一些答案和你的交互问问题的能力我们一直讲问问题评
批判式的学习要去 debate 用自己新的观点不断地学习以后的教育一定会把这个 AI 作为一个重要的元素现在其他没有这个系统学习的方式需要很长时间的调整
基于您所有读过的书能不能推荐两三本书我刚看了一本书叫 Auto Life 讲到 AI 和 Life Science 讲到长寿生活的方式叫 Auto Life 这本书很好这本书我原来读的 In Search of Memory 这是一本老书 In Search of Memory 这是一本特别好的书我和这个老先生我和他来请教过现在已经一百次了
到格雷比亚教授队的这是我讲讲对不对还有这个现在人的最重要的一个智能是记忆记忆分成几个层次有天生的定义的记忆有定义的记忆然后有这个短期的记忆然后有长期记忆然后学习其实就是把这些记忆就是你怎么去记忆它知识比如说
到了大脑外皮层的长进一些这种知识现在 AI 不太懂这种东西
AI 目前它对知识的抽象所以我觉得这个写得特别好我们人类是我们怎么记忆包括比如说老年人有失忆症你发现都是他这个大脑记忆比如说那个海马体开始就缩小了萎缩了然后这个时候人的这个所谓的 intelligence 怎么样所以这个记忆特别重要我们现在 AI 的这个记忆还是在行或者没有这样的分层所以我是这个说起来很好
好了,这期节目就是这样,如果你喜欢我的节目,欢迎前往苹果 podcast,腾讯新闻,小宇宙,喜马拉雅,QQ 音乐,订阅张小俊商业访谈录。如果你有其他想邀请的嘉宾,想听的内容,或者你有任何想探讨的话题,都欢迎各位听众朋友们在评论区里留言。那我们下集再见,拜拜。