We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode EP324-站在“人形机器人”的风口:我们究竟离真正的“具身智能”还有多久?

EP324-站在“人形机器人”的风口:我们究竟离真正的“具身智能”还有多久?

2025/4/8
logo of podcast 无时差研究所

无时差研究所

AI Deep Dive Transcript
People
A
A老师
王妈妈
Topics
A老师:我从事具身智能研究一年有余,此前专注于大模型。转向具身智能是因为它能更直接地提升生产力,特别是解放体力劳动和重复性劳动。虽然AI也能创作诗歌,但它缺乏人类的主观能动性。目前我们团队致力于多模态大模型的研发,目标是让机器人实现听、说、想、做、对话、处理视频等多种能力的实时交互。 我认为具身智能与传统人工智能的关键区别在于输出和场景。具身智能直接作用于物理世界,而传统人工智能的输出通常是信息流。人们对具身智能的期待是,拥有身体后学习方式会发生改变,但目前机器学习仍然依赖传感器数据。人类和机器学习中身体的意义不同:人类学习语言时会调动自身经验和认知,而机器学习语言则依赖符号系统和数据。机器学习依赖能指链,缺乏对所指的理解,而人类学习则会调动内部认知和经验。机器学习的泛化能力与人类认知的本质区别巨大,目前无法断言机器是否产生了认知。 机器人“大脑”负责任务规划和决策,而“小脑”负责本体控制和运动控制。目前机器人“大脑”的训练方式多种多样,包括遥操作、合成数据、世界模型和强化学习等,各有优缺点,尚未形成统一的技术路线。合成数据、世界模型和视频训练等方法旨在为机器人提供基础能力,而仿真平台则用于模拟真实环境进行训练。具身智能目前面临的最大技术瓶颈是任务泛化能力不足,这与数据不足和算法不成熟密切相关。具身智能最大的瓶颈是数据不足,这与算法不成熟互相影响。目前具身智能算法尚未收敛,这意味着技术路线尚未确定,不同方法的优劣难以评估。具身智能的突破性进展可能在三五年内出现,但整体而言仍是一个长期项目。作为从业者,看到技术突破性产品出现时会感到惋惜,但同时也会为行业发展感到高兴。 我认为具身智能的风险是存在的,但业内人士并不过度恐慌,因为目前技术距离失控状态还很遥远。目前具身智能模型是可解释的,因为其内部运算过程是可追溯的,只是人类难以用语言描述。 柯柯: 王妈妈:春晚的宇树机器人并非具身智能,因为它动作预设或由人工遥控,而非智能驱动。具身智能的核心是智能体与物理环境直接交互,其输出直接影响物理世界。 supporting_evidences A老师: 'Embodied intelligence means that it can more directly liberate productivity. It's like large models, which have liberated some productivity' A老师: 'I think that the essence of humans writing poems and AI writing poems is different. For humans, they have subjective initiative to write poems, and AI writing poems is not the same.' A老师: 'Now robots have several things to do, for example, they have to listen, they have to speak, they have to think, and then they have to' 王妈妈: 'It doesn't belong to the kind of embodied intelligence we are concerned about. It is pre-programmed or remote-controlled' 王妈妈: 'The core of embodied intelligence is that an intelligent body needs to directly interact with the physical environment.'

Deep Dive

Shownotes Transcript

好 哈喽大家好 这里是无时差研究所 我是柯柯哈喽大家好 我是王妈妈今天我们聊什么呢 王妈妈我现在也就是现在能再说一说话可能再晚一点就没什么话可讲所以赶紧多说几句我们要聊一个非常高科技的话题

其实我们之前在如果大家之前有关注到我们在去年的年终盘点节目里面其实提到了在过去一年里面投资行业非常关注的这种高科技领域的热点我们其实就提到了巨神智能对当时大家还觉得是个很陌生的词汇

但没有想到今年又被提到了一个很高的位置对因为在刚刚结束了两会里面大家政府工作报告中就有提到就是建立未来产业投入增长机制巴拉巴拉说到了非常多的高科技领域很多都是我们之前提到的这愣蹭其中一条就是巨神智能然后我一拍大腿突然想到我读书的时候社团老友 A 老师目前就是在国内相关领域的一个非常顶尖的研发机构的从业者

所以今天就是也想请 A 老师跟我们讲一些技术上的事情对欢迎 A 老师跟听众朋友们打声招呼哈喽大家好我是小 A 他们叫我 A 老师感谢王妈妈的邀请感谢柯克感谢无时差研究所来邀请我们邀请我参加这个节目也很高兴和大家分享一些自己平时的一些胡思乱想吧

那我们也是简单的希望大家能够了解一下叶老师的背景嘛也顺便问一些我现在还能懂的问题啊叶老师是什么时候投入到这个巨神智能领域的当时是为什么选择看好这个领域我其实从事巨神智能相关的工作可能也就一年的时间吧在之前我们整个团队都是做大模型的哦

然后其实就是很多团队做大模型的团队或者说做 AI 的团队都在向居然是能做转向这个和你们投资观察到的一些

你们不是因为 DeepSick 出来之后变成做巨神的吧我们我们领先我们我们提早一年就就醒悟了 DeepSick 无法碾压到我们我们早就溜溜溜溜溜溜溜了对对其实就是本来我们看那个 AI 这个相关领域的趋势嘛就是基础模型和应用本来就是就是有两条路嘛我们本来是做这种基础模型但是就其实相当于基础模型它随着这个模型的大小啊数据啊增长就

就是大家所所所知道的就有个 scaling law 嘛就根据这个东西在继续向上推的话其实目前来说能够看到的这种它相当于是在一个设定好的问题框架内在所谓的卷性能就是大家在像像 deep seek 就是这一波卷赢了下一波就是有谁出来就相当于是就又成为了新的卷王嘛在这种情况下就是其实

在基础模型上面能够被定义出来的新的重要的问题越来越少而巨神智能的话其实相当于是下一个更重要的一个包含了很多很多问题的一个领域嘛然后可能这这也是我们团队整个在大模型从大模型向这个巨神智能转化的转换的一个初衷或者说是动机之一吧对其实

看好军人智能这个领域主要是觉得我个人啊这个是一个非常 personal 的观点就是我觉得

巨深意味着能够更加直接的解放生产力吧就相当于是那个大模型它其实也解放了一部分生产力比如说你要写个周报啊你要写个什么东西的你就直接直接直接敲给他就是一些本来就是不该由人去劳心费神做的一些机械性的文案的工作的生产力确实被这个东西解放出来了我觉得巨深的话其实

相当于说他能解放更加直接的就是解放人的就是类似于体力劳动啊就是之类的就是解放生产力然后去就是一些就是重复性或者伤害性的劳动吧就是说应该应该就是说有一部分可以抽出来交给人去干嘛了人就去写诗吧哈哈哈哈

救命但但写诗难道不是被现在 AI 的一些也写的很好啊对啊就是其实现在有一种说法嘛就是说本来人类是想把劳动交给机器人自己去严实做话现在 AI 严实做话头头是道然后人还在做一些伤害性的劳动就是有很多人觉得这也确实有点背离了相关的初心吧对但是我觉得其实当然写诗这个话就更加说来话长了就是说那是另外一个还能聊一整天的话题

其实我觉得人写诗和 AI 写诗本质上就是对于人来说他是有主观能动性去写诗的和 AI 写诗并不是并不一样就 AI 写的再好不会满足这种需求

那我们说回来就是那你现在目前每日的工作里面会比较聚焦于就是巨神智能哪些具体的方向吗明白我我们现在其实从大模型转过来我们其实更多的就是说就是最直接的东西就是我们在做多模态的一个大模型就是包括这个我们更关注的解决的问题就是说一些多模态之间的实时交互技术就是说一个模型它可以

就是现在机器人有这么几件事比如他要听他要说他要想然后他要

然后同时他要做动作他要对话对对他然后他要他还要对有有有视频就是好多件事情之间我们选一到多件事然后我们关心的是如何让他们实时的在这个用一个模型同时的进行然后就相当于是一个同时处理这些事情的一个多模态的大脑吧对我们关注的就是这样一个任务然后我平时就是做一些算

算法的一些研发就比如说模型的训练和改进相关的工作嗯嗯嗯嗯

那不然我们就聊聊最底层的东西其实在之前节目里面我们也替大家厘清过这个专业知识的概念但今天可以再给大家厘清一遍或者请王妈妈先讲一遍没有吧就是我觉得可以技术扶贫一下给大家讲一下虽然好像有点稍微回滚了一下就还想说可不可以用比较简单的语言去描述一下巨神智能是什么

对或者就是说今年春晚里面爆火的雨树极限跳舞它到底是不是巨神智能我觉得可以给大家厘清几个概念什么是本体什么是巨神智能什么是大脑什么是小脑对其实刚才这个引子很好就是春晚的那个机器人是不是巨神智能我觉得就是

它不属于我们关注的那种巨神智能它巨神但是它是预编程或者遥控器就相当于是它的动作是预设好的然后相当于是或者是人在外面直接给指令操纵在这种情况下我们并不觉得它表现得非常的智能对它可能

对当时我们并不知道是有没有一套智能的一套就是流程参与了其中的某一个环节但是整体我们看来表现就是说你不通过智能也是有某种方法能够做到这件事的所以这就引出来就是什么是巨神智能其实就是这两个词什么是巨神还有什么是

什么是这个智能那么其实我觉得巨神智能的核心就是说一个智能体它要直接和物理环境去进行交互吧就是相当于是

其实它的直接一个直接的对比就是你在网页上看到那种就是拆 GPT 或者是一些什么人链识别它就是通过文本信息流的方式输出给你一些反馈但是巨神智能就是说这个智能体它的输出要直接对物理环境外界的这个物理世界去产生一些

就是影响或者是就是操作一些物理世界里面的东西吧对但其实我我其实有想想过一个场景就是我每天上班对走到那个门口

抬头看一眼他识别我人脸那个门就开了就实际上他识别我人脸那个模型他就是一个 CV 就是计算机视觉的一个模型嘛他本身其实不能算是巨神智能但是他这个结果直接操纵了那门你要把这个东西看作一个整体来说的话他就有一些巨神智能的意味了对所以说巨神智能我觉得和就类似于说他和智能的区别

更多的就是在于它的输出是不是直接影响外界的物理世界还是说通过单纯的信息流行输出那所以它跟传统的人工智能比起来就是巨神智能它的关键差异有哪些它和传统人工智能作为一个从业者来说其实我目前觉得就是说单纯从学术角度来说它的核心差异就是在于输出和场景因为它背后的人工智能原理在

在我们看起来其实它本质上是互通的就是说并不是因为它有了一个身体之后它有了和其他的一些智能体完全不同或者说就是从它的性质上就是两码式的一些学习的算法本质上就是它都有规则驱动和数据驱动就像是你这个机器人你假设你搭的是一个就是什么我看见人就抬左胳膊看见狗就抬右胳膊

就是这样一条简单的规则你把它放在机器人里它其实你也可以说它是一个巨神智能所以说规则系统它也就相当于说我们平时看过的看到的所有的那个形式当它与物理世界产生交互的时候我们都认为

他们其实只是这个输出上的区别它本身上没有区别包括现在大模型大家可能也会了解比如说 DeepSeek 这一波做出来的时候他提出的一些和强化学习相关的一些技术那么包括 OMAI 最早他做的 InstructGPTChatGPT 他里面提到的相当于是

就是说强化学习强化学习这个东西它本身就具有非常大的巨声色彩因为它里面的概念都是有环境和环境交互向环境输出动作然后从环境获得奖励然后去完善你就是输出这些动作的一些内部策略包括最开始一些强化学习的一些问题设定比如说操作多臂老虎机之类的这种形式它其实都是非常巨声的

所以说我觉得就是就总结一下还是还是那句话吧就是它的本质的区别在我看来是就是场景和输出的区别什么是多比老虎记多比老虎记是不是什么好东西跟赌博有关我想这个问题对那意思就是说传统的人工智能它其实是没有跟外界的交互的是吗

是的就是说那个当传统传统的人工智能你把它用来去操作一些跟外部交互的东西的话你其实可以认为你从某种程度上实现了巨神智能对但是现在大家说巨神智能这个词的时候很多时候心里想的更多的是说这个词能够给我们带来一些就是革命性的一些学习算法就是这种他人们对巨神智能有这样的期待就是因为

就是人们想到我是具有一个身体的而 AI 它是数据吞数据进吞数据出的他人自己觉得自己的学习的方式和现在这些模型是不一样的所以当你提到巨神智能的时候人们下意识的会产生这样一种期待就是说是不是加了一具身体之后那个学习这件事情就是机器学习这件事情就变成另外一回事人们是有这样的一种期许的但是从目前来说的话其实

你接触到的仍然是传感器数据这个 B 它的这个就是机械手它的每个关节的位置啊旋转角度啊都是作为数据流去交给这个模型的模型仍然是从数据当中来学习的对所以说就是我看到一个问题就是身体对于智能的意义我

我个人觉得这个问题是这样就是说身体对于智能的对于人来说身体对智能的意义和对于机器来说他的身体对他的智能的意义在现阶段而言他并不是同一个问题就是人的身体对于人的学习他具有的意义在于比如说就是我举个例子就是语言的学习来说机器对机器来说他看到的

他学习语言当然大家现在都知道就是说现在的语言智能很厉害对吧就是由 OAI 和 DeepStick 领先的大模型他们的语言能力可以说基本上已经学到头了他已经不比正常人差什么了那么他们是从什么来学习呢

他们把语言看作一种纯粹的封闭的符号系统就比如说从现在是从索旭尔开始的那种语言学他就是觉得一个语言他一个词跟他什么词跟词汇什么的都不重要他就是和他自己在这个体系当中他出现来的他出现的这个位置和他和其他的词的一些贡献就是共同出现就 co-occurrence 对就类似于这种

他是通过这种数据来学习的而人其实你在学习语言的时候比如说你去查一个字典比如说你想知道巨神智能是什么你在查字典的时候你会先查巨神智能然后巨神只告诉你是巨神的智能那什么是巨神呢什么又是智能呢然后你又去查什么是智能你会发现你陷入了一个无止境的一个符号运动就是你在

不断地用一些新的词来解释另外一个词那么你在什么时候停止呢比如说你查到了一个词你终于完全搞懂这个词是什么意思你不需要更多的符号来解释这个符号的时候你才搞懂那么这个时候其实你自己觉得你自己懂是因为这个词唤醒了你内部的一些认知途径或者是一些经验感受

这个东西你可以说它是机器在那种纯粹基于共同出现的这种书籍里面你和它的这种学习其实不太是一回事因为你就有身体这种感觉或者说更术语一点叫做洞觉意象图示就这个东西是来自于你和物理世界的交互的一个直接经验的对所以这是有身体对人的意义而有身体目前对于机器的意义在于它的身体就是

它还是转化成数据它是从数据中去学习的所以你并不知道这个机器它内部它是怎么想的所以说机器它没有所指和能指的区分对吗机器它就是一切都是能指它就是能指链不断地在在换来换去它是一套纯粹的分布系统它不会说这个东西它指向了它唤起了它内部的一些就是非符号化的东西因为一个机器

也不能说它和人的本质区别一定是这样因为这涉及到人的本质是什么问题这是另外一个问题但是机器目前来说机器的智能它作为一个模型来说它就是一套固定的一个运算它模型里面的参数每个参数是多少 1.2 1.3 你都是知道的

对它是设置好的或者是它是外界的训练出来的数据比方说它的那个就是减速器啊然后或者它的传感器啊给它的这些数据对然后对就是这些数据输入它的模型它模型里面存的一些叫做参数的数据它会

用这些参数相当于是相当于是一个式子里面就是就是就是 A 一倍的 X 加 B 一倍的 Y 等于 C 那个 A 和 B 就类似于这种东西是他训练出来的然后那个 X 和 Y 就是你说的传感器传进来的数据最后他这个结果就是完全有这个过程决定了对所以你可以说这种学习方式和你人的身体感受到的最终的那种学习方式是不一样的这没错对但是但就是说

他现在的巨神智能本质上还是就是数据驱动的 OK 那咱们经常说的这个机器的泛化能力或者巨神智能的泛化能力是在产生跟人一样的这种认知吗泛化能力的话我认为就是人类认知的本质这件事情过于复杂我觉得现在大家都在蹭就是说就是

很早其实一直以来大家都说有感知有认知就当于是认知就是说你真的比如说理解了一个东西或者说把它内化了一个什么的但我觉得就是说你对于机器能不能产生现阶段你对机器是否产生了认知或者是否产生了智能这件事情你并没有办法

就是由于你不是这个机器的身体的体验者你是没办法直接下出这种断言的你只能说它产生了一些任务之间的一些泛化能力迁移能力这种事情你可以说它产生了泛化能力但这种东西和认知是否能够划等号其实就是取决于你是如何定义认知这件事情本身呢

你是如何定义智能的,你是如何把智能和泛化能力画上等号对这些事情有些人是认可的,有些人是不认可的但是我认为目前来说你能观察到的所有的你认为一个东西是有智能你只是观察到了它的一些你输入给它一些外部的输入,然后它对这件事情做出反应

他这个反应是你能够用你的语言比较舒服的理解的就是你觉得你能够用语言比较舒服的说出他这个行为的逻辑或者说你作为一个人你觉得他像你

我觉得人类现在对于一个东西是否就有智能的这样一种判断大多都是基于这件事而不是说那个他对智能有一个非常一定有一个就是相当于智能的元旭是就是什么定义了智能因为还是那句话你在定义智能同时你要演出无穷无尽的一些语言的就是你会不断的向上追问最后你会发现你判断一个东西那么有没有智能你就是

就当你觉得他做行为的逻辑你能通过你的语言比较舒服的说出来的时候他就

你可以觉得他有智能嗯嗯嗯差不多是这样没想到我们解释一个巨声智能解释是其实没有必要解释的这么深但是就我也是一个比较喜欢胡思乱想各种概念的人所以对那我们再讲一个定义就是巨声智能它其实是个形态嘛但是从从业者来说它会分成大脑和小脑嗯那什么是大脑什么是小脑我觉得也可以给大家简单说一下这个其实

相对来讲分的还是比较清楚的就是它是和人类就是解剖学或者医学上认知科学上面对于大脑和小脑的相当于是对于对于那边的一个一个分类学的一个直接的借鉴吧然后大脑就相当于说

做一些就是任务规划或者是就是一些一些测论任务分解任务规划包括一些就是说比如说把怎么说呢把大象放进冰箱分为几步大脑的任务就是输出三步打开冰箱塞进去关上然后小脑的话现在一般来说比说的比较多的就是直接的对于那个对它本体的那种操控就所谓的运动控制比如说它得

他的站站着能走他比如说他的全地形去走对对他能爬楼梯对他被石头对他被石头绊了能自己爬起来或者能够自己稳住包括他自己自己用就是

他他实际操作那个机械手去把大象给塞进冰箱里这个事其实就是就是其实就是说那个小小脑也是参与了很多对就是其实他主要的区别就在就在这里所以具体就是还会定义到各种任务上面去嗯

所以目前就是从行业参与公司的分类上来说的话也是会分成大脑和小脑类公司那像咱们比较熟知的像语书这类公司它就是专门做小脑的公司所以它就在不断地去就是去去 test 这个机器人的性能的边界它把这个性能做到更极致就不仅是会翻跟头你踢它一脚它也不会它也能慢慢自己爬起来

对这个就是他们这类公司的目的那我理解像 A 老师他们做的目的其实是在对于大脑的训练那所以我们今天也是希望说能集中去聊一聊大脑的部分那在机器人当中训练大脑的目的最终是为了什么呢最终的目的就是

其实和那个其实和大多数人工智能的终极目的是一样的吧就是你希望你希望这个机器人他能够自己去就是你不要把你不要

就是把这个人的工作定义为把就是跟机器人说清楚每一步要怎么走这样仍然没有解放出劳动力就是相当于小脑他输出的是什么就是说炮兵阵地左移五厘米那种意思就是说那个你这根手指头要怎么动另外一根手指头要怎么动就是如果人对机器的操作仅通过一个

就是仅通过一个这样的模型的话就是说相当于是人是替代了他的一个小脑的部分就是做小脑的公司吧他们的目的是其实解放这部分就是人不要告诉他每根手指头怎么每根手指头在哪里动对我叫你抓这个东西你就能自动去把它抓出来对但是就是说

人即使分解到了抓东西这一步来说的话人的工作量仍然是仍然是很大的就是你比如说他已经到了那里你可以告诉给他他机器人帮你把这个东西给抓出来对吧但是但是在就是如何走到那里以及到底是抓哪个东西

就是相当于这些事情他其实需要对人类的指令进行理解然后并且自己把它分解到那个每一个细微的就是动作控制的一个序列的起始点上去对就相当于是你可以这样的话就是人类可以对机器人下达更加抽象的一些指令比如说你去帮我造一个什么东西他会自己去分解

或者说你可以说你上楼帮我取个东西大脑其实起的作用就是说要做到这件事情他需要先做哪一步后做哪一步他也可以把人类从这个过程的干预当中去解放出来尤其是其实大脑更多的还有就是说他小脑怎么动取决于

他对外部一切东西的理解他听到了什么看到了什么就那个包括人类人类希望他做什么这些东西需要有一个统一的中枢进行指挥吧嗯对就主要是通过这样的明白嗯

其实目前大脑还是有几种比较主流的训练方式就是像我们大家知道的之前那个斯坦福机器 Aloha 它就是通过摇操的方式就是你机器人在前面然后你在后面做一系列操作比如说它在前面提线木偶那种

对对对就那种感觉对然后教会他什么炒菜啊打扫卫生啊什么之类的就当时那俄罗哈的视频也非常的惊艳对然后另外还有一些像合成数据啊世界模型啊或者是通过呃现有的视频去训练然后再加上强化学习的一些方式就是感觉是现在的目前的路线都非常多啊训练大脑路线都非常多我不知道是怎么评价这几种呃主流的训练方式或者是说有没有现在目前大家还没有探索到的或者是说呃

哪一种方式会更理想一些还是大家都混在一起的方式明白明白其实就是你刚才提到的这些大脑的训练方式它其实是各司其职的相当于每一种训练的方式都有它的一些优点和缺点吧然后比如说你说的比如说用大量的视频数据和就是类似于就是训练一个世界模型的这个过程它一般来说是发生在

巨神模型的就是就是巨神之灯这个任务训练的开始之前就是相当于它是一个预训练的过程就是类比到大模型里面就是说它在大规模的五监督的语料上面去做去做一个预训练就是相当于大家通常说所说的我们花了几个月多少张英伟达的 H800H100 的卡去训练一个基础模型其实对于

对于机器人来说你可以理解这种这种世界模型或者说大规模的视觉育训练就是巨神智能的基础模型的一种形式对然后的话基于这个形式的话这个模型可以对语言人类的语言和外部的这样一些外部的这些世界的这个就是外部这个世界长什么样它有哪些东西有一个基本的一个鲜艳的知识这样

然后这个是作为他后面巨神大脑训练的一个起始点嗯然后的话就是说在巨神智能他具体的任务不管是大脑还是小脑的任务吧就是说在这个任务的训练过程中就涉及到你刚才提的提到的一些就比如说有操控

就是由那个实体操控去收集训练数据把它放在一个实际的环境里去根据反馈学习还是用一个合成的数据或者说你虚拟出来一个环境去让他先跟这个环境去进行交互然后然后就是先进行模拟再进行实际相当于这些方式的话嗯他

就是大家之所以都在用是因为没有一个放置四海而接准的就可以一步到位的一个方法对就是类似于那种实际采集偏实际采集的这样一种训练的方式的话它的一个主要问题就在于成本当然这个和本体制造的现状也有关系就是它的成本因为它会不断的试错试错过程中你的机器人甚至可能直接就报废掉了

然后包括就是你可能好多台机器人好多个就是员工在操作一天其实也收集不到多少数据它的那个能够收集到那个运动的那个轨迹数量之类的都是有限的然后像这种情况下就是说

你需要大量的数据先去进行先去弥补先去找到一个更好的一个起始点让你收集后面的这些数据数据过程更高效这过程中你就需要用你就需要用到一些就是合成数据或者模拟环境它的优点在于

它可以瞬间产生大量的和真实场景接近的数据这个在训练对训练模型来说其实就类似于一种 scaling law 你总归是要保证一些数据的一些基础的量在那里才能够进行有效的一些监督的学习其实这个就跟你去学车一样你先要在 VR 上面去

去打方向盘然后打它十几个小时你大概知道了然后你就上车去实操对你如果从一开始实操的话就是因为你不是一个因为机器人它本身不是一个

你可以理解为他在见到这个任务之前他是会油门刹车一起踩的人就是他会在你那个车上面乱搞的人所以你如果一上来不做虚拟环境你就直接去下生产环境的话你会产生很大的数据收集过程的成本就类似于这样一个逻辑对

就是有一些可以用便宜的也不是便宜吧就有一些可以用现成的这种合成数据啊或者是已经存在的这种虚拟模型去给它做一些基础是吧给它打好这个基础然后这个时候再用摇操这种方式其实弥补一些它可能本身就是基础数据没有的这些动作

去提高它的能力有一个概念叫做 seem to real 就是说从模拟器到真实场景其实这一步就是说你模拟器和你的实际的生长环境其实也是千差万别的所以就是这每一步其实都有可能就是都涉及到很多很多问题所以说

整体的这种技术路线目前来说还没有收敛的很好对就跟养小孩一样是真的是个养成的过程你别说巨神模型就我们以前自己训大模型的时候我们都说我家傻儿子终于会插秧了就是都

都会有这种感觉对所以这里其实我一直有一个问题就是刚刚说 sim to real 就是从模仿品仿真平台然后到现实世界之间的这种 gap 那刚刚说的像什么合成数据和世界模型包括视频训练这种它最终的目的是为了去打造一个模拟的仿真平台吗不是它的目的是相当于是

给这个模型本身的具有一些基础能力对 仿真平台的跟他们之间是什么关系仿真平台相当于是可以这么说吧就是你还是以学车作为例子就是说你的世界模型是你把这个娃完成的是你把这个娃从出生到长大的这十几年的

他在通过生活中建各种东西来学习他就有基本的一些认知能力这个过程其实是就类似于是是我们所说的世界模型的一些学习或者叫做在模型里面就叫做预训练的一个东西对然后

然后那个 sim 就是去模拟环境的话它就跟它其实相当于就是你已经站到了那个 VR 学车的那个台子上面对就是相当于是你确实已经在学在实打实的去模仿或者说通过强化学习之类你是在去形成自己的开车的一些

一些策略了就是你看见比如说看见前面人来要踩刹车这样的但只不过这个时候你操作的车不是真的车你看到的前面的行人也不是真的行人对然后最后的话当然你要在投入生产之前肯定是要去就类似于你肯定是要使机去上路的这个就是最后一步

明白了所以其实刚刚说的那些合成数据实践模型和视频训练这一些其实是给他一个基础的智能就是让他成长成一个能学车的人但至于你到底是用模仿就是到底是用仿真平台去就用 VR 学车还是真的上实车这个就在于说你的效率的选择你可能用 VR 先学一下车然后最后再上实车你可能效率更高一些

但是前提是你已经通过刚刚的那些数据把你喂成了一个能够理解学车这件事情的人对这是一种范式吧就是你也可以选择从一个小孩一出征你就叫他学车这样的话很有可能他真的就只会开车是你们你的同事有没有家里有小孩的他在养育小孩过程中会说今天带我孩子去百货商场让他来进行一些世界模型的学习

我同事有养孩子的嘛然后有一次他养孩子的术语就和其他家的不太一样他就说我孩子今天涌现了涌现了好可爱那目前来说的话巨神智能它面临的最大技术瓶颈是什么呢

我觉得就是这样当我们说瓶颈的时候我们仿佛觉得我们的水已经快装满了只剩一个脖子我们穿过去就海阔天空了实际上我感觉巨神智能现在的现状是你举目四望有无数座大山你在群山环绕中央不知道走哪条路出去就是类似于

类似于在实现巨人智能的每一步来说的话都会面临很大的阻碍比如说包括本体制造但是我们不搞本体制造但本体制造我们可以看到的就是说机器人本体的或者说报废率故障率什么的其实肉眼可见的也是有的对吧然后当然从我们

对于巨人智能的就是期望来说其实最大的问题还是你就是你刚才提到过的任务的一个泛化性的问题嗯就是

其实甚至说同一个任务你让他站在一个桌子前面把苹果放进篮子里你换一个桌子或者换一个苹果他如果都做不到做不到稳定成功的话就是这样的东西其实目前来说就是离应用还是会比较远所以说最大的问题就是说所以现在其实你去看那些学界发的 paper 所有人都在提一件一件事就是就是 task 之间的

他提出一个数据也说我们涵盖了多少种子任务然后这些子任务都包含比如说是单 B 的任务还是双 B 的任务还是说单 B 双 B 都有的然后包括是这个 B 上面有多少个关节就因为大家普遍的一个担忧就是你这个机器人你在他这个数据集上你去学习

学出来了你会操作 10 个关节放到 20 关节你就一定搞不定所以说他们一般就是说他我们的所谓的 domain coverage 就是他能够覆盖多少领域这件事情不管是做数据集合做模型都把这个作为主要的吹点其实越是主要的吹点越是主要的痛点大家

最希望的就是说一个机器人他能够真的理解物理世界它的这个规则然后你当你知道这个规则的时候你会对一个东西有预判就是说这个东西它是硬的是软的你拿起它需要花多大力气当你当你对于不同的任务你都要有这样不同的判断然后你去

通过你这样的判断你去生成合理的动作序列这样才能说它具有了我们所期望的那种智能但现在的话大多数都是说我一直过你和一个任务一直在一个任务上一直拼一直去一直训到它的成功率是比如说非常令人满意了然后我就然后我就说我这个机器人他学会了这个任务

但是就是说其实实际上你在说的是他在我们这张桌子我们这个型号的苹果我们这个型号的篮子下他学会了这个任务

然后这个型号的桌子上这个温度和湿度包括光线这个角度你学会了这个东西它是有一些限制条件的是的就有一些限制条件就比如温度湿度可能限制条件没那么大但是比如光线之类的它对于这个视觉的影响就有的时候就会有对所以它归根到底就是它还是过于

就是它场景过于单一了它没有真的产生所谓的对于这个物理世界的

就像人这个级别的对于物理世界的一个理解那如果比方说有一天这个世界模型其实已经比较成熟了它能不能就一把子提升你对于这个物理世界认知呢因为世界模型当中其实也会涵盖很多的就是物理世界的规律嘛那就是我把这个世界都交给你了你还有什么不会的呢是就是我对那个巨神智能实现这件事情的可能性我是相对来讲

比较乐观的就是我觉得这件事情作为他作为一个机器学习的一个任务来说他是他是怎么说呢他是可实现的就是我就是他只是有他只是有技术数据包括现在各个各方面的一些瓶瓶井嗯挡在我面前但是从原理上来说他一定是可以学到的因为物理世界他本身

它是由客观规律驱动的它并没有人的喜好本身复杂就相当于是现在人现在机器已经能够做到就是所谓的向人类对齐就之前很火的所谓的 RLHF 就是说

有人类喜好驱动的机器学习就用来训那些大模型的时候说就是像人类的价值观对齐像什么对齐我甚至觉得你像物理世界对齐这件事情从原理上来说比像人类价值观对齐要更简单只是技术上目前更难而已那其实那我是不是能简单的理解目前这个巨神智能最

最重要的这个瓶颈或者说现在的阻碍还是数据不足的这个问题是的就数据不足一定是就是从怎么说从目的从目的或者说从目标来说最大的问题就是可以说是可以说是泛化性对然后从手段来说从实现这个东西的手段来说其实数据

确实是目前比较比较缺的一个事情但是实际上目前除了数据之外包括就是我们模型算法测其实也面临很多的挑战因为所以就是就是他们数据和数据和算法其实本质上他也不是分的完全开的两个东西就有些时候你的算法没有到那一步的时候你并不知道你当前训不出来模型是由于数据不足导致的还是算法太烂

对就这两件事情是相辅相成你找当你找到一个高效的算法然后你发现就像大模型一样他已经找到这条路就是说我在当前算法下我知道我 scale up 这些数据我加入更多的数据投入更多算力我能够得到一个

一个可预期的一个提升现在之所以语言模型更成熟就是人们已经观察到这个现象对而在机器这边的话算法没有收敛的情况下 scaling law 你也确立不起来这种情况下你甚至也没办法把数据目前你在哪一个在哪一个程度未来需要扩张到多少做一个很好的预判其实目前也所以其实现在巨神智能算法还没有收敛嗯

不是基于 transformer 架构去做的一套东西吗对但是就是说 transformer 架构的话你其实指的是就是这个模型它的一个就比如说你你把一个数据输入进去以后它整个运算的这个

这个公式的一个形式但是就是现在这个形式定下来之后更重要的是现在是现在这个瓶子有了你要往里装什么东西在装这个是装什么东西的这个过程这个过程的话其实就是说所谓的这个训练的一个目标函数的设计就是同样一个穿梭模型你可以用比如说无监督的方式去学习用强化学习的方式去进行用监督学习或者模仿学习的方式去进行

对这种形式你都可以训练得到一个一瓶饮料一个穿梭门但是它的强弱之间的差别很大所以说不光是模型它本身的一个

它的一个架构的选型的问题还有就是说具体的训练的这个算法训练方式的对也是很重要算法收敛意味着什么就是说我们所说的技术路线收敛就是指现在大圆模型你让我去开发一个大模型我完全知道每一步是怎么做因为这件事情大家都趟过无数遍而且大家都行之有效了但是你让我去训练一个场景下能干好事情的机器人的情况下我每一步我都觉得

我在这一步这样设计到底对不对然后我先向行业去查以前查大家的 paper 查大家的技术报告查大家的一些就是公开的一些信息的时候我会觉得他们为什么要这样做他踩了哪些我不知道的坑就是现在我们做这种这个方面科研的时候我们是这样的形态而我们这种形态我认为就叫做技术没有收敛然后你相当于我刚才跟你说的那种做

大圆模型手的那种心理状态就是我知道这样搞一定能搞成因为大家都搞成了而且搞得都不差这种情况下我们就说技术基本上受力就是游戏攻略满出东哥茶道对对对就像 DeepSick 其实也是基于就这一套成熟的东西然后在上面去改变它的一些模型参数也不知道模型参数改变一些训练的方式就比方说它从之前传统的那种训练方式变成了它强化学习的训练方式

其实 DeepSeek 这件事就是当大家看到 DeepSeek 技术报告的时候大家都觉得他这样做是理所应当的但是我们看比如说我们想要做一个比如说多摩太大模型的时候我们看别人技术报告的时候我们会想他为什么会这样做而不是那样做他到底踩了就还是那句话我跟他不一样我会不会踩坑就是类似于这种想法所以就区别还是很大

您正在收听的是无时差研究所无时差研究所六周年周边上线啦这次我们和老朋友果熏一起推出了来自欧洲的有机 NFC 苹果汁联名款同时还附赠有无时差研究所超有态度的定制版环保袋大家可以直接点击 show notes 中的链接进行购买谢谢大家这么多年以来的支持希望你们能够喜欢

就是相信大家经过了刚刚这个 30 多分钟的烧脑的过程了已经喝了下课了烧脑的过程终于我们可以聊一点轻松愉快的话题了那就是我们离巨神智能还有多远今天请 A 老师拍一个时间今天就放在五十杀研究所这个地方没事你是匿名上节目没关系

我可没有那么大的能耐我们离巨人智能还有多远这件事我如果能说出来了的话我现在应该加入你们投资这骂谁呢就已经收敛了

投资圈现在就是马上五年三五年三五年你要看你就说实现巨人智能是怎么个实现法吧就三五年我觉得能见到一些突破性的进展但是我认为它整体上来说还是一个长期的工作因为这件事情其实我每次思考就是说我们离什么东西还有多远的时候我往往会

把这思考的结果是进入到想这样一件事情上就是当 2022 年的时候二二年底的时候那个时候那个时候我还在做就比如说就是就是十亿到二十亿大小参数量大小的那种大模型的时候那个时候我觉得一个成熟的对话系统甚至都是还要三五年的哦

但是事实上当 ChadGBT 出来的时候他完全是一个就是说你知道这件事终将出来但是当他出来的时候你会感慨就是和你的预期的时间非常不一样有可能会提前但是因为我们现在能够看到的是

就是困难和问题是非常多的对但是当一些事情忽然被解决的时候你会觉得你忽然理解了它忽然能被解决的逻辑但是返回到之前的实验点你仍然觉得这个困难会非常大所以这就是有的时候可能有些就是

不管是机构啊或者是股民来讲或者是一些想要参与通过某种方式参与到巨神智能这件事情上面来讲就是说他不敢下牌桌的一个原因就是他怕这件事情就像三体里面说的技术爆炸一样就是他怕有一天

这件事情会以一个比他更快的方式出现所以他就是在现阶段他就不敢下牌桌这个逻辑其实和当时的 ChatGPT 和 DeepSeek 是一样的但是就是如果你一定就是让我以现在的对这个行业了解或者感觉来说我觉得 10 年以上 10 年到 20 年应该是要那

我就想问个问题作为行业的从业者当技术爆发出现的那款产品来临的时候你会惋惜说这个不是自己做出来的吗?我其实这是一个很好的问题因为我们做行业的人其实每天都深陷在这种情绪当中

因为我们很多时候都知道一件事情在原理上它是可能的但是技术上是困难的所以当它出现的时候我们是会觉得惋惜或者会觉得怎么他们做出来了大家都理解这个事情

是的其实有一件事情非常有趣当然其实这件事可能也被很多人说过了就是 OpenAI 先做出了大模型大语言模型和 ChatGPT 其实隔了没多久就国内的公司全都做出来了对

对然后 OI 又又又出了 OE 就是长思微恋思考没过多久你像现在 Deep Seek 包括包括阿里千问他们他们千问就是 QWQ 这些系列这项目的他们又都做出来了就其实大家都知道这件事情

能做出来而且当一个人做出来的时候大家对这件事情的信心就暴增然后在这样一种心态之下当他们坚定了这个路线之后他们就也做出来了所以这件事情非常的就是说你对这件事情上的就是坚定和投入你敢不敢引领这个风潮其实也是一件非常

就是一种非常难能可贵的一种事情就像当时 SORA 做出来的时候其实大家也都是眼前一亮的感觉然后最后 SORA 反而是它真的开放公测的时候大家就觉得实际上也就那样包括像最近出来那个 Manos 大家其实也一开始很惊艳 Manos 这个事儿就是它其实是我们倒是觉得它没有 SORA 和 XGBT 刚出来的那么惊艳因为我们觉得 agent 这件事情

就是本来它只是一个它更多的是一种产品就是应用层面的东西给我们的震撼相对来讲没有那么大明白了知道就是真正行业从业者是怎么想的那目前来说的话像巨神智能的话已经在哪些领域有商业化应用了呀如果还有十年的话我感觉好像这个问题嗯

我以为大家乐观程度以为明年就怎么说但说句实话就是你要是就是犯大类说的话语术也算的话那语术的那些机器人其实已经真的在卖了很多网红博主都在测评是的是这样就是说我们我刚才说的是离实现巨神智能

那个有多远巨神智能我的我其实对他的期望这句话其实就包含我的大希望我觉得至少他是一个泛化的对物理世界理解的很好的然后这样一种真正的智能但是在具体的一些垂直领域的长久的应用他其实本质上并不需要搞得这么深入你像包括现在其实我知道就比如说一些

车厂或者药房其实你们都能看到对吧这些机器人他只要能够做到一个巡路然后能够做到一些基础的比如说把药拿起来放到一个正确的那个类别里面去然后放到那个送药那个传送单上之类的其实你可以说这个过程他也实现了一个智能他是针对这个垂直领域这个任务的一些智能现在的话就是

我感觉就是一些主要的落地就是车间啊药房啊之类但是其实其实还有一件事它也是巨神智能它也落地了只不过大家平时不把它当巨神智能就是自动驾驶啊是对对对对自动驾驶其实是呃数据最成熟并且数据最多的一个场景所以它其实呃

这个大模型包括这个 AI 这一波智能其实能够在自动驾驶率先实现落地就是说巨神智能其实还涉及到一个概念就是巨神智能和人性机器人的概念就是人性机器人目前能够实际上落地的场景虽然没有那么多吧但是它其实本身是涉及到一个巨神智能类似于终极形态的一个东西了对吧

就是说巨神智能实现巨神智能或者巨神智能落地和人型机器人落地是两码事然后包括其实你要说场景的话怎么说呢我目前还有一个想法就是比如说以语术为例你去控制这个机器人去参加各种商演

就是现在其实很多就是开业大吉的时候你搞一个机器人在那边跳跳舞啊什么的这其实也是一个落地的场景然后包括就是你把传统的广东的舞龙舞狮队给淘汰了对啊就是但是就是他虽然跟巨神智能这个智能这个本身相关度确实没有其他的比如直接在工厂里那种场景那么高但是大家可以说这件事情是和巨神智能有关的一个就是人型机器人的落地的一个场景巨神智能他现在他现在

他现在在这个时间点他其实有一些就是说情绪价值方面的应用场景你不能说他不是场景就是我听说就是你租宇书记这些人晚一天其实那个钱可能就跟租一辆好车差不多就是你只会觉得对网上有租赁业务的

我当时都有心动了我想买一个好三十天回本就是你去把这个机器人拿来玩我玩一天他让你觉得你很开心这件事情就是虽然它不是一个持续影响落地场景但是现在这个业务它已经存在了就说明人们有对这个情绪下滞的需求这样一个群体存在对你也可以说这是某种形式的落地吧

对对就慢慢没想到物以稀为贵买稀有的东西人们想要拥有它或者是去试一试这是一种很常见的事情是的

那我就想刚刚说那个在工厂里面的场景和那个药房的场景那这些是证明有泛化能力了吗还是它也是一个固定动作的我了解的大多数它可能泛化也只是相近的场景泛化你把一个去捡药的机器人去放在什么患者陪护上面我觉得大概率不太行目前没有跨得这么大的所以其实离我们真正希望它达到那个状态还有很远

其实网上现在有很多测评那个语书机器人的视频嘛就很多买到家里去语书就是其实没有没有真正的那个智能的机器人嘛所以你让他干什么动作他基本上都会 mess up 他更多就是只是一个陪伴的作用我感觉就玩一玩情绪价值对吧但是就是这样他展示出来的动作控制或者小脑的能力其实

就是对后续的研究本身意义也很大就是你这机器人本体越强后面对跟他相关的一些研究的推进也会越顺利就你把这个基础做好了对对把别人只要在你这个上面把软件加上去就行了我们就等待软件 deep seek 时刻你知道我听到这快一小时对啊感觉就是这文科确实该砍一砍因为感觉工作量真的好庞大确实需要很多功课是的是的哎呀

我学的也很累每天都在学因为感觉好像他有些事情似乎是可以解决但是是需要对量对时间对对对是之前正好有一期节目就是聊那个文科废除大家不是文科废除文科倒闭潮然后那期的我们的嘉宾正好是一个 science and technology studies 的一个博士他主要是在批判科学从他的身上学会了很多我也想批判

因为我也是很喜欢思考这种乱七八糟心理上的一个事对是所以你看比方说大家我觉得普通人会有的一些问题就是像巨神智能听上去真的它到有一天它隐晦了这么多人类中很细密的事情那它会不会有一天就是模糊人类和工具的这种界限就是如果机器人就是巨神智能实现到一定程度的话它

我个人觉得它一定会对社会的生产关系带来很大的变革但是它不一定是坏的一个变革它只是一个比较好用的一个工具但实际上就是说其实你觉得如果是机器人模糊了人类和工具的界限这件事情我觉得就是有某些

社会组织形式它对人和工具之间的关系的模糊的能力要比机器人存在的这一事实要严重很多好可以好说得好说得好隐晦了大家可以多思考一下这中间好几个逻辑转就是就是人类会担心

担心各种东西会把人类给整崩但是实际上人类整崩自己的能力要在这些东西之上那你觉得技术本身是中性的吗是中立的吗我认为就怎么说呢你如果是以它的一个概念或者它的现状来说我认为不是因为技术本身它的每一个链条都涉及都和社会的关系很大吧只能说但是

但是我们希望的是把技术从这个词的色彩里面解放出来是一件我们应该期待的事情

就是你希望它是中立的但是对但实际上它并不会是中立的就是你现在你现在以这个技术的现状来说并没办法说技术是中立的因为就是技术它有巨大的成本而一旦涉及到成本就跟社会相关的所有东西都进来了就你的社会资源的分配然后对对是的是的那所以有一天你会担心更高技术的人留到了更不好的人手里更不好的人就更厉害了吗

哇,这感觉是个电影的问题。这件事情我觉得其实这个恐慌已经一直存在了,就是现在大家说的你处理核废料,结果恐怖分子把它收走了怎么办之类的乱七八糟的,就这个担心是固然存在的吧,我倒没有和

在这个问题上和常人的思考有什么区别我觉得这种风险它必然会有的人类必然长久的伴随着这样一种风险存在的但是人也有对这种只要这个东西它会有产生积极作用的潜质会有更多的人来

不断的探索它人类也有这样的一个听起来他们固然就这两件事情固然都是存在的然后我觉得其实就是说人类对于 AI 这种东西的恐慌

我觉得就是说很多人确实嘴上说就是说我们一定要比如说要有一些约束的机制如果 AI 最后比如说你做了一机器人他见人就打见人就骂其实就是这种情况对吧好爽哦对就是这种情况实际上我觉得现在大家的普遍的情绪就是虽然嘴上在恐慌但实际上业内的人

就是并不恐慌就是不够恐慌就是恐慌是存在的但是业内的人知道现在离那一步可能还比较远所以说它不够恐慌就是所以导致现在其实并没有一套对于机器人的这种这种的监管机制就是我们我们认为它失控是常有的因为它是一台机器它失控是显然显然可能它作为一个模型来说它产生一些你意料之外的输出是也是很正常但是你要说机器人比如说

比如说要么是自己组织起来或者是真的是对人类产生什么感情这些事情还是太遥远了对你包括像那个但是这种情绪就是它是一种思潮永远存在包括从 OpenAI 离职的像 Illia 它创办的创业公司叫做 Safe Super Intelligence

他把 safe 放在最前面他其实就是相当于是把他深知整个社会上这种事情的存在这就是这种情绪的存在吧对但是我觉得就是以现在的这种人工智能的组织性是这可能扯远了点就是以现在的人工智能它的实现的方式而言的话我

就是可能有人说就是关于它会不会产生比如说自我意识啊之类的我对这个持否定态度就是我认为因为你现在是作为一个模型它每一层每一个运算单元里面它那个参数的数值你都是知道的

所以现在的模型大家说的可解实性不好主要是你没办法把从这个输入到它最后产生这个输出的过程用你的

语言把它描述出来但是实际上它只是一个数学模型的运算它之所以最后比如说一拆 GP 比例它说出了这句话它其实就是在说出每个词的时候依照这个概率分布选了一个比较大概率出现的词它之所以这个概率分布是这个样子的它就是通过一个数学的式子算出来的我认为这已经就解释就形成了可解释性

就是说因为你无论在任何时候你把相同的输入输给这个模型它生成的这个分布永远是这个所以我认为在这种情况下相当于说它虽然可能产生出一些智能的

表象但是它的内部是一个完全符号化的机制而人本身的人类的智能或者说人类的整个哲学场域它是一个符号化的场域吗目前是一个大大的问号如果说你目前的一举一动包括所谓的刚中脑的假设

你目前所做的一切都是相当于有个体验部分我在那边操纵着你如果这件事成立的话我觉得其实人类你和机器人就是同一种东西在这种情况下其实恐慌就变成了其实你跟他是同一种东西你也没有什么必要恐慌的如果他失控了说明你也可能失控那是一件好事对吧如果你的智能不是浮浪花子

那么机器人就不可能像你一样因为你们有本质上的区别机器人他是他是纯的符号而且是你可控制或者已知的符号是你已知的只要你能观察观测到他的模型中的每一个参数那么你相同的输入进去你这式子算出来他的他的动作就是哪一个这件事情这件事情你是就在这个层面上来说你是可以解释的而你自己你你

你并不能够其实有的时候你甚至解释不了你自己的一些行为对所以目前来说这就是你再往上追问这个问题就到了这个层面就是说整个人类的哲学的这个场域或者你的主体性它是可复合化的吗如果不是的话那么你就没有必要担心机器人和你之间的边界的问题那我多问一个就是这次不是 DeepSick 发的他那个 paper 里面有一个 Aha moment 吗

那其实是长思考里面他机器他出现了他自己就说这一步我找到了我之前可能有点错那这个算是一种这也是可解释的吗这个他必然是可解释的因为他出现啊哈 moment 的那个过程你知道这个啊哈 moment 他是从一个他是从一个概率分布里采出来的啊哈这个词那么他之所以是这样一个分布就是因为你把这个

你把这个你这个模型里面每一个参数到了那一步到了那一步以后它是这样的指比如第一个位置是 1.1 第二位置是 3.5 第三位置是-9 这样就是你从就是你从数学上它到这一步它就是一定会发生这些

一定会发生这件事他们想说的是他没想到的是什么其实我们我们我们我们业内人他就更多觉得啊我们的是一个是一个噱头他和之前的那个就所谓的一些智能的一些涌现现象啊之类的东西他他们是一他们是一码事他就是实际上就是说那个

就是问题的解决啊就是比如说你会算会做了很多奥数题这样的这样一个事情它和一个模型的一个能力的提升之间的关系它本来就是一个非线性的就是说你模型不不断的训练不断训练你的模型你可以你可以从某些指标上观察到它在不断变好不断变好不断不断变好但是它变好它一它

一定是在某一个时刻他能够把这道问题开始能做对在那之前他都不能做对就是说相当于你当你选择了以这个问题是我做对作为指标来说的话那他就很可能就会有一个 Aha moment 就是对这件事情和之前的一些涌现的一些现象的结论是一样的就是说他和我们如何衡量他出现了出现了这个令人惊叹的智能选取的这个指标是有直接的关系的对

所以它其实也是模型不断提升的一个结果对就是模型它其实本身是一个数学系统就是在你开始训练这个模型之后的每一步你都可以把它里面每一个参数存下来它的值你都是可以看到的所以这个过程当中是可追溯的对从这个过程当中只是说你追溯这件事情人类没法用这个语言描述说是说每一步这个模型处于一个什么状态你描述不了只是可以像

对但是你他虽然在这个概念上是黑箱但是他里边每一个树你都是能看到的你你输入每一个每一个树他产生的树你也都是知道好的我又聊复杂了听懂听懂听懂我发现你这个节这个你们在做这个事情的过程中有一种认识你自己的感觉对对我觉得对要调动

而且这个东西其实是个很抽象的东西我觉得对我们理解是个很抽象的东西但实际上我们觉得我们谈论这个话题实际上只是觉得我们谈论这个话题有意思其实你即使对这个话题没有任何兴趣你也可以搞人工智能它只是一个数学和计算科学对它的基础它只是一个科学和工程就是会有人啥也不能学文科对

也不是啊就是会有人杀也不想我现在觉得他有意义只是不需要这么多人学而已我觉得很有意义对你从打游戏的视角对我就从打游戏的那个感觉上讲就是比方说我玩那种智力类的游戏你就会觉得应该减少但是要优化一些文科生要提出更长远的目标和价值判断然后也同时需要

在搞这些人的里面就是在真正去搞理工这一类人的里面要有一部分人要有这个思考价值的能力而且其实我觉得就是文科其实我觉得文科其实是很重要的就是我觉得文科不但不但要负责提供各种价值还要思考为什么一定要用价值来驱动就是谢谢哦突然间觉得大宝剑更管用了哈哈哈哈

我觉得大家关于这期节目有什么想继续追问的或者说有什么感兴趣的点也欢迎大家积极在评论区和我们留言

我觉得今天上了一期上了一期上了一期我像是上了一节上了一节非常感觉这期节目该付费了我没有讲课的那个能耐我其实也是就是有很多胡思胡思乱想也感谢你们给我一个分享的机会我有的时候也是觉得憋得慌我们非常欢迎多来聊一聊对我觉得是我

我之前跟那个 AI 的朋友聊起这个嗯他就说 DeepSick 很神奇 DeepSick 的人都没有来聊过博客哈哈

他们这些人肯定对这些问题都有想法只不过他们每个人可能有自己的渠道来说我觉得我今天也非常开心因为虽然我在这个行业做投资但是我可能更多听到的还是技术层面的东西我觉得更多对于这个层面的思考或者对于智能究竟会带来什么的思考我觉得其实在今天这期节目里面也听到了很多所以非常感谢 A 老师今天做客无杀研究所非常感谢两位主持人

等 A 老师下次邀请 A 老师来聊诗歌这个更熟悉的领域真的是太惶恐了好那今天节目就到这里了谢谢大家拜拜拜拜

i talk too much