cover of episode S3E2丨解码新质生产力:GPT打开人形机器人通用之路

S3E2丨解码新质生产力:GPT打开人形机器人通用之路

2024/4/8
logo of podcast 泰度Voice

泰度Voice

AI Deep Dive AI Chapters Transcript
People
倪正洋
态度
陆昆仑
Topics
陆昆仑认为人形机器人技术发展迅速,经历了多次热潮,其核心在于软件和AI的进步,特别是大模型的应用,极大地提升了机器人的任务规划和操作能力。然而,数据匮乏是限制人形机器人泛化的主要瓶颈,目前主要通过强化学习和模仿学习两种方式获取数据,但都存在局限性。强化学习需要大量数据,而模仿学习的数据量有限,且观看视频学习的方式仍处于早期阶段。任务级人形机器人需要能够从头到尾执行任务并处理意外情况,目前主要围绕GPT和Transformer架构,但难以做到所有行业和任务的通用化。人形机器人产业化将经历半开放场景、开放场景和家庭场景三个阶段,硬件整合难度低于汽车,但软件成熟度需要时间,并需要通过生态方式不断演进。 倪正洋认为人形机器人行业发展脉络清晰,经历了认知、启动和持续发展三个阶段。GPT等人工智能技术的进步,国家政策支持和国内公司积极参与推动了行业发展。特斯拉等公司持续的技术进步和降本努力,提升了市场预期。人形机器人行业是一个大型板块,存在大量投资机会,一级市场主要投资人形机器人本体公司,二级市场主要投资零部件公司,两者之间存在共振关系。硬件方面,高价值量的环节已经确定,例如传感器和滚柱丝杠,但产品定义不明确是研发挑战。 态度认为人形机器人的泛化非常难,模仿学习受限于严重缺乏的数据,训练人形机器人的数据量级远小于GPT训练数据量级。 陆昆仑认为人形机器人技术发展迅速,经历了多次热潮,其核心在于软件和AI的进步,特别是大模型的应用,极大地提升了机器人的任务规划和操作能力。然而,数据匮乏是限制人形机器人泛化的主要瓶颈,目前主要通过强化学习和模仿学习两种方式获取数据,但都存在局限性。强化学习需要大量数据,而模仿学习的数据量有限,且观看视频学习的方式仍处于早期阶段。任务级人形机器人需要能够从头到尾执行任务并处理意外情况,目前主要围绕GPT和Transformer架构,但难以做到所有行业和任务的通用化。人形机器人产业化将经历半开放场景、开放场景和家庭场景三个阶段,硬件整合难度低于汽车,但软件成熟度需要时间,并需要通过生态方式不断演进。 倪正洋认为人形机器人行业发展脉络清晰,经历了认知、启动和持续发展三个阶段。GPT等人工智能技术的进步,国家政策支持和国内公司积极参与推动了行业发展。特斯拉等公司持续的技术进步和降本努力,提升了市场预期。人形机器人行业是一个大型板块,存在大量投资机会,一级市场主要投资人形机器人本体公司,二级市场主要投资零部件公司,两者之间存在共振关系。硬件方面,高价值量的环节已经确定,例如传感器和滚柱丝杠,但产品定义不明确是研发挑战。 态度认为人形机器人的泛化非常难,模仿学习受限于严重缺乏的数据,训练人形机器人的数据量级远小于GPT训练数据量级。

Deep Dive

Chapters

Shownotes Transcript

态度 voice 听见华泰泛化是非常难的。

特别是在模仿学习这一块,因为数据严重受限,这个数据大概是什么量级呢?

就是谷歌嗯 RT 旺嗯嗯啊花了 2000 万美元,花了两年的时间,其实才采集了 13 万条数据,就是 10 万级到 100 万级之间,这是机器人数据,已经是非常多的数据,但是我们知道这 GBD 训练嗯网络上数据光参数就有啊,一 1700 亿 GBD3.5。

其实任务级最核心就是要让机器人能够嗯能够从头到尾地执行一个任务,对,然后如果出现意外呢?

对,他会自己去处理。

现在来说总路径还是明确的,嗯是还是围绕这个 GBD 这条路径啊, Transformer 这条路径。

但是效果的话呢,现在呢,可能很难一下子做到所有的行业,所有的任务呢,都能做到,对,那么只是在一个任务啊,或者说是一个细分的行业,细分的场景当中,对去尝试。

机器人走路走得好呢,核心在于软件啊,因为硬件不是说难度不高,是硬件的基本形态已经定型了。

对对,它的上限还是足够高的,大家可以看到波升动力都可以空翻了。

一方面呢,它要借鉴于车的嗯嗯这个技术来实现 a 到嗯 b 的这个路径导航规划,嗯,但是另外一方面呢,它要克服更多的三维世界的问题,比如说车就不会爬楼梯,就是它的难度呢,其实比自动驾驶更高。

嗯,但是它的速度没有自动驾驶快,安全性的要求没有自动驾驶高。

大家都很期待,就是我机器人能不能看个视频我就学会了。

Sola 是生成视频,以机器人看视频来学习。

对,那么整个过程是非常相近的。

对,但是又不完全一样。

嗯,为什么呢?

因为机器人最终还是要在真实世界中来操作的,这个我们叫 simulation to real。

嗯,它会有一个 gap, 嗯,就是说它不可能完全仿真出物理世界真实情况。

对,对,这个 gap 呢,最后就需要通过调优的方式来解行知道。

投资者朋友们大家好,我是华泰基业团队的首席分析师倪正阳。

今天呢,我们非常荣幸地邀请到了华业天成的独立董事陆总为我们做人心机器人的分享。

那么首先请陆总做一下自我介绍。

好,谢谢郑阳的邀请,我是陆昆仑,来自华业天成资本,主要是负责机器人赛道的投资。

然后我们都知道,其实人员机器人行业的话呢,这段时间也是春风不断,也是提到了啊,包括像智能制造啊,这个心智生产力啊,包括像人工智能家啊,等等的板块啊,都是有一些政策的一些红利的啊。

那么我们首先想先请教一下陆总,就是啊,什么是人形机器人,您是从什么时候开始关注这个行业的啊?

好的啊,我认为人形机器人呢,有几个重要的标签,第一个呢,人形机器人是一个多关节多自由度的一个机器人,嗯,它比通常的六轴七轴的机械臂啊,它的自由度要多得多啊,通常会有 20-40 个自由度。

那么第二个标签是人形机器人,本质上它是为着通用而设计的。

嗯,它是一个通用的机器人啊,它未来承担的事情呢,可以远远地超过当前的工业的机械臂啊,或者扫地清洁的这些特殊的专辑。

嗯,这是第二个标签。

第三个标签是人形机器人它的这个当前的硬件啊,其实它是过分冗余的。

嗯,一般的活动都不需要这么多的自由度。

嗯嗯,那么人形机器人这些冗余的自由度呢?

嗯,它代表着它的技术难度是非常高的,嗯,是一个非常高技术的硬件跟软件的一个集成。

嗯啊,这是我认为人形机器人的三个重要的特点。

至于关注人形机器人,最早呢,是 2022 年 9 月 份,特斯拉发布,嗯,第一代的,嗯,擎天柱人形机器人,我是从那个之前开始关注的,但实际上,嗯,到现在一年半的时间,人员机器人呢,至少有三波比较大的热潮,嗯嗯,第一波呢,就是 2022 年 9 月 份,特斯拉发布人员基权,第二波是 open AI 发布 GBP 之后,嗯嗯, AI 是有希望给人形机器人通用化带来巨大的变化,嗯,第三波呢,实际上是在今年初,这个 Sara 的发布会有助于质检模型的进步,那么啊有可能也也能大幅地推动人形机器人的发展。

所以其实我关注人形机器人也很早,而且中间呢,是经过好几轮的重点的研究啊。

那我们想也请陆总给梳理一下,就是其实您刚刚也提到了,就是说就是有 3 个重要时间点,第一个呢,是这个特斯拉发布的这个 1.0, 第二个的话呢,就是 GBT 的一个泛化能力,第三个话呢,就是骚扰啊,这是三件事情,那么呃,也想请您就是呃,做一个稍微更细致一些的一个介绍,就是您认为从当时的关注到现在,就是整个产业链里边,他主要是在如何去演进的啊,想请您呃做一个解答。

从一级市场的角度跟二级市场呢稍微有点不一样,我看到二级市场华代证券呢过去呢对这个原型机器人呢各类零部件都做了非常详细的分析和研究啊,那么我们一级市场呢,其实呢,更多的偏向于这个软件和 AI 这边,嗯嗯啊,当然硬件呢也是我们关注的主题之一,嗯,那么从总体上来看呢,嗯,在过去这个两年的时间内,我们认为呢,人形机器人的研究和这个探索呢,可以简单地分为嗯,硬件和软件两大部分。

嗯那么硬件呢,刚才您已经讲得比较清楚了,嗯嗯包括它的本体和这个零部件。

嗯那么软件呢,可以进一步分为嗯这个行走和操作。

嗯那么行走呢,主要是下半身双腿如何在各类的环境当中呢?

嗯能实现非常稳定的行走甚至奔跑。

嗯那么操作呢,就是上半身的双臂呢,如何?

嗯,在不同的环境当中顺利地完成自己的任务。

嗯啊,那么呢,这个是软件要解决的两大核心问题。

对对啊,我们是从这个角度嗯来分类的。

那么具体在过去这个啊,这么一段时间之内呢,我们认为软件和 AI 这个技术呢,嗯,还是取得了突破性的进展。

嗯,这个进展呢,跟大模型的发布呢,是有非常深入的关系的。

嗯嗯嗯啊。

那么最重要的关系呢,有几点。

嗯。

第一点呢,是在具体的任务层面。

嗯,一个任务呢,它是一个长城的任务,它包含一系列嗯操作的组合。

那么在这个任务的层面呢,嗯,大模型能够非常有效地帮助机器人能理解自己需要干什么,嗯,以及如何去干,第一步做什么,第二步做什么,第三步做什么,一直到第 100 步做什么。

嗯,这是在任务级。

在大模型诞生之前,这一步基本上是做不到的,是需要一条条的这个程序来编程的。

嗯,那么在大模型发布之后呢,机器人就可以接受人类的指令,甚至理解自己应该要干什么,然后自己去编排,这是任务级的啊,这个软件和 AI 的飞速进步,这是就是在这一两年之内发生的。

嗯,那么第二个是操作集,嗯,操作集呢,具体的有一些原生动作,嗯嗯,比如说抓取,摆放,嗯,揉捏,嗯,平铺,对吧?

对对,这些动作呢,其实它的突破性进展呢,也是在这两年,嗯他也是嗯啊,这个强化学习和模仿学习,嗯啊飞速发展,嗯才能够使得这一块呢,是有巨大的进步的。

嗯,那么在前几年的时候呢,嗯,虽然业界也能探索,但是它的进步不大。

嗯,它进步呢,最主要体现在什么地方呢?

嗯,最主要体现在泛化。

嗯啊,那么过去的机器人,传统的机器人,它是没有任何泛化,对,它不管是抓取什么东西,还是嗯对软体进行操作,全部是预设的边层,在规定的时间,规定的地点,到达规定的角度,施出这么大的力。

对对那么现在 AI 加人工智能,对于这个操作这一块,嗯最大的进步是它能实现一定程度的泛化。

嗯嗯我举一个例子,嗯就是我如果学习能抓 100 个杯子,嗯那么啊第 101 个形态的杯子,那么机器人也知道从哪开始装。

对,这就是泛化。

这就是泛化,哈哈哈,这个是软件技术,嗯这两年带来的巨大的进步。

那么总结一下呢,就是说嗯啊, AI 大模型,嗯它的飞速进步呢,在机器人的长任务的编排,嗯嗯和技能层面的抓取啊这些操作上,嗯是给他带来了非常大的无限的可能。

对。

明白明白呃,我也知道,就是陆总您那边就是从这个一级市场这块,其实也是看了很多企业,嗯,这块也是我们今天特别想跟您呃交流呃请教的啊,那么我们可以从这么几个维度来讲,就是您刚刚也提到了,就是软件呢,主要包括呃行走还有操作,那么我们想从算法和数据这两维度,对,就是整个的这个人员机器人啊,它目前有哪些主要的算法,上面的一些路径,以以及这里边每一个的一些难点啊,优点啊,然后包括他的这个数据这块现在我相信应该数据还是呃稍微有点少的,那这块的话主要要集中攻克哪些问题?

好的,郑阳我我讲一下我们研究的一些对一些发现。

嗯嗯嗯,那么首先呢,是我讲一下这个行走这一块,对,行走呢,人行机器人最难的是双足的行走,那么四足的行走呢,其实在前几年呢,就已经相对比较成熟了啊啊啊,那么人行机器人它关键是双足,嗯,双足的行走呢,因为双足它是一个不稳定体,对啊,实际上它它在物理学上是有一个倒立版模型,大家可以理解就是你用一根手指,嗯啊撑着一个筷子,你要防止它不倒下来啊啊,这个盗猎版模型呢,最关键的呢,在最早期呢,其实是做精确的控制啊,这个日本人,日本人做得比较好嗯,那么到后来呢,其实叫做这个预测就预测到下一个阶段,嗯我可能我这个重心是在什么地方啊啊嗯,这是到第二个阶段,大概在 10 年 前,他们其实呢在 2020 年 左右呢,嗯,就是业界呢,普遍用这种强化学习的方法来训练嗯双足的这个走路,一开始是训练四足机器狗的走路,然后训练双足机器狗的走路。

嗯嗯,那么这一块呢,啊这两年呢,已经取得了非常长足的进步。

就是呃机器人走路走得比较好,这个大概怎么界定,你比如说它是直线走得好,还是速度走得快,还是说它可以避障,就怎么去衡量这件事情好。

机器人走路走得好呢,核心在于嗯,软件。

嗯啊,因为硬件不是说难度不高,是硬件的基本形态已经嗯定型了。

对对,它的上限还是足够高的,大家可以看到波升动力都可以空翻了。

对对对对对,它的液压,反正不用液压可能不能空翻,一般的动作都可以做的。

对,对,那么软件的难度呢?

嗯,主要是分为两大块,嗯,第一块是我保持身体的稳定性,不摔倒啊啊,我们或者叫鲁棒性,嗯,嗯,这一块呢,跟如何避障没有关系,嗯,他就是说我被人踹一脚,哈哈,或者说是,嗯,我突然踩到一个坑,是我要马上调回到这个平衡,回到这个平衡。

啊,对,这一块呢,是,通常是用,现在呢是用这个 MPC 加上强化学习的方法来训练。

嗯,已经比较成熟了。

啊。

第二个呢,其实呢,就是机器人从 a 点到 b 点的这么一个路径的规划以及行走,这个呢就类似于汽车的自动驾驶。

嗯,在这个过程当中,他要判断,嗯啊,哪些地方是比较容易走的,哪些地方是不走的?

对啊,哪些地方呢?

是我要避开的,如果是有障碍物,对,我要绕过还是跨过?

嗯,这个呢,就是它的难度呢,其实比自动驾驶更高嗯,但是它的速度没有自动驾驶快,安全性的要求没有自动驾驶高。

那像现在国内包括全球的这个行为这块,像您说的 a 到 b 点路径规划它的这个呃,三维这块的一个规划,您觉得现在技术路径上面处在一个比较成熟还是?

呃,还在大力研发的一个中期还是早期阶段?

大概是一个什么样的一进度啊?

现在现在的进度是?

嗯嗯,第一个呢,就是机器人本身保持平衡鲁棒性嗯嗯,这一块相对来说已经比较成熟了嗯嗯嗯啊,但机器人从 a 点到 b 点这个自动驾驶,目前来说呢,嗯,还是在继续演进。

一方面呢,它要借鉴于车的嗯嗯这个技术来实现 a 到嗯 b 的这个路径导航规划,嗯嗯。

但是另外一方面呢,它要克服更多的三维世界的问题,比如说车就不会爬楼梯对对吧,那么那么爬楼梯每个楼梯大小都不一样对对吧?

有的,而且每一级的高度都不一样,对,那么对基建来说其实是非常挑战的,嗯啊,这一块呢,还是要通过嗯啊,嗯,现在还是通过人工智能强化学习来不断地模仿更多的地形嗯,来训练这个机器人,这一块也是对学界呢,也在探索嗯,但是它总体来说呢,也是接近成熟,对,这个是下半身。

其实呢,嗯嗯,比较难的呢是这个操作。

那从操作层面上来讲,可能更多的就是像您刚刚提到一些任务集啊,一些技能的一些一些培训了,那这块也请您帮忙给做主要的一个梳理。

嗯,机器人的软件的另外一方面就是操作对,是干活对,那么人型机器人将来如果需要达到嗯,100 亿,1000 亿的数量,嗯嗯嗯,那么必须要有足够强大的嗯工作能力。

那么这个工作能力呢,绝大多数的操作呢,是通过啊,双臂,嗯啊,双臂来完成的,对,那么对双臂来说呢,传统的工作类似于传统机械臂的通过编程预设的工作,嗯嗯,都是传统技术早就解决了。

对对,核心是在一个嗯啊变化纷繁复杂的一个完全陌生的开放环境当中,对怎么样完成自己嗯随机生成的任何一个任务,对这个对机器人来说是非常困难的,是也是要操作,要解决的核心问题。

刚刚我们也讲到了,包括任务级和技能级两个层级。

对对那么这一块呢,现在学术的进展呢?

嗯只能说是嗯有巨大的进展,但是还不能说是接近终局。

嗯嗯它的进展在什么地方呢?

嗯第一个进展是,现在的机器人嗯的操作,嗯已经可以实现一定程度的泛化,嗯比如说像谷歌的嗯 RT one, RT two, 嗯它已经能实现一定程度的泛化。

嗯然后呢?

嗯不管是任务级长任务,还是技能级短的操作,嗯嗯嗯嗯它的具体进步啊,嗯都要求大量数据的训练,对,那么对机器人来说呢?

嗯,这又是一个巨大的难点,嗯啊,我们看到 GPD4, 它的成果已经非常让人惊讶,因为互联网上有几乎无穷无尽的数据,是的,是,对吧,特别是语言文字数据,对,还有图像数据,嗯,嗯,非常多,嗯,包括 Sara, 有大量的数据来训练,是,但对机器人来说,这些数据呢?

是缺乏的。

实际上,我们怎么去抓一个杯子?

嗯,并没有现成的很多数据,因为它涉及到什么?

涉及到杯子的形状、大小、重量,嗯,对吧?

它的材质,它的摩擦力,对吧?

它滑不滑,干的湿的都不一样,对,这些数据都是缺乏的,嗯啊,那么,不同的杯子,它的形态也不一样,嗯嗯嗯,那么,嗯,这种三维空间里头的操作数据将会成为嗯啊这个机器人干活这个训练的一个非常重要的瓶颈嗯那么嗯关于这个数据呢,现在呢有嗯也有几个不同的方式来获取,那么总体来说对于操作呢有两个比较大的路线嗯第一个是强化学习嗯强化学习他呢就特别需要大量的数据嗯啊这个我们过去对图像啊,包括这个 GBD 都用强化学习大量的数据,那么这个数据怎么办呢?

嗯嗯嗯有一种方案是可以用仿真器来生成数据啊,仿真器生成对比如说我如果训练机器人怎么抓不同的杯子对我可以把京东上所有的杯子都脱下来啊,图片都脱下来啊。

它怎么去仿真呢?

然后生成三维的啊啊,然后再加上其他的这个物理指标,然后用仿真这些杯子的这些物理特性,它的重量啊,它的三维,它的形态对,然后我在仿真不同的手型去抓它啊啊,通过仿真器来仿真,我这样抓它是会掉下来还是不会掉下来对对吧,因为仿真静态对,除了二维到三维,还有各种重量啊,加速度啊,对啊,光滑度啊,就看你仿真剂的维度多不多啊,如果仿真剂做得足够好,然后呢,又能够嗯,自动生成很多嗯新的形态的数据啊啊,在做这样的排列组合不同的杯体对吧,对,不同的重量对,这样的话就能访出对千千万万甚至一亿种不同的杯子对,但是呢,最终呢,这个我们叫 simulation to real 嗯,它会有一个 gap, 嗯,就是说它不可能完全仿真出物理世界真实情况。

对,对,这个 gap 呢,最后就需要通过调优的方式来解决。

比如说嗯,我通过这个仿真,我训练抓杯子,我能到 90% 的成功率啊啊么最后 10% 呢,我可能是需要机器人在实际环境中去抓啊啊,然后再修正这个数据啊,再进行进一步的训练。

第二步的这个修正实际上是一个真实世界里边的一个修正对真,当然可能您说 90 的成功率,可能它最后可能好一点,比如 95 对,剩下 5%, 我是需要在真实世界里边去去修正的。

对。

这个取决于仿真器的精度啊,数据的数量啊,数据的准确度。

对能决定前面是到 90% 还是 95% 对,但是通常最后呢,都会有一个 gap 对啊,那么需要去在真实环境当中去调优。

明白啊,这么听下来的话,其实这种增强式的这种逻辑呢,它其实是跟我们刚刚您讲 GBT 的这些,呃,文字生成啊,图像生成,其实是一个逻辑。

其实是逻,都是强化学习。

但那边的话呢,它可能本身就是面向虚拟世界界,对,我们认为虚拟世界要脱虚向实,对,要到真实世界,那这样的话它的难度就很大。

难度非常大。

所以相对来说,我觉得这个方式呢,可能也能做,但是听下来确实它的速度啊,就会比,就是,也就是说这个产业如果用增强这种方式,在它的这个行业的进步的速度啊,就会比这个 GBT 这些听起来就要慢一些。

它应该是比 GBT 要慢,因为 GBT 解决还是虚拟世界?

哎,是这个是实际事件?

是的是的是的那么呢,实际世界问题呢还有另外一种方式叫模仿学习啊模仿学习模仿学习呢嗯主要就是说机器人向人学习嘛嗯那么向人学习呢具体呢还有几个不同的路线?

嗯第一个呢就是我试教啊对吧我操作一个机械对对让他炒个菜是是然后呢我不操作他他自己学会了炒个菜他们这个菜里头可能有些变化对比如说鸡肉换成牛肉了他也会炒对这个是第一种你首先要试教一个完全一样的机械臂对然后呢这个机械臂他再去学啊第二种呢是嗯我可以用一个简易的数据采集的系统比如说我有一个带着触觉的手套啊啊对吧嗯然后他有五指,我带着我自己去炒菜对那么呢,炒完了之后呢,这个手套上记录的信息呢,就够机器人去训练模仿学习了,这种方式呢就是嗯嗯,他会更加的灵活度更高一点我我一个人我可以戴手套啊,戴膝关节啊,戴肘关节啊对,戴一个眼镜啊对我出去干活,干一天我就能采集很多的数据嗯嗯还有第三种呢,嗯就大家都很期待,就是我机器能不能看个视频我就学会了啊对对,那么这一点呢,其实就跟最近的这个嗯 Sara 呢,其实呢,对这个技术是有一定关联的,是的是吧, Sara 是生成视频以及机器人看视频来学习对,那么整个过程是非常相近的对,但是又不完全一样,嗯,为什么呢?

因为机器人最终还是要在真实世界中来操作的,嗯,那么视频它会丢失很多信息,嗯嗯,很多三维的信息丢失了,嗯,而且视频呢,很多时候呢,是要标注的,嗯啊,就像 Sora, 它其实是视频加上标注信息,是一起训练出来的,嗯,那么如果你单看视频没有标注的话,这个也是很难的,因为你看到一个东西,你不知道他在干啥,你的学习效率很低,对人类来说也是这样的。

所以这一块技术目前发展呢,还比较初级。

所以机器人呢,通过仿真学习,通过嗯,这个遥控操作学习,或者试教学习呢,嗯嗯,相对来说这一两年的进展比较快啊。

但机器人直接看视频学习,嗯嗯,这个进展呢,就慢一点,但我相信是未来一个非常重要的方向。

同样是这种仿真啊,就您刚刚提到的有 3 种嘛,其实在我理解啊,就第一种,第二种,其实它本质上是一类,嗯,就是试教和带模仿学习。

对,模仿学习都是模仿学习,他其实都是模仿学习。

第三种其实是一个质变,他第三种是看视频就可以了,就不用人在那边去操作了。

对,所以其实第三种,他其实更多的是,呃,需要机器人去理解视频里边的真实世界了。

对,我觉得这点其实是是很难的。

那我们比如说先讲前两点啊,就是说如果是我,我们需要人去试教,或者去穿戴一些传感的一些部件,但这样的话呢,它有一个问题,就相对于您刚刚说增强式,它最大问题就是它数据量比较少嘛,我顶多我炒几次菜,对,但是我如果去把京东的那个杯子我全部给下载下来,我可以下载很多,嗯,但我炒菜我一天只能炒那么几个是,然后我鸡肉炒完炒牛肉,总归我还有些肉是没有炒的,那那这件事情他是在他的这个泛化能力这块怎么去确保泛化是非常难的。

特别是在模仿学习这一块,因为数据严重受限,这个数据大概是什么量级呢?

就是谷歌嗯 t 旺嗯嗯啊,花了 2000 万美元,花了两年的时间,其实才采集了 13 万条数据,就是 10 万级到 100 万级之间,这是机器人数据,已经是非常多的数据,但是我们知道这 GBD 训练嗯嗯网络上数据光参数就有啊,一 1700 亿 GBD3.5, 嗯是吧,那么它的数据其实是嗯,是非常大的,完全不是一个量级的,万亿级的数据是是,所以这个量级的数据呢,是非常难做到泛化是,或者只能做到一点点的泛化。

对,那么将来要泛化呢,一定要有对大量的数据,还有大量非常好的数据对,这些都是对很大的挑战。

对。

那么这个数据的嗯嗯数据难在什么地方呢?

嗯嗯,数据第一个难在嗯,采集的成本要尽可能低啊,对,采集的效率要尽可能高,这是很难的。

对对,第二个是数据的质量要非常好。

因为很多数据不能每次炒它都炒糊了。

对,把这炒糊的数据弄过来没用。

哈哈哈,炒糊的啊,可能也有啊,有有,你知道这条路是失败是失败对,但是数据呢,它会有一个信息拣防的问题,就是你在一个环境当中采集的数据啊啊,最终它都在这个拣房里头,但你需要做拣房之外的泛化时候,它不可能做到啊,对吧?

你你总是在自己的认知范围之内对对来训练对对所以说数据的质量嗯还有嗯你怎么样来?

嗯设计这个数据都是非常高深的技术。

对有哪些比较优秀的一些一级市场的公司,或者说他们的解决方法是什么样的?

针对这个问题啊一级市场的公司嗯首先呢,我们分为学术圈和产业圈嗯嗯嗯对对吧,因为一级市场通常还没有真正的完全的大规模的产业化。

对对,他们在学术阶段呢,在美国跟中国都有一些高校呢,取得了一些进展,比如说美国的这个斯坦福,嗯,嗯,李菲菲的实验室,包括,嗯, MID, 包括这个 UIUC 啊,嗯嗯啊,嗯,这个中国像这个,嗯,北京大学,嗯,上海交通大学,嗯,嗯啊,包括这个香港科技大学,有些教授啊,嗯嗯啊,嗯,他们在这个操作上面啊,都有不同的,这个研究成果能实现一定程度的泛化,嗯,那么在产业上来说呢,最领先呢,嗯,几个公司呢,包括有这个谷歌,嗯,嗯,谷歌这个 it one, RT two, 嗯,啊,他们在厨房里头,然后谷歌呢,后来呢,又发布了 RTX 的数据集,对啊,对,把,它综合各类的数据,对,那么呢,特斯拉,特斯拉,大家能看到很多这个视频,对吧,它,它有这个摇操作,对啊,很显然,这些啊,它在这个上面也采集了相当多的数据,而且它还有其它的场景,比如说它的汽车制造对,它一定会采集很多场景的数据来推动这一块的进步,嗯嗯嗯对。

然后国内的话呢,像上海的这个有些独角兽的机器人公司,嗯啊,他们嗯也在和一些车厂啊,对一些 3C 电子厂合作,希望能在这方面呢能有一些进展啊。

明白明白,那如果针对于就是这是我们刚刚讲的一类嘛,那另外一类的话呢,就是像您刚刚说类骚啊这种就是看视频去理解这种真人世界,这种现在有做得好的企业吗?

这种感觉好像听起来更更远一点啊。

听起来这种现在呢,很多科学家都在探索啊啊,我相信它是一个嗯一定会实现了未来嗯嗯嗯但是现在呢?

嗯嗯总体来说呢嗯它的进展呢还没有对那么成熟对对啊,还需要不断地探索啊,这里面确实是有几个问题要解决,比如说我刚才提到的嗯它二维嗯视频呢会缺失一些信息对第二个他也需要一些标注是是吧,第三个就是说呢嗯这个你如何理解这个视频嗯也是一个很难的事情。

现在有一些明确的的一些解决的路径吗?

还是说现在都还在很很早期的摸索阶段这一块呢就是对于机器人来说。

它面对的是一个事嗯是一个真实事件对那么真实事件我们也可以建模,叫事件模型嗯啊这个概念相信大家已经嗯见过很多次了嗯嗯那么其实现在有一个非常明显的进展就是 Zara 对 Sara 从今年 2 月 份开始一直是很热的话题是是但是 Sara 呢?

它其实呢,并没有完全对这个世界进行建模嗯它它的这个路径呢,总体来说和这个 GBD3.5 GBD for 是类似的,就是当他看的视频足够多以后呢嗯他能够预测下一帧或者预测下一幅图应该是怎么画嗯但是他可能不知道这个世界是什么运营规律,比如说我爆炸的时候是啊是什么速度,子弹扔出去是什么速度对吧?

物体下坠的时候,羽毛飘在天空中是真到什么物理规律嗯他可能是不知道他只是见得多了明白吧哈哈哈但是呢,对对这个非常重要为什么?

对因为人类也是这样。

也是见得多嘛。

人类打篮球投得多了,对,人类从来不会计算我到篮对我有多少个角度,我怎么就是说打得多了,我有这个感觉,手感好,所以 Sora 其实也是一种类似于手感的感觉。

嗯嗯这块呢,对于机器人将来嗯学习这个事件模型是我想是会有推动作用的。

但是当前呢?

对,当前还没有完全的链接到这个机器人实际的这个是这个操作的这个演进上面。

嗯,明白明白。

这个真的是挺令人激动的,因为我如果看视频就可以学习到很多,那那就跟刚刚讲的就是警惕这些它的快速进步的曲线可能就能够匹配。

因为视频嗯它的数据量是非常大的,它能够非常好地解决机器人训练数据匮乏的问题是是如果这个路径走通了,机器人的这个嗯,操作的这个,干活的这个泛化能力将会得到飞速的提示的。

如果从操作层面上来讲的话呢,就是工业机器人,它本身它是一个闭环嘛,就是它其实它的维度是确定的嘛,就那么几个维度,它去怎么做,像您刚提到就是人员机器人,它肯定是一种开放式的嘛,所以它这里边的界定的方法就有了根本性的一些变化。

那么我们刚刚提到呢,这些更多的是这个操作层面,那么您刚也提到了,呃,操作级啊,任务级,那任务级这块现在有没有什么比较好的一些呃呃,展展开可以去分享的一些点啊?

任务级呢,总体来说,现在还是用这个 GBD 的思路来进行编排任务。

嗯其实任务级最核心就是要让机器人能够嗯能够从头到尾地执行一个任务。

对然后如果出现意外呢?

对他会自己去处理。

对这个其实呢依赖于嗯,依赖于长时间这个跟这个任务相关的常识啊。

对它的这个训练,现在来说总路径还是明确的,嗯是还是围绕这个 GBD 这条路径啊啊 Transformer 这条路径。

但是效果的话呢,现在呢,可能很难一下子做到所有的行业,所有的任务都能做到对那么只是在一个任务,嗯嗯啊或者说是一个细分的行业,细分的场景当中,对去尝试。

对这块的难度呢,它其实呢,嗯啊不在于那种什么仿真数据那块啊,它难度在于你对这个任务到底怎么理解啊,对吧,出了问题你到底怎么处理,是一个长期的过程。

对,但是呢,它是有办法的。

嗯,它的办法是什么呢?

嗯,就是任务级这块呢,它可以用完全软件或者 APP 的形式来解决。

将来呢,就是关于任务的学习呢,我觉得从长时间看的。

嗯嗯嗯,那么需要由于人性,机器人的平台,硬件平台,软件平台,然后用生态的方式来不断地演进。

这个就需要群策群力了。

群策权就是大家某一家公司把所有东西都做完。

对,也不是某一个技术路线能走到宗旨。

对,对这里。

嗯,这里呢,为什么这么说呢,就是因为人做事情有很多时候呢,它是一个综合性的方法。

对,有的时候是我知道原理,有的时候是我有经验,有的时候甚至我是背一个公式,对啊,这个东西它是没有没有一条路能打天下的。

其实真实世界里边也并不是有某一个底层原理,然后通吃所有的事情。

对不?

是的,也是我,很多东西我都费了工时,我也不知道为什么。

那现在有什么比较好的 APP 吗?

现在在在真正现在在在做的现在还没有。

嗯,这只是一个设想,这个产业还没有分层到 APP 跟硬件分开做。

我认为早期呢,这个嗯,原型机器人公司呢,还是要嗯,自己做一部分功能,就像功能机一样,对对吧,将来的话会发展对,它有生态对,那么现在目前来看呢?

嗯,从产业化的角度来说呢?

嗯啊,人形机型未来的产业化呢,我认为还是会有几个阶段啊啊,那么第一个阶段呢,还是在一个不那么开放的,比如说半开放的场景。

哪些是属于典型的半开放场景啊?

半开放场景典型的就比如说人机协作的场景啊,人机啊,人机协作,比如说人跟机器人,跟协作机器人有点类似,以及呢,比如说嗯,这个嗯康,我在一个空间内,嗯嗯嗯,这个清洁的问题这些半开放的场景嗯嗯嗯,做一些半截后化的工作,不是那种传统的编程的完全结构化,嗯啊,它会有一定的自主跟泛化能力嗯,但是呢,场景相对来说还是比较受限的,对,这个是最先实现的嗯,比如说我仅仅是在一个人不太多的仓库,嗯啊,里头搬箱子啊啊,以及搬小的物体搬大的物体对对可能有 1000 种 5000 种这种嗯嗯啊数量是可以预知的物体对对吧?

对这这种可能两到三年内嗯我觉得很快就能实现。

目前呢,就很多公司都在发布短的 demo 对看着都大家都能看到。

像这个 Digit 在亚马逊的仓库对吧?

对对这个景面柱在特斯拉的仓库对对这块商业化我认为会比较早的实现对对那么第二个阶段呢,其实呢,就是嗯更加的泛化嗯比如说我可以在一个比较开放的一个嗯啊商店对或者说是嗯呃超市对对吧或者说是我我能够捡取上万种不同的商品打包啊嗯啊这这种呢就更加泛化,而且人流量也比较大这个已经很开放了。

因为这超市虽然它不是外边啊,但是它已经是一个很开放的一个,而且很多突发情况都会出现的一个。

但超市也有它的好处,就是它所有的东西呢,都是确定的啊啊,他不会突然蹦出一个不知道的。

一个不知道的对对,他可能扫码都能扫到对,所以我知道他一共有多少个物品对他他对。

而且他可能大部分都是可以预测的。

是是是,他的泛化要求呢,也没有那种高。

还还是没那么高对对。

然后呢,到最后一个阶段呢,才是真正的走入家庭,因为每个家庭的东西真的是无法预测。

无法预测对,必须要非常强大泛化能力,然后每个家庭你交代他的工作也无无法预测对对,你可能是简单的端茶倒水,也可能做法对,甚至要紧急处置一些特殊情况,对,这些都都对机器人的这个智能化是极大的挑战。

这个过程呢,是要在第三阶段,嗯嗯,然后更细分一点的话呢,嗯嗯,就在刚才说的是任务级,对,那么在操作层级呢,一般来说,对钢体的操作呢,对,是要早一点,对,不管是大箱子、小箱子、盒子,对,基本上是钢体,这个是相对简单的,对。

那么对软体的操作,对,那肯定是要往后一点啊,比如说叠衣服啊,嗯,这个包饺子啊,嗯,这些事情,虽然对网上有些 demo, 但是真正走到商业化,嗯,还要解决很多这个,嗯嗯,落地的具体的工程问题,这块也是要稍微靠后一点。

对啊,这个时间很有意思啊,就您提到这个软硬的这个问题啊,其实每个东西它都有它的硬度嘛,对,最软的它也有它的硬度嘛,对,所以就是呃,叠衣服它是一个很很软的事情,那么我举一个箱子,它是一个硬的东西,对,那么这里边,呃,会不会比如说在硬件层面上?

到,当然软件很重要啊,但是硬件层面上,它的形态本身会不会有些变化?

比如说,呃,我为了能够实现更软的一些操作,所以我需要更多的,不管是力传感器,初学传感器这个人员,机器人,通用型的,但是它虽然通用,但是毕竟我也要考虑成本嘛,嗯,那我本来我只做硬的东西的话,那我可能就没必要有这么多的触觉,或者这么多的传感器,我在需要去做更通用的,偏软的时候呢,诶,我这里边的一些零部件我可能就会做一些升级换代有有没有这种可能性?

您觉得?

我觉得嗯,操作的东西越复杂越软,形态越多啊。

嗯嗯,对这个传感器的要求肯定是越高的。

对对,因为你要采集更多的信息。

对,但这个其实也有两条路,第一条路就是像人手这样,我非常细腻敏感,但这个手的代价肯定早期比较对,早期比较高。

第二种就是我,我也可以用人手抓不同的工具来解决啊,对吧,就像我还是回到包饺子,嗯,我可以用手捏,捏成饺子,也可以用一个包饺子去一夹啊,也可以包饺子,这也是啊,很好的路径。

这些呢,就是对,也有很多方法可以借鉴。

那你不包饺子,可能干别的事情,需要另外一个工具。

是是是,那么这个呢?

最后呢?

对,综合还是要看这个,嗯,技术成本,还有工程化,它在当中要做做这个 trade off。

是是是,其实说白了,人体是一个最通用的,本身我的所有的零部件都是 overqualified 的,对,所以我可以做非常非常多的事情,但是如果我去换成了人形机器人,我就得考虑成本,我就得考虑它的工艺包,考虑各种问题啊。

而且我还想补充说明一点,就是人形机器人在商业化当中啊,人形机器人这样的形态呢,嗯嗯,它本质上不是为了工业场景设计的,嗯嗯,因为工业场景在绝大多情况,它需要的是什么呢?

嗯嗯,啊,速度,力量,精确,精确度,重复性,然后重复性,嗯嗯,这种场景之下呢,嗯嗯,专机专用设备对专用机器人对最合适。

对对对对对,那么为什么现在的人员机器人厂商很多都讲我要在生产线上搞呢?

啊,其中一个原因是嗯,这个场景还是相对封闭,它接触的东西是相对有限的对对对吧?

对,那么它是比较易于在第一阶段嗯就能够实现落地的。

是,但是真正人形机型大放光芒,一定是在一个完全开放的对,像这种服务的这种场景,每天做的都不是重复的任务。

对对,这个是大家的一个比较重要的未来。

我记得之前马斯克说过,未来特斯拉的主要的市值,或者说它主要的价值增长点之一,很重要的就是人性机器人这个版块,它当时讲的表述是啊,未来每个人要配两个人性机器人嗯,那他提到这是一个百亿台套的这么个市场嗯,对所以如果是这样的话,如果能真正像您刚提到大放异彩,它在整个呃,开放式的环境里边都能够应用的话,那我相信这样的一个非常 Fancy 的这种前景啊,是有可能会出现。

对嗯。

对,这个非常是有可能出现的。

但是我还强调一下,就是嗯嗯,硬件的成熟度,它可能要早于软件的成啊是,是,这是第一个。

第二个,软件的成熟呢,它也不一定一蹴而就。

嗯,它可以先由软件平台,再由生态,嗯,让这个硬件不断地能学习,对,能做更多的事情。

对那么这个过程呢,它可能会一直往前演进。

确实,然后像您刚刚提到很多的关于这个软件的,不管是任务集啊,还是这个执行的这个操作集啊,嗯,这各种方面,然后包括学术界,产业界啊,然后算法啊,数据,从这几个维度其实都做了很多的一些详细的一些梳理。

然后那此外的话呢,因为我们刚刚也多多少少也提到了一些硬件,我也听下来就是呃,陆总您这边是也确实认为硬件它的成熟度早于软件,嗯,但您认为现在这个阶段就是可能硬件里边核心的有哪些啊?

就是比较重要的一些硬件的一些核心的零部件呢?

您是怎么看这件事情?

嗯,我是这么理解的。

嗯嗯,因为硬件华泰有很深的研究,我今天从另外一个角度来讲讲我的观点。

嗯嗯嗯,首先呢就是嗯,人形机器人零部件绝大多数呢都是传统的工业机器人零部件是是包括这个立矩电机啊,滚柱丝杠啊嗯嗯包括空心兵电机嗯嗯嗯嗯等等是吧减速机但是呢它需要为人民机器人做专门的定制化的设计嗯因为人员机器人跟工业机器人它的这个嗯要求啊它它的产品定义都是不一样的对啊嗯那么现有的嗯产品呢肯定不能直接用在对这个人型机器人市场,你要做定制化设计嗯这就带来第二个问题,人形机器人嗯硬件嗯当前研发呢嗯最大的挑战之一是嗯产品定义啊就我这个人形金钱做出来首先我不知道他是干啥的对对对吧对嗯那么我就不知道怎么定义每一个关节要多大的利益,要多大的速度,我只能说,先模仿,先模仿一下,先做一些简单的定义,比如说我速度 3 米每秒,对,对吧,我能。

对,我能举 60 公斤,嗯,我高度一米 75,嗯嗯,但是呢,这跟正常的产品定义是不一样的。

正常产品定义,比如说我定义一个面向家庭的车,嗯嗯,对吧,我要有 6 个座位,对吧,我空间要有多大,对,怎么样,我速度是多快,是吧?

对,我有哪些便携的功能,要不要冰箱,对,是吧?

人性机型不是这样的,因为它的场景还不明确,对,对,导致它在产品定义的时候呢,不清楚,对,所以呢,市面上的人信经营公司,它的造型不断地变化,它还没有趋于稳定,是是,是啊,然后也导致它的零部件呢,也在不断地变化,但是这个呢,也给很多公司呢带来新的机会。

对,如果一个零部件厂商,他能够更理解本体,更理解客户场景,嗯嗯,那么将会有利于他在这个市场上啊,嗯,更好地发展。

嗯,这也会持续几年,一直到这个本体像嗯车一样相对稳定了。

对对对,但即使像车一样,因为这个市场足够大嘛,足够大,它还是会有你。

比如也有奥迪啊,也有奔驰宝马,但现新能源车更贵啊是对,然后,但也有对吧,便宜,对,一定会有,所以一定也是百花齐放的一个状态。

对,我觉得是百花齐放。

嗯啊。

还有一个重要的嗯一点,嗯,就是人形机型产业链的嗯,这个整合难度是没有车大的,一个车经常有一两万个零部件,对,人型机器人一般来说是 1000 个左右,嗯嗯啊,一两千个零部件,嗯嗯啊,然后车呢,它对这个安全性啊,嗯,它在这个自动驾驶啊,什么时候它是不允许有任何失败,嗯,失败都会产生灾难性的失误,但任一机器人,其实呢,你杯子掉地下,对损失是可控的,对,是吧?

对对,所以说呢,他们在整个产业链的维度呢,嗯,第一个,他想象空间非常大,对天花板也很高,对,第二个,它的难度呢,嗯,不一定比车那么大。

是啊,明白,那么它的难度可能在软件上更大,对,在硬件上没有车那么大。

是的,是的,是的,非常同意陆总观点啊。

然后,呃,另外一点,我也想强调一点,就是因为我们刚刚讲就是人员机器人,很多的零部件嘛,其实包括我们团队啊,也是写了一些报告,然后包括我们把他的报名表进行了拆分,截到目前为止的话呢,其实整个的这些核心零部件,包括像您刚刚讲的 4 杠啊,然后这其他的这些的传感器啊,然后电机电控啊,这些加在一起,我们算下来,其实它成本啊,还是在嗯 10 万美以及以内了,但是呢,还是比较贵的,嗯,所以呢,就是我们也也借着机会啊,也去讲一下我们华泰机械团队我们对于这个啊,就是人力机器人硬件的一些观点啊。

第一点的话呢,首先硬件确实现在没有完全定型,但是确定的几个高价值量的几个环节是确定的,嗯,包括第一个就是这个传感器,特别是像六维力传感器啊,触觉传感器,像这些肯定是未来在量很高的一些版块啊,一些重要的细分环节,因为这些环节它的本身的难度壁垒又比较高,这些环环节的话呢,在人行出现之前,其实单体的价值量都是很贵很贵的,未来可能会随着整个的体量级的释放,成本有一定的下降。

但是呢,因为这个环节呢,它整个的这个行业的,这个生产的本身的难度啊,本身的壁垒,包括生产节拍要求,所以导致它成本应该来说在整个这个人性精神报表里边应该还是比较贵的。

这是第一个,第二个的话呢,就是我们讲的这个 4 杠,特别是滚柱 4 杠啊,这块的话呢,就是包括我们的呃,就是人际机制里面的这个呃,腿部啊,大腿小腿啊,包括胳膊各个地方其实都是需要的。

那这个的话呢,也是呃,因为 4 杠嘛,它需要呃,磨床,各种精密的这种各种的这种操作嘛,所以话啊,一定也是一个成本占比比较大的一个板块。

那当然其实您刚才也提到了,像电机电控啊,还有其他一些普通的一些传动的装置,那这些人员机器人里面也都会有,所以的话呢,其实人群机器人还是一个成本比较高的一个产品吧。

嗯,那这样的话呢,一方面软件的能力也没有达到一成熟阶段,嗯,第二个的话呢,硬件本身还是比较贵的。

那如果从软件角度来讲,您刚刚也提到了非常多的关于软件进步的方向,硬件的话呢,那么有一点就一定会是大家啊非常希望能看到的事情,就是国产化,嗯,因为现在毕竟还呃这个产业刚开始出现嘛,但是未来的话,大家一定认为中国制造业,特别是在这些传动部件里边会有很多的机会的。

那么像我们刚刚讲的,不管是呃传感器,还是这个像这个 4 杠,还有其他的一些呃电机、电控各类的传统装置,我们认为在未来可能都会有一些比较好的一些机会。

对,这是我们对游戏硬件这块的一个简单的一个想法。

对对。

郑阳,我非常赞同你的观点,就是我总体觉得就是做硬件,嗯,将来还是中国人会做得非常哈哈哈啊,中国的产业链,中国的公司如果不用中国的产业链,中国的公司做不出最强的硬件的。

对对硬机器人那如果就是呃从咱们呃这个一级市场的角度来讲的话,包括您包括咱们公司这边现在主要在投资的或者在关注的这些公司主要有哪些啊?

因为我想这些公司主要可能海外的会领先一些嗯嗯但是呃国内的呢呃很多还是比较早期阶段咱们公司作为专业投资这块的呃专业机构呃主要是什么样的一个思路啊?

我们主要是几个点嗯嗯首先呢是嗯硬件我们也关注啊软件我们也关注硬件通常是跟这个嗯行走是结合在一起对对对那么软件通常跟上半身操作结合在一起对对这两方面目前来说呢嗯它有不同的公司对对那么我相信将来会有一些公司能够做集大成,但当前这两条路线上的公司呢,稍微有些不一样啊,所以这两边我们都会关注。

对对。

估值怎么样?

现在都啊估值的话,现在贵的也到独角兽哈哈哈,便宜的话呢,早期的,嗯,大概估值还算是两三亿人民币的,也有像国内比较贵的是到 10 亿美元级别嗯嗯,那么美国比较贵的,像这个 fig 到 20 多亿美对对。

26.5 哈哈哈对对。

这个是人员基建市场嗯啊,这是第一个,就是两条线,嗯嗯,就是呃,硬件本体,还有这个嗯,操作软件这块都要看对。

第二块呢,是这个我们觉得将来成功的公司一定要有自己的任性机器人本体嗯嗯嗯啊,就像自动驾驶嗯,做得好的,能实现商业成功的,最好是有自己的车一样。

对对啊,这是我们总总体的第二个观点,嗯,第三个观点就是我们认为这个技术呢,还在不断地进步,对未来呢,有希望还出现很多突破性的技术,所以我们要时刻跟踪世界上这个研究者名最高的高校的最新进展,对,从里头发现一些嗯,一些最新技术的投资机会。

嗯,然后那我也从二级市场的角度来讲一下我我们的一个理解啊,刚刚呃最开始我们也提到了,就是马斯克在 22 年 九十月份的时候发布了第一台这个体验度的人。

呃这个 1.0 之后,其实我们从这个时间点做梳理啊,我们可以看到其实人群机器人是沿着一个非常清晰的脉络的啊,那么第一阶段的话呢,就是呃,特斯拉的这个这个人机器人出现之前及之后这段时间,其实市场上啊,没有认知到开始知道有这么个事情的一个阶段,所以呢,这个阶段的话呢,大家啊,就是当时就在预期的,就是可能国内会有些 TIER one 的供应商啊,那 TIER one 供应商当时就会明确收益啊,这是第一阶段。

第一段之后的话呢,其实在特斯拉的 1.0 出现之后呢,其实有大概呃小半年的时间吧,啊, 22 年 的呃,四季度开始到 23 年 的年初啊,这段时间,其实啊人员机器人这个版块的话呢,其实没有太大的变化,嗯,但是呢,到了四五月份之后,其实呢,整个板块从四五月份到年底,它其实是一个持续贯穿的一个非常热门的一个板块,其中有一段时间还是涨幅非常啊可观的一个板块,那这里边的话呢,我认为主要有几点。

首先第一点呢,就像您刚刚提到的,其实 GBT 这些呃,所谓的人工智能的这些新的一些应用啊,它的一些进展一定对于这个人员机器人这块是有很大促进作用的。

所以的话呢,就是从智能化这件事情的一个泛化的角度来讲,其实就扩散到了人性机型这个板块,人员机器人板块其实相当于是一个被智能化扩散泛化了的一个很好的一个板块。

对,所以呢,从四五月份之后,那么这个板块就开始启动,之后的话呢,包括像很多的呃,国内的一些替换供应商的一些啊,就是他们的一些量产的一些预期啊,包括像国家的持续的政策支持,包括国内的很多公司也开始去讲在做这一块,包括其实国内像刚我们提到的所谓的国产化降本嘛,所以也有很多公司在去开始去做这些事情。

其实我印象当中还有一件事情很重要的,就是特斯拉其实它每次发布的这个机型啊,其实还是有些改款的,对他一直有一些变化,就包括到 12 月 份,其实当时他又重点强调了一下他的手上的触觉,对,所以因为他一直有变化,所以大家一直会预期到这个行业有新的一些降本的一些可能性。

你比如说像我们讲如果是 4 杠的话,那大家讲 4 杠它需要磨啊,这种滚柱 3 杠特别贵,需要磨,那于是大家就想,能不有别的一些降本的思路,让思杠在磨之前,先用其他的工艺先做一道,然后再再去磨,成本就少一些,然后啊,时间也会短一些,所以就会出现很多的关于这整个版块的技术路径的一些各种的想象空间。

所以这个版块呢,一方面啊,就是从产业层面来讲,特斯拉包括其他的这些大的公司,持续的有新的进展的推出。

第二点,国家确实也是支持这种新兴行业的一个发展的,也有政策的一些呵护。

第三个的话呢,就是国内的这些,呃,因为确实像您也提到,就是这个行业呢,它不是个新行业,在设备类的话呢,在装备类的话,它其实也是一个,呃,就是已经有一定基础的一个行业,所以呢,有形成板块效应的这么一个基础,如果只有一两家公司,那就比较比较麻烦,但它是一个成集群的一个行业,所以它就会形成很多很热门的,有很多的不同的一些机会在里边。

所以一直到了去年的年底,其实都是这么一个情况啊。

那么到今年的话呢,我们认为其实这个板块仍然是很有看点的,我们今年往明年去预期,包括马斯克也提到了,后面要要量产嘛啊,所以话呢,包括量产的预期啊,包括像这些技术的一些进步,还有包括像刚刚讲的降本的,持续的这种方法的一些改进,其实都是我们后边可以去预期到的很多的一些点。

总而言之就是在硬件这个角度的话呢,就是二级市场来讲的话,我们从机械设备这个角度来出发的话,因为整个行业还是一个星辰大海的一个行业,所以的话呢,各个板块只要能有这种不管是降本还是提高效能的这些路径会存在,我们认为它都是一些很好的啊,一些能够挖掘到的一些机会点啊啊,所以话呢,我们也是在今年啊,包括在未来的几年,也都会重点在这个人力进行这个赛道里边啊,去做更多的一些深耕和这个挖掘。

对,主要是这么个情况,这是我们对于二级市场的一个理解。

好的。

这样其实我还有个问题简单先探讨一下,就是我发现一级市场很多公司呢,在做这个人性机器人的本体,对,但是二级市场呢,嗯嗯,人性机器人概念,我大部分还是在做零部件,您是怎么看待这个问题啊?

其实是这样的,就是本体的公司的话呢,其实国内二级市场也是有的,但是呢,国内确实因为现在本体公还是比较少,然后另一方面的话呢,就是从人机器人的所需要的这各种的零部件以及它所对应的这些装备来讲的话,它确实是一个比较成熟的一个行业。

所以话呢,其实它会导致一个结果是,其实产业的推动和二级市场或者说和这个资本市场本身是共振的。

嗯,因为这个产业本身在快速发展,所以一二级市场也会把大家的资源往这方面去涌,所以也会形成很多的新增的一些机会,所以那这件事情因为它本身是一个刚刚提到,是一个比较大的一个板块,那所以可做的事情有很多,所以大家都愿意在这里边好好去挖掘,然后呢去对接,那这样话就会形成很热的一个板块,因为毕竟对于整机厂来讲的话呢,一方面就是现在的量产的量,其实现在还是不明朗的啊,一方面的话呢,现在还在比较早期的一个阶段,所以话呢,就是可能这块啊,就是主机厂还是稍微少一点,而且啊,如果从零部件角度来讲的话呢,就是呃,资本市场的助力啊,可能短期来讲还是会呃比较清晰一些的,嗯,对,大概是这么个情况啊,然后那我简单总结一下啊,然后今天跟陆总这边交流得非常开心啊,然后陆总也非常专业,然后把关于我们原型机器人的啊,软硬件,特特别是软件这块的啊,几个方面,包括从这个任务层,包括从操作层啊,从学学术界产业界啊,这个算法啊,数据,从各方面都做了非常详细的一个梳理。

那么我们也是认为的话呢,就是人员机器那个行业一定会未来持续地有新的啊,这个更大的一些发展啊,那么我们也是持续关注这个行业。

感谢大家的收看,我们下期节目见,态度 voice, 听见华泰。