We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 【科技观察】大专也能干,机器人数据采集员到底香不香?

【科技观察】大专也能干,机器人数据采集员到底香不香?

2025/4/6
logo of podcast 早点生活

早点生活

Transcript

Shownotes Transcript

哈喽各位好我是杨仔哈喽朋友们我是原子哈喽大家好我是周周您接下来收听到的是我们直播时的播客切片这只是冰山一角想要了解更多有意思的话题欢迎在每个工作日的七点半到九点搜索早点生活的视频号抖音与我们一起在直播间相遇

这一 part 是看了严财经的一个文章再来聊一聊最近在各种招聘软件上什么 boss 直聘什么实习僧各种 upport 上都有一些公司正在招聘叫学历要求大专以上机器人数据采集员的一个岗位

这个工作的主要内容咱可以请康总上个图这是一个截图主要是负责什么机器人数据采集工作控制机器人的正确移动保护机器人处于安全状态等等薪资是一天 100 到 200 次不等

然后月薪可能就是 5000 到 6000 左右我看上面写的一个括号外包是的而且就给了这个地区是北京市海淀去上地是的就是外包这个是普遍这个岗位的一个现状这个外包包括这个按日节应该是很多这样一个公司去招这个采集员的一个岗位的需求除此之外还列出了很多对于人的外形的要求什么意思

就是你这个人首先你不能戴眼镜咱俩不行对咱俩肯定不行了其次呢没有高度近视小鱼不行了小鱼不行了然后呢这个有的是要求比如说男生你得是身高 170 到 175 这个原子就不行了原子是 185 然后呢体重是 65 公斤以内谁问你多高呢你看 1

170 到 175 体重 65 公斤以内这个其实是一个很标准的身型是的就是已经 pass 了很多国人男性了咱这个之前不是聊吗现在国人越来越胖需要减肥了国家带头减肥是的然后女生是要求 160 到 168 体重的是 55 公斤以内这怎么交的像跟一口

这有点是吧他其实挺严格的不戴眼镜没有高度近视男生 170 到 175 体重 65 以内女生是 160 到 168 体重 55 以内 15 公斤就是 100 出头 110100 以内其实很标准的一个身材还有一些公司要求什么呢不能有小肚子等会小肚子你都得摸他是一个很

怎么说很人就是很不能量化的一个要求对啊对对对然后还有说什么身体协调性较好这个原则也不行然后细心灵活有控制力反正就等等等等吧就是要求挺多活不少然后不想朋友抗议挺多大家都挺厉害的身材很标准没到 160 的矮个子就不行这个有朋友在问说没到 160 怎么

你可能 159 什么的应该也还行当然就是说回来为什么说这个机器人采集员他要求这么高呢他是一个什么工作呢为什么说这机器人可能还需要一些学历要求没有那么高的岗位呢是不是说他像 AI 一样就是很依赖数据标注有多少人工具有多少智能他是不是这样一个现状呢咱们就来看一看这个岗位到底是一个什么样的啊

上海的一个 90 后张谦就看到这样一个趋势了这半年来就一直在给数据采集港去投简历他投这个采集员主要是因为什么因为门槛低学历门槛低毕竟你想 AI 作为一个未来产业很多岗位招的都是什么工程师对于代码跟硬件起码你得有一定知识储备的

这样的一个岗位相对来说要求低一点而且他觉得这类工作挺有意思的就有一些数据采集的工作会模拟真实的机器人的作业环境然后采集员是穿动捕服就是动作捕捉的服装戴上 VR 眼镜

第一视角去模拟机器人去完成任务你是模拟机器人的那个人是的就是感觉很像是在玩游戏就你想正常你去商场里玩一个什么 VR 游戏什么 AR 体验你得给别人钱对你得花好很多钱这是别人给你钱对这个是别人给你钱他觉得这个很好玩可惜的是他投了很多简历但是目前一份都没收到这个转行对他来说还是有点遥远的

目前机器人的采集工作总的来看跟游戏的 3D 动画它比较类似毕竟你想训练机器人的时候基本上也会用到跟游戏 3D 类似的一个动作捕捉的技术有点像比如说我们去年跟各位聊到黑猴他们在前期的时候就会请到一些比如说科班出身的一些演员穿上动谱的一些服装去扮演里面那些角色比如说什么孙悟空的角色杨戬

这些他都是请真人来去做的没错翟南说的对就是人给机器人去做动捕其实你所谓动作捕装就是人类穿各种设备测量跟踪记录人的一个运动轨迹然后再通过计算机的处理得到一个三维空间的坐标的数据

当这个数据被计算机识别之后人体这个 3D 技术就可以应用在一个动画制作包括什么步态分析生物力学人机工程等等各个领域就这个数据是很有用的然后这一波其实为什么说很多公司都开始招数据采集员最开始是由全球顶尖的一些机器人公司来带动的谁去年 8 月特斯拉

特斯拉旗下 Optimus 就是他那个人行机器人开始招募数据采集员了工作内容就是你戴上动作捕捉服包括 VR 头盔每天沿着测试的路线去走 7 个小时以上身上同时去携带 30 磅的重物 30 磅大概是多少就是 13 千克就是 26 斤

这个重量我觉得也挺重了其实挺沉的对 尤其是对于女性来说挺沉的而且你想身上穿这么多的一些设备你可能走路也不是很舒服你可能很难像正常人走路那么走了所以他难怪在刚刚招聘需求当中是需要你比如说协调性好

你得灵活的确是这样是的而且与此同时还有身高的要求包括一些身材的要求你产机员需要佩戴设备的同时在工作过程中去完成很多的复杂的动作比如说什么站立坐下行走弯腰伸展蹲伏还有扭转身体等等各种复杂的动作都有但是特斯拉给的前途

特斯拉给的钱这个是一个小时 25 到 48 美金还可以啊一个小时大概是 180 到 342 元这比那个上面那个一天多得多对而且呢还有股权激励所以说这个特斯拉他招的这个人吧确实要求高但同时呢待遇不错相似的一些大型的招聘呢就开始在国内也开启了比如说这个去年 6 月呢智园机器人就在上海建立了一座 3000 平方米的一个素材工厂

就是数据采集的工厂在这工厂里就是很多的人去佩戴设备去教机器人各种动作比如说去模拟家庭零售服务业餐饮工厂等等各个场景你看它模拟这些场景基本上就是未来的机器人可能会产生的一些消费的场景没错比如说在家庭里一些机器人比如说在零售业的一些服务机器人包括餐饮的一些机器人工厂里的一些工业机器人等等等等吧

他模仿的就是他未来的一些工作场景而且是源源不断的给这些机器人去提供在这些场景里可能会产生的一些动作的数据

这个工厂应该是光投入了两个月之后就采集了超百万量级的一个真机的数据集这个数据效率我觉得还是可以的而且你从整个大厂的一个布局和落地来看我觉得真实的数据未来可能就是机器人去竞争的一个很大的门槛但是唯一的问题就是这个机器人数据采集员的门槛到底高不高

你看咱们刚刚说了他这个有身材要求学历要求比较低但是确实有很多人投了之后杳无音信没什么人去给他回复

来自深圳某个科技公司的招聘经理张女士就说了说数据采集员很多都是临时性的岗位他们一般是有较大的数据需求的时候才会定点的去招人一批一批这么招而且招的基本上是大专生或者是外包的临时工可能普遍的就是一两个月的短期工作他不会说有一个长期的岗位

这可能也是很多的一个问题吧就是当你看到这个岗的时候可能人家已经招完了对或者说当你看到这个岗的时候呢可能人家这个活都干完了这是一个核心的问题就是它的频次很低而且呢这个工期很短就是它不是一个长期的一个工作

当然就是整个工作难度呢也不算很复杂就是你可能每天就是咱们也说了很多遍嘛就是他去做一些比如说是人去学习拿矿泉水的动作呀然后去给他展示说怎么拿矿泉水怎么去捡东西怎么去做各种事情如果说这一个动作对于机器人学习上来说比较复杂的话呢可能说这个人啊一个星期都得去反复去做这一个动作哦

就比如说我可能踹阳仔一脚咱刚刚说了阳仔需要站立这个需要保持平衡这个动作很复杂因为可能我踹阳仔不同的部位它可能有不同的一种应激的反应来保持自己站立那么可能这一周我都需要做这一个动作就可能圆子得够着踹对当然这是举一个例子就是有很多的动作确实是

需要长期的一个行为才能让机械人去学会的可能相当于美术课上面的模特没错有点像倒不是说你需要很专业的一些背景可能更多的要求是你这个人得听话同时身体得灵活

而且这两年你会发现就是巨神智能很火所以说机器人产业对于动作捕捉的一些设备的需求其实也在大幅的一些增加就是机器人需要很高的一些人体的运动的数据精度更高而且是数据集更大

所以相比于这个电脑模拟的一些理想的仿真环境来说呢其实人去采集回来的真实数据它是可以兼容更多的随机性跟意外的其实我会觉得就是它要求这么标准的这样一个体型但是呢你说人每个人他走路的时候啊包括坐着的时候啊包括叠东西的时候他这个体态都不太一样

是的所以说当下业内的一个共识就是什么呢就是人类老师就是所谓的采集员或者说扮演机器人行为的一些人类对于机器人的能力增长是必不可少的而且人类采集的数据是可以更加真实的去反映世界的复杂性的

然后而且就是比如说可能他们的运行一个逻辑是什么呢就是我先做一些仿真数据对这个机器人进行一些预训练或者说进行一些出条然后呢再回来用一些这个人类采集的高质量数据我再进行一个精挑把这个假的数据呢和真的数据做一些结合让这个效率更高的同时呢可以让这个机器人更加去了解这个真实的物理的性能和这个效果

所以我觉得两方面吧一方面是用很多真实的物理数据另一方面你看 OpenAI 这些公司他们从软件端也在做一些什么世界大模型嘛世界模型什么的这些我觉得也是给未来的机器人去发展做了一些这个数据和这个训练上的一个铺垫吧

其实就像是咱们去学一个运动就比如说可能我们去学打桌球最开始你可能先去学一些理论对吧你可能最开始的时候你先是看别人怎么打这个台球的看他的姿势对看姿势看一些规则包括去了解一些理论基础

然后再去通过一些训练我去了解说真正是怎么击球的怎么去开球的怎么去走位的怎么怎么样各种的如果说有更要求的话比如说你要一些精细化的学习的话你可能还得找教练这可能就是跟当下人形机器人学习是同样的一个过程就是我先去用一些假的数据去让他学然后找教练找人去教这样一个简单的学习模式

当下其实机器人它其实有一个很主流的方向叫什么叫强化学习它是通过一种仿真的环境下通过试错然后我来告诉你哪个对了哪个错了如果你做的对了我会给你奖励如果你做的错了的话我会给你惩罚

相当于是我给你做了一个奖励函数就这个方式呢是能更好的训练机器人去走路啊跑动啊这样一个运动上的自平衡的能力其实核心来说呢就是能更好的去训练这个机器人的下肢力量

但是这个模式它没法训练它的上肢的动作就比如说我去抓握我比如说上肢做一些其他的复杂的一些行为这个是没法通过前化学习给它做得很好的我反而觉得上肢比下肢更重要一些其实上肢是很重要的就是可能后面很多的比如说我的灵活手我这个手能做很多的事情吗我这个手怎么去训练它可能不光是通过小脑来控制的它可能是通过人的大脑去协调的

所以你未来既然说你希望人性机器人成为一个玩具成为一个生产力去工厂里干活去商店买东西去融入家庭成为保姆其实关键就是在上职我之前跟各位同步我就是可能像很多这种科学家在去研发机器人的时候我们人类比如说普通的比如说拿起一个杯子打开一扇门包括拧开这个瓶盖对他们而言这其实反而是最难去攻克的一个技术难关

是的所以说真正上之难就是难在机器人的一个控制端如果说你想把它做好的话可能不是靠前话学习而就是靠这种反复去用人类的数据去训练这种叫做模仿学习这是不同的一个训练路径所以说操作环境下真正说你还是要手把手教学应该是效果最好的

这个你不光是上游的搭建包括下游对于数据的清洗审核其实都是需要大量的人力的当然这个人力可能还真是门槛不太高的人力所以这也是为什么很多的一些可能大专生或者是一些学历没有那么突出的人甚至是外行的人也可以通过这样一个工作去融入到这样一个行业来说所以你说这个人型机器人它是一个高精尖的技术但我觉得同时它在发展初期也算是一个劳动密集型的工作嗯

他也需要很多的人所以说你通过这项招聘包括整个行业的趋势来看都能看出来就是机器人行业他也在经历一个像 AI 一样的一个数据的危机之前奥特曼不是说说 AI 里面数据就相当于一个石油我觉得机器人来说也差不多高质量如果说数据不够的话可能机器人发展也会受阻

基本上可能一个人行机器人它跟自动驾驶还不一样自动驾驶你想你就是前进后退转向就这么点但是人行机器人它至少得有三四十个自由度的一个数据的输出它背后依靠的一个数据集是非常巨大的是比你汽车需要的要多很多的

而且你想就是现在大家去做这个人型机器人都要一个什么呢就是尤其是马斯克那一派的都希望说我有一个通用的一个性能就是我可以不光在工厂里可以干活我同时在家里也能干你给我放到任何一个场景我都能

那这个就是需要的数据就不光是说这一个领域的一个训练数据了它是一个海量的一个数据这个其实也是说很多的数据比如说我在工厂里训练出来的这个数据喂给你机器人如果说它放到别的场景里可能会存在一些不确定性嘛嗯

如果说你想做一些通用的机器人可能就你必须得完成这个不确定性和泛化性这个东西能不能完成也是一个未知数当然大家也是很期待说能不能说通过这些数据的堆积让人性机器人出现一个像 GPT 那样一个行业的爆发出现这个我觉得我们也是可以等一等的某个初心当下脑海里头都默默地脱下久久未尝的旋律是青春

一直放不下的面向情况