We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 人工智能浪潮中,被淹沒的「幽靈」訓練員

人工智能浪潮中,被淹沒的「幽靈」訓練員

2025/2/5
logo of podcast 端聞 | 端傳媒新聞播客

端聞 | 端傳媒新聞播客

AI Deep Dive Transcript
People
吴政廷
露露
Topics
露露:人工智能技术发展迅速,AI聊天机器人似乎变得无所不能,但科技进步的背后,是谁在训练AI?这些训练员对AI超越人类的说法并不以为然。 吴政廷:我通过报道揭示了AI训练员的零工生活。科技公司将AI训练零工化,外包给全球各地的AI训练员。这些训练员的工作包括对AI的回答进行评分和修改,挑战AI的智商。虽然时薪相对较高,但任务不稳定,账号容易被封,劳动权益也难以保障。这份工作类似于外卖骑手,与平台没有正式雇佣关系。AI训练员通常需要具备大学或硕士学历,语言和理解能力要求高。我的一位受访者说,为人工智能工作的人类有时比机器更机器。 Sharon:我因为在瑞典兼职难找,所以成为了AI训练员。虽然朋友对我的工作评价不一,但我还是参与了。我发现AI背后是大量人工,基础逻辑还是人的逻辑。审查员对中文文法的坚持让我印象深刻。训练AI像教小孩,终极目标是教会AI说人话,包括用词自然和在地化知识。但我隐约看到了AI发展的瓶颈,担心AI达到最高水平或零工外包不再管用,影响AI训练员的收入。

Deep Dive

Shownotes Transcript

我们找到爱

来自专传媒编辑部这里是端闻我是露露您会

过去两年,人工智能技术大发展,由 ChatGBT 领先的 AI 聊天机器人似乎变得无所不能,从物理解析到农历新年运势,AI 都能一一解答。但科技进步的背后,是谁把 AI 训练成当下最光鲜的模样?当世界在讨论 AI 超越人类的时候,为什么这些训练员对此不以为然?

我的同事国际组记者吴正廷为你讲述 AI 训练员的做题家生活今天是 2 月 5 日星期三工作管理平台啊 无限的上传 IT 瓶子 admin 要求但如果事情是不一样的

这就是你喜欢的工作平台

I'm cozyI have zero blisters on my toesand that's cause I wear Bombasthe softest socks, underwear and t-shirtsthat give backone purchased equals one donatednow go to bombas.com slash acastand use code ACAST for 20% off your first purchasethat's bombas.com slash acastand use code ACAST at checkout

郑婷你最近为端报道了科技公司在全球招募训练人工智能的人手你是怎么发现这个事情的其实我 2023 年硕士毕业要找工作的时候就看到一个繁体中文 AI 训练室的招聘广告就是我后来在这篇报道中写到的工作那我那时候就投了履历好像还通过筛选的是吗

AI 训练师那是一个怎样的岗位它是一个自由结案案件记仇的训练 AI 的工作那我们都知道现在我们熟悉的这些 AI 像是 TradeGPT 什么的它背后其实都是投入大量的数据去训练出来的

那这些数据是怎么来的呢当然很大一部分就是直接从网络上面找工程师直接将这些东西喂给 AI 但是随着 AI 技术的不断发展大家也慢慢意识到说数据的品质对 AI 训练出来的好坏有很大的影响那另外一个做法是所谓的人类反应

就是当今天 AI 给出一个回答之后那再去请人类去告诉 AI 这个回答好不好可以怎么修改那关于人类反馈 2016 年的时候有一个很有名的例子

当时微软在推特推出了 Taybot 这个 AI 账号它会模仿一个青少年的语气讲话推特用户 Tay 跟他互动把他训练成自己想要的样子但这不久之后网络骗子来砸 Tay 的脑子很快 Tay 就在说希特勒的话

但是很快因为有一些用户会故意搞乱叫 Tedbot 说脏话还有模仿一些比较右翼的内容所以最终 Tedbot 从一个天真无邪的青少年慢慢变成一个认为纳粹大屠杀是捏造的右翼分子那微软最终就不得不从推特上面把 Tedbot 撤下来

这个例子反映了人类反馈对 AI 学习的重要性像这两年为了突破 AI 模型进步的瓶颈有些公司就会大规模的请人手来帮助 AI 学习我当时候应征的那一职位就是在做像这样的教 AI 说人话帮助 AI 进步的工作那你应聘成功了吗其实没有就是那时候申请工作的时候我仍在美国

但是进入下一轮的时候他要填一些资料但那时候我已经回到台湾然后公司他发现我的位置不对就不让我继续做了我后来发现说我应征的这家公司虽然它是面向全球招聘你也是在线上工作不用去到办公室但他们就严格规定你一定要在当初应征的那一个地区去工作我不确定这是不是跟各地的劳动法规有关或是跟报税什么的

这个训练 AI 的产业现在是一个什么样的情况呢?

我觉得就是出现了一种系统科技公司他们尝试让人工智能训练去零工化的趋势就是把训练 AI 的工作拆成一个个的小任务然后外包给没有正式合约的员工举例来说我觉得可能很多我们的读者都已经在 LinkedIn 等求职平台上面看到有一家叫做 Outlier 的公司那他们在 LinkedIn 上面列了上万个工作在大规模的招聘不同于众的 AI 训练员

我后来调查后发现 Aurail 的背后是一间总部位于旧金山的人工智能公司 Skill AI 这间公司它目前的估值大概是 140 亿美元

他的客户有 OpenAI、Meta、微软、回答这些科技巨头如果你去看 Skill.ai 这个公司的网站会看到他们说他们会给客户提供最好的数据来打造最好的模型但这些所谓最好的数据其实很大一部分是透过像 Outlier 这样子的平台来外包出去外包给我报道的这些 AI 零工训练员

除了 Outlier 以外还有很多类似的平台但我想 Outlier 应该是目前规模最高的这些人工 AI 训练员他们都要做些什么呢

当 AI 训练员通过测试还有训练之后他们就可以开始接任务任务的种类还蛮多样的最常见的可能是要求他们得 AI 下一些很刁钻的指令然后对 AI 的回应进行评分还有修改换句话说就是要去尝试挑战 AI 智商的天花板让他越来越聪明

我采访到的受访者当中有人会要求 AI 去总结一篇很热门的小说的内容或是要他给台湾的寿阳饮料店像一些有谐音梗的店名

公司内部自己会用做题来描述这份工作因为确实很像是你接到一个任务然后遵从公司给你的规则来完成它完成之后还会有人来帮你批改这确实很像在学校里面考试做题然后我就联想到之前中国有所谓小镇做题家的说法帮了这群工作者取了一个零工作题家的名字嗯

那不过一个训练员累积一定的经验而且每次的做题成果都符合平台的要求得到很高的评分化那他就有机会晋升成为审查员去帮别的做题加批改答案这份工作赚钱吗

我觉得如果可以稳定接到任务的话那其实算是蛮赚钱的它给的是时薪每小时大概是 20 美元左右然后一些小于种像是日语之类的时薪会比整体中文还要高那这个数字其实是比大多数国家的法定最低时薪都还要高的那在一些发展公国家如果你在考虑美元的汇率优势这个薪资其实算是相当不错的

像是我的一位受访者他来自中国大陆他所在的那个省份最低工资也差不多是 20 元一小时但币种却是人民币所以他做这份工作确实可以赚到不少钱但问题在于这些 AI 训练员他们不是每天都能接到工作尤其是简体中文的任务因为平台上面的训练员可能会有两三千人那这么多的人抢很少的工作你就不一定可以拿到任务

很多收房者也都告诉我他们觉得平台在有多少任务可做如何分配任务上面都非常的不透明甚至有些人常常他们会一觉醒来就发现自己的工作账号莫名其妙被封了等于说被平台变相的解雇然后其中有些人这些账号被封的人还是已经做到审查员的资深员工

还有另外一个问题是前期其实很多训练都是不执行的应征过程你可能要通过一些测试也是等于说你前期需要付出比较多的免费劳动才可以真正开始工作赚钱而且平台跟这些训练员他们签的也是临时的合约两者不算是正式的雇佣关系那通常谁会去做这些工作呢

我觉得这份工作的要求还是蛮高的特别是语言还有理解能力我的受访者当中所有的人都有大学或者是硕士学历啊

然后甚至他们的专业就是读中文系或语言学他们可能刚刚离开学校在找工作期间需要收入他们就可能会选择这样一种兼职来赚点小钱如果是做中文工作的话他们就可能必须是中文母语者而且他们的英文也要很好因为整个平台基本上都是写英文他们也要用英文给平台写评分理由

我想大部分的人做這份工作都是抱著一種轉外快的心態但是很多人會越做越上癮就是因為當你完成一個任務之後平台會立刻把這份任務的薪水加上去這就會讓人有一種打遊戲的快感

有两名受访者都明确地告诉我说只要他们一找到全职工作他们就不会再继续做这份 AI 训练的兼职了所以他们的人员流动性其实也非常快有一个受访者跟我说你在平台做满三个月其实你就可以算是资深员工了

所以平台不断地在招人然后也会给员工一些内推的奖励政策像是你推荐一个人进来你可以获得一笔小奖金所以你可以参到在小红书 Reddit 这样的社交平台上面都有不少员工分享这个兼职机会的发文

但有另外一位受访者告诉我他觉得这份工作会让员工处在一个非常被动的状态就是你只能等待平台给你发任务你不知道有任务可做的状态会持续多久那这就导致他在有任务可做的时候会想要尽可能的多做把薪水冲高像是有一天那位受访者他就做了整整 12 个小时

评分标准不一致可能会是另外一个问题像是如果你不同意审查员对你的做题成果的打分然后你向公司的管理人员提出申诉但管理人员不一定会回复你甚至会跟你说如果你想要继续做这份工作那你就听他们的意见是最快的方式

听上去 AI 训练员这份工作跟外卖骑手蛮相似的因为外卖骑手也是跟平台没有正式的雇佣关系是他赚的钱是按他接的订单的数字来决定的是的 我想两者本质上是非常相似的而且便利的问题也都很像像是外卖骑手在送餐期间遭遇意外平台到底要负多少责任这个话题的讨论都在中文世界以及西方国家都是比较热烈的

我遇到的 AI 训练员他们虽然只是在家工作可能不会像外卖起手那么容易的处以以外但是因为他们和平台也是没有雇佣关系在很多劳工职权的问题上面他们其实是不受法律保护的还有另外一个点是因为他们的工资都是透过 paypal 打过来的那他们脚税到底应该怎么交很多人其实也都不太清楚

AI 训练员这份工作它也不是近期才有的,比如说早在 2017 年,SCALE AI 就创立了另外一家叫做 Remote Tasks 的公司,它会将门槛比较低的数据标注工作外报到菲律宾、肯亚、奈及利亚和巴基斯坦这些发展中国家去雇用比较低廉的劳动力。

2023 年华盛顿邮报就报道过,Remote Tasks 在这些国家存在拖欠工资、工资过低以及无预警解雇员东哥那种种争议。那篇报道形容人工智能浪潮的背后,其实是在数位血汗工厂里工作的这些大量的劳动者。

所以我在做这篇报道的时候,我就想起一本书,它的英文书名是 Ghost Walk,那有一个简体中文的译本叫做《消生逆极,数字化工作的真正未来》,它是由人类学家 Mary Gary 和计算机科学家 Sadaf Suli 所写的。

在書裡面他們家人工智能背後的這種隱形勞動稱作幽靈工作就是 Ghost Work 這些工作往往會被刻意地隱藏起來然後目的是要塑造人工智能無所不能的這樣一種假象那在過去去供人工智能運作的這些幽靈工作者他們可能大多是菲律賓的廉價勞工但是現在他已經慢慢擴散到散佈在全球各地然後受過高等教育的這些所謂零工作體家

我在做这篇报道的时候有一个受访者对我说了一句让我印象很深刻的话他说人工智能虽然是个机器但有时候为人工智能工作的人类有时候反而比机器还要极其我们稍后回来

请不吝点赞 订阅 转发 打赏支持明镜与点点栏目

这就是一个 PSA 或公开的鞋子宣传专家表示 Bamba 的鞋子是最好的方法来暖和较小的腿这两双鞋子非常舒适柔软和设计为最高的舒适度再加上每双购买的每双都会被购买所以需要重要的衣服的人可以在冬天里保持暖和

go to bombas.com slash ACAST and use code ACAST for 20% off your first purchasethat's bombas.com slash ACAST and use code ACAST at checkout

正挺你刚刚说人可能比机器更机器这句话还挺有意思的你能详细说说看吗这句话它是来自于我的其中一位受访者他叫 Sharon 那他来自中国大学读的是中文系还有一个比较文学的硕士学位他之前在中国的出版社做过几年编辑然后在 2023 年的时候去了瑞典读第二个硕士那他因为不会瑞典语在当地找不太到达

那不知道该怎么办的时候他就看到这个 AI 训练员的兼职机会所以他就投了简历然后在三个月后收到了邀请入职的邮件就比如说我有一个同学他就会直接认为我在做一个很不道德的事情很不道德的事情怎么说因为现在就是 AI 训练因为 AI 不是有很多能力问题吗所以

所以虽然身边的朋友对于他做 AI 训练的这个兼职评价不一但 Sharon 还是去做了那家公司的几个线上培训然后这些培训都是不执行的然后在培训结束之后 Sharon 就拿到了任务然后比较多是一些创意类型的像是让 AI 写小说然后由他来进行评分但是你也能看到就是说你在跟他互动的过程中他的一个成长就是和进步或者什么的比如说有的时候会让他

去写小说然后会给他一个就是你对小说的一个初始的一个情节的想法或者类似于这种然后他会生成那么你会去修改他生成的东西所以你会发现就是人们所想象的就是 AI 的背后他好像就是数据在跑但是其实所有的这些数据是由非常多的人工去雷起来的就是基础的那个背后的那个逻辑还是人的逻辑

其中有一次就是 AI 的回答当中有两个麻雀这样的表达那薛恩觉得说不管是一般说话还是网络上面其实都可以看到很多两个麻雀这样子的口语化表达所以他不觉得有什么问题但是他的审查员就说不对不可以这样子写硬是把它改成了两

芝麻圈那 Sharon 刚才没有见过审查员的真人但是他对于这样一种对中文文法的坚持非常的印象深刻但我那时候就问他说你有没有想过说给出这一个审查意见的可能也是一个 AI 呢

他当时就回答他觉得会这么坚守规则的一定是一个人而不会是人工智能因为 AI 它基于数据嘛然后它检索数据的能力肯定比人类强然后 AI 最后非常快速地发现有大量的人使用两个所以它就会很自然反而人类就是它有它从小到大接受的教育然后以及这个教育里告诉你只能使用两只去表达鸟类不可以使用两个去表达鸟类

的确,从这个层面来说,这话也是还蛮有道理的。那 Sherry 目前的收入如何呢?她目前工作了大概两个月,然后赚了 2000 美元。那根据瑞典的生活水平,她觉得这个数目还行,但是她也推测说在一些物价比较高的国家,像是澳洲,那可能就会觉得赚的钱还不够。

那 Sharon 的平台也有一个内推的奖励制度所以他推荐了十个人左右但是其中却只有一个人让他拿到奖金因为平台规定说被内推的人必须要至少坐满十个小时推荐者才可以拿到奖金

我觉得可能挺多人会卡在开头吧因为我有一个个人的原因是因为瑞典这边就兼职非常难找然后来说的话我其实不太介意前期可能需要投入比较多的免费劳动我对此是比较开放的

但是很多人可能他如果说做了两个课他还没有任务还没有钱进来的话他可能其实就不太愿意做了总体来说我觉得 Sharon 对于这份工作还是挺满意的可能跟他目前是留学生的这个身份有比较大的关系我有另外一位在纽西兰的受访者他也说到他认为这份工作非常的适合留学生做一方面留学生一定会具备双语的能力

那另外一方面弹性工是居家办公的这种自由度可以让留学生兼顾课业还有打工嗯 明白那 Sharon 这样在第一线近距离观察 AI 他有没有什么心得呢

我想 Sherry 当初之所以选择做这份工作可能也是对 AI 产业的发展有一些兴趣就是对于 AI 它的一个逻辑然后它为什么这样子表达然后它为什么是这个就是还是比较好奇因为加上我之前是做编辑嘛所以我自己就在领域上找工作的时候会更倾向于去找那种内容创作类的工作所以就很容易去看到这类工作

那做了一阵子之后他觉得训练 AI 就有点像是教小孩就是我们为 AI 数据然后 AI 转化为自己的营养然后再形成自己的答案那训练 AI 的终极目标其实就是要教会 AI 说人话这里指的不只是用词更自然还包含一些在地化比较 localized 的知识像是我有另外一位来自台湾的受访者他非常想要帮助 AI 完成在地化的这个目标

所以他有一次就对 AI 出了一个题要 AI 像一系列台湾首尔饮料店的鲜银梗店名但是 AI 给出的回答他都觉得不够好笑所以他就给了低分然后写了他的理由然后把这点写在意见里面交上去

那然后呢结果他的答案就被审查员打了低分因为审查员觉得说不好笑这件事情实在是太主观了然后我那个受访者他又觉得很不服气因为在他看来他们之所以会被雇佣就是为了让 AI 跟人性化跟在地化可以教他一些比较幽默的这种的东西但是因为平常平台的规则非常的机械非常的标准化所以他们这些训练员可以做的东西其实很有限

那像刚刚提到的雪伦,她其实也有类似的感受,像是她在教 AI 写小说的时候,她训练的那种模型,她只能写非常短小而且情节比较幼稚的小说,甚至有的时候她得整个帮 AI 重现一遍。但是要提高 AI 的文学创作水平的话,就必须教会 AI 用一些修辞手法,像是异象、隐喻之类的,但她觉得目前 AI 还是很难理解这些表达。

他甚至觉得说他已经隐隐约约看到 AI 发展的一个瓶颈在前面了什么层面的瓶颈呢 AI 训练它的终极目标是要达到牧鱼者的水平然后如果他真的某一天可以达到这个水平那他就不再需要人类的帮助了目前的状况是这些矽谷的科技公司他们搭建了这些理工平台然后设定了一套标准化的流程和规则然后让来自世界各地的 AI 训练员来训练

但是这套系统到底能不能帮助 AI 进步突破所谓的瓶颈我觉得很多实际在做这份工作的 AI 训练员其实也都是有点存疑的

像薛润就觉得说一旦越来越多的人意识到就是 AI 可以达到的最高水平就是这样子了或是零工外包的做法不那么的管用那相应的这些案子的需求就会减少然后客户一旦变少最直接影响到的就是他们这些人工智能训练员所以我觉得他其实有点担心自己这份工作还可以做多久正廷做完这题之后你对 AI 的看法有没有一些变化呢

在录这一期节目之前有和几位受访者在同心联系因为这一个文章毕竟是去年 11 月的事情那我发现虽然只是隔了两三个月但是这些零工平台的状况其实已经有了很大的变化比如说有一位曾经跟我吐槽过说做题流程不透明评分标准不统一的受访者他跟我说现在平台已经做了很多很多的改善谈得出来有努力想解决这些问题

我觉得这其实也是 AI 这个产业的一个特征吧就是它的变动非常的快非常的大然后扩张的速度会快到一种让人匪夷所思的地步所以我觉得在接下来这一年 AI 产业会继续速度发展但也不见得会继续往不断进步然后大型语言模型变得越来越好的方向因为就像 Sheron 所说的现在有越来越多的人开始看

那找一群有大学学历的理工训练者来训练 AI 这个效果到底如何我们现在也都还不知道但我觉得这本身是一个非常有趣的现象因为在过去我们可能会觉得 AI 是一个非常科技的东西认为学生和毕业生可能未来要被 AI 给淘汰了但是这个工作它让过去被排除在 AI 浪潮之外的人

文学科的毕业生他们也有了参与这个产业的机会他们可以在第一线和大型预言模型和最先进的 AI 交流互动那我觉得这些人的反思会非常有趣那之后也会想要继续关注谢谢正婷谢谢露露本期节目由宁慧主持 WinKuan 制作 HY 编辑剪辑与声音设计王波维以及江河媒体工作室 Alexson Ago

欢迎你在 YouTube 收听端文可以在节目下方的评论区随时发表你的想法参与讨论也欢迎你在 Apple Podcasts 或者 Spotify 为我们评分如果你喜欢端文欢迎你成为端传媒的订阅会员支持华文世界不可或缺的深度报道与多元声音同时也欢迎你追踪端传媒的社媒平台掌握更多与我们息息相关的新闻有价值的新闻与我们紧密连接在节目资讯栏位可以找到相关订阅资讯

以上就是今天的短文我是宁慧我们下次见 You'll still get unlimited talk, text and data for just $25 a month with Boost MobileForever

请不吝点赞 订阅 转发 打赏支持明镜与点点栏目

请不吝点赞 订阅 转发 打赏支持明镜与点点栏目