We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode How AI Agents Will Turn Freelancers Into Orchestrators With UpWork

How AI Agents Will Turn Freelancers Into Orchestrators With UpWork

2025/4/9
logo of podcast The Brave Technologist

The Brave Technologist

AI Deep Dive AI Chapters Transcript
People
A
Andrew Rabinovich
Topics
我加入Upwork是因为过去十年一直在研究以人为中心的AI,而Upwork作为全球最大的自由职业者市场,是通过人机整合实现AGI的关键。AI不会取代自由职业者,而是会使他们能够完成更复杂的工作,提高效率。Upwork内部有一个名为UMA的AI代理,帮助客户和自由职业者寻找工作和合作;我们正在努力让自由职业者与外部AI代理互动,2025年将是“代理年”。人本AI的理念不是取代人类,而是增强人类的能力,让人类能够完成更复杂的任务。当前AI的最大问题是缺乏自主性,无法决定做什么以及何时完成任务;人机协作将弥补这一缺陷。AI在自由职业领域的应用取决于自由职业者的能力,高级工程师会利用AI工具提高效率,而一些人仍然坚持传统方式。Upwork通过衡量质量、成本和时间三个维度来评估AI的应用效果,并通过一些确定性指标来衡量质量。Upwork正在与一些自由职业者合作测试AI工具,他们对AI工具带来的更多工作机会感到兴奋。AI将改变自由职业者的工作方式,从直接参与工作转变为管理和指导AI代理,从而处理更多项目。自由职业者应该学习如何将工作外包给AI代理,并利用AI代理完成更复杂的任务。人机交互界面是AGI发展中缺失的关键环节,需要开发更有效的界面来促进人机协作。

Deep Dive

Shownotes Transcript

UpWork公司人工智能和机器学习副总裁兼主管Andrew Rabinovich讨论了人工智能如何将自由职业工作转变为人机合作关系,从而放大而非取代人才。他还讨论了人工智能时代的就业保障,以及自由职业经济如何应对机遇和挑战。主要内容: 为什么预测2025年是“代理年” AI代理如何将员工转变为管理机器的管理者 以人为本的人工智能如何专注于增强人类能力而非取代人类能力 为什么人工智能开发中缺失的部分是创建人和机器之间的自然接口 嘉宾简介:Andrew Rabinovich是UpWork公司人工智能和机器学习副总裁兼主管,也是计算机视觉和机器学习领域的杰出人物。他以其在深度学习方面的成就而闻名,尤其是在目标识别、场景理解、增强现实和多任务学习等应用方面。Rabinovich在学术界和工业界都担任过有影响力的角色,为谷歌和Magic Leap的尖端研究和技术开发做出了贡献。2020年,他创立了AI视频协作平台Headroom,该平台于2023年被收购。 ---------------------------------------------------------------------------------------- 关于本节目:《勇敢的技术专家》旨在阐明新兴技术的机遇和挑战。为了使其易于理解、不那么可怕,并更易于所有人接受!加入我们,让我们一起揭开人工智能的神秘面纱,挑战现状,并赋能普通人拥抱数字革命。无论您是技术爱好者、好奇的人还是行业专业人士,本播客都邀请您加入对话,共同探索人工智能的未来。《勇敢的技术专家》播客由Luke Mulks主持,他是Brave Software(Brave浏览器和搜索引擎的制造商,现在通过Brave Search API为人工智能提供动力)的业务运营副总裁。音乐:Ari Dvorin 制作:Sam Laliberte</context> <raw_text>0 从隐私问题到无限潜力,人工智能正在迅速影响我们不断发展的社会。在本季《勇敢的技术专家》播客中,我们将揭开人工智能的神秘面纱,挑战现状,并赋能普通人拥抱数字革命。我是您的主持人Luke Malks,Brave Software(Brave浏览器和搜索引擎的制造商,现在通过Brave Search API为人工智能提供动力)的业务运营副总裁。♪

您正在收听《勇敢的技术专家》的新剧集,本剧集的嘉宾是Andrew Rabinovich,他是Upwork公司人工智能和机器学习副总裁兼主管,也是计算机视觉和机器学习领域的杰出人物。他以其在深度学习方面的成就而闻名,尤其是在目标识别、场景理解、增强现实和多任务学习等应用方面。2020年,他创立了AI视频协作平台Headroom,该平台于2023年被收购。目前,他领导Upwork的人工智能和工程工作。

在本剧集中,我们讨论了人工智能时代的就业保障,以及自由职业经济如何应对机遇和挑战,AI代理如何将员工转变为管理机器的管理者,以人为本的人工智能,以及Upwork正在构建的赋能其社区应对人工智能不确定性的解决方案。现在是本周《勇敢的技术专家》节目。Andrew,欢迎来到《勇敢的技术专家》。你今天过得怎么样?很好。很高兴来到这里,Luke。

是的,是的。感谢您的加入。我对这次谈话非常感兴趣。现在Upwork肯定有很多有趣的事情发生。您现在正在做的最令人兴奋的项目是什么,您可以与我们的听众分享吗?

当然。大约一年前,我的创业公司Headroom(从事视频会议工作)被收购后,我加入了Upwork。选择Upwork的主要原因是,在过去的十年里,我一直致力于“以人为本的参与”这一概念。

人工智能,而不是通用人工智能。众所周知,Upwork是全球最大的自由职业者市场,我认为这是通过人机集成实现AGI的重要组成部分。太棒了。您如何看待人工智能改变自由职业经济?独立专业人士有哪些机遇和挑战?

我们可以退一步思考一下进化中阶跃式变化,从蒸汽机和电力等等开始。如果您是一位农民,您手工完成所有工作,随着电力的发明,人们并没有停止务农。他们

他们只是开始更好地、更高效地务农,对吧?因此,我们认为同样的情况将发生在所有数字工作中,这就是Upwork帮助促进的工作。那就是自由职业者将能够完成更多、更复杂的工作,并与人工智能合作。这并不是说自由职业者会被机器取代。而是自由职业者与机器一起可以取得更大的成就。

明白了,明白了。你触及了我本来要谈到的一个关于就业保障的好点。我的意思是,Upwork显然与许多自由职业者有联系。例如,他们现在是否正在使用平台上的AI来提高工作效率,或者您能否就此方面分享一些信息?与您的问题相关的有两个方面。首先,Upwork上是否有帮助自由职业者寻找工作的工具?第二个问题是,Upwork上是否有帮助自由职业者与外部来源的AI合作的工具?第一个问题的答案是肯定的。Upwork今天内部有一个元代理,称为UMA,代表Upwork的Mindful AI,它可以帮助客户和自由职业者进行合作。

要么找到人来帮忙完成工作,要么帮助自由职业者找到工作。现在,对于第二个问题,我们正在积极努力,我不能公开谈论太多。我们正在努力让自由职业者与代理互动。而且,2025年是代理年。

可以这么说。许多人以非常不同的方式定义代理,但无论定义如何,人与机器之间的互动如今都非常活跃。最简单的形式是提示。您访问Chat GPT,向其提问,它会给出答案。这是人与机器之间的互动,尽管相当原始。因此,如果您假设Upwork上可以完成的所有事情,

从设计、编码、写作、音乐创作、搜索引擎优化,例如,播客,任何您想做的事情。对于世界上所有即将推出的代理。我们思考的是,什么平台级接口允许Upwork上的所有这些自由职业者与所有这些即将到来的代理互动,以提供帮助。因此,平台上并不存在这样的功能,但未来会有更多功能。

不,太棒了。是的,听到你们对这件事的思维方式以及你们如何看待这件事,真的非常酷。我们可以深入探讨一下以人为本的人工智能的概念吗?是的。这是一个定义相当宽松的术语,但包括您在内的一些人,

斯坦福大学人类人工智能研究所的Yann LeCun和Fei-Fei Li谈到了这一点。其理念不是取代人,而是增强人,对吧?我们都希望在某种程度上成为超人,而这将使我们能够做到这一点。一个简单的比喻是,我们已经构建了人工智能来击败人类下棋,现在是围棋,对吧?所以问题是,你不想再与电脑对弈了,因为电脑总是会赢。

但是,你是否可以与电脑一起下棋对抗另一个使用电脑的人?可以说,它变成了一个不同的游戏。也许它不再被称为国际象棋,但它仍然是全新的东西,对吧?所以这里也是一样。我们想要构建不会……像在……领域构建人工智能一样……

人类之外有点尴尬,因为我们不知道要赋予它什么目标,对吧?例如,如果在地球上,我们想说,帮助我们解决长寿、饥饿罢工和全世界缺乏资源的问题。这些是我们可以赋予人工智能的非常具体的任务。但这些事情都涉及到人类,并赋能人类和更好地服务人类,对吧?如果我们谈论的事情

发生在月球上,我们对此一无所知,那么这可能就是通用智能,但与人类无关。所以我认为我们谈论的是如何构建在人类领域工作的人工智能?同样,为什么当我们建造类人机器人时,它们看起来像人呢,保罗?

因为我们为其建造机器人的世界是为人类建造的。因此,这些机器人必须与人类具有一致的运动学和其他能力,以便它们适合其建造的参考框架。对吧?所以整个故事始于这部名为《她》的电影。我相信你看过。目标是真正创造……

不是一个会接受人们的任务或指令的助手,而是一个同伴,一个与人类平等的人,并认识到人类擅长某些事情。我们擅长情绪。我们擅长直觉。我们擅长感受。另一方面,机器

也擅长某些事情,但与我刚才提到的内容相当正交,对吧?他们可以永远工作。他们没有记住一切的问题。他们拥有普遍的知识,诸如此类的事情,但他们没有推断或建立直觉或建立更多基于情感层面而不是纯粹的信息获取的关系的能力,对吧?所以如果你把两者结合起来,

那么你就能真正达到下一级智能

称之为通用智能或其他,标签无关紧要。但我理解,人机共生的全新能力是下一级。有趣。您认为这种AGI的最大影响是什么?因此,今天人工智能的一大问题是它不是代理的,这意味着它没有

决定做什么的能力,

也没有能力决定工作何时完成得足够好。因此,我们可以说,所有事情的机制,去弄清楚在哪里钻下一个油井,或者去弄清楚如何建造下一枚火箭。机器可以做到这些,而且只会越来越好。对此我非常有信心。但是弄清楚要做什么以及何时……

解决方案是否达到了预期的结果,这并不明显。因此,理解,就像我们在人类世界中所说的那样,在工作或人际关系等方面有很多所谓的机构知识。但也存在许多未记录在案的机构知识。机器从数据中学习。

如果没有数据,或者数据量不够大,那么学习就会变得非常非常困难。这就是为什么我们有像人机循环强化学习方法这样的东西,对吧?每次都向人们寻求答案是可能的,但这被证明非常昂贵且

效率低下。然而,人类拥有一种洞察力和智慧,我认为机器在短期内不会拥有这种洞察力和智慧。因此,解决非常实际问题的能力显然会到来。但还有一些复杂的社会结构需要人和机器的这种配对。不,这很有道理。这很有道理。鉴于此,Upwork似乎是一个非常有趣的领域,你知道,自由职业者既是……我想象他们会使用你们来……你知道,不仅是……获得工作,而且是完成工作。对。所以你可以有这种反馈,Luke,我想象。

您是否看到AI的使用在自由职业方面真正兴起,这很有趣,还是现在已经全面普及了?因为我想象你们到处都在需求。这是一个很好的问题,这在很大程度上取决于自由职业者的素质。

以软件工程为例。有Cursor、Copilot、Reflection等工具可以为您编写代码。我一直都在使用它们,而且我编写的代码比过去十年可能多出10倍。哇。

如果您是一位非常高级的软件工程师,您将学习如何使用这些工具,有些人确实如此。但仍然有一些自由职业者认为,你知道,你打开一个带有VI的空白终端,然后你从头开始编写代码,一切都是手动的。他们能否编写最佳代码?可能。这需要永远吗?是的。这会非常昂贵吗?是的。因此,我们现在开始看到的是,那些已经采用工具并知道如何使用它们的人与仍然以传统方式做事的人之间存在着非常……

软的,但却是分歧。有趣。作为客户或用户,您可能有很多方法可以量化这些进步。而且,你知道,嘿,你节省了这么多时间,或者你获得了这么多的增长。你们是否正在围绕这一点制定指标?哦,是的。是的,是的,是的。绝对的。所以你想衡量三个领域的事情。首先当然是质量,对吧?因为当客户进来时,他们希望并要求一定的质量。尽管今天工作的结构方式是,我们主要负责寻找匹配。但是否匹配成功,这在平台之外发生。所以工作发生在平台之外。在质量之后,显然是成本,因为每个人都想要最好的东西,但价格更便宜。然后是时间。

并且围绕如何在更短的时间内实现相同的质量有一些非常有趣的指标。因此,价格会大幅下降。一个很好的例子是,例如,机器翻译。如果你想

从法语翻译成英语,你可以去Upwork,并要求搜索引擎为你找到一位说法语和英语的翻译人员,他们可以完成这项工作。你可以开始看到,有一些自由职业者会说,“我会为你完成这项工作。”在后台,他们会使用ChatGPT进行翻译,然后他们只需编辑,然后他们能够比那些手工翻译的人快几个数量级地返回工作。

如何衡量质量呢?你们能从中学到纯粹的指标吗?还是说仍然存在主观因素,你们这边正在做一些假设?我只是很好奇。当然。这是一个很好的问题。问题的答案来自DeepSeek的新闻。具有讽刺意味的是,有些任务是确定性的。例如,

代码完成或编译,对吧?您不需要主观指标来确定编写的代码是否可以编译。你只需编译它。如果它可以编译,那么它就可以工作。如果不行,那就不能工作,对吧?所以DeepSeq所做的是,他们说,大概我们没有很多计算资源,因为我们不是一家美国公司。我们需要进行微调或后期训练过程,这通常需要大量

模型建模、评估模型,例如LLM作为判断类型的东西。但是这些模型的训练成本非常非常高,判断模型也是如此。运行它们也很昂贵。

因此,一旦我们有了要训练的模型的建议,与其让LLM作为判断者来评估结果,不如我们制定一些确定性的规则。这些规则需要恒定的时间来运行,因此成本低廉。然后,对于我们想要对其进行微调的许多任务,我们将只使用它并假设它有效,对吧?所以这里也是一样。当涉及到任何生成模型时,

非确定性任务,事情非常非常主观。除了获得人类专家的共识之外,很难推导出任何启发式方法。我的意思是,很难推导出不是启发式方法的指标,对吧?因为每个人都可以说这是主观的,那是主观的。幸运的是,工作中的许多工作

领域对此感到满意,因为它一直都是这样。即使是在编写代码这样相当确定性的任务中,人们也有不同的编码风格,对吧?如果我们,随着我们扩展到这种人机合作,客户可以进来并说,我需要,我

我想要编写这种类型的代码。查看我的代码库并模仿我拥有的编码风格。然后机器可以做到这一点。如果人和机器的曝光率是首要的,那么在结构上很容易将编码风格传播到代理,然后让自由职业者进行评估,并说,是的,这是根据谷歌或其他任何人的编码风格编写的。然后它继续前进。但是如果你这样做

在相反的情况下,你只是把工作交给自由职业者,自由职业者可能会查看你提供的作为示例的代码,并编写他们习惯编写的代码。很难让他们改变它,因为与机器不同,像经过训练编写代码的人一样,以某种方式编写代码。很难让他们改变它。

好吧,这很有道理。这真的很有趣。你们是否与测试人员或自由职业者紧密合作,他们就像……你知道,在……测试版或测试队列中,可以向你们提供关于这些事情的反馈?他们对什么感到兴奋?我们正在进行这项工作。并且有一些自由职业者渴望采用新技术,因为他们认为这是获得更多工作的机会。

- 对。- 对吧?我认为,随着代理变得越来越强大,你可以认为今天Upwork上存在的工作量可以成倍增长,因为你不仅能够解决更复杂的问题,你还可以来到Upwork并说,“为我构建一个开源版本的Facebook。”- 哇。- 现在,如果你今天在Upwork上这么说,

A,你可能永远都找不到一个愿意为此签名的软件工程师,因为这太疯狂了,对吧?即使他们这样做了,这也需要数百万美元和多年的时间,对吧?当然。是的。

如果你能够找到人机协作,那么我可以想象这可以在30天内完成,只需10万美元。这是事情的复杂方面。但在事情的简单方面,我们可以开始考虑代理能够以惊人的频率解决几乎这些微型任务。

对。作为企业或消费者,您可以访问Upwork,然后您可以说,我想要这个,我想要那个。每个项目都像10美元、50美元一样。但会有这么多,一个自由职业者将能够管理整个范围。

他们可能与不同的代理一起完成的数百个小型项目,从而增加了对他们时间的需求。是的,我本来想问。我很少听到人们说“惊人的频率”之类的话。所以想象一下,有人完成数十个项目可以扩展到数百个。是这样的……是的。有趣的是,他们直接参与或在每个项目上花费的时间将会减少,因为那时他们将处于……模式。

管理/验证或指导,而不是做,你知道,你也可以在人身上看到这一点,对吧?例如,假设你是一位软件工程师,然后你是一个个人贡献者。你负责,你知道,编写设计文档到实际编码,到测试,到部署,等等。然后你看看管理一千人组织的人。他们什么都不做。

但他们确保每个人都能完成自己的工作。因此,如果可以这么说,相同类型的协调将在人和机器之间发生。我告诉你们,有些机器比人类更先进,但我认为我们可以把这个话题留到下一次对话中。是的,所以从管理猫到管理代理的场景,对吧?正确。是的,而且这些代理……

他们非常有趣,因为他们没有任何社会问题。他们没有任何偏好。他们没有任何意见。他们只是做事,对吧?因此,作为协调者,你更容易做到高效。只要有正确的抽象层,如果可以这么说,来连接它们并使接口高效。太棒了。我还想知道,

听起来这对于项目管理甚至直接工作本身都很有帮助。那么在业务方面呢?您是否看到代理可以帮助进行合同谈判等事情?未来代理与代理之间的谈判类型的事情?还是说总会有一个人类参与其中?对于人类来说,它实际上是一个市场,对吧?因此,今天事情的工作方式是,客户来到平台上,与UMA见面,告诉UMA他们想要什么。

描述项目。UMA制定项目计划。然后它使用该项目计划和搜索引擎来查找一组可能的候选人,自由职业者。然后它帮助这些自由职业者代表他们向客户撰写工作建议。然后UMA切换帽子,帮助客户选择合适的候选人。然后……

工作开始了。然后UMA将促进任何类型的谈判等等。对于代理来说,这很简单,对吧?每个令牌的价格都是固定的,没有什么可谈判的,对吧?只要您拥有正确的接口,换句话说就是API,那么一切都会非常无缝。您可以预测

提前知道事情的成本是多少,因为它是固定的,对吧?而且总会有竞争,正如你今天所看到的那样,一个新模型出现,他们说,每个令牌的价格便宜一分钱,或者上下文窗口大10倍,你知道吗?仅仅通过这种自然竞争,你就能在质量和效率上得到这种提升。哇。是的。

哇。太棒了。我的意思是,听起来现在相当全面了。看到这将走向何方,真是令人兴奋。它正在实现。你知道,这不是一夜之间就能改变的。我们必须记住,Upwork已经存在了20年。你知道,一方面,我们在内部构建了许多工具、创新和技术。

但另一方面,回到人类因素,有很多惯性。由于惯性,人们以某种方式做某些事情。尽管拥有所有最新和最强大的工具,他们仍然需要时间来适应它们并进行调整。

放弃所有他们在过去已经验证有效或无效的事情。当然,当然。保持文化精神,在组织内部获得这种契合。是的,这很有道理。我的意思是,这其中一件有趣的事情是拥有20年的数据、经验和市场成熟度,然后能够在这种背景下应用这些工具,而不是像……你知道,成为自由职业者或创业公司。

等等。这非常有趣。我相信许多自由职业者,那些还没有被这种东西吸引住的人,但对此感兴趣,您是否有什么建议或让他们为进入这种人工智能驱动的就业市场或思维方式做好准备的技巧或其他任何东西?我会建议他们弄清楚他们自己的哪些工作可以外包给代理。是的。

然后开始考虑更复杂的任务,他们自己可以在代理的存在下解决这些任务。因此,如果您过去习惯于在Tailwind或其他任何东西、React Native或其他任何东西中构建网站,那么就开始考虑构建更动态的网站。

包含用户交互、搜索引擎优化等各种内容的网络应用程序。因此,您可以实际处理更大的项目,而不仅仅是做这一件事,因为您只依赖自己。有趣。太棒了。我知道我们今天讨论了很多内容。还有什么我们没有讨论过,你想让我们的听众知道的吗?我认为我们确实讨论了很多事情。一件

我特别兴奋的事情是,需要存在一个人和机器之间的接口,使我们能够

以最有效的方式进行互动,因为如果我们不这样做,它将无法工作。有一些初创公司和大型公司正在考虑这个问题。我认为这将是这个AGI难题的下一个缺失部分,如果可以这么说的话。因此,机器越来越聪明了。他们需要与专家人类互动

就像你从OpenAI那里听到的那样,你现在可以拥有博士级别的Chat GPT或硕士级别的Chat GPT。因此,很明显,人们的专业知识不仅仅是拥有互联网连接和脉搏。人们的知识非常宝贵。

这将继续增长。人们上大学,尽管,你知道,现在这值得怀疑。但是人和机器之间的接口,使他们能够以非常自然的方式做到这一点,我认为这是缺失的一环。

我期待着尽快看到它的出现。那种打破聊天提示的限制,对吧?像让它更集成一样。提示是它的非常一维的版本,但我们需要它更多。一件非常成功的事情,所以我来自计算机视觉背景。

背景。我们早期学到的一个教训是,涉及通过示例学习的算法一直都非常非常成功,对吧?而这种人机循环强化学习只是另一个例子,对吧?告诉我你更喜欢A还是B。你不必告诉我为什么,只需对它们进行排序即可,对吧?在计算机视觉中,它就像,这是一张带有识别对象的图像。

这是一张另一张图像。你能识别任何物体吗?我甚至不会告诉你这些物体是什么,但它们必须在任何维度、颜色、形状、结构、家族等方面与这些物体相似。你能认出它们吗?我们能够训练机器在10到15年前做到这一点。因此,这种通过示例学习至关重要,机器必须开始通过示例向人类学习,而不是在训练阶段,而是在实际问题解决的推理过程中。

有趣。有趣。是的,这很棒。人们可以在哪里关注你,以了解更多关于你们正在发布的内容,或者只是看看你在网上要说些什么?Upwork有一个AI博客。每当我们在那里发布内容时,我通常都会在LinkedIn上交叉引用它。酷。除此之外,我们还做了很多基础研究。当它发表时,你可以在我的学者页面上看到它。

太棒了。好吧,Andrew,这是一次非常有启发性的谈话。感谢您抽出时间与我们的听众分享Upwork、您的工作和观点,并很乐意让您回来查看情况,看看事情进展如何。很高兴和你谈话,Luke。谢谢。非常感谢。祝你一切顺利。感谢收听《勇敢的技术专家》播客。为了不错过任何一集,请确保在您的播客应用程序中点击关注。

如果您还没有切换到Brave浏览器,您可以今天免费下载它,网址为brave.com,并开始使用Brave Search,它使您可以私下搜索网络。Brave还可以保护您免受广告、跟踪器和其他在网络上跟踪您的令人毛骨悚然的东西的侵害。