Alexandr Wang创建Scale AI旨在帮助机器学习团队更快地标记数据。它最初只是一个用于人工的简单API,但幕后,他正在解决一个更大的问题:如何将凌乱的现实世界数据转化为AI可以学习的东西。如今,这个早期的想法为美国AI基础设施背后的一个价值数亿美元的引擎提供了动力——推动着从财富500强的工作流程到实时的军事规划的一切。就在上周,Meta同意向Scale AI投资超过140亿美元,使该公司估值达到290亿美元。Alexandr加入了我们的Lightcone节目,分享了Scale AI是如何从一个不起眼的YC创业公司发展成为世界上一些最先进的AI系统的支柱的,他如何看待与中国AI实验室的竞争,以及构建塑造前沿的基础设施需要什么。 </context> <raw_text>0 自从我们与Scale AI首席执行官Alexander Wang录制了这个Lightcone节目以来,Meta已经同意向Scale投资超过140亿美元,使该公司估值达到290亿美元。Alex还宣布他将领导Meta新的人工智能超级智能实验室。
您即将听到的对话涵盖了这项投资之前的历史,从Scale在YC的早期到其在基础模型训练中的重要作用。让我们开始吧。人工智能行业确实持续遭受缺乏非常严格的剖析之苦。
评估和非常严格的测试,这些测试确实显示了模型能力的前沿。最重要的是你必须真的、真的、非常关心。当你面试别人或与别人互动时,你可以看出哪些人只是,
敷衍了事,而哪些人则坚持他们的工作。这对于他们来说是如此令人难以置信的重大、有力和重要的事情,以至于他们会做得很好。看到人类知识的前沿是如何扩展的,真是令人兴奋的时刻。
欢迎收听Lightcone节目的另一集,今天我们有一个真正的惊喜,它是Scale AI的Alexander Wang,Jared,你很早就与Alexander合作过,那是什么样的感觉?那是哪一年?让我们回到当时的情景。
是的,Alex,我的意思是,我们今天想谈论的大部分内容都是Scale现在正在做的事情,因为目前的工作非常、非常棒,而且非常有趣。自从Scale在YC成立以来,我认为从一开始就谈起是合适的。有趣的是,Diane和我在上个月曾经在MIT与大学生交谈。在所有创始人中,他们最敬佩并希望效仿的实际上是你。每个人都想成为下一个Alexander Wang,因为每个人都知道你辍学MIT并最终创办Scale的故事,但他们不知道真实的故事。所以我认为回顾过去,谈谈你最终辍学MIT并创办Scale的真实故事会很酷。所以在我去MIT之前,我在Quora工作了一年。
所以这是2015年到2016年,或者不,对不起,2014年和2015年是我作为软件工程师工作的时候。那时市场已经到了ML工程师(他们当时被称为)或机器学习工程师的薪水超过软件工程师的地步。所以那时市场就是这样。我去参加了这些夏令营,这些夏令营是由你
由理性主义者组织的,旧金山的理性主义社区。所以,嗯,它们是为早熟的青少年组织的,但是它们是由,嗯,呃,
许多在人工智能行业中发挥关键作用的人组织的。所以其中一位组织者是这个人,Paul Cristiano,他曾经是,他是RLHF的发明者。现在他负责,或者他是美国人工智能安全研究所的研究主管。他在OpenAI工作了很长时间。Greg Brockman曾经来发表过演讲。Eliezer Yudkowsky曾经来发表过演讲。实际上,当我,我不知道,我当时一定16或17岁,
我接触到了这样一个概念,即在我一生中,可能最重要的事情是人工智能和人工智能安全。所以这是我非常早接触到的东西。所以当我进入MIT时,我18岁时开始在MIT学习。我深入研究了人工智能。那是我在日常工作中所做的大部分事情。然后,嗯,
有点坐不住了,申请了YC。然后这个想法有点像,好吧,你如何在……最初的想法是,好吧,你可以在哪里将人工智能应用于某些事情?这是在……
聊天机器人的时代,这实际上令人难以置信,嗯,当时有一个小型聊天机器人泡沫。是的。是的,百分之百,在2016年,嗯,我认为这是由Magic引发的,对吧。或者,或者其中一些应用程序,以及Facebook对聊天机器人有宏伟的愿景,无论如何,这是一个小型聊天机器人热潮。所以我们最初想做的,呃,
是为医生开发聊天机器人,对吧?这是一个有趣的想法,因为你们对医生了解多少?是的,一点也不。基本上,一点也不。这只是有点像,哦,医生是一件听起来很贵的事情。所以,我认为这就像,我认为这表明,我的意思是,我不知道,你们经常看到这种情况,但我感觉大多数时候年轻的创始人,比如前10个想法,就像,
首先,它们非常具有模仿性。所以它们可能就像,这里有很多相同的想法。有一个约会应用程序。有一些,一些关于,你知道,社交生活的东西,你知道,相同的想法。然后我认为,我认为年轻人对alpha的感知非常差。他们实际上是什么,
将处于独特地位去做的事情。我认为,你知道,大多数年轻人没有自我意识。所以,你知道,不清楚。所以当我们在YC时,我们与另一家YC公司合住。我们有点像,我们正在观察这个,这个像聊天机器人热潮一样的东西,
领先于,你知道,当时正在发生的事情。但是很明显,如果你想构建聊天机器人,回顾过去说这很有趣,需要大量数据,并且需要大量的人工来使它们有效地工作。所以就像,只是在某个时候脱口而出,就像,哦,像,
如果你只是那样做了呢?如果你只是为聊天机器人公司做数据和语言数据以及人工数据呢?顺便说一句,我们也很迷茫。我想你可能还记得。我们在批处理中期相当迷茫。我想很多YC公司都是如此。所以然后我们
转向了这个概念。我认为,你知道,最初的想法是像用于人工任务的API或类似的东西。有一天晚上,我只是在四处寻找域名。ScaleAPI.com可用,然后我们就买了它
我认为一周后,我们在Product Hunt上推出了它。是的,我记得。Product Hunt页面仍然在线。我昨晚还在读它,我记得标语,它是一个用于人工的API。这大概是我对当时你所拥有的精炼见解的回忆,就像,如果有一个,如果你可以用API调用一个人呢?是的。那是,我的意思是,我认为我们用了三天时间来制作登录页面,并在Product Hunt上发布。我认为这个想法抓住了,
当时创业社区的一些想象力,因为它有点像这种奇怪的未来主义形式,你拥有像
人类被委托,像API委托给人类以这种有趣的方式。是的,这就像一种反转,是的。是的,是的,完全正确。人类为机器工作,而不是相反,是的。是的,是的,是的。这很有趣,因为在最初阶段,我们只是与从Product Hunt联系我们的所有这些工程师合作,这是一个真正的各种用例的集合。
但这足以让我们当时筹集资金并开始运营。几个月后,很明显,自动驾驶汽车实际上是我们需要关注的第一个主要应用。所以我会说,在公司成立的第一年里,有很多非常重要的决定。PRIYANKA VERGADIA:当时有一件事让我很好奇
当时已经有其他解决方案成为业内标杆,例如亚马逊的Mechanical Turk,是人们正在使用的工具,但你最终吸引了另一批不知道它的人,你的API更好,你赢了
当时并不清楚,因为你可能经常与Mechanical Turk进行比较。是的,所以Mechanical Turk绝对是当时大多数人心目中的概念。我的意思是,这只是这些事情之一,我认为很多人听说过它,但是任何使用过它的人都认为它很糟糕。所以就像每当你处于一个空间,而这就像
这就是像,人们提到一件事,但它很糟糕。这通常是一个非常好的迹象。嗯,所以这足以让我们早期充满信心。但我认为真正,我会说,嗯,对公司成功真正起根本作用的事情实际上是专注于这个,像这个,看似非常狭隘的问题,自动驾驶汽车。我认为,嗯,
你知道,我记得我们刚离开YC大约六个月的时候,基本上,另一家YC公司Cruise通过我们的网站联系了我们。眨眼之间,他们就成为了我们最大的客户。他们只是从你的发布中找到你的吗?是的,我认为甚至可能是谷歌。这甚至不是完全显而易见的,但是,是的,模糊地从我们的发布和模糊地。实际上是Cruise的一位前YC创始人联系了我们。所以也许一些……
YC的胡言乱语。嗯,我们是caretta。呃,
谁知道呢?世界以神秘的方式运作。所以他们发展得非常、非常大。所以早期,我们做出了这个决定。我记得我们当时去见了我们的主要投资者,我们进行了这样的对话。就像,嘿,实际上,我们认为我们可能应该只关注这个自动驾驶的事情。这实际上是一次非常有趣的谈话,因为他们的反应是,哦,这显然太小的市场了。你永远不会
那样建立一个巨大的企业。我们说,我们认为它可能比你想象的要大得多,因为有像,你知道,所有这些自动驾驶公司都在获得巨额资金,汽车公司也在进行大型自动驾驶项目。而且这显然是未来。感觉就像,
一些,嗯,嗯,应该存在的东西。所以我们说,如果我们专注于它,我们认为我们可以更快地建立业务。回顾过去很有趣,因为两件事都是真的,它使我们能够非常快速地建立业务,达到规模。而且确实,那还不够大的市场来维持一个巨大的企业。Scale的故事在很多方面就像这种进步一样,你如何继续?你知道,人工智能是一个令人难以置信的动态空间。嗯,很多事情都在不断变化,而且,嗯,
我认为,我们公司引以为豪的是我们如何能够继续在这个发展非常迅速的行业中不断发展和贡献。你是什么时候开始更加了解缩放定律的?因为出现的一个有趣的事实是,你有点像数据领域的Jensen Huang。我认为在自动驾驶中……
缩放定律并不是一件事情,因为最大的原因实际上是自动驾驶中最大的问题之一是你的整个算法需要在汽车上运行,所以你受到可以访问和可用的计算量的很大限制,所以
很多工程师和许多从事自动驾驶的公司从未真正考虑过缩放定律。他们只是都在考虑,好吧,你如何不断改进这些算法,使它们越来越好,好到足以安装到这些汽车上。但是后来我们在2019年开始与OpenAI合作。这是GPT-2时代。我会说,
GPT-1……GPT有点像好奇心。我记得OpenAI在大型人工智能会议上会有一个展位,他们的演示是允许研究人员与GPT-2交谈。而且它就像……
不像,非常令人印象深刻,但它,像,有点酷。它,像,有点这样的东西。然后我认为到了GPT-3,它有点像……那时缩放损失很明显,你知道,感觉非常真实。那是,我的意思是……
我认为GPT-3是2020年。所以实际上是在……世界意识到正在发生的事情之前很久。是的。你早在2020年就知道吗?你强烈预感到这将成为Scale的下一个重要篇章吗?还是直到ChatGPT流行起来?那很清楚吗?像3.5还是4?我认为那是4?我认为像……
在2020年,我认为很明显缩放定律将成为一件大事,但仍然不是完全显而易见。我记得这种互动,你知道,我获得了GPT-3的早期访问权限,然后它就在游乐场里。然后我,我和我的一个朋友一起玩它。我告诉我的朋友,哦,你可以和这个模型交谈。在谈话过程中,呃,
我的朋友对人工智能变得明显沮丧和生气,但这不仅仅是,哦,这是一个愚蠢的玩具。这就像,这是一种有点私人的方式。那时我意识到,哇,这在某种程度上与之前存在的任何东西都有质的不同。那时它感觉像通过图灵测试了吗?有点像,是表象。是的,表象。这就像它可能通过图灵测试的景象,对吧?但我认为真正,嗯,
导致我所说的生成式人工智能的认可,这个术语在某种程度上仍然如此,实际上是DALL-E,我认为这说服了……说服了所有人,但我认为我个人的……旅程就像GPT-3一样,非常有趣,然后,所以它就像公司中的许多赌注之一,然后在2022年,在DALL-E和
后来是ChatGPT和GPT-4等等。我们与OpenAI合作开发了InstructGPT,这是ChatGPT的前身。这变得非常明显,对于公司来说,坦率地说,对于世界来说,这都是孤注一掷的时刻。那时我们也看到了大型公司发生变化,因为那是2022年末3.5版本的发布。我们开始看到许多公司和聪明人
在2023年改变方向并调整他们的公司。那就是那个时刻。你提到的这种动态,有点像,你知道,技能,NVIDIA的数据之类的东西。我认为这变得相当明显,你知道,
我会说GPT-4确实是那一刻,哇,这就像,缩放定律非常真实。对数据的需求基本上会,你知道,增长到消耗人类拥有的所有可用信息和知识。所以这就像,哇,这就像一个天文数字般巨大的机会。
是的,4似乎是第一次你可以做到基本上从不产生幻觉。你实际上可以在有限的领域获得零幻觉体验,即使在这一点上,我们仍然处于这种状态。经典的观点是,如果它产生幻觉,你没有在提示或上下文中提供正确的数据,或者
你试图一步做太多事情。是的。我的意思是,我认为,我认为推理范式,是,有很多优势,而且在这个模型改进的最后一个时代,它实际上非常有趣,因为,嗯,
收益并不是来自预训练,所以我们正在转向推理和强化学习的新缩放曲线。但这令人震惊地有效。我认为,你知道,它……
人工智能和摩尔定律之间的类比非常清楚,那就是你会进入不同的技术曲线,但如果你放大,它只会感觉像模型的平滑改进一样。一些真正大型、知名包装器出现的一件事是,他们可以访问基础模型的完整参数微调,尤其是前沿的闭源模型。
这是否是你们业务的重要组成部分,或者人们正在寻求的东西?就像这些垂直化的完整参数微调数据集一样。是的,我认为这将成为未来的蓝图。对。所以现在,我的意思是,像总数量。
大规模参数微调或强化微调模型仍然相当小。但是如果你考虑一下,像未来的一个版本是每个公司的核心知识产权实际上是他们专门的模型或他们自己的微调模型。就像今天一样,
你通常会认为大多数科技公司的代码、知识产权是他们的代码库。将来,你通常会认为他们的、他们的、他们的专门知识产权可能是为他们所有内部工作流程提供动力的模型。他们可以在上面添加什么特殊的东西?好吧,他们可以添加数据和环境,这些数据和环境在某种程度上是特定于他们每天遇到的日常问题或信息或挑战或业务问题的,
在日常水平上。这就是那种真正细致的、现实世界的信息,你知道,其他人不会拥有,因为其他人并没有像他们那样进行相同的、完全相同的业务活动。但这其中有很多奇怪的张力。我记得我们的一位来自顶级模型公司的朋友来过,他们说,嘿,你认为YC和YC公司会给我们他们的评估,以便我们可以针对它进行训练吗?我们说,不,伙计,你在说什么?
他们为什么要这样做?因为那是他们的护城河。然后我想现在根据这次谈话,实际上,我的意思是,评估作为RL循环的一部分非常重要。然后甚至评估也不是真正有价值的部分。有价值的部分实际上是为你的数据集和你的集合正确微调的模型
你知道,各种问题。是的,它们就像乐高积木,对吧?如果你有数据,你有环境,然后你有,你有,你知道,基础模型,你像,你知道,可以将它们堆叠在一起,得到一个微调模型。显然,评估很重要。这是其中一些张力。这基本上是在,你知道,简而言之,某种程度上,嗯,
AGI是否会成为一个博格,就像吞噬整个经济一样,像,你知道,作为一个公司,或者你仍然拥有一个专门的经济?我的信念,一般来说,是你仍然拥有,
特别是作为经济,像,像,这些模型是平台,但它们像,现代世界的alpha将取决于,你知道,你在多大程度上能够将你的业务问题封装到数据集中或环境中,这些数据集或环境有利于
构建像差异化模型或差异化人工智能能力一样的东西。是的,这就是为什么向我索要评估如此疯狂的原因,因为,好吧,你得到了评估,基础模型要好得多。然后不是,你知道,现在你所有的竞争对手都拥有曾经是你优势的东西。我认为我们将经历一个在人工智能中学习的过程,我们将学习
什么是界限,对吧?我的意思是,我认为对于科技公司来说,很明显也很直观的是,他们不应该放弃他们的代码库,他们不应该放弃他们的数据库。他们不应该放弃他们的数据,他们不应该放弃他们的代码库。我认为,在一个高度依赖人工智能的经济体中,这些的类似物会随着时间的推移而确定,但是,是的,评估、你的数据、你的环境等等。我认为你对未来工作方式的塑造持非常技术乐观的态度。
你能更多地谈谈这个吗?因为我认为你之前暗示过。它将更加专业化。并不是说所有这些工作都会
消失,对吧?首先,不可否认的是,我们正处于一个新工作方式时代开始的时候。像,你知道,人们长期以来一直在使用这个词,那就是工作未来。好吧,我们正在进入工作的未来,或者至少是下一个时代。所以工作从根本上会发生变化。但我认为……
人类拥有未来。我们,我们像,我们实际上有很多代理权,以及很多、很多选择,关于这种工作重组或工作流程重组最终将如何发挥作用。你知道,我认为你可以在现在的编码中看到这一点。我认为编码在某种程度上是,是真正像,
其他领域和其他,你知道,其他工作领域的案例研究,其中初始阶段是这种助手风格的东西,在那里,你知道,你正在做你的工作,然后模型有点像在这里和那里帮助你。然后你进入,你知道,那种光标代理模式之类的东西,你就像……
同步地要求模型执行这些工作流程,你有点像,你正在管理一种代理,或者你有点像,你有点像与单个代理进行结对编程,然后现在有了Codex或其他类似的系统,很明显,范式是,哦,你有这个像
你有这个像代理群,你将把它们部署到所有这些不同的任务上。你只需要像,有点像,你知道,像给出所有这些任务,你将拥有这种像,这个代理队列,它们有点像,你知道,做你认为合适的工作。而最后一份工作在当前劳动力中具有语义意义。这是一个经理,你知道,你基本上是在管理这种像
这组代理来做实际工作。所以,而且,我认为像AGI或,你知道,AGI或末日论者等等,他们认为,哦,即使是管理代理的工作也会由代理来完成。所以人类将完全被排除在这个过程中。但我们的信念,我个人的信念是,你知道,这是,嗯,
非常复杂。管理也更多地是关于你有什么样的愿景,以及某种程度上是什么,是什么样的最终结果是你所追求的。我认为这些从根本上来说,你知道,我们有一个人的维度
需求和人类欲望驱动的经济。所以这些将由人类驱动。所以我认为经济的最终状态只是大规模的人类管理代理,简而言之。我有一个有趣的故事,我的一个创始人朋友正在尝试提升一个
他的初级员工,但他们非常、非常聪明。他们正在研究代理基础设施。然后他说,嘿,你想,你知道,我在找一个可以担任管理职位的人。你以前从未管理过人。你,你知道,如果我们在你手下雇佣一些人,你会怎么想?而这个,你知道,20多岁非常聪明,你知道,有点像,他只是一个工程师。他说,
我为什么要那样做?给我更多计算资源。模型,看看上个月模型发生了什么。我不必做任何事情。它只是开始做一个月前它无法做的事情。我为什么要管理人?我会为你管理更多代理,这很好。好的。那么随着时间的推移,人类将做哪些独特的事情?
这种愿景元素非常重要。这种像,有点像调试或某种程度上像,
修复出现问题的地方。像大多数经理的工作,作为一个经理来说,就是扑灭火灾,处理问题,处理出现的问题。像我直觉上认为,你知道,理想的经理工作似乎是一份非常舒适的工作,因为你就像,哦,是的,所有其他人都在做所有工作,我只是有点像,我只是含糊地监督。然后现实显然是高度混乱的。我认为人们经常跳到这种像,你知道,极端的现实,就像,哦,
哦,是的,这些像,你知道,你只是要管理代理,你将有点像,过着这种,你知道,维多利亚时代的生活,你所有的问题都解决了。但是,但是不,我认为它仍然会非常复杂,比如让代理很好地相互协调,以及协调工作流程,然后调试出现的问题。这些仍然是复杂的问题。而且,而且,
你知道,看过自动驾驶领域发生的事情后,我或多或少地意识到,达到90%的准确率很容易,但要达到99%却非常非常困难。我认为,大规模代理部署也会出现类似的情况,也就是说,最后10%的准确率将需要大量的工作。是的,即使对于现在的自动驾驶汽车,也存在远程辅助处理所有这些极端情况。所以最终仍然有人在管理汽车。是的,顺便说一下,比率……
这些公司没有公布数据,但我认为比率大约是五辆车对应一个远程操作员,甚至可能少于三辆车对应一个远程操作员。所以比率就像……
你知道,比人们想象的要低得多。我认为,即使在自动驾驶汽车中,人类的参与程度也比大多数人意识到的要高得多。我的意思是,如果你从这个角度来看,我认为这仍然非常乐观。它只是获得乘坐服务的结果,而不是在当今世界,如果你是一名优步司机,你只开一辆车。在这个世界里,你可以开五辆车,对吧?好吧,你必须相信这一点,就像对未来的乐观版本一样,你知道,失业率仍然很低,等等。你只需要相信人类的欲望和需求几乎是……
几乎是无止境的。而且,你知道,价格会下降,事情会变得更好,经济会变得更高效,我们只会想要更多。我认为这是一个相当……
人类历史上的趋势是,你知道,我们的需求有些无止境。所以我相信,你知道,经济可以变得尽可能高效,或者说它可以变得超级高效。然后人类的需求就会继续填满这个桶。
在20世纪,也许是20世纪早期,当你提到计算机时,人们并没有像今天这样看待计算机。他们认为计算机是一个坐在穿孔卡片制表机前的人。这就是计算机的工作。这是一个职称。从字面上看,这是一个人真实的工作。当然,现在,人们会问,所有的计算机在哪里?好吧,它们现在是真正的计算机了。我不知道。那是阿波罗任务。是一群……
人们只是在计算阿波罗的轨迹。就是这样。因为安装在火箭上的计算机实际上是一个微控制器,我认为它的频率只有个位数赫兹。计算量非常小。只是人类在做这件事。完全正确。即使是这个,我的意思是,我认为程序员的概念在某种程度上是高度深奥的,因为,哦,你就像在为这些……
机器编写指令,就像你……
只是不断重复地做。在某些方面,这就像所有人类都将获得的杠杆提升,类似于程序员历史上获得的杠杆提升。长期以来,我认为硅谷的很多人都会这么说,在人工智能之前的世界上,最接近炼金术的东西是编程,因为你可以做一些事情,创造出无限的……你所构建的任何东西都有无限的复制品,它们可以运行……
运行无限次。我认为整个劳动力很快就会看到如此巨大的杠杆提升,这非常令人兴奋,因为我认为程序员在过去的几十年里受益于这种独特的优势地位,他们拥有1、10、
10倍或100倍的工程师可以构建一些绝对令人难以置信的、非常非常有价值的、非常非常令人震惊的高效的东西,突然之间,我认为所有行业的工人都将获得这种程度的杠杆作用,所以我很想知道你之前提到的关于Scale如何不断重塑自身的问题,如果你要描述Scale的发展轨迹,那么故事是什么,以及……
转折点是什么?我们最初的业务完全围绕着生产数据,为各种人工智能应用生成数据。主要是自动驾驶汽车公司,对吧?在早期,正如你所说,你真的专注于此。是的,在最初的三年里,完全专注于此。专注于这项业务、发展这项业务的一个特性是,随着时间的推移,你知道,我们有这样的义务,真的要领先于人工智能的大多数浪潮,如果这是有意义的话。因为人工智能要在任何垂直领域取得成功,都需要数据。因此,我们对我们……
我们产品的需求往往会先于人工智能向这些行业发展的实际情况。例如,我们于2019年开始与OpenAI合作开发语言模型。我们于2020年开始与国防部合作开展政府人工智能应用和国防人工智能应用。我认为这远早于最近的……你知道,最近由无人机推动的……你知道,……
国防部的人工智能热潮。在我们开始出现这种……你知道,最近围绕企业人工智能实施的更大浪潮之前很久,我们就开始与企业合作。所以几乎是系统性的或……
或内在地,我们必须基本上领先于人工智能的浪潮。我认为这实际上与英伟达非常相似。你知道,每当黄仁勋进行关于英伟达及其未来和前景的年度演讲时,他总是领先于趋势。这是因为他必须在趋势发生之前到达趋势。我认为,这是一件事。
我们的业务持续适应的一种方式,因为人工智能就像这样,你知道,它就像,它就像,它是世界上发展速度最快的行业,我认为在世界历史上也是如此。因此,你知道,每一次转变,每一次发展都非常迅速。另一件事发生在2021年5月,2022年初,我们开始开发应用程序。因此,我们开始构建应用程序。
基于人工智能的应用程序,现在更多的是面向企业和政府客户的代理工作流程和代理应用程序。这是我们业务的一个有趣的演变,因为历史上,我们的核心业务是高度运营化的。你知道,我们建立了这个数据工厂。我们拥有所有这些生产数据的流程。
数据。这是一个非常运营化的过程,它涉及大量的人类和人类专家,才能在质量控制系统到位的情况下生产高质量的数据。这种高度运营化的业务及其成功为我们创造了动力,让我们能够梦想构建应用程序业务。当我们进入这个领域时,我研究过其他基本上成功地增加了……
非常不同的业务,以及哪些是某种独特的特征,或者为什么其中一些业务有效?其中一个可能最有趣的是,我认为在现代商业史上最独特的是……
亚马逊建立AWS。你知道,如果你在2000年写了一个短篇故事,说一个大型在线零售商将建立一个大型的云计算租赁服务器业务,这似乎是毫无意义的。我记得他们在2006年推出AWS时,亚马逊的股票下跌了,因为所有分析师都认为这是一个糟糕的主意。这以前从未做过。它只是……它看起来与他们的核心业务完全无关。它有……它就像……这个……奇怪的东西。但是这种智慧我认为是双重的。我认为,首先……从与那些……你知道,那些……的人交谈中可以看出……你知道,这项业务的起源时刻,一件事情,可能最重要的事情是他们相信……相信……
AWS的底层商业模式基本上将是这个……这个无限大和不断增长的市场。这个市场将永远增长。将会有这种指数级的计算量需要在世界上建立起来。如果你这样做,那么规模经济将带来足够的成本优势。我认为初创公司,你知道,你必须在某个时候切换模式,早期,
你试图进入非常非常狭窄的市场,几乎是你能找到的最狭窄的市场。然后你只是试图获得动力,然后慢慢地从这些超狭窄的市场中发展壮大。然后,在某个时候,如果你有雄心壮志要成为一家市值1000亿美元或更多的公司,那么你必须换挡,问自己,哪些是无限的市场?你如何才能朝着这些无限的市场发展?所以这是我们意识到这一点的时刻。并且
简单的认识是,每个企业和每个组织都必须使用人工智能驱动的技术重新调整其整个业务。现在,显然,像代理驱动的技术。随着时间的推移,这将吞噬整个经济。所以这就像另一个……好吧,这是一个无限的业务需要建立。
大型企业和政府的人工智能应用和人工智能部署。我认为很多人没有意识到你们正处于这场变革的中心。他们仍然认为Scale是一家数据标注公司。但是,如果你快进10年,
你认为Scale的大部分业务实际上将是代理业务吗?是的,它目前发展速度快得多。我认为这是一个无限的市场。所以大多数市场糟糕的一点是,它们有一个相当浅的S曲线。但是,你知道,你看……
超级规模公司或大型科技公司,它们拥有这些非常庞大的市场。所以你真的想进入这些,这些,这些无限的市场。到目前为止,我们的策略一直是专注于为……你知道,专注于少量客户,并且……
并且非常有选择性。因此,我们与世界上排名第一的制药公司、世界上排名第一的电信公司、排名第一的银行、排名第一的医疗保健提供商合作。我们与美国政府、国防部和其他政府机构开展了大量合作。整个事情就像,我们如何采取一种非常专注的方法来构建类似于……
真正差异化的人工智能能力。我认为所有这些听起来都有些陈词滥调,但我们在构建所有这些应用程序方面拥有数亿美元的业务。据我估计,我认为这是业内最大的人工智能应用业务之一。这当然是我们投资者告诉我们的。它是由……
我们在数据业务中的差异化所推动的,因为我们的基本信念是我们之前谈到的那样。每个企业或每个组织的最终状态都是某种形式的专业化,这种专业化是由他们自己的数据赋予他们的。
历史上,我们的日常工作是为世界上这些大型模型构建者生产高度差异化的数据。然后我们可以将这种智慧、这种能力和这些运营能力应用于企业及其独特的难题,并为他们提供专门的应用程序。老实说,这听起来有点像Palantir。是的。
在最宏观的层面上。是的。你有点眯着眼睛看。因为你们是一家技术提供商。我们就像一家技术提供商,为世界上一些最大规模的组织提供服务,重点是数据。是的。我认为关键的区别在于,你知道,Palantir,
已经建立了围绕这些数据本体的真正重点,并真正解决了企业中混乱的数据集成问题。而我们的观点是,什么是最具战略意义的数据,能够为您的AI战略带来差异化?我们如何……
从您的企业内部生成或利用这些数据来开发它。我想在未来五到十年内,你们最终将成为非常大的竞争对手。但就目前而言,这基本上是全新的领域。我的意思是,我认为这是一个无限大的市场。是的。所以你可能永远不会真正相遇,这很有趣。是的。我认为在实践中,我们现在实际上……坦率地说,我们与Palantir的合作多于竞争。这是因为这些大型组织中的问题实际上非常庞大且难以解决,以至于他们束手无策。他们根本没有机会雇佣能够解决这个问题的人。但是像Scale或Palantir这样的公司实际上可以雇佣……
实际上可以申请YC的同类型人才。有点像这样。是的,我不知道。我现在脑海中的主线是意识到……
你知道,资金充足。然后限制因素实际上是真正优秀的技术人才,他们乐观并且非常努力工作。这样的人不够多。这对全世界来说都是如此。顺便说一句,我认为关于……的一件很酷的事情是……
正如我们之前谈到的那样,突然之间,这些人获得了近乎无限的杠杆作用。所以我认为这个瓶颈现在有望由于人工智能而被打破。再说一次,我认为就像在云计算领域一样,AWS是迄今为止最大的,但是还有很多其他的云计算提供商实际上都……它本身并不是赢家通吃的业务,也不必是。是的,完全正确。我认为……
市场规模太大,甚至无法接近赢家通吃。没有一个组织能够拥有……
能够吞并整个市场的运营广度。谈到运营,你显然生活在未来,这非常酷。我相信你正在使用所有这些代理和工具来运营Scale,以使其更高效。你能分享一些你们公司内部正在做的事情以及你们正在采用的代理,以便用更少的人做更多的事情吗?我们很早就看到了这一点,因为当
模型开发者开始开发代理并开始使用强化学习,例如实际的……你知道,像推理模型,这些模型实际上可以执行端到端的流程时。我们负责生成许多使代理能够实现这一目标的数据集。然后我们看到了这种训练过程的有效性。我认为强化学习对代理部署的有效性是……
非常疯狂。所以一旦我们意识到这一点。我们意识到,好吧。如果你真的可以……你知道。将现有的……
人为驱动的流程转换为强化学习的环境和数据,那么你就有能力将这些……人为驱动的流程,特别是那些你对一定程度的错误是可以接受的,并且对一定程度的可靠性是可以接受的流程转换为……转换为代理工作流程,因此有各种各样的……你知道
在我们招聘流程中发生的代理工作流程,在我们质量控制流程中发生的代理工作流程,以及用于自动执行某些数据分析和数据处理以及各种销售报告的代理工作流程。它有点像嵌入在公司的每个主要组织中。整个事情就像,这只是一个心态。你能否识别出这些非常……
非常重复的人工工作流程,并基本上经历这个过程,将它转换为使你能够构建自动化工具的数据集。这些数据集实际上是什么样的?我的意思是,对于浏览器用户来说,它是一个环境吗?然后,你知道,这里有一个视频,展示一个人正在经历填写此表单的过程,并决定在这个下拉菜单上是“是”还是“否”之类的事情。我的意思是,你知道,只是一个具体的例子,给听众听听。我们经历的一个过程是,你知道,你,你,
你会从候选人那里获得一个完整的资料包,你会想把它提炼成某种简报,以便为更广泛的委员会的决策提供关于该候选人的所有重要细节。在这些情况下,你知道,总的来说,像深度研究++之类的东西是最容易实现的。这只是……你能否将这些流程……
或多或少看起来像,你知道,你必须在很多地方点击并提取大量信息,然后将它们组合在一起,然后对这些信息进行一些分析。这个过程,这个基本的基于信息的一种分析过程,是最容易通过代理工作负载来驱动的。你需要的数据类型就像,你知道,我们称它们为环境,但通常它只是,任务是什么?执行该任务所需的所有数据是什么?以及如何有效地执行该任务的标准是什么。当提示工程和元提示似乎如此有效时,你需要强化学习和微调吗?我认为是的,我的意思是,我认为我认为提示,随着模型的改进,提示也会改进,但是提示会让你达到一定的水平,然后强化学习会让你超越那个水平,实际上这是一个很好的观点。我认为在我们的业务中,大多数情况下是……
主要是提示,这非常有效。我的意思是,奇怪的是,哦,天哪,你不需要打开模型。然后坦率地说……
下一个模型会非常好。然后评估主要是在选择哪个模型,或者你知道,你什么时候切换到下一个模型?我认为初创公司基本上需要一个策略,说明他们将如何沿着复杂性曲线向上发展,可以说是这样。就像你需要……你知道,无论你构建什么产品或业务,都需要……真正受益于……能够沿着这条复杂性曲线向上发展的能力,这是模型能力的广泛……
更广泛的曲线。我的意思是,你实际上创建了这个排行榜,其中包含许多非常困难的任务,这些任务正试图进入推理的下一个曲线。你能告诉我们关于它的事情吗?我们与人工智能安全中心合作构建的一件事是“人文最后的考试”。这是一个有趣的名字。我认为不幸的是,还会有另一场考试。但是,你知道,这个想法是,如何有效地与……你知道,……
该领域最聪明的科学家合作。你知道,我们与许多非常聪明的教授合作,但也与许多非常聪明的独立研究人员合作。我们只是整理和汇总了这个数据集,其中包含世界上最聪明的研究人员所说的……
他们最近从事的最困难的科学问题是什么。他们解决了这些问题,或者他们或多或少地得到了正确的答案,你知道,他们能够解决这些问题,但它们是他们知道的最困难的问题。我很想知道你是如何想出这些问题的。所以每位教授都贡献了新的问题。所以这些不是,这些问题以前从未出现在任何教科书或任何考试中。它们只是从他们的脑海中蹦出来,然后他们像从头开始一样写下一个问题,我理解对吗?是的。一般的指导是,你知道,
你最近的研究中出现了什么你认为特别困难的问题,对吧?顺便说一句,这些问题非常困难。它们太疯狂了。我不知道你们是否看过这些问题。它们完全疯狂。是的,完全疯狂。顺便说一句……它们无法在互联网上搜索到。你需要具备丰富的专业知识,并且需要花很长时间思考它们。是的,它们需要大量的推理。我最近……现在,所以我们有一个时间限制,模型……
只能思考,我认为是15分钟到30分钟。最近来自一个实验室的最新的请求之一是,你能否将这个时间限制增加到一天,以便模型最多有一整天的时间来思考,来思考这些问题。但是是的,不,它们是极其困难的问题。除非你对特定问题有专业知识,否则你可能没有机会答对。但是即使是这个评估,我认为当我们第一次发布它时,
你知道,这是今年早些时候,最好的模型的得分只有7%、8%。现在最好的模型的得分超过20%。它发展得非常非常快。我认为,你知道,我认为……所以你认为我们也会对这个进行基准饱和吗?我认为最终会饱和。然后我们必须转向新的评估。我的意思是,我认为……
命名的优势在于它是最后的考试。新的评估将是某种现实世界中的任务,现实世界中的活动,这些任务和活动本质上更加模糊和复杂。你有没有自己解决过这些问题,Alex?我知道你长期以来一直是一名竞技数学家。是的,是的。我的意思是,数学问题需要很多,它们在这些领域非常深入。我认为我设法解决了一些,但大多数问题都是无望的。是的。
是的,我查看了模型可以解决的问题。所以这是一个评估。我们还制作了许多其他评估。但是是的,我认为人工智能行业确实,我认为,仍然缺乏非常困难的评估和非常困难的测试,这些评估和测试真正展示了……
模型能力的前沿。当您构建一个在行业中变得流行的评估时,这些评估会产生这种更深远的影响,那就是这突然成为研究人员试图……
优化的北极星和衡量标准。所以这实际上是一项非常令人欣慰的活动,你知道,我们构建了“人文最后的考试”,你知道,大多数……所有模型提供商都会报告他们的……他们的……他们的……结果。有很多研究人员真的有动力做好工作。我的意思是,它,它,而且模型将变得非常擅长……你知道,……前沿研究问题。
我想Sam开始谈论……你知道,AGI的第四阶段创新者即将到来,你知道,这是对明年的预测。你认为这是……你知道,正确吗?未来12到24个月是……实际上是新的科学突破,突破……
将来自这些模型的推理操作。我的意思是,我认为这是非常合理的,你知道,在生物学等领域,这可能是我最常遇到的一个领域,但是有一些……模型对生物学有一些人类甚至没有的直觉。因为这只是……你知道,它们拥有这种不同形式的智能。对。因此,你期望在某些领域中,模型……
与人类相比,具有一些根本性的深层优势。所以我认为在这些领域中,期望出现这种情况是非常现实的。我认为生物学对我来说是最清晰的一个领域。它在化学领域已经发生了。去年,诺贝尔奖颁给了谷歌团队,Demis和John Jumper以及AlphaFold。是的,完全正确。那是一个巨大的飞跃。在此之前,有一个比赛,他们试图获得更多将被软化的蛋白质折叠结构,并且……
结果非常糟糕,AlphaFold摧毁了它。这是一个成为科学家的奇怪时期,但对科学来说是一个令人兴奋的时期。有一个短篇故事。它讲述了一个未来的故事,在这个未来中……
实际上是人工智能正在进行所有前沿的研发研究。科学家,科学家所做的是,他们只是观察人工智能所做的发现,并试图理解它们。是的,我的意思是,我认为这是一个非常令人兴奋的时刻,可以看到人类知识的前沿是如何扩展的。然后,我的意思是,我认为这将是很棒的,因为在……
生物学领域将推动医学和医疗保健等领域取得突破。然后,经济的大部分将继续运转,满足人类的需求。中国开源或深势开源他们的模型是一个非常有趣的问题。这将如何发展?而且有一种尴尬的……
事情是,现在世界上最好的开源模型来自中国。我的意思是,这是一种需要应对的尴尬现实。——你认为我们能做些什么来确保美国模型领先呢?这是否注定如此?或者有什么东西告诉我并非如此?
对我来说,为什么中国模型如此好的最简单的解释是间谍活动。我认为这些前沿模型的训练方式有很多秘密。当我提到秘密时,这听起来比实际情况更有趣,但实际上有很多隐性知识。有很多技巧和关于在哪里设置超参数以及如何使这些模型工作以及如何使模型训练工作的小直觉。中国的实验室……
能够如此迅速地发展,加速发展,取得如此快速的进展,而一些即使是非常有才华的美国实验室的进展速度也较慢。我只是纯粹地认为,这是因为关于如何训练这些模型的许多秘密,这些秘密离开了前沿实验室,并回到了这些中国实验室。我认为模拟未来的唯一方法是中国拥有……
相当先进的模型。目前的情况是,它们并不是最好的模型。它们有点像落后半步,比如说。但很难预测当它们真正势均力敌时会发生什么。我们在能源生产方面严重落后,这完全是监管问题。这可以在两秒钟内解决,但你知道,还没有解决。这是一个巨大的问题。我的意思是,如果你看看,你知道,过去不会预测未来,如果你看看美国总电网生产的样子,它就像猪一样平坦,如果你看看,你知道,中国看到的那个总电网生产,它就像,你知道,它在过去十年里翻了一番,它就像,它就像一条直线,我看到了,这令人震惊,我的意思是,这仅仅是政策失败,中国只是,你知道,绝大多数是煤炭,煤炭在中国增长,
在美国,实际上,可再生能源增长了很多,但是可再生能源与化石燃料相抵触。所以我们有点像对我们的电网进行了转型,而那里只是——
继续复合,比如说。我们在电力生产方面存在这个问题,但我们在芯片方面具有优势。我认为,从净值来看,我们在计算方面将领先。如果你看看数据,我的意思是,这与你一直在问的许多问题有关,但是,我的意思是,我认为中国在数据方面处于非常有利的地位。说起来很奇怪,因为它显然是……
你知道,我们帮助所有美国公司处理在中国的数据,他们可以忽略版权或其他隐私规则,并且他们可以,你知道,毫无顾忌地构建这些大型模型。然后,第二个问题是,中国实际上有大型政府数据标注项目。有七个数据标注中心,比如三个,
在不同的城市,是由政府自己启动的,对人工智能公司使用数据标注有大量的补贴,有一种凭证制度。事实上,有大学课程,因为,你知道,有趣的一点是在中国,就业是一个如此重要的国家优先事项,以至于他们喜欢,
你知道,当他们有一个战略领域,比如人工智能时,他们会想,好吧,所有工作是什么?他们会创建这些渠道来创建这些工作。然后我们在机器人数据中也看到了这一点,比如在中国已经有了,他们是物流,
大型工厂里装满了机器人,它们只是去收集数据。奇怪的是,即使是今天许多美国公司也依赖于来自中国的数据来训练这些机器人基础模型。长话短说,我认为中国可能在数据方面具有优势。然后是算法,你知道,美国,
总体上更具创新性,但如果间谍活动继续成为现实,那么你知道,你在算法方面基本上是持平的,所以……所以很难建模,但我认为可能,你知道,它就像
60,40,70,30,美国拥有不可否认的持续优势,但有很多世界,中国只是赶上,甚至可能超过。对我来说,可怕的事情是观察擎天柱或YC拥有一些机器人公司,如Weave Robotics,以及
我们看看这些东西。软件可以和中国出来的任何东西一样好,甚至更好。但是当涉及到硬件时,这里就像炸弹成本,20,000美元,30,000美元。我们甚至无法在这里制造高精度螺丝。而在那里,同样的机器人,具身机器人,可以制造,我不知道,2000美元,3000美元,4000美元。就像你走在深圳的街上,他们就有了。那么,如何在某种程度上与之竞争……
在国家层面。中国在制造业方面令人难以置信的程度,我
我的意思是,这是一个非常大的问题。它与国防和国家安全有关。这是一个根本性问题,因为在某种程度上,国防和国家安全将归结于哪些国家拥有更多能够阻止冲突或能够击落其他东西的东西。是的,我认为这将不再是战斗机和航空母舰了。我的意思是,这可能是这场微型战争。它就像超级微型。它是
无人机和具身机器人。我的意思是,是的,没错。无人机、具身机器人、网络战,嗯,
冷战时期的理念,比如,你知道,你制造越来越大的炸弹。这与之完全相反。它实际上是,它就像碎片化,并且,并且,朝着某种程度上,你知道,更小、更灵活、更可归因的资源的方向发展,这是,这是,这是其中一个大的趋势,我会说。然后另一个大的趋势是我们相信的,那就是,
向代理战争或代理防御的转变,这基本上是,你知道,如果你,如果你真的规划出,今天的战争是什么样子,或者像,你知道,实际的冲突过程,你知道,如果你看看俄罗斯、乌克兰或其他冲突地区,像决策过程是由,非常,你知道,
手动和人为驱动的。它就像所有这些,所有这些非常关键的战时决策都是用非常有限的信息做出的,不幸的是,在这些非常手动的工作流程中。因此,很明显,如果使用人工智能代理,你将拥有完美的信息,并且你将能够立即做出决策。因此,你知道,它,我们将看到这种向人工智能的巨大转变
代理驱动的战争和代理驱动的冲突。它有可能将这些冲突变成这些几乎难以理解的快速发展的场景。而且
而你们正在积极从事这项工作,对吧?有什么你可以谈谈的吗?我假设其中一些是机密的,但是……是的。我们正在做的一件事是,我们正在与位于夏威夷的印太司令部一起构建一个名为Thunder Forge的系统。它负责印太地区。它是旗舰……
国防部使用人工智能进行军事规划和行动的项目。所以我们基本上是在做我所说的那样。我们采取
现有人类工作流程,军方以所谓的教条方式工作,或者他们有点像受这种非常成熟的军事规划过程的教条约束。你只需将其转换为一系列协同工作的代理,并执行完全相同的任务,但这就像完全由代理驱动一样。然后突然之间,你将这些
非常关键的决策周期从72小时缩短到10分钟。当你在下棋时,如果你与人类下棋,他们只是花所有时间思考。这是一种缓慢的游戏。如果你与电脑下棋,它只是这些立即的回击。这是一种不屈不挠的战争形式。其中一部分是能够立即看到思维链……
是最强大的东西。是的。因为,你知道,我不想要答案。我想看看你是怎么得到的。然后实际上看到推理本身是如此强大。我的意思是,这实际上是为什么第一次深度搜索的发布更有趣的原因。因为我认为,哦,一个已经出来了,但他们隐藏了推理。它就像,不,推理实际上是一个非常重要的部分。
他们隐藏它的唯一原因是他们不想让其他人窃取它,但他们无论如何都这么做了。我认为这是另一个……
关于这个领域有趣的事情,那就是,你知道,到目前为止,你真的可以建模为,就像有一些先进的能力,你可以尝试保密,你可以尝试保密,但它们会随着时间的推移而公开,无论你做什么。好吧,我的意思是,很明显,亚历克斯,你做了很多令人难以置信的事情,多次改变了你的公司,并且你在许多领域都有这些深刻的专业知识。你显然是铁杆的。
对观众有什么建议才能更像你?你知道,我认为最重要的事情是你必须真正、真正、真正地关心。我认为在某种程度上,这是青春的愚蠢……
当你年轻的时候,几乎所有事情都感觉像,你知道,如此天文般重要,以至于你就像你非常努力地尝试,并且关心每一个细节。你知道,每件事对你来说都重要得多。我认为,我认为这种特质非常、非常重要。而且,你知道,对于不同的人来说,程度不同。所以几年前我写了一篇名为“雇佣那些在乎的人”的帖子。是的。
它真的很简单。你注意到,我注意到,当你面试人们或与人们互动时,你可以分辨出那些只是像,
敷衍了事的人,与那些像,他们喜欢,坚持他们的工作,就像,你知道,它就像,它就像,对他们来说如此令人难以置信地具有纪念意义和力量,以至于他们,他们做得很好。当他们做得不好时,它会让他们感到不安。当他们做得很好时,他们对自己非常满意。所以有点像,关心的程度。而最伟大的指标之一,就像,
A,就像我多么享受与人们一起工作,或者坦白地说,他们在规模上的成功程度,实际上只是这个,是什么,你知道,在多大程度上,他们的,他们灵魂的程度投入到,投入到,投入到他们所做的工作中。
所以我认为,如果你要选择一件事情,那可能是某种意义上的统一因素,那就是,你知道,我很关心。我非常关心我们在公司做出的每一个决定。你知道,我仍然审查公司的每一个招聘。你知道,我们有这个流程,为什么,我批准或拒绝公司的每一个招聘。而且,而且我很关心。然后这个,然后像,我和所有这些非常关心的人一起工作。然后这使我们能够真正地,像,
我们对业务中发生的事情感受更深。因此,我们就像,你知道,我们将更快地改变方向。我们将更快地学习。我们将更认真地对待我们的工作。我们将更快地适应。我认为这对我们取得的成功非常重要。亚历克斯,你最近告诉我一个故事,这个故事让我印象深刻,关于即使最近,当Scale是一家非常大的公司时,你个人也在手工审查发送给合作伙伴公司的所有数据,并且像,
基本上就像最终的质量控制,就像,你知道,就像,你知道,那个数据点不够好。是的,没错。我认为很多创始人可能会,可能会,你知道,同意这一点,但是你的客户的感受以及你的客户何时快乐和悲伤,就像它真的会让你感到,当你有,当你拥有不满意的客户时,它就像,它就像一件非常痛苦的事情。总的来说,
你知道,我们在公司有这个价值观,质量是分形的,而且我相信,
高标准就像,它们会在组织内部层层下渗。而且,你知道,你很少看到一个组织,比如,比如标准随着你在组织中职位越来越低而提高。你知道,大多数时候,当人们意识到他们的经理或他们的管理经理或他们的主管或任何人都不关心时,那么他们就像,你知道,那,那,
消除了那种像,像对需要关心的那种深切渴望。所以这非常重要,这种高标准和这种像,这种对质量的深刻关心是像,这是这个像,深深植根于整个组织的信条。创始人模式,伙计。创始人模式。伙计,我们必须让你回来。非常感谢你抽出时间与我们在一起。就这样。
对不起,我们时间到了,但我们下次再见。