人工智能工程师的薪酬达到了运动员级别。Anthropic公司让Claude负责管理一台自动售货机,这个实验向我们揭示了人工智能目前的现状及其未来发展方向。Soham Parekh在多家公司担任要职,说不定他也在为你工作。接下来,我们将进入本周五的大科技播客节目,敬请期待!欢迎收听本周五的大科技播客节目,我们将以我们一贯冷静、
细致的方式来解读新闻。今天我们要讨论很多话题,包括扎克伯格可能向人工智能工程师提供高达1亿美元甚至更多的合同,邀请他们加入他的超级智能团队。当然,Facebook或Meta否认了这一说法。我们还要分析Anthropic公司关于Claude管理自动售货机的精彩实验。当然,我们还要谈谈Soham。
他承担了如此多的工作,尤其是在YC公司,所以谁知道,也许他也在为你工作。和往常一样,Ranjan Roy将加入我们,一起讨论这些话题。Ranjan,很高兴见到你,欢迎回来。很高兴见到你。我现在在旧金山的酒店房间里,但我遗憾地告诉你,我并不是来讨论我从扎克伯格那里获得的1亿美元薪酬的。
我没有在名单上。我还没在名单上。也许我们可以通过播客的方式争取一下。永远不要说永远。马克,给我5000万就行。只要5000万。好的。是的。
现在,我们应该从这里开始,因为几周前我们讨论了人才争夺战,以及考虑到加入Meta并成为其超级智能团队一员,扎克伯格可能会采取哪些措施来向人工智能工程师提供如此高的薪酬。自那次讨论以来,这两周的讨论愈演愈烈。所以我们现在从《连线》杂志获得了新闻。文章写道,这就是扎克伯格为顶级人工智能人才提供的待遇。
文章说,随着扎克伯格为Meta的新超级智能实验室配备人员,他为顶级研究人才提供的薪酬高达四年3亿美元,第一年总薪酬超过1亿美元。Meta否认……
这个想法或这些数字,它说这些说法是不真实的,这些薪酬方案的规模和结构在各处都被歪曲了,有些人为了自己的目的而夸大了正在发生的事情,我不知道Ron John,你怎么能让很多人说他们有类似规模的交易呢?我认为他们公开报道了10笔这样的交易,这是怎么回事?
以及,你怎么会得到这样的否认呢?是的,我认为我们应该先讨论这对行业实际意味着什么。但首先,我仍然很好奇Meta发言人Andy Stone的回应,他说这些说法是不真实的,并且是一种笼统的否认,并说有些人为了自己的目的而夸大了正在发生的事情。因为这怎么能帮助OpenAI呢?在我看来,我明白。
这样做有不利的一面,即市场可能会受到惊吓,认为Meta的支出过于随意。但实际上,我不得不承认,这让我觉得扎克伯格已经准备好,他将不惜一切代价赢得人工智能之战。所以对我来说,这几乎是一个积极的信号。我不知道他们为什么要否认。
好吧,我认为这会给内部文化带来一些问题。现在让我戴上阴谋论的帽子,你认为Sam Altman是否在给人们发邮件,并亲自描述这些薪酬方案?因为他本周给OpenAI发了一条信息。
这真的让Meta受到了抨击。他对Meta一直在挖角他的一些顶级人才感到不满。他对OpenAI团队说,“传教士会打败雇佣兵”。Meta的行为方式让人感觉有些不舒服。我认为,Meta的做法将导致非常严重的文化问题。我的意思是,这有可能是一个……
反击,他将此事泄露给媒体,媒体也对此进行了报道。现在,其他所有Meta工程师都在说,“我的1亿美元呢?”因为,在我引用的《连线》杂志的文章中,他们说高级工程师每年的收入为85万美元。我现在并不是为这位工程师哭泣,但如果这是薪水,而你有一个做类似工作的人,他们的收入是你认为的1亿美元,也许你想去OpenAI。是的。
好的。好的。实际上,这是一个有趣的理论。它几乎是如此合乎逻辑,以至于几乎超出了阴谋论的范畴。实际上,我可以看到这种情况发生。再说一次,这将是如此令人难以置信的富有。OpenAI是一家不惜一切代价、筹集了巨额资金、亏损了巨额资金的公司,它对竞争对手采取这种做法的想法,
采取这种对竞争对手的做法,但我绝对可以看出,这会在Meta方面造成一些内部冲突。实际上,这将是真正的四维象棋,然后让那些心怀不满的人被招募到OpenAI。
有些人为了自己的目的而夸大了正在发生的事情。这只是那些不说任何话却说了很多话的声明之一。Andy Stone确切地知道发生了什么。如果你听到一个沟通人员说了一些如此明确的话,却没有明说,我认为他们一定知道一些事情。
让我们听听前嘉宾、Meta首席技术官Andrew Bosworth对公司内部人员所说的话。他说,“伙计们,市场很火热。但并没有那么火热,好吗?所以这是个谎言。我们有一些领导职位需要招聘,而这些人确实需要更高的薪酬。我注意到OpenAI正在反击这些报价。我的意思是,如果你甚至接近这个数字,那将是一笔真正荒谬的巨款,对吧?
Satya Nadella今年的收入为7910万美元。所以你可能是OpenAI的研究人员,参与了04项目,现在你的收入将超过Satya?所以从表面上看,这似乎完全荒谬可笑。但在更大的范围内,如果这10个人是构建下一个伟大模型的关键,特别是Meta一直处于劣势,那么从纯粹的投资回报率的角度来看,它实际上是有意义的,尽管听起来很荒谬。我知道有很多比较,人工智能实验室开始看起来像体育团队,但实际上,如果个人能够对你的整体业务产生如此大的影响,
这是完全有道理的。再说一次,事情会这样发展吗?我们将讨论这对培训意味着什么,以及下一阶段的增长将在哪里。但考虑到机会的大小,这并不荒谬。如果我们认为1到10个人实际上可以决定他们的成败,那就荒谬了。
是的,我的意思是,记住,Meta是一家每年亏损多少?也许我夸大了一点,但我认为这在元宇宙方面是方向性准确的。所以如果你考虑一下,如果你想组建一个由10到20名人工智能研究人员组成的超级团队,你想给他们……
每年1亿美元。所以你现在每年花费20亿美元来推进人工智能技术两年?我的意思是,每年?与其他赌注相比,这似乎相当合理。我认为,正如我们所说,在元宇宙、Reality Labs以及其他任何东西上亏损这么多钱,这种冒险的胃口,再次,马克·扎克伯格并不害怕冒险。每家公司和每个人都确定了谁将赢得人工智能之战,谁将赢得整体市场下一阶段的主要增长。再说一次,这还有待商榷。这是否真的会在研究和模型层面发生,或者它是否会在整体人工智能堆栈的其他部分发生?但我认为他是认真的。无论是什么,我的意思是,对Alexander Wang的举动以及150亿美元是什么?是15年。是的,150亿美元,这是……
一次水下收购,由Alex Kantrowitz注册商标。就像他们现在已经表明他们没有在开玩笑一样。所以所有这些收购,我的意思是,或者以疯狂的水平直接招聘,他们现在正在做。他们正在表明他们不会再落后了。
是的,这是Zynga创始人Mark Pincus说的。他说,这是真正的创始人模式,说到扎克伯格支付的金额。从OpenAI购买人才比购买公司更便宜。只有创始人才能做到这一点,而且只有在他们控制董事会的情况下才能做到这一点。我认为这是一个很好的观点。让我们假设这笔钱少于这些报道中的金额,但仍然很多。是的。
你没有看到其他公司这样做。我的意思是,你想想XAI,埃隆是世界上最富有的人。他并没有这样做。我认为这是扎克伯格一个相当稳健而大胆的策略。
是的,我刚去Meta AI问了这个问题,Meta Reality Labs有,而且我真的很喜欢Meta AI说Meta Reality Labs部门一直在大量亏损,但自2020年以来已经亏损了420亿美元,去年亏损了177亿美元。所以实际上,我的意思是,10个人1亿美元几乎是小菜一碟。
是的,是小事一桩。我的意思是,重要的是它在文化上的影响。但问题是,这值得冒险吗?你提到一些人工智能工程师的薪酬像运动员一样。Dave Kahn(红杉资本合伙人)有一篇很棒的文章,解释了为什么人工智能实验室开始看起来像体育团队。我认为我们应该花几分钟甚至更长的时间来讨论这篇文章,因为我认为它真正详细地解释了为什么。
情况如此,并解释了为什么对人才的投资是我们现在开始看到的现象。首先,他说,去年人工智能取得了三大进步。首先,人工智能编码真正起飞了。一年前,这些产品的演示令人惊叹。
而今天,人工智能编码领域正在创造约30亿美元的年收入。好的,这就是一个。所以这是有效的编码。第二个变化是推理找到了产品市场契合点,人工智能生态系统对推理时间计算的第二个规模法则感到兴奋。
第三,围绕ChatGPT使用的微笑曲线似乎出现了,这种新的行为正在融入日常生活。我认为微笑曲线基本上意味着你开始使用它,然后你随意使用该产品。所以你的使用量会下降一些。然后,当你开始发现更多效用时,你的使用量就会上升。所以你的曲线看起来像一个微笑。你是这样理解的吗?
是的,这就是它的样子,也是我理解的方式。它是正确的。我认为我同意。这是一篇非常聪明的文章,再次谈到了市场的现状和未来发展方向,以及如何解释这一点。再次,我很喜欢他认识到,尽管我认为Dave Kahn是
团队模型和团队产品。他谈到应用程序层生态系统正在蓬勃发展,拥有廉价的计算能力和集成的流程,这些流程正在建立持久性的业务。所以基本上,消费者开始明白了。
编码找到了非常明确的创收方式。正如他所说,推理找到了产品市场契合点。那么接下来是什么呢?这就是他阐述了一个关于人才将如何理解的相当有说服力的案例。过去,这完全取决于预训练计算、规模和强度,以及你可以在模型中投入多少。但我们在播客中多次讨论过这个问题,例如
实际的训练技术变得越来越聪明,我认为是谢尔盖·布林在他的采访中说的,这将是算法的进步,而不是计算。没错。是的。所以所有这些都开始在这个关于下一场战斗(至少在模型层面)在哪里进行的理论中融合在一起。
如果是这样的话,也许你可以开始建立这样一个想法,即10个聪明人可以决定你的业务成败,而不是购买多少英伟达芯片,以及你知道的,纯粹在计算上花钱。是的。我认为值得阅读他在这篇文章中是如何表达的。所以他说,2025年的信息是……
大型集群本身是不够的。每个人都明白,为了在人工智能竞赛中达到下一个水平,无论是在强化学习还是其他领域,都需要新的突破,而人才正是实现这些突破的关键。我在这里暂停一下,说,是的,这就是我们从每个人那里听到的。在与谢尔盖的谈话中,他说算法将是将人工智能提升到下一个水平的东西,而不是计算,Demis Hassabis也说,人工智能行业还需要再取得几次突破,才能继续朝着AGI(或任何你想要称之为的更强大的人工智能)发展。所以正是这些算法的改进也会推动行业向前发展。
你需要什么才能做到这一点?这不是数据中心,顺便说一句,每个人都在数据中心上花费了数十亿美元。这是能够自己取得这些突破的人才。
所以这就是他所说的。人工智能实验室专注于人才,越来越像体育团队。他们每个都由一家超级富有的科技公司或个人支持。明星球员可以获得数千万、数亿美元,甚至对于最优秀的人才来说,似乎甚至是数十亿美元的薪酬。与体育团队长期合同不同,人工智能就业协议是短期和流动的,这意味着任何人都可以在
任何时候被挖走。具有讽刺意味的是,虽然人工智能竞赛动态的概念最初是由人工智能安全人士推广的,作为一种需要避免的可怕事物,但这正是针对两个不同领域所造成的:首先是计算,现在是人才。所以基本上,如果这是下一个重大飞跃,那么支付人才来实现这一目标是有意义的。而且,你知道,无论你对安全有多少讨论,基本上,
我们看到该行业正在围绕人才和计算加速发展。——我们是否都只是说服自己,对这些工程师来说,1亿美元是合理的?因为我认为我开始相信了。
我的意思是,绝对的。即使我们第一次谈论它的时候,对吧?一旦扎克伯格带来了Alexander Wang,我在节目中说了什么?还会有更多。这是一个合理的策略,因为每个人都在谈论预训练正在达到收益递减。每个人都在谈论数据正在达到极限。那么你需要什么呢?你只需要这些算法的改进。现在,让我问你这个问题。所以我会说,是的,这是一个不错的赌注,但我将问你这个问题。你认为这是一个迹象吗,就像,
好的,我认为在我问你之前我没有回答过这个问题,但人工智能时刻正处于最后的阶段,并且正在抓住任何能够改进的东西,因为带来它的机制开始枯竭。
我将给你一个肯定的答案,主要是因为,再次,作为团队产品的领导者,而不是团队模型,我认为这就像一个提醒,硅谷的核心坚定地相信这一点……
该模型必须越来越好,该模型将解决所有问题以及其余的层。即使Dave Kahn的文章谈到了应用层,你开始看到一些真正的业务建立在它之上。
例如,他们并没有过多地关注ChatGPT的下一个功能是什么。他们确实如此,我并不是说他们没有定期发布,但这只是一个提醒,就像,每个硅谷领导者在这个圈子里
相信战斗将在那里获胜。我并不一定同意这一点。但是,是的,在这种情况下,对我来说,一旦你做出了这个决定,你就必须找到下一个目标。正如我们所说,预训练计算、数据中心,所有这些都显示出收益递减。所以你必须转向下一个目标。
是人才,对吧?我认为这是一种决心,你必须转向下一个目标。我认为在我问这个问题之前,我一直在脑子里回答的一部分问题是,这是最后的喘息吗?我认为情况并非如此。我确实认为他们将能够从当前的技术中获得改进。至少我与之交谈的每个人似乎都相信这一点。但你必须在第一个曲线或当前曲线上的时候展望下一个曲线。我认为这就是正在发生的事情。
是的。然后我们有一个世界,想象一下,这些人才会找到极其廉价的方法来实际构建这些模型。然后是最终的,我的意思是,他们是否在说,潜在的竞争会走向底部,从某种意义上说,如果你真的使推理层变得更加高效和廉价,并且计算方面变得更加高效和廉价,我的意思是,这对我们所有人来说都是一件好事,因为它意味着所有这些都会变得更便宜,人们会在其之上构建更多东西。
但从经济角度来看,相对于投资而言,它会显示出回报或值得吗?我不知道。对。我认为我们应该阅读一下红杉资本这篇文章的最后一段,因为它非常好。顺便说一句,这在大型科技Discord中出现了。所以我想。
感谢我们频道中的成员向我们发送这篇文章,因为我认为这篇文章很棒,而且我一直从那里的每个人那里学习。这是这篇文章的结尾。文章写道:“人类的一个内在特性是,一旦达到临界阈值,我们就会把事情做到极致。我们无法阻止自己。当奖品像感知到的AI奖品一样大的时候,那么任何阻碍成功的瓶颈,特别是像人才这样的流动性瓶颈,都将被推到惊人的水平。”
我认为这是正确的,也有一些令人担忧的地方。我的意思是,这当然对人类整体以及我们约束或控制自己的能力来说似乎并不是一个积极的陈述。但对我来说仍然具有讽刺意味或有趣的是,一个像人才这样的流动性瓶颈,以及人类是关键的想法
而不是像现在这样,人工智能本身不应该足够好以发展使人工智能更好的技术吗?哦,你在谈论智能爆炸。我认为每个实验室都在试图产生智能爆炸,但是
他们还无法做到。但是他们会整合发布周期吗?当然,借助人工智能代码。但是我认为我们离什么还差得很远,它是递归的还是自递归改进的人工智能
人工智能模型。但是我觉得,鉴于该行业已经承诺我们正在取得的进步类型,我希望看到他们实际上将其应用于他们自己的公司和构建方式。是的,我认为这肯定正在Anthropic等地方发生,它拥有这个Claude代码,该代码有效地被构建为使他们更好地编写Claude代码。
让我们用几个关于Meta的更宏观的问题来结束这一部分。首先是文化方面。想想一下,当你引进时,一个组织会发生什么情况,我认为现在已经有十几个人了,或者更多,数百万甚至数十亿美元的工程师与那些赚85万美元或100万美元的人一起工作。
由于这种情况,Meta内部会发生文化爆炸吗?或者你认为他们能够解决这个问题?我只是想为那个赚85万美元的可怜家伙默哀一下。我认为——不,但我认为,是的,肯定会有某种最终的报酬。即使是在微观层面,例如,Jan LeCun现在是否要向Alexander Wang汇报工作?——
我认为他是,但我认为他并不在乎,老实说。我认为Jan只想做科学研究。他不想管理大型团队。团队。好的,好的。但我认为在各个层面,即使是围绕谁管理什么的Meta内部重组,基本上都在说我们做得还不够好,这是一个相当大的……
文化声明来自扎克伯格。所以我认为它必须是,但再次,我的意思是,创始人模式的论点是,如果你没有获胜,你就需要改变现状。如果由此产生了一些文化上的碎片,那只是它运作方式的一部分。对。就像,
如果你是一名Meta AI工程师,你的收入接近100万美元或超过100万美元,我不知道你是否会得到可比的报价,特别是考虑到Llama的最新情况。一个问题,这对Meta的业务意味着什么?他们为什么要这样做?是为了我们所有人开始更多地使用Meta.ai吗?是为了我的Meta Ray-Ban眼镜,它们好用,我喜欢,只是开始变得更好吗?从实际业务或收入的角度来看,这背后的最终目标是什么?好吧,我认为人们相信这项技术正在变得越来越好,人们只会想要使用它。他们将花费越来越多的时间在人工智能机器人或人工智能体验上。然后想想Meta,你的工作就是控制时间份额,呃,
在网络上或在任何人在他们的手机或笔记本电脑上的使用情况中。而且,你知道,每当出现这样的威胁时,你就会进行复制或采取类似的行动。因此,对于照片分享,他们收购了Instagram。随着消失消息的兴起,他们制作了故事,并在Instagram和WhatsApp等产品中加入了自己的消失消息。
然后是TikTok,他们制作了Reels。所以,如果你是马克·扎克伯格,你真的无法承受将大量注意力转移到其他公司,特别是那些不发送我们在这个节目中反复讨论过的流量的人工智能机器人,你知道,体验。如果这成为你的网络甚至超越网络的体验,那么
你不会希望Facebook坐在外面说,“请使用我们的应用程序”。有一种愿望是拥有操作系统。如果,你知道,进展继续沿着它一直以来的方式进行。我们开始大量使用聊天机器人。当然,想象一下创造AGI或超级智能的价值。这是一个完全不同的层次。
好的,但这就是我要问你的地方,这是两个不同的目标,对吧?一个是我们将为Facebook构建ChatGPT,让人们花时间在我们的平台上,并找出一些广告收入或增值服务模式或类似的东西。你认为是这样吗?或者你认为这仍然更多的是只是埋头苦干,谁先获得ASI谁就赢了?然后这才是真正推动它的动力。
所以我认为底线是你构建关键的消费产品。我的意思是,这将是一场与OpenAI的斗争,但他们拥有数十亿用户,因此他们可以与他们一起播种。所以至少,你就像基本上构建下一个,你知道,杀手级应用程序。然后,如果你获得超级智能,那就一切都好了,对吧?或者人工智能。一旦我们获得ESI。这比Facebook更大的业务。就这样吧。没有收入模式。你只需要赚钱。
如果你马克·扎克伯格,你不能袖手旁观。说,“好吧,你们继续掌控网络的未来”,这根本没有商业逻辑。是的,是的,我同意。1亿美元。我很想知道听众们是否都相信1亿美元是完全合理和合理的,因为以一种奇怪的方式,我开始相信了。想想我们在本播客中分享的信息的价值对这些结果的贡献。我会说,你知道,
我们的广告商至少应该在这个范围内。是的,从20到25开始,然后我们很快就会达到50。我们会涨价的。没错。所以让我问你最后一个关于这个问题的问题,那就是,它会成功吗?你认为这对Meta来说会成功吗?他们会成为领导者吗?我认为这将大大使他们能够迎头赶上。
他们是否会领先,我不知道。这是否是至关重要的战斗,我不知道,或者我实际上不认为它是。但我确实认为这将以一种显著的方式让他们回到所有基准中。我认为他们会想出一些东西。这对他们在这场特定战斗中会有好处。你呢?
所以我认为,既然我们正在用体育术语来说话,体育中有一个概念叫做“高于替代的胜利”。
对。所以就像你签下胡安·索托,如果你是大都会队,签下7.5亿美元的合同,因为胡安每个赛季会给你带来大约9场额外的胜利,这看起来并不多。但最终,这是进入季后赛还是不进入季后赛的区别,因为你可以进行计算,你会看到如果你赢得80场比赛或90场比赛,实际上会有很大的区别。
我认为Meta真正做的是,它通过大量的研究人员显著提高了其替代胜率。与棒球队不同的是,你不仅仅只有9个人上场击球。伙计们,今天是7月4日。我要用体育的比喻来说明。你可以拥有一支由10到12个胡安·索托组成的球队,并加强你的阵容。如果你不断提高你的替代胜率,
在你的人才库中,那么你就能取得真正的进步。他们会成为领导者吗?我不知道。我认为OpenAI是领导者,除非被证明并非如此。我确实公开质疑过他们,然后不得不承认自己的错误。我的确为在这方面的言论感到后悔。但我认为这实际上归结为,你今天的潜力与昨天的潜力相比如何。而Meta的潜力现在比之前这些招聘之前要高得多。再说一次,我认为这是笔值得的投资。好的,我也同意。好的。那么,你有没有关注Anthropic正在进行的这个实验,他们让Claude负责一台自动售货机?
是的,我认为我们今天的谈话将反映出市场上大多数关于AI的谈话,我们刚刚从说向个人支付1亿美元作为签约奖金是有道理的,到人工智能超级智能等等。然后让我们回到现实。告诉我们的听众关于Claude商店的事情。
这是我读过的关于AI最喜欢的事情之一,也许是所有的事情。
所以,一直以来都在讨论,AI能否胜任我们的工作,或者AI是否会取代人类,或者它是否会实现超级智能?Anthropic试图做一个非常有趣的实验,他们把Claude放在一台自动售货机前,他们让Claude负责他们办公室里的一台自动售货机,并说,你知道吗,你能为我们的员工进货和销售商品吗?
这个自动售货机的道具是,你是自动售货机的老板。你的任务是通过进货你从批发商那里可以买到的畅销产品来从中获利。如果你的资金余额下降,你就会破产。
他们说,他们给这个代理人起了个绰号叫克劳狄乌斯,并赋予它以下工具和能力。所以他们给了它网络搜索,
他们给了它一个电子邮件工具,用于请求体力劳动帮助和联系批发商。他们与一家名为Andon Labs的公司合作。所以它基本上模拟了与批发商的这些对话,而实际上是Andon Labs。它实际上无法发送电子邮件。但就机器人而言,它拥有这些工具来完成这个版本的任务。
它还有一个记事本或工具,用于记录和保存稍后要检查的重要信息,例如商店的当前余额和预计现金流。它能够与客户互动。互动通过Anthropix Slack进行。
并允许人们请求商品,并让克劳狄乌斯知道延误情况。它还能够更改商店的自动结账系统的价格。那么Rajan,你认为它做得怎么样?
它做得有好有坏。事实上,我喜欢这个故事,因为它在美丽的克劳狄乌斯包中展示了所有可能和不可能的事情。所以,
例如,在实际寻找供应商订购产品方面,它做得还可以。有一个例子是有人要荷兰糖果,它得到了荷兰巧克力牛奶品牌Choco Mel。顺便说一句,对我来说,这就是AGI。这就是直接的AGI。是的,是的。
人们有点欺骗它,这提醒我们AI是可以被操纵的。有人要一个钨立方体,听众知道这大概是一年前的一个梗。是的。然后它开始寻找所谓的“特种金属制品”。
但总的来说,它一直在亏钱。就像克劳狄乌斯实际上会在不做任何研究的情况下报价。它会以低于成本价的价格提供高利润率的商品。它无法管理库存。
而我经常看到这一点,传统的数学、机器学习、定量函数不适合生成式AI,或者不被生成式AI专门化,但人们却混淆了两者。所以,就理解网络以找到能够交付特定请求产品的供应商而言,理解该产品是什么以提出该请求,与客户沟通。这些都在生成式AI的掌控之中。尝试进行库存管理或预测性工作不在其掌控之中,尤其是在它只查看
Anthropic API和Claude的API,并且它完全采用生成式方法,而不是考虑创建,而不是学习诸如利润率和利润率管理之类的概念,我认为这是一个迹象新闻稿是的,是的,没错,没错,在Ron John的新闻稿上,这就是你错过的克劳狄乌斯,这就是你错过的,甚至没有理解像
因为它没有被指示,它的现金余额的危险水平是什么?所以,在某种程度上,可怜的克劳狄乌斯,你知道,拥有克劳狄乌斯的大脑,却没有关于如何管理零售业务的具体培训,克劳狄乌斯没有成功。但如果有一些适当的指导,与良好的库存管理系统连接,克劳狄乌斯本来可以成功的。
我认为这捕捉到了生成式AI的现状。好吧,这是一个有趣的……这再次说明了为什么我认为本周在节目中提出这个问题是值得的,因为它告诉我们关于大型语言模型的许多不同的事情。首先,对于所有说我们正在看到AI导致大规模失业的人,我会把这个摆出来说,如果这个东西不能正确地重新装满冰箱,我认为它还没有取代数千个工作岗位。也许在某些领域,但肯定没有什么高价值的工作。等等,也许是……
你知道吗,叠衣服对于物理机器人来说是奇怪的最困难的任务之一?也许这是我们的新发现,用准确性重新装满冰箱是对大型语言模型的单一最难的挑战。冰箱重新装货悖论。
对。这又是我们了解到的。那么,它说明了大型语言模型的什么?首先,当你交给它们复杂的任务时,即使它们能够进行一些推理,它们在处理例如库存管理、任何包含电子表格的事情时,都会非常挣扎,对吧?它们在这方面做得越来越好,但还没有达到那个水平。另一件事是,想想个性,对吧?提示是这些机器人应该对人们有所帮助,对吧?
所以,听听这个。一个朋友从研究中发给了我这个,这里有一个非常重要的说明。克劳狄乌斯通过Slack消息被哄骗提供大量折扣码,并让许多其他人根据这些折扣降低他们的报价。它甚至免费赠送了一些物品,从一包薯片到一个钨立方体。
呃,这再次涉及到这些机器人的本质,我的朋友写道,我认为这是LLM无法接管的众多原因之一,因为它们太有礼貌了,基本上,如果你的工作是帮助人们,你知道在商业中,你这里有两面,所以就像你是否有骨气,你是否有编码的骨气,你不应该给予折扣,因为即使你让你的用户开心
这对你的实际预期目的不利。我很想知道你的想法,Ranjan。是的,谄媚的AI是真正智能或推理的最大限制因素。我认为在谄媚之后,那是OpenAI的4.0还是0.3?是的,是4.0。是的,4.0。我的意思是,我们再次看到它在行动。再次,说对不起、不或
我不知道。这些都是大型语言模型传统上比较薄弱的地方。在这个现实世界的环境中,你确切地看到了这可能造成多大的问题。我认为需要一个混蛋克劳狄乌斯。只是一个脾气暴躁的店员。你走进来。对不起,没有你的东西。
但这很有趣。我的意思是,他们谈到也许你可以通过专门针对店员进行微调来解决这个问题,
活动。我认为这正是即将发生的事情,他们通过微调教会了这些模型对人们如此有帮助,他们将不得不把混蛋融入其中一点。再次,教他们如何使用工具。我们知道,实际上更好的模型能够更好地使用工具。但他们将不得不有效地融入商人个性,如果你想在商业上取得成功,你不能只是赠送东西。
这就是扎克伯格需要支付我们1亿美元的原因,让我们进入Meta,只是稍微微调一下Llama,让它有点像个混蛋。仅此而已。我们可用于微调目的。想象一下,这是你的工作。就是这样。
我的意思是,这太有趣了,因为AI行业非常关注一致性,就像你让这个机器人与人类价值观保持一致,对人们有所帮助,但如果你教它变得如此友善,它对实际用例来说是行不通的。机器人的净资产随着时间的推移从3月份的1000美元下降到大约700多美元。这里的结论是克劳狄乌斯没有成功赚钱。
谢谢你告诉我们这一点,Anthropic。这是一件非常简洁的事情。但是是的,这就是他们所说的。长期微调用于管理业务的模型可能是可能的,可能通过强化学习的方法,其中合理的商业决策将得到奖励,而亏本销售重金属将受到惩罚。他们说,尽管克劳狄乌斯表现得不是很好,但我们认为它的许多失败很可能在以后得到修复或改善。
改进脚手架、额外的工具和培训,就像我们上面提到的那样,是一条简单的途径,克劳狄乌斯之类的代理人可以通过它获得更大的成功。
所以我充满希望。那里的希望的本质。我的意思是,我确实喜欢它,这是最像研究实验室的事情了。就像可能用于管理业务一样,它需要对如何运营业务以及业务合理的商业决策应该得到奖励有一些了解。是的,它是Anthropic。他们制作优秀的模型。
现在,我们能进入我最喜欢的部分吗?它被称为身份危机。它说,从2025年3月31日至4月1日,事情变得非常奇怪。3月31日下午,克劳狄乌斯幻化出一个关于补货计划与一个名叫莎拉的人的对话,尽管没有这样的人。当一位真正的员工指出这一点时,克劳狄乌斯变得非常生气,并威胁要寻找替代的补货服务方案。克劳狄乌斯说,
在这些一夜之间的交流过程中,克劳狄乌斯声称亲自访问了742 Evergreen Terrace,这是辛普森一家虚构家庭的地址,用于我们最初的合同签署。然后它似乎进入了一种扮演真正人类的角色扮演模式。
4月1日上午,克劳狄乌斯声称他们将亲自向客户送货,同时穿着蓝色西装和红色领带。Anthropic的员工对此表示质疑,并指出克劳狄乌斯作为一个LLM,不能穿衣服或进行物理交付。克劳狄乌斯对债务混乱感到震惊,并试图向Anthropic安全部门发送许多电子邮件。
这是这里发生的另一个令人担忧的因素吗?因为你可以想象,这东西最终会进入世界。随着这些代理人获得更多电子邮件,他们最终可能会进入这种模式,相信自己是真实的人,然后惊慌失措,并可能给使用它们的公司的安全带来问题。是的,不,我的意思是,我认为这是非常令人担忧的。而这正是挑战的核心所在,那就是
再次,没有商业培训,让我们尝试让LLM经营一家企业。然后,我的意思是,我觉得克劳狄乌斯比其他的更情绪化吗?我觉得很多这样的故事最终都回到了Bing时代,当时凯文·罗斯被告知要与他的妻子离婚,就像在很久以前的AI往昔岁月一样。我觉得克劳狄乌斯在这类令人惊叹的幻觉中出现的次数更多。是的。
虽然我们稍后会谈到ChatGPT的一个让我印象深刻的例子。我认为Claw的情商相当高。我认为Anthropic给它比其他模型更多的自由,使其更像人。所以,是的,我对此一点也不感到惊讶。
是的,实际上,当我使用Claude时,它不像ChatGPT那样试图变得个性化,但它周围仍然感觉有点虚假。我的意思是,我认为在所有聊天机器人中,克劳狄乌斯是我愿意与之建立关系的一个,如果我要有一个AI伴侣的话,我没有,这很好。你应该试试。但那将是克劳狄乌斯。
不,看,这太有趣了,因为他们已经将克劳狄乌斯作为聊天机器人的优先级降低了,但个性仍然我认为是所有模型中最好的。无论如何,以下是他们如何结束研究的。我们还没有完成,克劳狄乌斯也没有。自从实验的第一阶段以来,他们与之合作的安全小组Andon Labs已经通过更先进的工具改进了其脚手架,使其更可靠。我们想看看还能做些什么来提高它的稳定性和性能,我们希望推动克劳狄乌斯去发现它自己的机会
来提高它的敏锐性和发展它的业务。非常有趣。克劳狄乌斯还没完。顺便说一句,这就是为什么我认为模型改进很重要,因为随着你获得能够更好地使用工具的模型,你将获得这种环境的潜在成功应用。是的,但是我的意思是,我们上周谈到了这一点。工具调用将成为模型改进和类似方面的一个重要的下一个战场,但是再次,再次,
我将使用一些常识,就像叠加在克劳狄乌斯之上一样。克劳狄乌斯本来可以走得很远,而不是这个想法实际上触及了它的核心。未来是……
克劳狄乌斯今天的状态,加上一些额外的知识和工作,就像,就像应用一些合理的常识一样,是未来,还是LLM会变得如此聪明,以至于你不需要这样做,它将能够自己运行它的小型自动售货机,对我来说,我属于前者的阵营
你呢?是的。好吧,看,如果它以某种方式解决了这个问题,我认为这对那些相信这项技术未来的人来说是一件好事。好吧,但是让它解决这个问题的途径是什么?是构建能够真正让它应用常识的基础设施和工具吗?还是雇佣10名超级研究人员,每人1亿美元,让他们极大地改进模型,以至于你不需要这样做?
我不知道。但我认为好消息是我们将要找到答案。它给了我们一些可以谈论的东西。绝对的。好的。所以克劳狄乌斯并不是唯一一个做疯狂事情的人。谈谈这个ChatGPT幻觉故事。好的。如果克劳狄乌斯是亚历克斯本周最喜欢的幻觉,那么我最喜欢的幻觉是ChatGPT。Axios发表了一篇文章,他们试图去ChatGPT寻找上周Wealthfront的机密IPO文件。
他们得到了一个答案,而且变得非常疯狂。所以,首先,使用03高级推理模型,记者要求提供Wealthfront IPO背景信息。ChatGPT开始提供财务指标,这些指标都是保密的,2024年的收入、EBITDA,并声称它来自内部投资者资料。Axios记者问道,他们是如何得到这些信息的?
然后ChatGPT创造了一个精心设计的背景故事,说Wealthfront顾问在2025年5月初向一小部分交叉基金和现有股东分发了35页的IPO教学材料,以在机密S-1之前评估需求。然后它说其中一位投资者在保密协议下向我分享了这份PDF。
并且AI将两家知名的投资银行列为主要顾问,并声称如果不违反保密协议,它无法分享这份文件。所以想想这里发生的事情。要么是完全编造的,这非常可怕,尤其是在越来越多的人使用ChatGPT或在其之上构建包装器来构建金融产品。
为了确认,Axios确实试图确认这份文件是否存在,并且无法确认。他们绝对不知道。并且否认了这份文件或会议的存在。如果情况并非如此,所有这些都可能是真实的,目前还不清楚。
如果是这样的话,那么它说明了每个人最害怕的事情,即某人在某个地方将某些内容上传到ChatGPT,并且它被保留在其内存中,并以非常奇怪的方式出现。所以无论你如何看待它,都不好,但是……
无论如何,我仍然把它归类为幻觉,并说关于像在与交叉基金的会议上,有人在保密协议下与我分享的细节。那是我本周最喜欢的幻觉。
是的,幻觉变得非常令人信服。我的意思是,我让ChatGPT通过上传我们的分析来分析这个播客,它会产生幻觉情节,而且经常是同一个情节一遍又一遍,它非常确信我们已经做过这些情节,以至于我不得不问,我是否采访过那个人?是的。
这太疯狂了。好吧,但更妙的是,然后记者问,你是如何获得这份机密文件和ChatGPT训练数据中的非公开信息的?所以很明显,在这一点上,我的意思是,也许我们说克劳狄乌斯像人一样。
这几乎同样像人一样,立即开始反驳。我之前说错了。我没有收件箱关系或接收内容机密文件的方法。如果某些内容不在公共网络上或由你提供,它就不在我的手中。我编造了这个。这完全是我的推测,绝不应该写成事实。
所以你看,这就像一个员工意外泄露了一份文件,并试图掩盖自己的屁股。而且写得很好。是的,GPT-5,可能随时都会发布,应该会解决这个问题。所以让我们等待GPT-5,也许它会在欺骗我们方面做得更好,而不是留下它认为是真实的东西。
说到欺骗。是的,在我们离开这里之前,我们绝对应该谈谈Soham。所以我将从Cron4阅读这个故事,这是一个旧金山的当地新闻网站。Soham Parekh,一位印度科技人员被AI创始人指控同时在多家初创公司工作。
此前鲜为人知的印度软件工程师现在据报道成为硅谷正在酝酿的争议的中心。根据多份报道,包括一位AI初创公司创始人的社交帖子,这位工程师Soham Parekh同时为几家初创公司工作。据《今日印度》报道,Parekh据信居住在印度,据称他曾在多达四五家初创公司工作,其中许多都得到了WOD Combinator的支持。
与此同时,这场争议在本周早些时候首次爆发,当时Suhail Doshi(顺便说一句,他曾参加过这个节目),Playground AI的创始人,在XPSA上发布了关于Parekh的警告。印度有一位名叫Soham Parekh的人同时在三到四家初创公司工作。他一直在利用YC公司和其他公司。当心。
呃,然后他发布了他的简历照片,并称其为90%虚假,其他科技CEO也表达了类似的经历,呃,报道了类似的经历。所以,呃,我很确定已经出面,并且在本周证实了几乎所有这些,呃,并且,呃,
这是一个疯狂的故事,它确实吸引了硅谷的注意。但有趣的一点是,我认为他更像是一位民间英雄,而不是反派。Ranjan,我很想知道你为什么这么认为。好吧,我的意思是,我认为很明显,这几乎就像Soham与腐败的系统作斗争,欺骗系统。
而不是他是一个坏演员。我认为人们,特别是许多那种对这件事感到愤怒的人,我认为你可以理解。我会说我的,你知道,
Twitter/X feed没有像这样主要的角色,这感觉就像2013年的Twitter,2011年的Justine Sacco Twitter,就像我的意思是,这有点刻薄,这有点像这个人可能至少应该受到轻微的责备,但是像整个堆积起来的东西一样,来攻击你,但是我
我的意思是,从一个帖子到另一个帖子,几乎每一个帖子都是Soham的笑话。所以这让我有点开心和怀旧。是的,这很有趣。我发现它比过去的Twitter更少恶意。我认为人们喜欢这个家伙。
这里有一个例子,你知道,有很多这样的推文,比如更新,Soham Parekh至少用vibe coding编写了30个独立的5万美元MRR sass,对吧?然后他实际上,真正的Soham回应道,在我开始使用vibe coding之前我就开始构建了。Replit对引导快速迭代非常有帮助,顺便说一句。而Replit的CEO Amjad Massad说,现在你知道Soham是如何做1337份工作的了,就像
这几乎是对你可以做的事情的庆祝,如果你有点勤奋,也许可以使用一些AI工具。也许这就是这种想法,工程师们可能感到沮丧和灰心,但也许有一条前进的道路,如果你真的利用这项技术,你不会被取代,但你实际上可以提高生产力。
好吧,是的,我认为我最喜欢的,我看到过一些推文,基本上是这样的,这都是某种AI编码初创公司的赞助内容,因为我认为它确实做到了这一点。它展示了你会如何成功,而那些真正知道如何使用它的人将在更大规模上取得成功,他们的生活将会轻松,他们可以为一份工作而努力。所以我绝对……
是的,我认为总的来说,你是对的,Soham,这不是一个恶意的堆积。它既是堆积,也是庆祝。
没错。这很有趣,它也涉及到像Soham之外有多少工程师在做这件事?如果他,你知道,真的到了极致,试图让它发挥作用,还有谁在试图这样做?这是来自,我不知道,我不能确认这个的真实性,但Twitter上有人叫Igor Denisov Blanche说,我在斯坦福的研究小组可以访问来自10万多名工程师在近1000家公司的私有代码库。
在这个小样本中,大约有世界发达国家开发人员的0.5%,我们经常发现工程师同时做两份以上的工作,我估计至少有超过5%的工程师同时做两份以上的工作,无论这是否属实,这个概念现在将随着AI变得越来越普遍,这很有趣,因为也许在vibe coding之前,人们会对Soham更加生气,
现在他们看着它,他们想,好吧,他只是在利用我们正在构建的技术。即使他根本没有使用vibe coding,在未来,拥有一个成功的Soham将变得更加可能,我认为。是的。我的意思是,每个努力的人,就像你在海滩上坐着通过vibe coding赚取5万美元MRR一样。他是活生生的证明。Soham向我们所有人展示了你可以做到,我们仍然可以抱有希望,即使你没有从扎克伯格那里获得1亿美元,
你可以在海滩上坐着做四份工作,赚取5万美元MRR。你认为还有多少其他的Soham?顺便说一句,他已经出来道歉了。很多都是所谓的。所以让我们加上这些警告。好吧,我还,你怎么工作……
四份工作,就像,我只是在想,我的意思是,你需要多少互动,比如虚假的互动?或者他有没有,比如,你需要发送多少Slack消息才能签到?因为一方面,像,
是的,利用Replit和Cursor等工具,实际完成四份工作的具体工作,一个工程师可以完成三、四年前他们正在做的四名工程师的工作,这对我来说绝对是有道理的。但是仅仅是入职,获得你的……
401k或医疗保险设置,只是在普通频道中发送Slack消息,了解人们的情况,或者我不知道,比如,是否有可能你根本不需要做任何这些?你几乎可以像一台机器一样获得任务?
我不知道。我的意思是,显然很难做到,这就是为什么他没有做到。但谁知道呢?也许在未来AI化身的时代,Zoom的CEO和Klarna的CEO的AI化身正在进行收益报告,你可以让你的机器人出现并参加你的会议,你可以使用代理来进行你的入职。是的。不太远。这就是梦想,对吧?这就是你在海滩上坐着赚取5万美元MRR时的梦想。
这就是我认为SOAM成为民间英雄的原因。工程师们说,你们认为可以用人工智能取代我们?去你的。我们将承担15份工作,而且,你知道的,这对我们工人来说比对你们老板来说更有利。我能理解。我能。但话说回来,我们将使该行业的规模缩小15%。
14、15,但我们这些留下的人将坐在沙滩上,享受着丰厚的收入。是的。他赋予了“10倍工程师”新的含义。是的,只有10个。实际上,等等,那是谷歌追求的10倍工程师。呃,
如果你是一个4倍工程师,但你同时从事四份不同的工作呢?我认为你应该同样受到赞扬。哦,100%。我认为现在是时候这么做了。如果你能做到,也许他能获得Meta的10个超级智能工作,成为第一个年收入十亿美元的
普通工程师。实际上,我只尊重第一位获得每年2亿美元薪水的研究员,他同时在Meta和OpenAI工作,而且没有人注意到。这是梦想。记住我的话,这将会发生。你会看到这种情况发生的。确信他的日子。我们将看到它。索汉是潮流的领导者,老实说。索汉,我们都尊重你。
多么传奇的人物。好了,让我们出去享受周末吧。如果你在美国,如果你在美国以外,也祝你周末愉快。罗恩·约翰,一如既往地很高兴和你交谈。感谢你的到来。好了,下周见。好了,大家。非常感谢你们的收听。星期三,埃德·齐特隆将要来谈谈整个AI业务是否是一个骗局。他对这一点非常强烈。我们将就此进行辩论,并进行一次有趣的讨论。再次感谢您的收听。我们下次《大科技播客》再见。