We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
A
Andrej Karpathy
N
N.L.W.
Topics
Andrej Karpathy: 大型语言模型(LLM)的出现,颠覆了以往技术传播模式。以往新技术通常稀缺、资本密集且需要专业技术知识,但LLM却反其道而行之,普通大众从中受益匪浅,而企业和政府机构的影响相对较小且滞后。ChatGPT作为史上增长最快的消费者应用,拥有数亿周活跃用户,其应用范围涵盖写作、编码、翻译、辅导、摘要、深度研究、头脑风暴等多个领域。这并非简单的升级,而是对个人能力的重大提升,使用门槛极低,模型廉价甚至免费,速度快,任何人都可以通过网址或本地机器访问,并支持多种语言和表达方式。这种技术突破前所未有。然而,在企业和政府领域,LLM的益处却相对有限。原因有三:首先,LLM的能力在于提供广泛但浅显的准专家知识,而组织的优势在于集中各种专业知识。虽然LLM可以提高专家的效率,但对组织的整体提升有限。其次,组织面临的问题更复杂,需要更多的协调工作,例如系统集成、品牌规范、安全协议、隐私考虑、国际化、合规和法律风险等,这些因素难以纳入LLM的上下文窗口。第三,大型组织存在固有的惯性,包括文化、历史先例、政治因素、沟通成本、员工再培训挑战和官僚主义等,这些都阻碍了LLM的快速采用。总而言之,目前LLM对个人的影响远大于对组织的影响。 展望未来,LLM的持续普及取决于性能提升和资本支出的动态范围。目前,尖端LLM性能易于获取且廉价,但未来情况可能发生变化。一旦资金能够购买到性能显著提升的LLM,大型组织将集中资源购买更强大的智能,社会精英与普通大众之间的差距可能再次扩大。但至少目前,我们正处于技术史上一个独特且前所未有的局面。许多科幻作品并未预测到AI革命将以这种方式发展,它并非由政府秘密项目掌控,而是像ChatGPT一样,一夜之间免费出现在每个人口袋里的设备上。 N.L.W.: Andrej Karpathy的观点很有见地,它帮助我们理解AI目前如何改善现状。企业是由专家组成的,而个人通常只擅长少数领域。因此,对于个人而言,AI能够将他们在大多数领域的水平从新手提升到中等水平,这比对专家的提升更有意义。AI对个人的应用场景远多于对专家的应用场景。 大型语言模型可能会导致企业内部核心职能和次要职能的分化,并促进数字员工的兴起。企业可能会选择不招聘某些技能,因为AI工具已经足够胜任。这尤其体现在代理(agent)的兴起上,企业可能会选择低成本的数字员工,即使其能力不如人类员工。很多企业对代理的应用会从边缘职能开始,例如销售和营销部门。 虽然大型语言模型对个人的影响更大,但其在企业领域的应用速度也远超以往任何技术。企业对AI的采用速度非常快,这与以往任何技术都不同。企业上下都意识到AI是具有颠覆性的力量,它不仅带来了新的工具,还解锁了全新的效率和机遇。虽然企业在实验方面受到限制,但许多企业正在积极拥抱外部实验,并将经验应用到内部流程中。 大型语言模型的普及将极大地促进自下而上的创业活动。许多以前难以实现或资本密集型的活动现在变得更容易,这将激励更多人创业。

Deep Dive

Shownotes Transcript

谢谢。

大家好。在我们深入今天的节目之前,快速说明一下。首先,正如我几次提到的那样,对于那些正在寻找 AI Daily Brief 无广告版本的人,您现在可以前往 patreon.com/ai daily brief 找到它。最后,我想了解一下人们对此的看法。

AI Daily Brief 社区一直非常支持并参与到超级智能的故事中。我们正在考虑为来自这个社区的投资者保留我们当前轮次的一部分。但是,我正在尝试评估兴趣。如果您认为我们应该探索这一点,请发送邮件至 [email protected],主题为“super”。提前感谢您的意见。有了这些,让我们进入今天的节目。

大家好。欢迎回到 AI Daily Brief 的另一期长篇阅读节目。在我们开始之前,还有一个快速的提醒。当您收听时,我正在佛罗里达州,可能正要给孩子们带来他们第一次迪士尼乐园之旅的惊喜,这应该很棒。但是,正如我提到的那样,这意味着下周的节目有点不同。我们有一系列非常有趣的采访。

有很多关于代理、氛围编码和重大技术变革的讨论,我认为这些将是一个非常有趣且富有启发性的节奏变化。如果发生一些疯狂的事情,您可以放心,我会找到一种方法来参与其中并与您分享一些内容。但与此同时,假设这种情况不会发生,我们将有一周的预先录制的采访,然后我们将在下周末回归,进行复活节长篇阅读周日,然后是正常的节目。

但是,现在,让我们来看看 Andrej Karpathy 最近发布的这篇文章。它基本上是一篇博客文章,但分享到了 X 上。当我们能够阅读该领域一位伟大思想家的作品时,这总是非常令人高兴的,尤其是因为这些类型的作品往往比发表在彭博社社论版块的文章更具对话性。通过选择将其发布在 X 上,

Andre 邀请了讨论和对话。我们过去已经看到,当 Andre 邀请讨论和对话时会发生什么。当这位男士引入“氛围编码”一词时,尽管它与他最初使用的含义有点不同,但这显然是今年最具影响力的概念之一。无论如何,这篇文章名为《权力属于人民:大型语言模型如何改变技术传播的模式》。我们将首先阅读它,然后我将回来讨论它。再次感谢大家,这实际上是我在阅读而不是 AI。

Andre 写道:

这种进展感觉很直观。在早期阶段,新的强大技术通常稀缺、资本密集型,并且其使用需要专门的技术专业知识。因此,大型语言模型展现出这种模式的戏剧性逆转,这让我感到非常独特和非凡。它们为普通人带来了不成比例的利益,而它们对公司和政府的影响则更加温和和滞后。

ChatGPT 是历史上增长最快的消费者应用程序,拥有 4 亿周活跃用户,他们使用它进行写作、编码、翻译、辅导、总结、深入研究、头脑风暴等。

这不是对之前存在的技术的微小升级。它是一个个体在广泛能力上的强大倍增器,并且使用的障碍非常低。这些模型价格低廉,甚至免费,速度快,任何人都可以按需通过 URL 甚至本地机器访问,并且它们使用任何人的母语,包括语气、俚语或表情符号。这太疯狂了。据我所知,普通人从未经历过如此迅速而戏剧性的技术突破。

那么,为什么公司和政府领域的益处要温和得多呢?我认为第一个原因是大型语言模型提供了非常具体的可行性特征,即仅仅是准专家知识和绩效,但同时涵盖了非常广泛的领域。换句话说,它们既多才多艺,又肤浅且易错。与此同时,一个组织的独特优势在于能够通过雇用工程师、研究人员、分析师、律师、营销人员等将不同的专业知识集中到一个实体中,

虽然大型语言模型当然可以提高这些专家的个人效率,例如起草初步法律条款、生成样板代码等,但对组织的改进表现为在它已经能够做的事情上变得更好一点。相比之下,一个人通常最多只能在一个方面成为专家。

因此,大型语言模型提供的广泛准专业知识从根本上使他们能够做以前无法做的事情。人们现在可以进行氛围编码应用程序。他们可以处理法律文件。他们可以理解深奥的研究论文。他们可以进行数据分析。他们可以为品牌和营销生成多模式内容。他们可以在无需额外专家参与的情况下,以足够的能力完成所有这些工作。

其次,组织处理的问题复杂性更高,需要协调。考虑各种集成、遗留系统、公司品牌或风格指南、严格的安全协议、隐私考虑、国际化、法规遵从性和法律风险。有更多的变量、更多的约束、更多的考虑因素以及更低的错误容忍度。将所有这些都整合到上下文窗口中并非易事。你不能仅仅通过氛围编码来解决问题。你可能因为一次灾难性的幻觉而丢掉工作。

第三,大型组织存在有据可查的惯性,包括文化、历史先例、在快速变化时期升级的政治势力范围、沟通开销、分布式员工的再培训挑战以及老式的官僚主义。

在快速采用这种闪亮的新型、多功能但肤浅且易错的工具时,这些都是主要的阻力。我并不想低估大型语言模型对公司或政府的影响。但至少目前以及在整个社会中,它们对个人的改变比对组织的改变要大得多。玛丽、吉姆和乔经历了大部分好处,而不是谷歌或美国政府。

展望未来,大型语言模型的持续传播当然取决于持续的性能改进及其能力特征。整体效益分配尤其有趣,并且很大程度上取决于性能作为资本支出的函数的动态范围。今天,前沿级大型语言模型的性能非常易于访问且价格低廉。除此之外,你无法花费额外的资金来获得更好的性能、可靠性或自主性。金钱买不到更好的 ChatGPT。比尔·盖茨与 GPT-4.0 的对话方式与你一样。但这能持续下去吗?

训练时间缩放、增加参数和数据、测试时间缩放、增加时间以及模型集成、增加批次,这些都是增加动态范围的因素。另一方面,模型蒸馏,即通过训练来模仿大型模型来训练不成比例的强大小型模型的能力,一直是降低动态范围的因素。

当然,一旦金钱能够购买到明显更好的 ChatGPT,情况就会发生变化。大型组织可以集中其大量资源来购买更多智能,而在个人类别中,精英阶层可能会再次与社会其余部分分离。他们的孩子将由 GPT-8 Pro Max High 辅导,你的孩子将由 GPT-6 Mini 辅导。

但至少在目前,我们发现自己处于技术史上独一无二且前所未有的境地。如果你回顾各种科幻小说,你会发现很少有人会预测人工智能革命将呈现这种进展。它应该是一个由将军们掌握的绝密政府超级大脑项目,而不是 Chachipi T,它基本上在一夜之间免费出现在每个人口袋里的设备上。

还记得威廉·吉布森的那句话吗?未来已经到来,只是尚未均匀分布。令人惊讶的是,未来已经到来,而且分布得令人震惊。权力属于人民。我个人非常喜欢它。今天的节目由 Vantub 提供赞助。

Vanta 是一个信任管理平台,可帮助企业自动化安全和合规性,使他们能够展示强大的安全实践并扩展规模。在当今的商业环境中,企业不能仅仅声称拥有安全性,他们必须证明这一点。实现与 SOC 2、ISO 27001、HIPAA、GDPR 等框架的合规性是企业展示强大安全实践的方式。

每次我们将企业与 Superintelligent 的代理服务提供商联系时,我们都会看到这一点的重要性。对于企业来说,许多这些合规框架根本无法协商。

问题在于,处理安全和合规性既费时又复杂。这可能需要数月的努力,并占用宝贵的时间和资源。Vanta 通过自动化 35 多个框架的合规性使其变得轻松快捷。它可以在几周而不是几个月内让您准备好接受审核,并为您节省高达 85% 的相关成本。事实上,最近的一份 IDC 白皮书发现,Vanta 客户每年获得 535,000 美元的收益,并且该平台在短短三个月内就能收回成本。

事实胜于雄辩。超过 10,000 家全球公司信任 Vanta,包括 Atlassian、Quora 等。在有限的时间内,听众可以在 vanta.com/nlw 获得 1,000 美元的折扣。这是 vanta.com/nlw,可享受 1,000 美元的折扣。

今天的节目由 Super Intelligent 提供赞助,更具体地说,是由 Super 的代理准备情况审核提供的赞助。如果您已经收听了一段时间,您可能已经听我说过这个,但基本上,代理准备情况审核的想法是,这是一个我们创建的系统,可以帮助您为您的业务设定基准并规划机会。

在您的组织中,代理可以专门帮助您解决问题,以一种完全针对您的方式创造新的机会。当您进行此类审核时,您将进行基于语音的代理访谈,我们将与您的一些领导和员工合作。

来规划组织内部正在发生的事情,并找出您在代理旅程中的位置。这将产生一个代理准备情况评分,其中包含一组深入的解释、优势、劣势、主要发现,当然还有一组非常具体的建议,然后我们可以帮助您找到合适的合作伙伴来实际履行这些建议。因此,如果您正在寻找一种启动您的代理策略的方法,请发送电子邮件至 [email protected],让我们将您连接到代理时代。

我认为这里有很多有趣的东西,我将以诚实的方式、没有特别的顺序来处理它,这只是我对这篇文章进行反思时的一系列想法。首先,我认为这实际上是一个非常贴切的观点,它帮助我们理解人工智能目前如何改进事物,即认识到公司是由专家组成的,而个人天生只能在很多事情上成为专家。

因此,鉴于个人在很少的事情上是专家,而在绝大多数事情上是新手,人工智能将他们从新手提升到中等水平或从新手提升到设计、编码等方面足够的能力,这通常比在他们为之贡献的公司环境中以专家身份工作的人的改变更大。

基本上,对作为个体工作的个人有价值的用例范围天生就高于对作为专家的专家有用的用例范围。

我认为这是一个非常贴切的观点,我还认为它将影响这些事物如何在企业和公司内部扎根。一个有趣且不明显的结果,尽管现在感觉它可能越来越明显了,那就是公司内部核心职能和辅助职能之间的更强区分。

当涉及到这些辅助职能时,使用人工智能工具来完成这些事情的新手专家(主要工作是专家)的能力可能足够好。换句话说,公司可能会决定不招聘他们以前会招聘的某些技能和专业知识,因为即使他们确实必须做某事,但这也不是业务的核心。人工智能版本已经足够好了。

现在,显然,如果您坐在那里大喊代理、代理,我认为您正确地认识到这似乎是我们可能看到人们选择雇用数字员工而不是人类员工的地方。体现和接受这种足够好的方法之一是选择低成本的代理选项,是的,它可能仍然无法与一流的人类版本竞争,但对于一个认为这件事很重要但并非关键任务的公司来说,这完全足够了。

您下周在我们的采访对话中会听到很多主题,那就是代理的很多起点都将处于边缘。在销售组织、营销团队中,这并不是说这些事情不重要,但它们与业务的核心职能是分开的。

但是,我认为需要注意的第二件事是,虽然我总体上同意,如果您只考虑以自身能力工作的个人和以专家身份在公司工作的个人,人工智能和大型语言模型特别对以自身能力工作的个人产生了或具有更大的影响潜力。我认为 Andre 的论点可能会误导人们理解这些技术在企业领域的巨大影响和速度。

如果您查看公司部门中技术变化和采用率的先前速度,并将其与人工智能进行比较,则绝对没有可比性。企业和公司为了至少尝试采用这些技术而彻底重新调整自身的速度是前所未有的。

组织上下都明白,这些都是具有巨大破坏性的力量。它们不仅仅是新的工具。它们正在释放出全新类型的效率以及我们几乎尚未触及的全新类型的机遇。相对于一般公司惯性的压力,采用速度实际上非常快。现在,正如我所说,这并没有削弱他的观点,即人们自己更快地弄清楚这些事情确实非常强大。

事实上,我们正在看到很多自然演变和进步,人们使用他们的个人 Gmail 帐户来弄清楚事情,然后慢慢地将他们学到的东西带到办公室。一些非常聪明的组织正在做的事情(一些可能落后的组织没有做的事情)是积极地将外部实验纳入内部新流程采用渠道。

组织和企业对他们可以多么自由奔放和实验性受到限制。但是,我想说的是,总的来说,他们高估了风险,并且低估了让人们进行实验的方法,即使他们无法使用公司数据。我要说的最后一件事是,我认为 Andre 注意到的这种技术传播进展的另一个结果是,我们可能会看到自下而上的创业活动急剧增加。

以前似乎对人们来说难以企及的活动,或者由于他们必须雇用某人来做而导致资本受限,并且阻碍了他们去做他们一直想做的事情的活动,已经大大减少了。这意味着那些将摆脱他们正常企业束缚并尝试去做他们一直梦想的事情的人数将会增加。

我认为我们将看到小型企业创业者、个体经营者、建造事物的人数绝对爆炸式增长,因为这变得更容易了。这是我最期待看到的结果之一。无论如何,非常感谢 Andre 提供了另一篇发人深省的文章。一如既往,感谢大家收听或观看。下次再见,和平。