We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 869: AI Should Make Humans Wiser (But It Isn’t), with Varun Godbole

869: AI Should Make Humans Wiser (But It Isn’t), with Varun Godbole

2025/3/11
logo of podcast Super Data Science: ML & AI Podcast with Jon Krohn

Super Data Science: ML & AI Podcast with Jon Krohn

AI Deep Dive AI Chapters Transcript
People
V
Varun Godbole
Topics
Varun Godbole: 我认为关注AI代理可能是一种错误的方法,我们应该专注于构建能够提升我们智慧的系统。许多问题源于缺乏元认知,而不是过度思考。通过与AI系统互动,我们可以提升个人能动性,并通过不断挑战自身局限来实现成长。在知识日益商品化的时代,智慧将成为关键的差异化因素。有效的提示工程需要清晰明确地表达需求,就像有效的沟通一样。理解人类认知和意义建构有助于更好地与AI互动和设计产品。我不确定自动化技术的极限在哪里,但我相信关注个人成长和智慧比追求自主AI代理更有价值。我认为,个人成长和智慧的提升是我生活中最重要的事情,这比拯救经济更有意义。 Jon Krohn: (在对话中,Jon Krohn主要提出问题和引导话题,没有形成具体的核心论点,而是对Varun Godbole的观点进行回应和补充。)

Deep Dive

Shownotes Transcript

这是第 869 集,与深度学习研究员瓦伦·戈德博尔 (Varun Godbole) 共同探讨。本集由戴尔 AI 工厂与英伟达以及开放数据科学大会 ODSC 赞助播出。

欢迎收听超级数据科学播客,这是数据科学行业收听率最高的播客。每周,我们都会为您带来有趣且鼓舞人心的人物和理念,探索机器学习、人工智能和相关技术的尖端领域,这些技术正在使我们的世界变得更好。我是您的主持人约翰·克罗恩 (John Krohn)。感谢您今天加入我。现在,让我们化繁为简。

欢迎回到超级数据科学播客。今天,我为您准备了一集令人兴奋的节目,内容是一位资深的 AI 研究员,他最近将注意力转向了我们所处这个疯狂、快速发展、指数级增长的时刻的未来影响。瓦伦过去十年一直在谷歌从事深度学习研究,参与纯理论和应用研究项目。例如,他是《自然》杂志一篇论文的共同第一作者,该论文中一个神经网络

击败了专家放射科医生在检测肿瘤方面的能力。他还共同撰写了《深度学习调优手册》(Deep Learning Tuning Playbook),该手册在 GitHub 上获得了近 30,000 颗星。这太疯狂了。最近,他还撰写了《大型语言模型提示调优手册》(LLM Prompt Tuning Playbook)。他致力于大型语言模型的工程设计,使其能够生成代码,最近几年担任谷歌 Gemini 团队的核心成员。他拥有计算机科学学位和西澳大利亚大学的电子工程学位。

瓦伦在今天的节目中主要讨论的是宏观层面,因此应该会吸引任何像我一样的人,这些人都在努力理解由于智能的丰富,社会在未来几年或几十年内可能会有多么大的不同。在今天的节目中,瓦伦详细介绍了人际关系疗法如何帮助他掌握 AI 提示工程,为什么今天如此关注 AI 智能体可能是错误的方法,以及我们应该

关注什么,知识商品化如何使智慧成为未来经济的关键差异化因素,以及为什么未来可能属于全栈员工而不是传统的专业员工。好了,准备好迎接这集改变思维的节目了吗?让我们开始吧。瓦伦,欢迎来到超级数据科学播客。你今天过得怎么样?谢谢。很高兴来到这里。谢谢你邀请我。我想你在纽约?

我在。我现在的情况还不错。有点冷,但是的,期待天气变暖一点。我们彼此认识,都在纽约。我们实际上是在健身房认识的。没错。所以你也知道,我已经一个多月没去纽约健身房了。因为我过去一个月都在加拿大。当我与纽约的人交谈时,他们会说,“哦,太冷了。”我每天都会查看纽约的天气,我想,“我希望今天有你们那样的天气。”

你知道,你开玩笑说这个。我在澳大利亚长大,所以我并没有真正经历过这种寒冷的天气,而且实际上很喜欢它。我没有在雪地里长大。我不知道。我觉得它很清爽,也很令人振奋。当你走到户外时,它会让你有点震惊。我喜欢这样。你没在塔斯马尼亚滑雪吗?没有,没有。当我来到美国时,第一次去太浩湖,差点在初学者雪道上丧命。你第一次看到雪的时候几岁?

26 岁。哇,太酷了。我相信我们有很多听众从未见过雪。我们的听众来自世界各地,但这对我来说相当疯狂,因为我出生一天后就离开了医院。那是三月,所以我不知道。也许当时下雪了。不知道。我现在不会去查的,但我猜我可以在年鉴中找到。无论如何,正如听众现在所知,我们彼此认识,是在健身房认识的,我们都在同一个 CrossFit 健身房锻炼,但是

你出现在这个节目中的原因实际上与这无关。你甚至不知道这一点,因为我没有告诉你。但我把你列入我的名单,让你参加播客的原因是我在我的朋友娜塔莉·蒙比奥特 (Natalie Monbiot) 的博客中读到了关于你的内容。有趣。我实际上不知道这一点。

是的,我知道你不知道。因为我告诉你这是我的私人信息。好吧,现在全世界很多人知道了。但是,是的,在一月底,我的嘉宾娜塔莉·蒙比奥特 (Natalie Monbiot) 在第 823 集节目中,精彩的节目,她是一位令人难以置信的演讲者。

她谈到了虚拟人类经济,这是一个非常酷的节目。它讲述的是你虚拟的版本如何产生收入并在社会中发挥有意义的作用,以及这在今天已经成为可能,但在未来可能会越来越普遍。事实上,我不知道为什么我说“可能”,它将在未来变得越来越普遍。所以在一月底,娜塔莉写了一篇文章。她每周都会写一封电子邮件,她拥有牛津大学语言文学学位。所以她写的博客文章非常好。

并通过电子邮件通讯发送出去。是的,在一月底,它与你有关。事实上,我认为你可以说你是本周整篇文章的灵感来源,因为这篇文章是关于不要沉迷于 AI 智能体,就像 2025 年每个人都在做的那样,它说要构建能够使我们变得更智慧的系统。是的,是的,是的。我的意思是……

我认为,是的,没错。我与她聊过这个话题,我认为这方面的一个重要影响因素实际上是多伦多大学的约翰·维韦奇 (John Vivecki) 教授。他一直在研究智慧、相关性和显着性的认知基础。他在网上有一系列精彩的讲座,我认为这些讲座非常出色地为我们提供了一个关于认知各个不同方面的视角整合

这当然在过去几年里极大地影响了我对 AI 和大型语言模型的思考。是的,我和娜塔莉聊过这个话题,因为我们通过另一个共同的朋友认识,我们谈到了这个话题。是的,就像很多人都在专注于构建智能体一样。但我认为,我个人感兴趣的是我们如何利用这些系统来

提高我们在世界上的个人能动性和智慧,你可以争辩说构建一个智能体确实会赋予你更多的能动性,但我认为框架很重要,就像产品界面的构建细节以及你如何构建问题框架的细节一样,所以真正让我兴奋的是,是的,我作为一个个人如何能够更有效地

做一些有益社会的事情,并与真实、美好和善良的事物保持一致,在世界上做好事,基本上成为一个更好的人,与我的愿望保持一致,无论我的愿望是什么,无论是想在健身房变得更健康,还是想减少焦虑,或者想……无论我的工具性目标是什么,我如何利用这些系统来实现这些目标并培养我自己的能动性

这太美妙了。实际上,我想要邀请你参加播客的部分原因是我认为这非常贴切。它有点……它重新构建了我对我在 AI 方面所做的一切以及我想在主题演讲或播客中谈论的内容的全部思考。我认为这是一个非常棒的视角,我将大力宣传它。太棒了。

太棒了。我真诚地相信,世界上的许多问题,或者至少可以说,也许我不会将这一点投射到世界上所有人身上,我会谈论我自己。我自己的许多问题肯定来自于缺乏元认知,而不是过多地思考。我认为我生活中许多问题都来自于我的生活没有得到充分的检验,而不是像……

某种程度上过于清醒。我认为我真正兴奋的另一个原因是,或者说我在生活中看到的一般情况是,当你提高自己做事的能动性时,我发现我很快就会达到这种行为所包含的极限,你知道吗?我认为就像是在与这些极限进行互动一样,

我觉得我作为一个人成长得最多,并重新评估我的优先事项是什么,我真正关心的是什么,我对我的理想自我应该是什么样的概念化。所以我认为在这方面有一些非常强大的东西,

关于参与这种相互循环的可能性,我们作为个人变得更有能动性。有一些系统能够促进这种培养。然后,当我们在世界上做更多的事情并使用这些系统时,它们会通过我们与它们的互动而变得更好,这反过来又会相互增强。我认为,当我们变得更有能动性时,我们就会达到极限。是的,我们会发现我们的局限性信念。我们会发现我们想象力的极限。

在认识到并富有同情心地与这些局限性信念、这些极限和这些局限性行为进行互动时,我认为我们会作为个人而成长。我认为,我不知道,我生活中最好的事情都来自于这种人类的成长。这就是我最近真正兴奋的事情。我认为这是一个伟大的使命。我认为这是可行的。我认为这是我们所有人

都可以以小的方式或大方式努力实现的目标,作为个人,以及正如你所说,在我们构建的产品中,在我们构建的 AI 系统中,作为本播客的听众。我们将在节目的后面回到这个话题。所以这种智慧的 AI 东西,嘿,你在谈论智慧。这就是我们的意思。我们的意思是能够真正模仿 20 年代黑帮的 AI。这就是我们的意思。

这个智慧的 AI 系统的想法,我们将在节目的后面进一步讨论,以及你与之相关的部分著作。我想从你五年前写的文章开始。五年前,你发表了一篇《自然》杂志的论文。你是这篇《自然》杂志论文的第一作者之一。你共同担任这篇《自然》杂志论文的第一作者。很多听众可能知道,但可能并非 100% 的听众知道,《自然》杂志是你可以发表的最负盛名的同行评审学术期刊之一。

正如你在我们开始录音前对我提到的那样,这篇文章的标题相当不起眼。文章的标题是《人工智能乳腺癌筛查系统的国际评估》。但这有点掩盖了为什么这篇文章如此有趣,不是吗,瓦伦?是的,这方面有一些非常有趣的事情。所以当时的团队非常感兴趣

我们如何将机器学习用于各种类型的医学影像。这项具体工作是针对乳房 X 光摄影影像,你知道,这与很多人的生活息息相关。我们在本文中证明,可以使用深度学习系统

预测活检确诊的乳腺癌,根据你进行预测的国家/地区,时间为两到三年,因为不同的国家/地区有不同的筛查指南等等。你可以提前几年预测这些活检确诊的癌症,而且你可以做到

比专家人类放射科医生更好。因此,我们在来自美国和英国的非常大的回顾性筛查数据集上进行了基准测试

总共有几十万名患者,或者大约有 10 多万名患者,论文中有详细说明,我们还对与收集的数据无关的专家放射科医生进行了单独的读者研究,并且模型也优于他们所有人,因此团队非常兴奋……我认为人工智能在医学方面具有很大的潜力,可以使其更容易获得,并使其……你知道……更具可重复性。所以是的,这是一个非常令人兴奋的机会。是的,这篇论文中还有一些相当知名的作者。德米斯·哈萨比斯 (Demis Hassabis)、穆斯塔法·苏莱曼 (Mustafa Suleiman),DeepMind 的联合创始人。太酷了。是的,这是一个很好的例子……

这是一个有趣的情况。实际上,我们可以将这一点与智慧的 AI 理念联系起来,因为在这篇 2020 年的论文中,你描述了一个可以替代人类完成任务的系统。但这不仅仅是关于替代。这是关于增强和补充,对吧?

是的,没错。因为你会发现,我的意思是,这在论文中并没有真正提到,但你通常会发现人类和 AI 具有不同的优势和劣势,对吧?我认为这是一个活跃的研究领域。坦白说,我对乳腺癌筛查文献不太了解,因为我过去几年一直在从事其他工作。但是

存在一个世界,它可以非常……这种综合可以非常强大,对吧?我认为这就是……这就是真正让我兴奋的。并且仅仅使用……有些国家……

例如,一种看待它的方式是该国每位乳房 X 光摄影师的患者比率。再说一次,已经过去很多年了,所以我没有这些数据,但你可以想象,有些国家的比率很低,对吧?然后还有一些国家的比率实际上……你知道……有很多患者,每位乳房 X 光摄影师或放射科医生有很多患者。所以我认为

利用技术来大幅改善获得可能挽救生命的筛查的机会,这真的很酷。

本集超级数据科学播客由戴尔 AI 工厂与英伟达联合赞助播出,戴尔 AI 工厂提供全面的 AI 技术组合、经过验证的交钥匙解决方案以及专家服务,帮助您更快地实现 AI 成果。利用戴尔广泛的 AI 基础设施和服务以及英伟达行业领先的加速计算,扩展您的企业规模的 AI 和生成式 AI。

这是一个完整的堆栈,包括 GPU 和网络,以及英伟达 AI 企业软件、英伟达推理微服务、模型和智能体蓝图。访问 www.dell.com/superdatascience 了解更多信息。网址是 dell.com/superdatascience。当然。那么,让我们谈谈你从那时起一直在从事的一些工作。其中一件事情是调优手册。你将自己描述为对……

对更系统的深度神经网络开发充满热情。深度神经网络是一种 AI 技术,可用于促进乳腺癌筛查,也可用于促进我们今天在文本生成、图像、视频等方面拥有的所有生成式 AI 功能,所有这些都通过人工神经网络实现。是的,你作为谷歌团队的一部分发布了这个调优手册。那么,请告诉我们关于这个手册的信息。

是的,这个手册背后的许多动力实际上来自于这项乳房 X 光摄影论文的工作……

当时,而且现在仍然如此,训练神经网络可能是一个非常临时性的过程。有些人可能会不客气地称之为炼金术,而且这确实如此。但这就像……它涉及大量的实验、大量的经验主义、大量的研究来训练和部署模型。所以我真正感兴趣和兴奋的是

好吧,在那时,就像我训练了很多模型一样。我认识很多人也训练了很多模型。这就像,我们如何系统化这个过程,对吧?我们感兴趣的广泛研究议程有点像……

你可以想象从炼金术到化学的转变。或者就像,你可以想象,系统化对工程非常非常有帮助。因此,坦白说,在那篇论文中,即使我是第一作者,其他作者也比我了解得多,我从中学到的一切都来自他们。

实际上,我们只是把我们的想法放在一起,并试图写下什么有效,什么无效。我们共同拥有数十年训练这些模型的经验。

我们想提供一种系统的方法来思考超参数调整、架构,就像模型选择的各个方面一样。确实,我认为这个手册是在 ChatGPT 发布之前发布的。但我认为手册中描述的许多内容在今天仍然非常正确,因为该手册的目的是对……

对如何思考运行超参数扫描、应该绘制什么样的图、如何更系统地对诸如“我有这个计算预算。这些是我的问题的约束。因此,我如何才能系统地完成一系列步骤并可靠地达到良好的结果?然后我应该采取什么流程来一遍又一遍地执行此操作?”等问题进行经验性研究。以及……

这就是整个手册的内容。因此,它当时在互联网上很受欢迎,我对此感到非常兴奋,我们将其作为降价文件发布。因此,当时发布论文或此类 ML 工件的标准方法是 PDF 和存档。

但我们真的想将其作为降价文件发布,我认为是知识共享许可证或任何宽松许可证,因为我们真的希望社区能够轻松地对其进行分叉、修改、提出他们自己的最佳实践,并向我们提供……

回馈请求或其他内容,使其成为一种合作的事情。我认为我们并不完全清楚。我不想夸大其词。但很酷的是,最终发生的事情是,很多人决定对其进行分叉,我相信他们以多种不同的语言众包翻译,这些翻译并未得到我们的认可,因为我只会说英语。但这很酷。我认为它在今天对于训练模型的人来说仍然非常相关。

当然。

我认为这是一个非常宝贵的资源。而且我不只是这么认为。在录制本集时,它获得了 28,000 颗星,这太疯狂了。这是我在项目中见过的最多星数之一。所以是的,影响巨大,有一些令人惊叹的贡献者。所以是的,感谢你和谷歌大脑团队,以及哈佛大学的克里斯托弗·沙卢布 (Christopher Shalhoub)。克里斯蒂安·麦卡切恩 (CHRISTIAN MCCUTCHEON):是的,他实际上在去哈佛大学之前曾在谷歌大脑工作。

是的,他很酷。就像我说的那样,即使我是第一作者,其他作者……我真的很想感谢乔治·达尔 (George Dahl)、贾斯汀·吉尔摩 (Justin Gilmore)、扎克·纳多 (Zach Nadeau)、克里斯·贾卢 (Chris Jalou)。他们是团队背后的真正大脑。我只是向他们学习,并让一切顺利进行。是的,我已经学习了。与他们一起工作非常有趣。我很感激我们能够将它发布出来。

我教授深度学习入门课程。我已经做了将近 10 年了。而且,你知道,五年前,大约六年前,它被出版成书。我开发的课程是一个深度学习入门课程,每个班级都会问的一个问题是。一旦我解释了,你知道,我们可以添加更多层,我们可以将一层或所有层的神经元数量加倍。我说,好吧,为什么?

你为什么做出这些决定?直到现在,我基本上总是说,好吧,你可以通过实验来找出经验结果,或者你可以进行某种搜索。最简单的方法是进行网格搜索。因此,只需设置一些要搜索的参数即可。但也有一些巧妙的贝叶斯方法可以确定理想参数是什么。

是的,所以这个手册几乎就是关于这个问题的。它试图采用一种更通用的方法。因此,它在某种意义上是与架构无关的,因为它不会告诉你何时应该添加新层,以及何时应该更改层的宽度。但它确实是在帮助从业人员解决这个问题,这是我现在拥有的实验。我应该进行下一个实验是什么?并且

因为假设是,如果你可以设置基本情况和良好的递归关系,你就可以迭代地走向成功,对吧?因此,手册中有很多关于你应该如何思考设置实验的正确初始状态的思考?以及你应该如何思考,鉴于我收集到的数据,

下一个实验是什么?我应该强调,这应该是一份动态文档。这也是它在 GitHub 上是一个降价文件的原因。我们保留更改意见的权利,并且非常欢迎和鼓励反馈。这不是最终答案。我的意思是,我不会假装自己是每个人都应该如何调整模型的仲裁者,但这就像……

我们已经训练模型一段时间了。这是我们对如何思考这个问题的看法。这就是那种氛围,对吧?希望它能帮助人们。如果它没有帮助,请点击创建问题或其他内容并给我们反馈。

是的。很好。瓦伦,感谢你提供这个资源,以及所有你从中获取信息以创建这个对我们所有人来说都非常宝贵的资源的人。这太棒了。是的,在对更系统的深度神经网络开发感兴趣之后,

你,或者实际上,我不知道是不是之后,可能是同时进行的。你还在从事代码生成研究。我认为这也在 ChatGPT 之前,对吧?是的,是的,没错。是的,实际上……

是在之后吗?有点同时进行/之后。这本手册是我从事医学影像工作和大型语言模型工作之间的过渡。是的,这在 ChatGPT 之前。因为谷歌研究博客文章谈到了这个代码生成工具的影响。是的,我们一直在从事这个项目。所以是的,没错。没错。没错。这在 ChatGPT 之前。

没错。我现在想起来了。是的,是的,是的。我会在节目说明中为人们提供这个链接。有一篇来自 2022 年 7 月的博客文章,这比 ChatGPT 发布早三个月或四个月。这篇谷歌研究博客文章的标题是《增强型机器学习代码补全提高了开发人员的工作效率》。所以绝对领先于它。

我的意思是,现在听到这个消息并不令人惊讶,因为可能我们所有的听众,任何编写代码的听众,都必须使用工具来帮助你。GitHub Copilot、Claude、谷歌 Gemini、ChatGPT,有很多很棒的工具可以帮助你完成代码补全。它们是无价的工具,但仅仅是……

两年前的 2022 年 7 月,这可能并不明显。它可能看起来像是一种干扰,或者会产生如此多的错误,以至于你需要更多时间来处理代码补全所犯的错误。所以是的,我的意思是,在那时,我已经知道了,我的意思是,序列到序列建模已经……

已经很长时间了。我想它最初用于……早期的用例是翻译,但我不知道这似乎是一件非常酷的事情。早期的结果非常有希望。我在大脑团队中的一些受人尊敬的人非常喜欢这个。

而且这对我来说似乎是一个真正很酷的用例。我不知道,这对我来说很有意义,我认为我之前在从事医学影像工作时看到过,甚至像……在那时,我已经从事深度学习研究一段时间了,这就像,是的,这还处于早期阶段,但也很令人着迷的是,模型在很多事情上变得越来越好。

而且每年,硬件都会变得更好,模型的规模也会变得更好。一旦出现“哇,你可以将它用于工程生产力”的生命迹象,这对我来说就很有意义了。

所以是的,这是一个很酷的项目,我很感激能够参与这个项目。团队真的很酷,我从他们那里学到了很多关于这些东西的知识。因此,代码补全,显然我们知道这在今天作为……

作为现有的这些通用大型语言模型的一部分非常有价值。我已经提到了一些,Claude、ChatGPT、DeepSeek 算法现在在录制本集时引起了很大的轰动。另一个……

有价值的,而且我一直在大量使用它,代码补全工具是谷歌 Gemini。因此,谷歌 Gemini 是一款很棒的大型语言模型,我认为你也在 Gemini 团队中从事代码生成工作,对吧?没错。没错。没错。我从一开始就是 Gemini 的一部分。我是一个核心团队成员。是的,我一直在那个团队工作,直到最近我离开谷歌。

是的,那肯定是一个令人兴奋的时刻。这很酷。这很有趣。是的,一定很神奇……我的意思是,你不需要自己详细说明,但我可以想象,在能够处于 AI 系统能力的最前沿的团队工作一定很神奇。例如,在录制本集时,我正在查看 LM Arena

它允许人们对输出进行排名,并并列第一,在统计上并列第一,

在录制本集时,作为总体上最好的通用大型语言模型,汇总了大量不同的指标,是谷歌 Gemini 2.0 Flash、谷歌 Gemini 2.0 Pro、ChatGPT 4.0 和 DeepSeq R1。如果你愿意超越仅仅是那些 95% 的置信区间,那些为我们提供四路并列第一的统计评估,

首先是 Gemini 2.0 Flash,排名第一。看到这个结果真的很酷。我的意思是,你不需要再详细说明了,但如果我参与了这样的项目,我想我会非常自豪的。我的意思是,我只是一个大型团队中的一员,你知道吗?这很有趣,这是一次非常酷的经历。而且……

那里的人都很酷。所以我也知道我们不能对细节进行太多说明,但我很好奇,因为我在录音前和你谈到了特定的 Pytorch 库,比如 Pytorch Lightning,这是我经常使用的工具,而你似乎甚至没有听说过 Pytorch Lightning。我当时想,“什么?Vroon 怎么会不知道 Pytorch Lightning?”

然后我想,哦,是的,当然,因为 PyTorch 是一种元产品。所以谷歌可能不会使用它。我当时想,哦,你们都在使用 TensorFlow。你告诉我,实际上这并不是主要的——是的,很多人使用 JAX。实际上——Jacob Austin 最近刚刚发布了一个非常棒的指南或教程,讲解如何在 TPU 上扩展模型。JAX 和 TPU 在谷歌内部被大量使用。

用于建模。是的,就像,是的,我在谷歌待了一段时间了。所以我对外面发生的事情有点不太了解。因为就像,你每天都在进行冲刺模式的工作。我认为尤其是在过去,

几年里,至少对我个人来说,从事机器学习工作有点让人难以招架,因为感觉每隔几周,世界某个地方就会出现一些令人难以置信的新公告,讲述某人是如何完成一些令人惊叹的新事物。老实说,就像,

五到十年前,机器学习的时代要简单得多。现在似乎每周都会发生一些事情。所以,是的。我很高兴地向我的朋友们宣布,第十届年度 ODSC East,即开放数据科学大会 East,2025 年你不想错过的唯一一场会议,将于 5 月 13 日至 15 日重返波士顿。我将在那里主持一个关于自主 AI 的实践研讨会。

ODSC East 为期三天,内容丰富,包括实践课程和对尖端 AI 主题的深入探讨,所有课程均由世界一流的 AI 专家讲授。此外,还将有很多绝佳的社交机会。无论您的技能水平如何,ODSC East 都将帮助您获得 AI 专业知识,从而将您的职业生涯提升到一个新的水平。不要错过。早鸟折扣即将结束。您可以在 odsc.com/boston 了解更多信息。网址是 odsc.com/boston。

这真是太疯狂了。这是一种转变。四年前我开始主持这个节目的时候,我并不总是每周都有一些突发新闻让我觉得需要谈论。所以有时经常收听节目的听众会知道我每周做两期节目。周二一期,周五一期。周二的节目总是会有嘉宾。时间较长。通常大约一个小时。周五……

有更大的灵活性。当我从主持该节目四年的 Kirill Aramenko 手中接任主持人时,他将周五节目称为“五分钟周五”,这些是简短的个人节目。他会在这许多节目中谈论生活哲学建议。所以我延续了这一传统。但我延续这一传统并谈论你可能想培养的习惯或如何掌握你的习惯的部分原因是,并不总是……

有新的数据科学和机器学习内容让我谈论。而现在这种情况永远不会发生。总是有很多内容可以在周五的节目中谈论。我认为现在已经过去几年了,你知道,有时我会邀请与主题相关的嘉宾,比如几个月前我们邀请了一位经济学家 Natware 来谈论为什么人们,

为什么人们并不总是快乐,尽管与历史相比,现在是活着的最佳时期。所以,你知道,我有时会邀请这样的嘉宾来做一些有趣的节目,但如果是我自己一个人,我几乎总是会研究某个特定数据科学主题。这意味着通常是机器学习或 AI 主题。我没有,我没有做很多关于新的数据可视化技术的节目。对。对。这太疯狂了。我认为这表明

我认为在我们下面确实正在发生寒武纪大爆发。我确实认为,大型语言模型,或者只是深度学习,但大型语言模型只是我在计算领域看到的、在我短暂的职业生涯中看到的、最深刻的事情之一。但当我回顾历史,或者我对计算的历史感兴趣时,就像

这简直太疯狂了,我们已经看到了正在发生的事情。大型语言模型甚至改变了机器学习本身的方式,这真是令人着迷……

我将大型语言模型的一种看待方式是,它们是对机器学习人才的套利,过去,如果你想成为一名机器学习工程师,你需要学习 PyTorch 或 JAX 或其他什么。你需要学习如何收集所有这些数据。如果你想要解决的目标是将“智能”放入你的产品中。而现在,似乎发生的事情是,你需要能够用清晰的英语在提示中表达你想要的行为,并进行良好的评估以衡量和描述该推理调用的性能。它如何将过去是机器学习核心内容的大部分内容转变为简单的提示,这真是令人着迷。它令人着迷的是,

有效提示所需技能与有效训练模型所需技能似乎大相径庭,这……所以,我对此很感兴趣很久了,就像,这意味着在一个什么样的世界里,

你可以将推理视为理所当然的事情,对吧?就像你可以在丰富的推理调用之上构建系统。能够系统地调整你的提示并系统地管理你的提示(随着模型的改进)意味着什么?这实际上是我离开谷歌之前发布的最后一件事,那是一本关于提示的策略手册。

该策略手册实际上分为两部分。第一部分是我高层次的思考,就像我对如何思考预训练与后训练以及如何思考提示的高层次思维模型。第二部分是对以下内容的明确规定:好的提示是什么样的,不好的提示是什么样的。但我认为,正如我在策略手册中提到的那样,我认为前半部分实际上比后半部分更有趣、更具有前瞻性。

因为后半部分是从当前模型的水平写成的。就像提示 01 或 flash 思维,至少对我来说,感觉与提示 40 或 Gemini 1.5 之类的提示有质的区别。但与此同时,这种差异在我看来,在于提示本身的表面模型

形式,而不是我对引擎盖下实际发生的事情以及提示如何转换为计算的思维模型。显然,这有点难以理解,因为它是一个引擎盖下的模型,但这正是该调整策略手册前半部分试图解决的问题,即如何思考这个问题。我处理这个问题的方式是通过

向人们解释……这就是它开始变得有点哲学化的地方,对吧?因为它与我最近一直在做的一些事情有关,那就是……

大型语言模型是一种通用的机器,因为它们是通用的序列到序列机器。然而,当你要求大型语言模型给你一个答案时,例如,如果你问它,“约翰多大了?”或“某个名人多大了?”它会给你一个答案。

但问题是,这个东西不是世界上有形的实体。它从它接受过训练的数据集中获取事实等等。所以策略手册试图解释的就是,你可以这样想,对于大型语言模型来说,客观事实并不存在。例如,对于《指环王》的粉丝来说,假设我想出一个……

命题阿拉贡是冈多的国王,好吧,实际上,乔恩,你是《指环王》的粉丝吗?我不知道是否……

我多年前看过所有《指环王》电影。我还读过《霍比特人》。我不喜欢读《霍比特人》。没关系。我觉得它枯燥乏味,而且线性。好的,那么让我问你这个问题。假设我想出这个命题比尔博·巴金斯是一个霍比特人,对吧?这是我的陈述,对吧?这是对还是错?我会说这是对的。

好的,告诉我比尔博·巴金斯在哪里?告诉我比尔博·巴金斯在哪里。他在夏尔。夏尔不是真的,伙计。如果夏尔不是真的,那怎么能是真的呢?J.R.R. 托尔金是决定夏尔中什么是真实之神。对,对。所以在夏尔的世界里,这是真的。但在地球上,就像……

不真实,除非我们说虚构在某种程度上是真实的,对吧?关键在于你提出的每一个命题背后都有一系列假设。这就是为什么在策略手册中,我称之为电影宇宙,因为人们现在已经习惯了这个概念,对吧?因为有不同的电影宇宙。有 DC,有漫威,等等。但关键是

比尔博·巴金斯,比尔博·巴金斯是一个霍比特人的真值取决于你身处哪个电影宇宙。如果你身处 DC 电影宇宙,那么这个命题可能甚至没有意义。它甚至没有可解决的真值。在《霍比特人》的电影宇宙中,它确实如此,对吧?

在地球的电影宇宙中,它并非如此。那么,当你使用序列到序列模型时会发生什么呢?我思考的一种方式,或者我思考的一种方式是,互联网,或者所有书面文本语料库等等,是对现有所有电影宇宙的集合并集的近似值。问题是,如果你对所有这些东西进行训练,

然后你根据它对统计模型进行下一个标记预测。该分布中将存在许多模式,对吧?但你关心的模式,即你关心的电影宇宙,可能不是模型拟合的模式,对吧?

所以我们刚刚描述了预训练,所以这就是预训练的问题。所以你现在在后训练期间需要做的是,你需要将该分布塑造成你实际想要的那个分布,其中特定的电影宇宙中总是有两个参与者。一个是 AI 助手,一个是人类。模型无法访问互联网。对模型有一些假设,例如,

与世界的互动,对用户是谁有一些假设,对什么是事实或不是事实有一些隐含的和默示的假设。这就是为什么我认为你应该给预训练模型或任何模型一个未充分指定的词缀,例如,“你好,你好吗?”除非你正确地进行了后训练,否则你只会得到无意义的生成。

因为它不知道你身处哪个电影宇宙。或者如果你问它,某个名人的年龄是多少?它不知道你是否在谈论真实的名人。你是在谈论某个虚构的宇宙吗?你是在谈论该命题为真的时间,比如 X 年前吗?你是在谈论现在吗?实际上,所有这些都需要大量的认知支架……

所有这些人性化才能发挥作用,对吧?所以策略手册的前半部分是一种尝试,我不知道我是否成功了,试图更详细地解释这一点。然后这会影响你思考提示的方式,因为这意味着思考提示的一种方式

就像,好吧,对于后训练来说,后训练的数据来自人类评分,对吧?就像为我们创建演示一样。所以思考这些后训练大型语言模型的一种方式是,它们是基于 AI 的

它们是扮演人类评分员角色的统计模型,这些评分员扮演 AI 助手角色。这说得通吗?是的,这说得通。所以当你更进一步时,就像,好吧,你如何有效地提示模型

这就是我在互联网上看到的人,或者我也谈论过,这都是关于将正确的上下文放入模型中。我认为这在某种简化的方式上是正确的。但我们在这里真正谈论的是,思考它的一种方式是,假设你写下一个提示,并想象一下,如果你只是从街上随便找一个人。现在这个人可以访问所有人类知识的总和。

但它不知道你是谁

它什么都没有,就像想象一下,当你输入提示时,有一个从街上随便找来的人,他可以访问所有人类知识的总和,并且每次输入提示时,他都会阅读提示,然后阅读你放入提示中的数据,然后他会决定响应是什么。所以当你这样表达时,显然这在引擎盖下并没有发生,但当你这样表达时,你实际上会把什么放入提示中?

对。就像,你会如何有效地与这样的人沟通?对。我发现当人们……这很有趣,你知道,橡皮鸭效应,就像……

在你向我寻求建议之前,尝试向橡皮鸭解释你的问题。然后我发现,当人们抱怨说,哦,我的提示不起作用,他们就像,滔滔不绝地讲述它不起作用的所有方式以及模型不理解他们想要的所有方式。当我告诉他们,你有没有尝试过将这些抱怨放入提示中?

通常提示的效果会好得多,对吧?因为思考它的另一种方式是我在策略手册中链接到的

有一个关于此的维基百科页面。我相信社会学家或其他人称之为高情境文化和低情境文化之间的差异,例如更明确的沟通形式与更含蓄的沟通形式。我发现提示这些模型最有效的方法是对它们进行极其明确的说明。

我在策略手册中真正推荐的另一本书是非暴力沟通,这是我在治疗和夫妻治疗中学习到的。我做夫妻治疗并不是为了更好地提示模型,但对于所有观众来说,不用说,但这表明有效的沟通和明确表达你想要的可观察行为

来自另一个人实际上与更有效地提示这些模型并没有太大区别。所以无论如何,所有这些都在策略手册中,这就是我塑造许多其他……我思考认知已经有一段时间了,然后这塑造了我最近几个月一直在思考的事情。

人工智能正在改变我们开展业务的方式。但是,我们需要的人工智能解决方案不仅要有雄心壮志,而且还要实用且具有适应性。这就是 Domo 的人工智能和数据产品平台的用武之地。借助 Domo,你和你的团队可以将人工智能和数据转化为创新的用途,从而产生可衡量的影响。

虽然许多公司专注于狭窄的应用或单一模型解决方案,但 Domo 的一体化平台更加强大,具有值得信赖的人工智能结果、安全的 AI 代理,可以连接、准备和自动化你的工作流程,帮助你和你的团队轻松地通过针对你角色量身定制的引导式应用程序获得见解、接收警报和采取行动。该平台还提供灵活选择要使用哪些 AI 模型的选项。

Domo 不仅仅提高生产力。它可以改变你的流程,帮助你做出更明智、更快速的决策,并推动真正的增长。世界一流的公司都依赖 Domo 来做出更明智的决策。了解如何利用 Domo 释放数据的全部潜力。要了解更多信息,请访问 ai.domo.com。网址是 ai.domo.com。太棒了。这真有趣。

我喜欢这一点,你知道,谷歌软件工程师去接受夫妻治疗,结果他变得更擅长提示工程了。它确实有效。我认为,是的。我认为,我认为这也是为什么我认为我看到,我偶然发现提示最好的人最不了解计算机科学或类似的东西。我实际上发现这种负相关性,你知道,

像最了解机器学习的工程师和他们提示的能力之间。这都是轶事,对吧?这不是科学,对吧?这只是感觉。但我认为这其中有道理,因为事实证明,在我看来,能够有效地提示所需技能与在以下情况下进行有效人际沟通所需技能非常相似,

在两个参与者对对方知道什么没有太多假设的情况下,对吧?这很有挑战性。是的,是的,是的。所以这里有很好的见解。我们现在已经谈了很多关于

你在谷歌大脑研究团队的几年里所做的事情,参与 Gemini 项目,非常酷的事情。最近,这个大型语言模型提示调整策略手册。但在录音时几周前或一个月左右,你实际上已经退休了,如果用更好的词来形容的话。你现在,你知道,你让自己保持忙碌。你退休后让自己保持忙碌的事情之一就是写作。

所以回到本集的开头,以及 Natalie Mobayo 关于你和你工作的帖子如何让我邀请你参加本集节目,她提到的具体帖子名为“从知识到智慧,大型语言模型时代的价值创造”。这都是关于明智的 AI,我们在本集开头就开始谈论的事情。所以总的来说,告诉我们……

什么是明智的 AI,你在这里的愿景是什么?我的意思是,你已经在本集开头谈到了这个想法,即增强人类能动性,而不是仅仅关注自主 AI 系统。所以使用大型语言模型,使用 AI 来增强人类能动性,让我们成为我们自己最明智、最好的版本,帮助我们进行元认知。所以实际上,也许在本集节目的开头,你已经谈论得足够多了。现在你可能还会想到其他一些事情想补充

但我绝对想谈论的一件事是,大型语言模型会产生一些复杂性,会带来一些挑战。有很多实验室都在明确地追逐人工通用智能,这是一个可以进行人类可以进行的任何学习的单一算法的概念。

但在许多方面,它将不同于人类智能,在某些方面比人类智能更强大,因为它具有巨大的广度。你告诉我,我认为是在我们开始录音之前,关于 T 恤尺寸以及 T 恤的宽度和高度。所以也许你可以谈谈这个比喻并解释一下。但基本上,这些大型语言模型,这些 AI 系统,当我们接近 AGI 时,

随着越来越多的任务可以由大型语言模型完成,创建如此多事物(代码、艺术)的边际成本趋于零。这对人类来说带来了非常有趣的意义,对于我们的目标是什么、我们如何评价自己、我们应该做什么。是的,是的。有很多。是的,有很多需要解开。所以让我……让我稍微放大一点。对。所以。

首先,我认为我不知道什么是 AGI 的单一共识定义。感觉就像这是那些目标点不断变化的事情之一,它真正意味着什么。所以……

所以放大来看,当我写那篇文章时,对,那只是意识流。坦白说,我仍在努力理解许多这些想法。这有点像那篇文章是开源博客,我像实时博客一样写下我的想法。我想处理它的方式是,与其预测……

事情将如何发展,或者 AGI 的科幻未来会是什么样子?只是更清楚地了解我们现在身处何地?现在正在发生什么?从第一性原理的基础上看待当前的相关曲线,然后稍微推断一下。然后看看,好吧,如果你这样做,这意味着什么?然后稍微推断一下,看看这意味着什么,等等。

尤其因为关于 AI 正在发生的事情有很多炒作和夸大其词。所以我想要从实际的数字和曲线开始,对吧?所以首先想到的是,人们在互联网上说了很多次,那就是每年,两件事同时发生。模型变得越来越好。

在所有基准测试中,对吧?就像今天的 Claude 与去年相比,Gemini,Chachapit。这些模型,在录音时它们所处的位置与 12 个月前相比,总体上要好得多。但与此同时,对于相同的功能,推理成本下降了几个数量级。上下文窗口已大幅增加。

在某种程度上,延迟有所改善,因为我们看到较小的模型可以完成以前模型可以完成的相同工作。所有这一切,坦白说,都反映了我们在计算领域看到的其他情况,对吧?首先,大型昂贵的东西出现,然后较便宜的东西出现。这不仅仅是计算。就像特斯拉 Roadster 在 Model S 和 Model 3 之前出现一样,对吧?而且……

所以这就是我开始的地方。然后其中一件事,正如你在本集开头指出的那样,人们一直在将这些模型用于提高软件工程师的生产力,对吧?像 Cursor、Lovable、所有这些初创公司、Replit、Copilot 和 GitHub。所以如果你绘制那条曲线,你会发现那条曲线的移动方式非常惊人。

然后如果你只是推断它,就像你已经开始一样,我已经开始看到这种现象,那些不是

传统的软件工程师或不会将自己定义为软件工程师的人,编写软件的行为现在对他们来说更容易接近了,因为这些工具存在,不仅在于生成代码本身的行为,还在于理解一段代码的作用,理解一些模糊的东西。生成和交付软件的做法变得更容易接近。然后

所以这就是曲线。然后我开始思考,好吧,似乎有一个反馈循环驱动这两件事。这是我们可以讨论的另一件事。但重要的是,那条曲线似乎,似乎那条曲线背后有很大的动力。

所以如果你开始将那条曲线推断到它的逻辑结论,你会得到什么?那会是什么样子?有两件事开始出现。第一个是,就像在开源 LAMP 堆栈出现之后出现全栈工程师一样,

几年前,我的怀疑是,你将开始看到我所说的全栈员工的出现。

或类似的东西。例如,想象一下,想象一下回到大型语言模型之前的世界,你有一些 UX 设计师、一个 PM 和一个团队中的许多工程师。假设 PM 想考虑发布一个新功能。那么,在旧世界中,他们将不得不编写 PRD,让一些 UXer 制作模型。

让工程经理同意优先考虑。为了让团队朝着这个新功能努力,这将是一件非常大的事情。

我们正在迅速接近的世界是,PM 假设团队正在使用 AI 辅助工具,可以创建一个原型,你可能实际上不会发布。但他们可以带着生成的模型和生成的原型去见工程经理,或者去见团队,展示交互,展示它可能的样子,

并可能已经使用原型进行了一些用户研究,并在工程师“实际上”花费一秒钟考虑是否应该优先考虑它之前,大大降低了风险。这只是一件非常近期的事件,对吧?所以我在这里描述的是角色工作方式的一种流动性,对吧?所以……

所以如果你继续从那条曲线推断,如果你假设模型将继续变得更好、更便宜,那么你会看到什么?对我来说不清楚

未来的组织是什么样的。现在,许多组织都是按功能组织的,因为 PM 在一个组织中,UXer 在一个组织中,工程师在一个组织中。也许有不同的排列方式,但是 PM、UX 和 eng 的角色在行业中相当……相当明确,对吧?但如果你现在达到这样一个世界,

这些 AI 驱动的工具可以以这些不可预见的方式加速你。这会在这些团队的组织方式中注入很多不确定性和流动性。

我最近一直在思考的一个模型是,这就是我所说的全栈员工,他们不仅在狭隘的局部领域内思考,而且会从头到尾地思考整个技术栈,思考团队或人员单元如何在更广泛的组织中创造价值,对吧?因为你可以将这些角色视为技能的集合,对吧?

这就像,我不知道是谁说的。这就像,创造价值的方式总是捆绑或解绑。就像,也许我们看到的是团队内部聚集技能集合解绑的开始,以便可以根据组织或团队的特殊需求以不同的方式动态重新捆绑它们,对吧?当你想到这一点时,这真是太疯狂了。

与此同时,由于这些模型普遍可用,我还开始思考或注意到,不仅固定复杂度软件交付的成本会迅速下降,与模型的质量成正比,推理成本等等,而且复制成本也会下降。

例如,假设你创建了一些网站,制作了一些SaaS产品等等,而你在市场上并没有超级差异化。我复制它的成本,假设我以某种方式可以,我也不想和你区分,无论出于什么原因,我想和你一起降价竞争。即使你假设LLM等等将具有某些单位经济效益,

这里有一个非常有趣的动态,许多产品和服务突然变得比过去更有竞争力,除非它们具有非凡的差异化。所以我得出的一个自然结论是,再说一次,这些都是假设,对吧?这里有很多假设链,但我开始想,哇,

软件行业是否开始更像音乐行业?在那里,只有一两个艺术家可以改变他们访问的任何城市的酒店价格,而几乎所有其他人……

都处于该频谱的另一端,对吧?除非他们提供极具差异化的产品或服务,使他们能够保持竞争优势并保持利润。然后这让我,这有点像,我试图串联你提到的所有事情。这实际上将我们带到了智慧,对吧?因为好主意从哪里来?

因为如果我们说的是比特世界,而不是原子世界,也许它有不同的动态,但我们可以讨论一下。我对原子世界以及制造等等的了解要少得多。但如果我们真正说的是经济曲线

似乎有很多动力支持它。再说一次,这不是一个二元的事情,对吧?它将像一个梯度,对吧?但也像不连续的,就像如果你的团队足够小,这意味着你暂时不雇佣

一段时间内的项目经理,如果你自己可以做所有事情,如果你可以做,你就不要雇佣太多工程师。就像它创造了一样,随着曲线的变化,即使曲线本身可能是平滑的,但它对市场的影响可能是非常不平滑和不连续的,对吧?这很难预测。

但是如果你沿着这条曲线继续前进,如果你看到,好吧,在市场上正确区分的价值只会增加。这意味着对洞察力、洞察力的系统性培养将有越来越高的溢价,对吧?好主意从哪里来?它来自人类。

对。然后你也可以谈论像科幻小说中模型做的事情等等。我们不必深入探讨很多哲学,除非你想。但对于这个思想实验,让我们假设最终仍然有人类利益相关者参与公司的合并等等。人类从哪里获得好主意?好吧,

事实证明,很多文献,或者至少,你知道,我仍然是这方面的学生,就像我说的,我还在学习,但似乎各种积极培养智慧的过程与积极培养好奇心、开放心态、探索、整体适应性之间有很多相似之处,对吧?所以

如果你认真对待所有这些想法,这就像在一个知识迅速商品化的世界里,关键的区别在于你作为一个人有多聪明,你对社会有多积极,你对社区有多宝贵,以及你有多自主,对吧?就自主而言,我的意思不是说我有权成为……而是

你是否在约瑟夫·坎贝尔的意义上追寻你的快乐,对吧?就像,你是否自愿地,你知道,前进,个体化并沿着你的生活道路前进并培养智慧?所以这最终以,是的,你知道,与娜塔莉交谈和与一些人交谈告终。这就是为什么,就像,我认为这项技术让我兴奋的不是仅仅自动化事情的行为,

因为很快,这种框架就会把你带到一个世界,我认为看待这个框架的一种方式是,它会把你带到一个潜在的完全竞争的世界,这不是你想要的。由于很多原因,这不是你想生活的世界。但如果你想在经济中创造差异化的价值,那么这需要你……对我来说,框架是这样的……

模型如何,这些AI系统如何才能更具能动性?我如何才能更具能动性,对吧?正因为我更具能动性,我才能触及我自己的局限性假设、行为等等,从而在智慧上得到成长。那么我如何将这项技术整合到我的认知堆栈中

才能成为一个更有效的人,以实现我的理想目标,无论是以某种方式出现在我的家人、朋友、社区等等面前,还是出现在我的事业中。所以这就是我如何

将所有这些联系在一起,然后一旦我开始……这幅图的很大一部分对我来说仍然不清楚,但一旦我开始看到这条线索,我就对冥想和智慧实践以及其他事情感兴趣了很多年了,还有治疗,但这对我来说变得非常强大,因为我开始好奇,你如何开始将这些事情联系在一起,将它们联系在一起意味着什么,这意味着什么,就像

这最终也让我对如何有效地运用这些模型有了深刻的见解,因为我忘了是谁说的,这就像媒介即信息,对吧?我们使用自然语言与这些事物交谈。语言是人类为人类创造的。这些模型显然不是人类,语言对人类做出了许多认知假设。

所以我认为它会带你到一些非常有趣的地方,让你可以更有效地与这些机器交互,从而在世界上创造价值。所以这就是我漫谈的线索

我问了你一个非常长、非常复杂的问题,所以答案很长是有道理的。但也很迷人。我认为那句话,“媒介即信息”,实际上是一位加拿大传播理论家马歇尔·麦克卢汉说的。对,是的。对,对,对。是的,你说的所有这些都很有趣。我觉得你想到这个想法很有趣,

人们需要追求智慧才能有所区别,并基本上拯救经济。但是,我喜欢这个想法。是的,我不会,我不知道我会用拯救经济来表达。我会说,我会说一些话,这就是我表达的方式。对。嗯,

自动化的极限尚不清楚。我真的不知道。而且有可能……有可能这是模型所能达到的最佳状态。我个人不相信这一点。但我也不知道它们能好多少。我就是不知道。我认为……

这有点哲学化了。我发现如此迷人的是哲学,我以前从不关心它,现在在我的生活中感觉更加切实可行了。当我思考如何用这些模型解决实际问题时,这有点像,这不像,我们如何拯救经济?

对我来说,更像是经济,在我看来,经济应该存在,或者应该为人类的繁荣而存在。这就是我个人关心的,对吧?这就像,我无法改变整体经济。坦率地说,我甚至不想要那种权力。我认为我无法明智地引导它。但我知道在我的生活中……

有些方面我可能在自欺欺人,有些方面我很愚蠢,有些方面我希望在理想情况下变得更好。这只是在反思这样一个事实,即我不知道未来会发生什么。但我知道的是,我生活中最好的事情都来自于努力提升自我,并为我自己努力提升自我。

表现得更好,你知道,就像每年都在接受治疗一样,这对我来说是发生过的最好的事情。成为你能成为的最好的提示工程师。为了我自己,对吧?是的。对,对,对。好吧,我认为这里有一些深刻的东西,对吧?这就像即使是提示,就像……

有一些非常深刻的东西。这就像在你解决问题之前,你经常会提示自己,好吧,我需要考虑哪些事情?我们内心深处的东西开始产生答案。我觉得这很有趣。我发现它很有趣,因为我们终于有了真正扎实的认知模型来更好地理解自己,因为我关心的是理解

我想努力成为一个更好的人。这听起来有点俗气,但那是现实打击了我一段时间之后。我已经了解到,这实际上是我最有效利用时间的方式。所以我认为这与其说是拯救经济,不如说是我们作为个人如何拥有工具来

参与人类的繁荣,至少在我们控制的范围内。对我来说,经济只是所有这些的出现。这就是我希望达到的目标。这就是我无论如何都要达到的目标,也就是说,我认为这是这里崇高的目标。正如我在节目开始时所说,我现在正在宣扬的信息是,我们应该在人工智能方面努力的方向是,允许人类繁荣,尽可能地支持我们。

太棒了。是的,所以我会链接到你的时事通讯,以及这篇关于知识到智慧、LLM时代价值创造的文章。看来,当这一集播出时,你可能会有其他与之相关的博客文章,因为你会有更多想法并更充分地阐述它们。

我喜欢你既然现在休假或退休了,你这样形容自己。你说退休,我这样做的时候就紧张了。休假。我在休息。我只是想放松一下,但我想工作。

所以作为这种氛围驱动的开发的一部分,我意识到你主要谈论的可能是软件开发,但你似乎也在作为一个人进行很多开发。因此,关于这一点,我很想听听,我认为根据你在我们开始录音前告诉我的内容,你可能有一本推荐书可以帮助我们所有人进行个人发展。是的,我强烈推荐赫尔曼·黑塞的《悉达多》。这是一本我发现自己多次阅读的书

我认为这本书非常深刻。是的,我强烈推荐这本书。事实上,作为奖励,如果你愿意,如果人们,有些人更喜欢视频而不是书籍。如果你想要视频,我强烈推荐约翰·维维奇教授的讲座系列《从意义危机中觉醒》,他是加拿大约翰斯大学的教授,也是多伦多大学的教授,我认为他有一些非常棒的东西。而且

尽管它说《从意义危机中觉醒》是关于意义和显著性等等,但我还是要补充一点,观看这个讲座系列极大地提升了我对LLM、提示和认知的思考。

这是一种类似的精神联系,它似乎有点偏离主题,但它在精神上与非暴力沟通对我更有效地提示或思考人际沟通模式的帮助类似。

同样,这个讲座系列将为任何观看它的人提供的是对你的认知、你如何创造意义以及你认为相关的更深入的探索。因此,我认为这将帮助你

更有同理心,如果这甚至说得通的话,对LLM,或者更系统地思考如何更有效地提示它们,如何更有效地运用它们,如何更有效地设计产品界面以允许你的用户更有效地与它们交互,就像让你对你的用户如何希望与这些系统交互更有同理心一样。所以……

这似乎有点哲学化,但我实际上会说,对于那些真正想要构建良好的体验和产品并认真思考这些问题的人来说,我认为约翰·马维奇教授的《从意义危机中觉醒》讲座系列是一个极好的资源。很好。感谢你的建议。

所以瓦伦,你在这一集中与我们分享了很多引人入胜的想法。当然,我会提供你的时事通讯供人们订阅。这是一个子堆栈,所以至少目前它是免费订阅的。也许有一天它会成为一个巨大的付费墙。可能不会。子堆栈,只是为了大家,只是为了管理任何点击订阅的人的期望,

这不是我的工作。我不希望它成为我的工作。我只是想在写作方面变得更好,而且我喜欢它。所以这只是一个我写下我正在思考的内容的空间。不同的帖子会有不同程度的编辑。它主要是一种让我与朋友分享我兴奋的事情并创建一个空间供人们评论他们发现令人兴奋或不令人兴奋的内容的方式。它不是……我不想象……我预见不到它会成为……

是的,我想让它保持趣味性。非常好。除了你的时事通讯,我们的听众今天之后还能如何关注你?我认为时事通讯可能是最好的方式。我有一个领英账户和一个推特账户,但我几乎从不发推文。对不起,X。我从不发X。我从不发推文。我不知道。我从不这样做。我在那里潜伏。即使在领英上,除非……

我觉得我写了一些朋友告诉我他们喜欢的东西,然后我会把它发布在那里,以防其他人也喜欢它。所以领英和推特,但我并没有真正经常使用它们。Substack可能是最容易联系的方式,因为当你,是的,因为你可以回复订阅,我会收到一封电子邮件。所以这就像,这可能是最简单的方法。非常好。

太棒了,瓦伦。感谢你今天抽出时间。我真的很喜欢今天的节目。它真的让我大开眼界,是的,希望我们将来能再次见面,看看你在做什么。是的。非常感谢你邀请我。这很有趣。

在与瓦伦·戈德博尔的一集中,他讲述了如何将从治疗中学到的技能(例如明确表达需求和避免假设)直接转化为有效的AI提示。AI工具如何打破传统的角色界限,可能导致全栈员工能够使用AI助手在不同领域灵活工作。AI使知识日益商品化的经济影响,可能导致类似于音乐行业的赢家通吃动态。

为什么关注通过AI增强人类能动性和智慧可能比追求自主AI代理更有价值,元认知和自我反省在AI增强型未来中的重要性,在这个未来中,个人成长和智慧成为关键的区别因素,以及如何理解人类认知和意义创造可以导致更好的AI交互和产品设计。

与往常一样,你可以在superdatascience.com/869上获得所有节目说明,包括本集的文字记录、视频录制和节目中提到的任何材料、瓦伦的社交媒体资料的网址以及我自己的网址。

下周,我将在弗吉尼亚州里士满的RVA科技数据和人工智能峰会上发言。我将做开幕主题演讲。这是3月19日。这是一个为期一天的会议。有很多优秀的演讲者,所以这可能是一个很好的机会,可以当面见面并享受一个很棒的会议,特别是如果你住在弗吉尼亚州里士满附近。

好的,当然要感谢超级数据科学播客团队的所有人,我们的播客经理索尼娅·布拉乔维奇、媒体编辑马里奥·蓬博、合作伙伴经理娜塔莉·泽斯基、研究员塞尔吉·马西斯、作家扎赫拉·卡切博士和我们的创始人基里尔·阿罗门科。感谢他们制作了今天这集令人耳目一新的节目。

谢谢。

如果你还不是订阅者,请订阅。如果你愿意,可以编辑我们的短片,编辑我们的视频,对不起,编辑成短片。但最重要的是,请继续收听。我很感激你的收听,并希望我能继续制作你多年来喜爱的节目。直到下次,继续努力,我期待着很快与你一起再次享受超级数据科学播客。