We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 871: NoSQL Is Ideal for AI Applications, with MongoDB’s Richmond Alake

871: NoSQL Is Ideal for AI Applications, with MongoDB’s Richmond Alake

2025/3/18
logo of podcast Super Data Science: ML & AI Podcast with Jon Krohn

Super Data Science: ML & AI Podcast with Jon Krohn

AI Deep Dive AI Chapters Transcript
People
J
Jon Krohn
R
Richmond Alake
Topics
Jon Krohn: 我已经使用 MongoDB 作为后台数据库为初创公司构建应用十年了。NoSQL 数据库(如 MongoDB)与 SQL 数据库的关键区别在于数据结构:NoSQL 数据库使用灵活的文档数据模型,而 SQL 数据库使用结构化的表格数据模型。MongoDB 的灵活模式使其成为 AI 应用的理想选择,因为它允许在开发过程中根据需要调整数据结构,而在生产中保持稳定。 在与大型语言模型(LLM)交互的应用中,MongoDB 的灵活模式尤其有用,因为它允许存储来自不同 LLM 的不同输出字段,而无需预先规划数据库模式。 MongoDB Atlas 提供了 MongoDB 的托管服务,消除了数据库管理的负担,并支持多云和多区域部署。MongoDB 的易用性和对开发者思维方式的理解使其成为 AI 应用的理想选择。 Richmond Alake: NoSQL 数据库(如 MongoDB)与 SQL 数据库的区别在于数据存储方式:SQL 数据库采用表格格式,而 MongoDB 使用键值对形式的文档数据模型,更符合开发者的思维方式。MongoDB 的灵活模式使其成为 AI 应用(包括自主式 AI 应用)的理想选择,因为它能够适应 AI 领域快速变化的需求。MongoDB 的灵活架构提高了开发效率,这在竞争激烈的 AI 领域是一个关键优势。 MongoDB 现在集成了原生向量数据库,简化了 AI 应用的开发,并支持混合搜索,结合词法搜索和向量搜索。2025 年将是多智能体 AI 架构走向主流的一年,这将涉及多模态嵌入、多语言能力和多种检索机制。高效的内存管理对于构建可靠且高性能的自主式 AI 系统至关重要。MongoDB 可以作为工具箱,用于管理和检索自主式 AI 系统中大量的工具,从而克服上下文窗口的限制。 成功的 AI 战略应建立在客观事实和明确的支柱之上,并制定出相应的策略和战术。Arena 框架提供了一个构建 AI 战略的结构,它将策略、战术和市场竞争结合在一起。成功的 AI 团队应遵循积极进取、集中协调、资源丰富、高效运作和数据驱动的原则。语音代理将日益普及,但可能不会成为与 AI 交互的主要方式。内存管理将成为 AI 系统的关键关注点。

Deep Dive

Shownotes Transcript

自主式 AI、AI 成功策略以及为什么灵活性对于跟上 AI 市场至关重要:Jon Krohn 与 Richmond Alake 讨论了 NoSQL 数据库 MongoDB,包括为什么它是开发(自主式)AI 应用工具包中的一个绝佳补充,并深入了解其原生向量数据库。Richmond 还谈到了为什么他预计多智能体 AI 架构将在 2025 年成为主流。其他资料:www.superdatascience.com/871本集由戴尔 AI 工厂与 NVIDIA 以及开放数据科学会议 ODSC 提供赞助。有兴趣赞助 SuperDataScience 播客剧集?请发送电子邮件至 [email protected] 获取赞助信息。</context> <raw_text>0 这是第 871 集,嘉宾是 MongoDB 的员工开发者布道师 Richmond Alake。本集由戴尔 AI 工厂与 NVIDIA 以及开放数据科学会议 ODSC 提供赞助。

欢迎收听 Super Data Science 播客,这是数据科学行业收听率最高的播客。每周,我们都会为您带来有趣且鼓舞人心的人物和理念,探索机器学习、AI 和相关技术的尖端领域,这些技术正在使我们的世界变得更好。我是您的主持人 John Krohn。感谢您今天加入我。现在,让我们化繁为简。

欢迎回到 Super Data Science 播客。今天,我们邀请到了才华横溢的作家、演讲家和机器学习开发者 Richmond Alake 来参加节目。Richmond 是 MongoDB 的 AI 和机器学习员工开发者布道师,MongoDB 是一家大型上市数据库公司,拥有 5000 多名员工,年收入超过 10 亿美元。

他与 Andrew Ng 共同开发了 deeplearning.ai 课程“提示压缩和查询优化”,自去年发布以来已有 13000 多人参加。他还曾在 Coursera、Datacamp 和 O'Reilly 等平台上开设课程。他撰写了 200 多篇技术文章,总浏览量超过 100 万次,其中包括为 NVIDIA 撰写的文章。他之前曾在多家伦敦公司担任过机器学习架构师、计算机视觉工程师和 Web 开发人员等职务。

他拥有英国萨里大学计算机视觉、机器学习和机器人专业的硕士学位。今天的节目最受数据科学家、机器学习工程师和软件开发人员等实践者欢迎,但 Richman 在介绍技术概念方面做得非常出色,因此任何感兴趣的听众都应该会喜欢这集节目。

在今天的节目中,Richmond 详细介绍了 NoSQL 数据库(如 MongoDB)与关系型 SQL 数据库的不同之处,为什么像 MongoDB 这样的 NoSQL 数据库特别适合开发现代 AI 应用(包括自主式 AI 应用),MongoDB 如何集成原生向量数据库,使其特别适合 RAG(检索增强生成),

为什么 2025 年标志着将改变我们构建 AI 系统方式的多智能体时代的开始。Richman 还提供了他在当今竞争激烈的环境中构建成功的 AI 策略的强大框架。好了,准备好收听这集有趣且内容丰富的节目了吗?让我们开始吧。♪

Richmond,欢迎来到 Super Data Science 播客。我们正在伦敦您美丽的 MongoDB 办公室进行现场录制。感谢您的邀请。感谢您来到这里。很高兴在伦敦见到您。很高兴能当面进行这次访谈。确实不错。我在伦敦没待多久。我昨天刚飞过来。所以很明显,由于从纽约飞过来的时差,我直到凌晨 4 点左右才睡着。

然后最疯狂的事情发生在我住的地方。我已经告诉 Richmond 了,但他们早上 10 点开始进行火灾警报测试,我知道这对大多数人来说是可以接受的。但是当你刚从纽约来,凌晨 4 点才睡觉时,我就想,哦,我的上帝,这太疯狂了。而且就在我的房间里,我的房间里的火灾警报器在早上 10 点开始响,

自从我来到 MongoDB 办公室后,今天过得很愉快。这里空间很漂亮。您可以看到一些背景,甚至可以看到碎片大厦,这是伦敦标志性建筑之一。

Richmond,您之前在第 685 集节目中出现过。那是两年前的 2021 年 6 月播出的。在那期节目中,我们重点关注构建实时机器学习应用程序。我们在这期节目中也会谈到构建机器学习应用程序。但是所有这些现在都将以您过去一年多作为 MongoDB AI/ML 员工开发者布道师所积累的经验为视角。所以

跟我们说说这是怎么回事。什么是员工开发者布道师的角色,您是如何进入这个领域的?是的,这是一个很好的问题。再次很高兴参加节目。感觉发生了很多事情。自从上次我来这里才两年,对吧?但在那段时间里,确实发生了很多事情。所以很明显,最重要的事情是我在 MongoDB 担任员工开发者布道师,并且我

上次我参加您的节目时,我认为我谈到了我在日常工作之外所做的外部写作。那时我是一家咨询公司的机器学习架构师。除了朝九晚五的工作外,我还做了很多写作,也做了很多教学工作。所以事实证明,

这是一份全职工作。这是一份全职工作。它被称为开发者布道师,像我这样的人在某些组织的开发者关系部门工作。我过去做为消遣的事情现在是我的全职工作。我可以向我们的客户(外部和内部)教授 AI 的最新技术。我通过各种方式做到这一点。可以是撰写内容。

可以是参加播客。也可以是直接与 MongoDB 的客户沟通。我们有很多客户正在构建非常有趣的 AI 应用程序。现在,员工级别指的是经验和期望

对您的期望也是如此。这是我的下一个问题。所以,作为一名员工开发者布道师,这不像是一项面向内部的角色。就像有人获得员工机器学习工程师职位一样。这是一个资历级别。是的,完全正确。酷。那么让我们具体谈谈 MongoDB。我已经构建了十年利用 MongoDB 后端技术的初创公司。

所以我可以含糊地谈论它,那就是,对于已经熟悉 SQL 的人来说,关键的区别是 SQL 是一个结构化表格。所以它看起来就像您看到的 Excel 电子表格或 Google 表格一样,其中包含特定名称的列和一定数量的行,这与 SQL 表的结构类似。像 Mongo 这样的 NoSQL 数据库

没有这种结构。所以,菲尔,听着。它有结构,但它不是关系型数据库中具有的表格结构。您指出了一个要点,那就是 MongoDB 在这个领域已经存在了十多年了。我们一直在支持初创公司和大型企业组织

只是应用程序开发。我还想快速说明的是,Mongo 是 NoSQL 公司。当我想到我大脑中自己的向量表示,即意义表示时,NoSQL 和 Mongo 在我的内部向量空间中占据相同的位置。这非常好。我

我希望在这次谈话之后,您会将 MongoDB 视为 AI 应用程序的数据库。您可以做到这一点。我认为这占据了您大脑潜空间中的另一个空间。很好。是的。对不起,我打断了您,您正要解释 MongoDB。

NoSQL 数据库与关系型数据库(如 SQL)的不同之处。是的,关系型数据库用于以表格格式存储数据。所以您有行和列,关系型数据库已经存在了很长时间,自 80 年代以来。

所以它们非常适合所构建的用例和一些应用程序。MongoDB 是一个基于文档数据模型的数据库,它本质上是将数据存储在键值对中。

MongoDB 早期让许多初创公司开发者产生共鸣的一点是,它易于上手,并且当您使用 MongoDB 数据库时,它反映了开发者的思维方式。

也就是那种类似 JSON 的结构。对我来说,这是我职业生涯中非常非常重要的一刻。我认为我上次在这个播客中没有提到过,但我大约五年前,也许七年前是一个全栈 Web 开发人员。但我过去讨厌编程。

但我爱上了编程,因为 MongoDB 使我更容易思考这个堆栈。我是一个前端开发者,但是当我理解了,当我使用 MongoDB 作为数据层时,我看到我可以在数据层中以与应用程序层相同的方式表示数据,这就是我所说的 JSON 结构,文档数据模型,

一切都明白了。它改变了我的职业生涯,我成为了一名 MEAN 堆栈开发者,对吧?使用 MEAN 堆栈构建 Web 应用程序的全栈开发者。是的,MEAN,M-E-A-N,这是一个首字母缩写词,其中

每个字母代表堆栈中的不同层,而 M 是 MongoDB,对吧?它是堆栈的基础。E 是 Express,A 是 Angular,N 是 Node.js。实际上是 Angular.js,然后是 Angular。所以在我们现在拥有的 Angular 之前,还有一个名为 Angular.js 的库,它使用起来要困难得多。嗯哼。

我记得的一件事是为什么我们早在,是的,大约在 2014 年,我们正在做出数据库决策,所以是 11 年前。我们选择 Mongo 和这种 NoSQL、类似 JSON 的结构、键值对的原因之一是它允许您拥有更大的灵活性。所以您的应用程序或网站的特定部分

您可能无法确定长期要在该页面或应用程序的该部分显示哪些信息。因此,MongoDB 使得无需提前规划并对某些数据的结构或应用程序的某些部分的结构过于严格,您可以简单地说:“好的,今天我们将使用此键。它将被称为这个。它将填充此类数据。

如果将来您更改了它,也没关系。是的,是的。您说到点子上了,首先,您说到点子上了,您说得很好。我们今天在 AI 领域也看到了同样的情况。所以 AI 领域发展迅速。

这绝对是轻描淡写,对吧?感觉 ChatGPT 昨天才发布,而 ChatGPT 是在 2022 年 11 月发布的,才两年时间。但是我们在 MongoDB 做的一件事是,我们拥有该文档数据模型,它允许您拥有灵活的模式,对吧?这意味着随着您对应用程序需求的理解不断发展,您的数据层也可以随之发展。

但与此同时,一旦稳定下来,一旦您对想要的数据表示方式有了稳定的理解,数据在应用程序层中的表示方式,您实际上可以在 MongoDB 中锁定模式。因此,一旦进入生产环境,它就会为您提供固定的结构,但在您进行实验时,它会为您提供灵活性,这……

是许多人在今天使用 AI 时所做的事情。所以他们需要这种灵活的数据结构。他们需要 MongoDB 提供的功能。非常有道理。我想到的一件事是,如果您正在构建某种利用当今 LLM 的应用程序,您可能会尝试调用不同的 LLM 模型。有时您会调用 OpenAI API。有时您会调用 Cohere。是的。

其他时候,您自己的基于 LLAMA 的模型在您自己的基础设施上运行。因此,根据您调用的 LLM,即使您的用户体验保持相对一致,在幕后您可能会有不同的字段。例如,当您调用您的 LLAMA LLM 时,它可能有不同的输出。它可能有一些额外的字段,而当您调用 OpenAI API 时却没有这些字段。因此,Mongo 允许您非常灵活地

在幕后,只需说:“好的,我们将存储这些额外信息。”而如果您尝试以表格方式完成所有操作,则必须已经为稍后使用的 LLM 设置了该列。是的,我们有……而且有一点……

再说一次,我们今天在 AI 工作负载中有很多发展和实验。拥有一个严格的模式,仅仅因为您在应用程序空间中发生了一些您一开始没有意识到的变化而必须进行模式迁移,这会给开发者带来很多痛苦。在我们今天的 AI 时代,速度是一种竞争优势。

提高开发人员的生产力是一种竞争优势。因此,如果您拥有一个灵活的数据库和 MongoDB,它可以让开发人员更快地行动。我们还意识到,我们也希望这些 LLM 为我们提供结构化输出。因此,您在 OpenAI 或 JSON 模式中拥有结构化输出,这是大多数 LLM 拥有的。这与我们之前讨论的内容相呼应,即

十年前像您这样的开发者产生共鸣的是,嘿,JSON 在应用程序层中很有意义。现在它在数据层中也很有意义。现在,如果您查看 MongoDB,我们的 LLM 启用了 JSON 模式。现在您的 LLM,这只是以统一的方式思考整个 AI 堆栈的一种方式。

您在应用程序层中考虑 JSON,在数据层中考虑 JSON,在 LLM 中考虑 JSON。它只是使一切变得更容易。很好。这是一个很好的宣传语。也许我们必须将其转换为 YouTube 短视频或其他内容。我喜欢它。它很完美。

因此,我们现在已经介绍了 NoSQL 数据库是什么,Mongo 如何成为典型的 NoSQL 数据库,以及它与 SQL 关系型数据库的不同之处。人们可以立即免费访问 MongoDB。

有一个 MongoDB 社区版本,我将在节目说明中提供链接,但它是免费的。它也可能不包含 MongoDB 正式版提供的最新功能。所以听起来您将好心地为我提供 MongoDB Atlas 的链接,这是一个 MongoDB 云平台,可以免费开始使用。

并且允许您开始使用 MongoDB。是的,完全正确。因此,在节目说明中,将有一个链接供您创建免费的 MongoDB 帐户,您可以尝试将 MongoDB 用于您的 AI 应用程序。因此,存储您的运营数据、元数据,以及我们即将讨论的存储向量数据。

是的,这非常令人兴奋。事实上,我认为我们应该接下来讨论这个问题。但我还想快速说明一下,到目前为止,这听起来几乎像是一个冗长的广告,因为我是一个非常大的 Mongo 粉丝。很明显,您是 Mongo 开发者布道师,所以您也是。但我并没有为此获得报酬。Mongo 并没有以任何方式赞助这期播客。这只是对……

对这个工具的真正热情。完全正确。我认为这就是 Mongo 的作用,对吧?因为它与构建这些应用程序的开发者产生了深刻的共鸣。我们了解开发者的想法。现在在这个 AI 时代,我们也了解 LLM 如何提供输出。它只是使构建应用程序变得有趣。这就是 Mongo……没有人想成为数据库管理员。没有开发者想成为数据库管理员。所以 MongoDB 让数据库……它只是让它变得有趣。

让开发者觉得有趣。是的,有一点,对不起,我打断了,但关于粉丝我想指出的是,几年前我曾经写过很多关于 MongoDB 的文章,七年前在 Quora 上有一些文章,我告诉人们去使用 MongoDB。所以对我来说,这是一个完整的循环时刻,能够回来产生影响。

本集 Super Data Science 由戴尔 AI 工厂与 NVIDIA 提供赞助,帮助您加快从桌面到数据中心的 AI 应用。

戴尔 AI 工厂与 NVIDIA 提供了一个简单的开发启动平台,允许您在安全可靠的环境中进行本地原型设计。接下来,通过使用基于容器的微服务快速构建 AI 和数据工作流来开发和准备扩展,然后使用可扩展的基础设施框架在企业中部署和优化。访问 www.dell.com/superdatascience 了解更多信息。网址是 dell.com/superdatascience。

当然。这很好。我很高兴您能享受它。那么 MongoDB Atlas,告诉我们为什么有人——使用像 MongoDB Atlas 这样的云系统有哪些优势

与尝试在您自己的基础设施上设置您自己的 MongoDB 相比?是的,使用 MongoDB Atlas,您可以获得 MongoDB 的托管产品,对吧?其中一个关键点是您可以在当今任何大型云提供商上使用 MongoDB。例如 AWS、Azure 和 Google Cloud。

在多个不同的区域。所以我们拥有多区域、多云基础设施。数据库层也在 MongoDB 中分布式。所以您拥有所有这些。再说一次,我说的是没有开发者想成为数据库管理员。您可以在 MongoDB Atlas 中获得所有这些,以及其他产品,例如流媒体。我们有专用的搜索节点,当我们讨论向量数据时,我们可以讨论这些

MongoDB 数据库的向量数据功能。所以这就是为什么本质上你会。很好。是的,让我们现在谈谈这些向量数据库。我之前已经开过一个玩笑,那就是,如果您还不是 AI 开发者,那么您可能不知道向量空间,但本质上,

向量是一个高维空间,所以很容易想象一个三维空间,因为这是我们生活的视觉世界。

所以如果您想象一个三维空间,您可以取任何类型的对象。所以在大约 2011 年、2012 年左右,将单词放入向量空间是一件大事。所以有一个非常著名的算法 Word2Vec,由 Thomas Mikulov 创建。这是一种将自然语言中的单词

一些与单词相关的非常有趣的属性,那就是一个单词的含义往往是其周围单词的平均值,这是一个令人难以置信的事情,但事实证明这是真的,因为您可以训练这些计算机科学算法来做到这一点,说:“好的,仅仅根据周围的单词,无需数据中的任何标签,您可以获取大量自然语言

并使用像 Word2Vec 这样的东西来创建您想要的任何维度的词云,在这个空间中越接近,单词的含义就越相似。因此,英国和美国的单词拼写通常最终会出现在完全相同的位置,因为无论您是否使用“u”来拼写“honor”,它的含义都是相同的。

然后同义词会靠得很近。您最终可能会得到一个数据库语言区域。所以 NoSQL 和 MongoDB 会在经过良好训练的空间中非常接近。

附近您会发现 SQL 和 MySQL 以及关系型数据库。然后在另一个不太远的地方,您可能会发现 Angular 和 React,也就是编程语言。在三维空间的完全不同区域,您可能会发现日期和时间。因此,您最终会在这个三维空间中表示含义。但是对于向量空间,您可以拥有数百个维度或数千个维度。

因此,这允许您在该空间中拥有更大的粒度,其中沿其中一个维度移动代表数据存储方式的某种含义。总之,向量数据库在过去十年中非常重要,最初主要用于单词,但现在用于整个文档。例如,对于 RAG,对于检索增强生成来说非常重要。

您通常会获取,假设您有 100 万个文档,您可以将每个文档转换为某个高维向量空间中的位置

然后您可以根据某人提出的查询实时检索相关的文档,这取决于查询的语义含义。所以是的,向量数据库如今对于 RAG 等应用程序来说非常重要。在准备这次采访之前,我不知道 Mongo 也提供向量数据库。因为我一直认为 Mongo 只是那种 JSON 结构

但是是的,您现在也有向量数据库了。跟我们说说这个。是的。在 MongoDB,我们与各种客户合作

我们的根源始于在数据库中存储数据。所以十多年前,我们看到大多数客户都在 MongoDB 之上使用搜索引擎。为了简化操作,因为这就是我们的关注重点,也就是客户的需求,我们将搜索功能集成到了数据库中。所以我们有了 Atlas Search。然后我们还注意到,许多客户都在涉足与语义搜索相关的用例。

使用他们的向量数据。大多数这些人都在附加扩展或其他数据库来实现向量搜索。但我们将它集成到了 MongoDB 中。所以现在您有一个数据库,您可以使用它来执行正常的……

词法搜索,但您也可以执行向量搜索。您实际上可以将两者结合起来,并进行混合搜索。所以在您拥有……的情况下

我在某些情况下看到过,两个免费数据库。使用 MongoDB,您拥有一个可以为您的整个 AI 应用程序提供支持的数据库。这就是它的优点。它非常有道理。您可以想象,如果您从头开始并且知道这一点,您可能会认为这比获取一些单独的向量数据库并必须确信它们之间的链接将始终有效更容易,因为您最终可能会遇到版本问题,其中

向量数据库进行某种更新,它不再像您期望的那样从 Mongo 或 Back 中引入字段。而当 Mongo 完成所有操作时,可能有人正在测试以确保一切正常。完全正确。很好。好的,那么让我们现在谈谈向量数据库和 AI 以及 MongoDB 的扩展概念。您最近发表了一篇关于 AI 堆栈的博客文章。

实际上,在录制时,如果您在 Google 上搜索“AI 堆栈”一词,您的博客文章会显示为排名第一的搜索结果。因此,我将在节目说明中提供一个链接。我们在这期节目中前面谈到了 MEAN 堆栈之类的东西,这是一个关于后端一直到前端技术的开发者理念。

AI 堆栈是否与这种事情有关?是的。所以我们说主堆栈是,好吧,我们没有说,但我们知道主堆栈是由一堆工具和库组成的,用于构建 Web 应用程序。所以 AI 堆栈是由工具和库组成的,用于构建 AI 应用程序。我想说的一件事是 AI 堆栈

它的可视化方式不同,这取决于您与之交谈的角色。所以当我与开发者交谈时,当您看到这篇文章时,当我与开发者交谈时,AI 堆栈中的层数比我向高管或副总裁级别的人解释 AI 堆栈时要多。这是因为我觉得开发者需要更深入地了解。

我们需要深入了解当今是什么构成了 AI 应用程序,并了解其构成。但是对于一些首席执行官和副总裁级别的员工来说,他们不需要了解内在细节。他们需要了解高级信息。所以要说明的是,大多数副总裁或公司的高级副总裁

高管将 AI 堆栈描述为拥有应用程序层、数据层和计算层。非常简单。所以应用程序是——对不起,您有应用程序层、工具层,然后是计算层。所以应用程序将是您今天看到的任何产品。所以 Cursor,一个非常流行的由 AI 提供支持的 IDE,将位于应用程序层。

然后在您的工具层中,您有像 MongoDB 这样的公司或任何支持应用程序层的工具。然后在您的计算层中,您有像 NVIDIA 这样的公司。但是当我与开发者交谈时,我会双击它,然后我们会讨论堆栈的其他层。我现在不记得所有内容了,但是编程语言非常重要。

当您开发此 AI 堆栈、AI 应用程序时,您选择的语言非常重要,因为并非您将在堆栈中进一步使用的所有库都使用您可用的所有语言编写。有些只是 Python,或者有些只是 JavaScript,对吧?现在有些正在发展到同时拥有两者。但是您的编程语言至关重要。

您有模型提供商、数据、数据库(将是 MongoDB),然后您有模型提供商。当我与开发者交谈时,堆栈需要几层。我倾向于深入探讨这一点。

很好,是的。所以如果人们想要一个框架来描述不同的层,就像您所说的那样,从底部到顶部,从您的计算层一直到您的应用程序层,您提供的这个 AI 堆栈框架。再说一次,我们将在节目说明中提供一个链接,以便人们轻松地跟随。您最近发布的另一件事

是名为 MemoRiz 的东西。所以它就像记忆,但它也有,那是像 Riz 吗?是的,那是像 Riz。那是我深夜编程时想出的一个库的有趣名称。这就像一个 Z 世代术语。它只是意味着好?

那是我试图显得年轻的尝试。请一些 Z 世代听众提供信息。是的,我认为它很有趣。我不知道人们是否觉得它很有趣。但是实际上,这是一个我涉足的有趣项目。它主要试图解决我在一些客户构建 AI 应用程序时看到的一些问题。那就是,它与内存有关。对吧?

所以当我们进入,或者我们已经进入这个自主式时代,

记忆变得重要,数据变得重要,你构建、存储和检索记忆的方式实际上会影响你的 AI 系统、你的自主系统的可靠性和性能。因此,记忆正成为我们今天 AI 应用的一个重要方面。所以在 2003 年,2004 年,我们有了 RAG。向量数据库使 RAG 成为一种流行的……在 2023 年、2024 年。

在 2023 年。我说什么了?2003 年,我想。好吧,2023 年和 2024 年,向量数据库使 RAGA 成为 AI 应用中非常流行的机制。但随着我们进入 2024 年下半年和 2025 年,我们看到更多自主系统的形式因素出现

在该领域更为普遍。自主 RAG 成为人们正在实施的事情。但现在我们看到的是,有很多公司和开源库都专注于数据是如何构建的。

在这个自主系统中检索,以及超越相关性的不同评分机制,对吧?有很多关于这方面的研究论文,一家让我想到的公司是 MemGPT。它背后的公司是 Letta。还有一家公司叫做,还有一篇论文叫做 Hipporag。

他们试图解决的主要问题是如何在一个存储布局中有效地存储内存,但在你的自主系统需要的时候有效地检索它。所以记忆是我试图解决我在自主系统中看到的围绕内存管理的一些问题。

当你想拥有一个自主系统时,人们会遇到什么样的问题?在尝试开发一些 RAG 应用时,内存不足是常见情况吗?人们在内存方面遇到的常见问题是什么?关于内存不足,这是否常见?上下文窗口不足是常见的,对吧?

显然,我们现在有了很大的上下文窗口,一百万个上下文窗口。你的口袋有多深,这是我对那些试图在每次推理学校都塞入一百万个标记的人开的玩笑。哦,我的天哪。但我看到与上下文窗口相关的其中一个问题或问题是

在自主领域,LLM 现在能够使用工具了,对吧?工具使用是指你提供工具

一个 LLM,它可以使用的一组 JSON 模式工具来完成目标。这将是你的系统中 LLM 知道的 Python 函数或微服务的 JSON 模式,现在它实际上可以选择正确的工具来使用,选择正确的参数,然后在你的系统上调用它。这本质上就是工具使用,或者函数调用,无论你想怎么称呼它。

一件事情是,如果你在文档上使用一些 OpenAI 模型,指导意见是每次只放入 10 到 20 个,嗯,

上下文窗口中一次的这些工具的 JSON 模式,因为显然你的上下文窗口有限,你放入的工具越多,LLM 选择就越难。所以在记忆库中,我实现了一种我们称之为 MongoDB 作为工具箱的设计模式。

本质上,你正在做的是使用 MongoDB,这就是 MongoDB 对 JSON 的亲和力再次非常有用,这种文档数据模型是,我们将你系统中可以拥有的所有工具存储在 MongoDB 中,并在 MongoDB 中以及你的工具元数据旁边也具有向量表示。向量表示可以是

该函数以及描述何时使用该工具的 Google Docs 字符串以数字格式表示。你可以做的是,在你调用 LLM 之前,你可以实际调用你的数据库来获取正确的工具。这样你就可以发送两个或三个工具。

在当今瞬息万变的 AI 环境中,你的数据需求超过了大多数公司提供的狭隘应用和单一模型解决方案。Domo 的 AI 和数据产品平台是更强大的多合一数据解决方案。使用 Domo,你和你的团队可以将 AI 和数据应用于创新的用途,从而产生可衡量的影响。虽然许多公司专注于狭隘的应用或单一模型解决方案,但 Domo 的多合一平台为你带来值得信赖的 AI 结果,

安全连接、准备和自动化工作流程的 AI 代理,帮助你和你的团队轻松地获得见解、接收警报并采取行动,通过针对你角色量身定制的引导式应用程序。你可以灵活地选择要使用的 AI 模型。Domo 不仅仅提高生产力。它改变你的流程,帮助你做出更明智、更快速的决策,并推动真正的增长。

数据可能很难处理。Domo 很容易上手。立即访问 ai.domo.com 了解更多信息。网址是 ai.domo.com。很好。这很有道理。是的,这是一个有趣的设计模式。它允许你的自主系统扩展,对吧?所以现在你可以拥有任意数量的工具。

并且你绕过了限制。- 很好,这是一个很好的结合,从一开始 JSON 结构如何与 MongoDB 本身固有的键值对相结合,作为一个开发者,自从你发现它以来,它使开发变得轻而易举,把你变成了一个全栈开发者,现在它允许你提出巧妙的方法来使用 LLM 来调用工具。很好。

说到代理,许多人,可能包括我自己,都说 2025 年是代理年,是自主 AI 的一年。但在我们开始录音之前,你对我说,这是多代理的一年。告诉我们关于这件事。

2025 年是从不同角度来看待代理的一年,对吧?我认为从主流商业角度来看,我,以及该领域的许多人都曾在今年之前、去年甚至 2023 年的一些人都在大喊代理。现在它已经成为主流,是商业化的,现在每个人都意识到了这一点。但我认为,作为该领域的领导者,并且处于前沿,帮助我们的客户领先几个月,这是我们的责任。

如果我们能够为他们提供良好的服务。所以代理很好,很好,我们都应该构建它们并学习它们。但我认为 2012 年是 AI 的多代理时代。我的意思是,多代理架构将非常流行。它们将非常流行。我们将拥有多模态嵌入。现在你有了嵌入,它不仅仅是

文本,它们是图像、视频、音频,所有这些都使用一个嵌入来捕获。多语言嵌入可以理解不同的语言。你的自主系统中将有多种检索机制。因此,向量搜索并不是你需要的全部。

向量数据库很流行,但你不能仅仅依靠向量表示来从你的数据库中检索正确的信息来提供给你的 LLM。你需要更多不同的搜索机制。我们看到很多人转向我刚才谈到的这个内存管理领域。

多代理、多模态、多语言、多种检索机制。还有多步推理。所以 2025 年是 AI 的多代理时代。是的,我们正在采用 2023 年和 2024 年磨练的一些基础,并以多方面的方式扩展它们。

你绝对说得对。展望 2025 年之后,你对今年之后代理的预测是什么?对 AI 的预测……对我来说非常有趣,因为每个人都总是错的。也许三四年以前,没有人能预测我们会在这里,对吧?如果我要做一个合理的预测,它不会很疯狂。我认为语音代理将会……它们会越来越受欢迎,对吧?

我非常坚信,语音代理可能不会像人们想象的那样流行。它们不会成为我们与代理互动的主要方式。但是语音代理,每个人都希望在他们的 AI 应用中实现语音,因为

因为就像我说的那样,AI 本身的实验性质。我看到内存管理成为一个重要的话题。我遇到了吴恩达。他是 AI 先驱。他首先说的是,“萨特。里士满,你如何在遗传系统中模拟记忆?”这是去年的四月。

他在这个领域比我领先得多。我看到很多人开始关注遗传系统中的内存管理和内存建模,因为这就是人类的工作方式。我们的大脑中不仅仅有一种检索机制。我们有几种不同的记忆形式,回忆记忆。因此,遗传系统也需要同样的机制。

你提到吴恩达真是太好了,因为我的下一个问题与之相关。所以吴恩达,说他是数据科学和 AI 领域最重要的人物之一,是最知名的人物之一,这还是轻描淡写了。几个月前,他在第 841 集节目中出现过。

你和他一起上过课。所以吴恩达创立了一个名为 Deep Learning AI 的平台,这是一个学习平台,我们的许多听众可能都知道,并且可能在那里上过课。你与吴恩达一起在 Deep Learning AI 上开设了一门生成式 AI 课程。这是怎么回事?好吧,这是因为我的经理实际上只是……

联系了,我认为是 Deep Learning AI,并直接建议我们开设一门课程,对吧?因为 MongoDB,我们相信我们是最好的,我们是最好的 AI 应用数据库。我们想

广而告之。所以他们对我们所拥有的东西很感兴趣。他们是 MongoDB 的粉丝。所以早期的 Coursera 是建立在 MongoDB 之上的。所以他们对我们想说的话很感兴趣。有趣的是,我们在那门课程中当时所说的话,它是在去年 6 月发布的,今天甚至更贴切。因为我们不仅仅谈论 RAG。

我们在 Gen-Tek 系统中谈论 RAG,但我们谈论的是一个重点,即在 LLM 中提供大型上下文。所以我们谈论的是一个主题,即提示压缩。所以这门课程是 AI 系统中的提示压缩和 RAG,或者类似的东西。链接将在节目说明中。

但是是的,所以吴恩达对这门课程很兴奋。我们很高兴提供这门课程。能够亲自见到他是一种荣幸。有趣的故事。吴恩达知道 MetaMask。

我很好,数字版,数字版的我,在我真正见到我之前,因为当我过去为了娱乐而写作时,我在 Medium 上写了很多东西,吴恩达在 YouTube 上有一个最好的视频,关于阅读研究论文,他在斯坦福大学的课堂上教学生如何阅读研究论文,所以……你

我的教育程度是硕士,但我仍然必须阅读大量的研究论文,而且我今天仍然阅读大量的研究论文。所以我发现那个视频非常有用,大约是五年前,我写了一篇关于它的 Medium 文章,比如分解和创建一个框架或概念,让人们可以使用它。他看到了那篇文章。真的吗?是的。这很酷。那篇文章在 Medium 上也疯传了,所有的好东西。

是的,他只是提到,我们也谈到了这篇文章。我说,哇,你写了这篇文章?我说,是的,我写的。所以他在见到真实的我之前见到了数字版的里士满。是的,我也是。在上一集节目中,我一直在和你像素对话。它们只是在真实里士满几秒钟后移动到世界其他地方的里士满像素。

很好。那么,我的节目的哪类听众应该去参加你在 Deep Learning AI 上的 Gen AI 课程?谁是目标受众?我认为大多数软件开发者都应该涉足人们今天正在构建的东西。所以,如果你是软件开发者,就去参加这门课程。

很容易从第一性原理分解,嘿,这就是关系型数据库的样子,但这就是 MongoDB。这就是 AI 中的 MongoDB。这就是 RAG。这很可能是一个你将在不同层面面临的问题。所以我把它分解了。所以我真的认为大多数软件开发者都应该参加这门课程。

很好。好的,现在让我们稍微放大一点。到目前为止,在本集中,我们主要关注的是人们可以使用的一些特定的 AI 工具、功能和特性。

现在让我们更广泛地谈谈 AI 战略。你是在这个领域的领导者。你在 MongoDB 内部和外部领导团队,指导人们如何构建成功的 AI 团队和产品。所以你是谈论这个问题的最佳人选。在竞争如此激烈的环境中,如何才能建立有效的 AI 战略,在这个环境中,有这么多

人试图构建类似的东西?是的,这是一个好问题。顺便说一句,作为一个 AI,它发展得非常快,我不得不花很短的时间思考这个问题。我相信有很多 AI 领导者和企业 AI 领导者都彻夜难眠,只是为了跟上制定 AI 战略和

展示 AI 计划的投资回报率,今年也是 AI 中“让我看看钱”的一年。但是该领域的 AI 战略非常困难。但我看到有效的方法是将你的战略基础建立在支柱和客观真理上。

所以,当我制定战略时,或者如果我在考虑如何制定战略来赢得某个目标,或者完成我被赋予的任何任务时,我总是考虑第一性原理,我寻找我可以将我的策略建立在其上的支柱,我寻找这些支柱中的客观真理。例如,如果……

一个支柱是,假设我试图,我们正在谈论开发者和工程师。假设我试图考虑一个围绕开发者的 AI 战略。我会做的是看看围绕那个开发者角色的支柱是什么,对吧?所以我们知道的一件事是开发者生活在 GitHub 上。所以 GitHub 将是一个支柱。

然后我会自问,GitHub 的客观真理是什么,对吧?那么开发者在 GitHub 上到底做什么?GitHub 中有什么东西是永远不会改变的?如果它确实改变了,那么这意味着平台发生了巨大的转变。

所以这就是我思考问题的方式。我查看角色,查看其他属性,尝试形成支柱,尝试在支柱中形成客观真理,尝试形成我正在做的一些信念和假设,并尝试从所有这些信息中形成一些策略。

我很高兴地宣布,我的朋友们,第十届年度 ODSC East,即开放数据科学大会 East,这是你在 2025 年不容错过的一次会议,将于 5 月 13 日至 15 日返回波士顿。我将在那里领导一个关于自主 AI 的实践研讨会。

ODSC East 为期三天,内容丰富,包括实践课程和对尖端 AI 主题的深入探讨,所有课程均由世界一流的 AI 专家讲授。此外,还将有很多很好的社交机会。无论你的技能水平如何,ODSC East 都将帮助你获得 AI 专业知识,从而将你的职业生涯提升到一个新的水平。不要错过。早鸟折扣即将结束。你可以在 odsc.com/boston 了解更多信息。网址是 odsc.com/boston。

这很有道理。我真的很喜欢这个想法。我认为我以前没有以这种结构化的方式去做。我是在我的脑海中以一种 NoSQL 的方式去做……但我确实……有这些事情。即使我们生活在这个变化非常快的空间中,也绝对存在这些支柱和不会改变的东西。GitHub 就是一个很好的例子。对我来说,即使在我的职业生涯中……

回到 2007 年到 2012 年我攻读博士学位的时候,即使在那时我也想,哇,世界变化很快。我在我的职业生涯中在哪里可以找到坚实的基础?当其他人……我攻读的是神经科学博士学位。所以有些人正在培养细胞组织培养物。其他人正在记录雪貂大脑中的记录。你拥有非常具体的技能。我说,好吧……

地球上存储的数据量将会持续增加。分析这些数据的计算成本将会越来越低。所以我当时想,我应该学习统计计算和机器学习。这将是一件有用的事情。所以有这些

大趋势或支柱,即使在这个变化非常快的空间中,你也可以感到安全。- 是的,它让你保持脚踏实地。当我还是一名网络开发者时,我也做了同样的事情,我想,我在寻找我职业生涯中的下一步,寻找下一个挑战,我自问,今天我可以参与的有趣的问题是什么,它将在很长一段时间内保持相关性?没有比复制人类智能更有趣的问题了。

所以我说道,好吧,我要去大学攻读 AI 硕士学位。

这将是相关的。它可能会有不同的形状和形式,但它将保持相关性,直到我们可能达到 AGI 或某种形式的超级智能。是的,这很有趣。我最近一直在思考的一件事,我认为我还没有大声说出来,所以听到你的想法会很有趣,鉴于你在教育和商业应用方面都有很强的 AI 背景。我最近一直在思考的一件事是,即使 AGI 出现了,

我认为系统的思维方式仍然与我们的思维方式大相径庭。所以我认为,就像我们今天看到的那样,对于某些类型的编码问题或数学问题,你可以让一个多步推理系统能够达到或接近博士级别的数学学生或化学学生,或者计算机科学学生。

但是还有很多更难打包成这种方式的问题。以这种方式训练 AI 系统将更加困难。所以在我看来,似乎仍然有一些地方人类智能仍然具有优势,我们与这些 AI 系统相辅相成,就像

你知道,你今天很少会做长除法。你会拿起你的计算器让它为你做。我们将会有越来越多的事情可以使用计算机为我们解决。但是我……即使……是的,我不知道。我的意思是,在许多方面,AGI 系统的概念,这取决于你如何定义它,是它理论上可以执行人类执行的任何类型的思维。但似乎仍然存在相对优势。所以,是的,这是我最近一直在思考的事情,即使……

几年前,我曾经想过,“哇,AGI 系统或人工智能超级智能系统,这是否对人类构成生存威胁?”并且仍然存在一定的可能性。但越来越多的,出于某种原因,以我可能难以很好地表达的方式,你可能比我表达得更好。

它并不让我害怕。在我看来,我们将成为彼此自然的补充。我理解的一件事是,当两个智能系统相遇时,它可能是混乱,也可能是合作。对,对。两个 C 之一,无论哪个。现在,我们正在创造人工智能,现在它是合作的。这很好。我希望它能继续这样下去。但即使你看人类,对吧,

我们在人类内部拥有相同的智能形式,但我们仍然有合作和混乱。我认为会有一个点,希望不会,但存在一种可能性,它会转变为混乱状态。谁知道呢?但我认为 AI 无法复制的另一个 C 是好奇心。我真的很认为人类是其中一种智能形式,只是……

对环境如此好奇。我们仍然有太空探索。我们甚至还没有离开这个星球。所以我们仍然处于旅程的开始。所以我认为对太空的好奇心……

宇宙是广阔的,我们不会派遣 AI 为我们去探索宇宙,因为我们想做的一件事是体验。我们也想加入人类的体验。所以我知道我们发射了很多卫星来探测太空,但它们会把信息发送给我们,这样我们就可以体验和学习。

好奇心可能是 AI 永远不会从我们这里夺走的东西。他们可能会夺走我们今天定义为工作的东西。我期待着这一点。我不想工作。但就像我说的那样,我过去为了娱乐而做的事情,现在我把它当作工作来做。所以我认为几年后,人类将有机会。大多数人将有机会或有机会做他们认为有趣的事情并获得报酬。

这可能是一个……好吧,我不是末日论者,但我确实认为我们必须考虑我们的智能形式和人工智能形式之间可能存在混乱状态的可能性。是的,如果……而且我意识到这就像……

非常天真,但如果我们可以让 AI 开发中的所有关键参与者,如美国、中国、英国,如果每个人都能朝着相同的目标努力,而不是相互对抗,那就太好了。是的,我们正在朝着相同的目标努力。研究界如何继续合作,这很有趣

合作。是的。尽管,你知道,制裁。创新会找到出路。很好。还有一个很好的声音片段。很好。好的。太酷了。我们刚才进行了一次有趣的讨论。我还想谈谈关于 AI 战略的另一件事。我们刚才谈论了如何在竞争环境中使用你的支柱来构建 AI 战略。

你与你的支柱一起开发的另一个框架是你称之为竞技场框架的东西。告诉我们关于这件事。所以竞技场框架是针对战略方面的,对吧?当我试图制定战略时,我会考虑这个问题,它来自于思考

什么经受住了时间的考验,对吧?好吧,不是全部时间,而是某种形式的时间。你知道角斗士曾经战斗的竞技场,对吧?这些都经受住了时间的考验。你今天可以看到其中一些。围绕它们的建筑非常坚固。所以你看,支柱的形式,是一个圆圈,它们有很多支柱,支柱有部分。所以你可以把它想象成你的 AI 战略,你的策略

在竞技场中展开战斗,对吧?竞技场是市场,无论你想怎么称呼它,自由市场。所以制定你的战略,首先,使用支柱并拥有客观真理的部分,了解你的资源并制定你的策略,可以创造非常好的战略和策略,你可以将它们应用到竞技场中。

很好。那么在团队方面,我认为这将是你的下一个问题,对吧?你有你的战略,你有你的策略,现在你有一个团队。我认为 AI 领域发展得相对较快。我认为对于那些领导团队的人来说,我认为你们需要在追求创新方面积极进取。你们需要在发布和开发方面积极进取。

进入市场。所以要积极进取、集中、协调、足智多谋、高效和数据驱动。Accreed 是它的缩写。我认为这些原则,如果你体现了这些原则,你将在快速发展的领域取得成功。因为如果你积极进取,你就会

你会全力以赴地解决大多数问题。如果你集中精力,你就会专注。如果你协调一致,你就会与你的环境和环境中的资源和谐相处。如果你足智多谋,你将利用你环境中的所有东西。如果你高效,你将充分发挥你的能力,而不会花费时间或金钱等成本。并且你是数据驱动的,这使你能够证明你的结果,批准你的假设并进行改进。

这是我思考问题的一个漫长的方面。但我考虑这个……

可能比以往任何时候都多。很好。你有一些关于 AI 战略的可靠原则。显然有很多东西需要吸收。也许它将成为未来的课程或书籍。也许它将成为未来的课程。在我们结束本集之前,我想快速提到,自从我们上次交谈以来,你实际上已经发布了一些其他内容,我们的听众可能会感兴趣。所以在 O'Reilly 平台上,你发布了一门计算机视觉课程,这实际上是

与我们今天讨论的所有 MongoDB 内容大致正交。是的,计算机视觉是我在硕士阶段学习或擅长的东西。所以就像我说的那样,我一直都在进行教学,当我担任机器学习架构师或计算机……

我在 AI 中的第一个角色实际上是计算机视觉工程师。然后我成为了一名机器学习架构师。现在我是一名 AI 和 ML 开发者倡导者。所以我在去年 10 月 2024 年与 O'Reilly 合作发布了一门计算机视觉课程。它只是涉及计算机视觉的基础知识。所以目标检测、姿态估计。我们正在研究不同的技术。我正在解释这些模型。实际上有一个……

它实际上是一门实践课程。所以大约有四个小时,或者可能有两个小时被编辑掉了。但大约有两个小时是我使用 PyTorch 编码并向你展示如何从头开始构建神经网络。然后我们训练神经网络,并进行一些迁移学习。所以它有很多好的部分

这么说吧,那些老掉牙的东西并不是生成式AI,而是计算机视觉。但它确实很棒。是的。我的意思是,在包括今天的节目在内的很多节目中,我们最终谈论了这么多关于生成式AI和AI智能体的内容,这很有趣。

这正是人们现在谈论的内容。它很新,很酷,但像计算机视觉这样的东西绝对不会消失。它不是生成式的东西。它不一定是AI智能体,尽管它显然可以与这两种类型的东西中的任何一种结合到一个系统中。补充它,为AI系统提供看和导航世界或做出决定、根据周围环境中的信息得出结论的能力。

酷。然后是最后一件事,我总是以向嘉宾推荐书籍来结束节目,你仍然需要这样做。但在你这样做之前,我还想提到,你和许多其他合著者一起,大约有10个人,我没有计算确切的数字,你们合著了一本2024年由PACT出版的书。

名为“构建AI密集型Python应用程序”。它实际上是一本关于MongoDB的书。是的。所以,当我加入这家公司时,MongoDB内部有很多令人惊叹的人,他们非常有创造力,非常聪明,并且渴望学习。

并且渴望为这个领域的普遍智能做出贡献。这就是为什么你会看到这本书有很多作者,因为每个人都渴望在这个发展非常迅速的领域做出贡献。

这里有很多学习者。我们身处战壕之中。我们身处竞技场。我们向客户学习。我们帮助我们的客户。我们将这些学习成果融入到我们认为与当今许多开发人员产生共鸣的书中。这就是我们正在做的。因此,我们构建的学习材料

希望它经受住了时间的考验,也许是两年,三年。很好,是的。所以,是的,我想如果人们想学习更多关于我们在今天节目中讨论的内容,他们显然可以在Gen AI上学习深度学习AI课程。我们会提供一个链接。

但如果你更喜欢从书中学习,我还会在节目说明中提供你撰写的《构建AI密集型Python应用程序》一书的链接。非常好。好的,那么,里士满,这就引出了我的倒数第二个问题,你有没有给我们推荐一本书?是的,我可以推荐两本吗?可以。好的,非常好。一本是塞思·戈丁写的《这就是策略》。

免责声明,附注,它不是策略。这本书实际上并不是策略。这本书实际上是一堆塞思·戈丁的即兴发挥。他是一位非常受欢迎的营销人士。所以它实际上是一堆即兴发挥。你可以看到它是一堆长篇推文,被放在一本书里。有些人可能不喜欢这种结构形式,但他谈论了很多

在营销和销售环境中制定和构建策略。这非常相关。我在MongoDB的一个营销组织中,但我认为开发人员也应该阅读这些书籍。它只是包含了很多宝石。它并没有真正的结构,所以人们讨厌它,但我喜欢它。

是的,这是我的第一本推荐书。《这就是策略》塞思·戈丁著。第二本是《关键对话》。我认为这是一本很受欢迎的书。几个月前有人向我推荐了这本书,因为在我职业生涯中我发现自己

与不同类型的人进行了很多对话。MongoDB是一家大型公司。我们有超过5000名聪明的人在这里工作。人工智能领域正在发展壮大。几年前,它感觉很小,就像一个紧密的社区。现在,每个人都在这个领域,但像你和其他领域内的影响者和专家一样,我们仍然有这个小群体,但人工智能领域正在发展壮大。我出于不同的目的与不同类型的人交流。《关键对话》让我能够以一种能让我得到我想要的东西的方式说话。这听起来很简单,但是……

这是一件很难做到的事情,你可以在与某人交谈时表达你的目标,而不会迷失在情绪或某个时刻,并确保你达到你想要的结果

为什么不也避免树敌呢?并且在最有效的时间,在最关键的时间这样做。所以这本书真的帮助了我。我大概只读了一半。那本书叫什么名字?《关键对话》。《关键对话》。很好。非常酷。我认为这是一本非常受欢迎的书。我认为《这就是策略》也是一本相当受欢迎的书。是的,是的,是的,是的。

很好。好的,里士满。我本来想问,你有没有给我推荐什么书?这太有趣了。实际上,我昨天在飞机上。我读了一本来自,你认识科尔·纽斯鲍姆或纳夫利克吗?你听说过她吗?没有。几年前,也许十年前,她写了一本名为《用数据讲故事》的书。

是的,我见过……它非常受欢迎。太疯狂了。我不知道她卖出了多少本,但根据亚马逊评论的数量,它就像成千上万或数万,我不记得了,亚马逊评论。所以可以肯定地说,这本书已经卖出了数十万册。现在,我实际上没有读过那本书。我相信这是一本好书。很多人读过它。但是……

在录制时,我正在为一个大型开幕主题演讲做准备。我和你谈过这个。我不知道在录制这期节目时它是否已经过去,在发布这期节目时,但在3月19日,我将在弗吉尼亚州里士满的RVA科技数据与人工智能峰会上发表这个开幕主题演讲。我以前做过主题演讲。

但我邀请了科尔·纽斯鲍默,纳夫利克来参加节目。我不记得那一集的具体编号,但也许是一年前或两年前,当时她正在宣布她最新著作《与你讲故事》的出版。

所以它是一本关于有效演示的指南,它让我想起了《关键对话》,就像这本书中很大一部分内容一样,她在这本书中谈论的是如何利用演示来改变人们的思维方式,使其与你的思维方式一致。所以,我

是的,到目前为止,我一直非常专注于这本书。她是一位了不起的沟通者,所以当然这是一本好书。她是一位畅销书作家,所以不出所料,这是一本非常紧凑的书,写得非常好,而且她在《与你讲故事》这本书中也很好地运用了故事。所以到目前为止我非常喜欢它。我还没看完,但是……

很好,它一直都很完美。如果你正在收听节目,或者你,理查德,特别想让我推荐这本书,那么现在你得到了。如果你正在准备演讲,我已经,你知道,我已经草拟了几页关于我想做的事情的想法,在录制时我距离演讲还有一个月的时间,我想,

所以开始读这本书是完美的,因为它有很多练习。所以我在做笔记的时候写了很多东西,好吧,这对定义我的受众和开发材料很有帮助。我真的很兴奋。我认为这将让我发表有史以来最好的演讲。很好。首先,我不会去弗吉尼亚州里士满,但我希望演讲会被录制下来,而且我能看到它。我想提的一件事是

软技能在人工智能或任何技术角色中都非常重要。大多数开发人员应该超越技术能力,也关注软技能。实际上,几年前,也许是四年前或三年前,我在英伟达上写了一篇文章,名为《数据科学家应该学习讲故事》。是的,我认为这就是我标题的措辞,但它基本上谈论的是用数据讲故事。

这是一篇短文,也许有2000到3000字,有很多图片,它谈论的是同样的事情,对吧?利用数据向合适的受众传达想法。我认为我还提供了一个框架,说明人们应该如何处理它。但这就是我想说的,这是一个当时的相关话题,或者说她十年前写了一本书。所以我认为这又是一个支柱,对吧?

你可以以此为基础发展你的职业生涯,那就是有效的沟通,对吧?当然。我以前,当我五年前,四年前开始主持这个节目时,我经常问客人的一个问题是,你在面试的人身上最看重什么?因为我认为我们的很多观众都想知道人们在寻找什么关键技能。沟通通常是人们最先寻找的东西。

没错。即使是与大型语言模型交谈,沟通也是一件大事。提示工程。这完全是关于沟通,伙计。是的,我们最近和瓦伦·戈德博尔做了一期有趣的节目。它已经发布了,我不知道,我没有放在面前。现场录制一集节目的一件有趣的事情是我不想只是坐在我的电脑后面

但通常当我远程录制时,我的电脑就在那里,所以我可以查一下。这是那一集的编号。是一样的。科尔·纽斯鲍姆,奈飞那一集。我没有记住那一集的编号。瓦伦·戈德博尔,也是一样。这是一件非常有趣的事情。瓦伦·戈德博尔在谷歌做了10年的软件开发人员。在最后几年,他是双子座的核心开发人员。所以,你知道,他是一个大型语言模型工程师。而且……

而且他在那一集中有一个非常有趣的时刻。我认为这可能是播客历史上最有趣的事情之一,他谈到他是如何通过与伴侣进行关系治疗而成为一个更好的提示工程师的。

我取笑了他,因为我说,这太像谷歌开发人员了,这件事,你关系治疗的主要结果是你成为一个更好的开发人员。更擅长与机器交谈。哦,哇。这实际上很好。我觉得这很好。喜欢这个。很好。好的。所以最后一个问题,里士满。节目结束后人们如何关注你?

是的。领英是我选择的平台。你可以关注我的领英。此外,我在MongoDB上发表了很多文章。我们在这里也发表了很多文章。所以你的领英资料会有一个链接。

是的,领英是最受欢迎的关注我的方式。是的,而且我还真的鼓励一些开发人员和正在收听的开发人员尝试使用MongoDB进行他们的AI应用程序。下面会有一个链接,你可以在那里获得一个免费的MongoDB Atlas集群并试用它。将你的向量数据和元数据导入,让我们一起构建未来。

很好。结尾的信息很好,里什曼。说得很好。你是一位很棒的演讲者。很高兴邀请你参加节目,并在这里亲自见到你。是的。非常感谢。是的,也许几年后我们可以再次联系,看看你过得怎么样。感谢你的邀请。

很好,与里奇曼诺拉切一起度过了精彩的一集。在节目中,他介绍了MongoDB的文档数据模型,该模型使用类似JSON的结构,使其成为AI应用程序的理想选择,因为它在实验过程中提供了灵活的模式,同时允许在生产过程中锁定模式。他还谈到了向量搜索功能以及它们现在如何直接构建到MongoDB中,从而能够在单个数据库中组合词法和向量搜索的混合搜索。

他谈到2025年是多时代时代的开始,其中包括多智能体架构成为主流,多步骤问题解决模型,处理文本、图像、视频和音频的多模态嵌入,多语言能力以及超越向量搜索的多种检索机制。

他还为AI战略提供了ARENA框架,其中包括在具有客观真理的坚实支柱上构建,遵循ACRED原则:积极进取、集中化、资源丰富、高效和数据驱动,并在市场竞技场中测试策略。他还谈到内存管理对于AI系统正变得越来越重要,需要采用复杂的方法来有效地存储和检索信息。

与往常一样,你可以在superdatascience.com/871上获得所有节目说明,包括本集的文字记录、视频录制、节目中提到的任何材料、里士满社交媒体资料的网址以及我自己的网址。

我简直不敢相信它终于来了。如果你想在3月19日明天在线下而不是在线上联系,我将在弗吉尼亚州里士满的RVA科技数据与人工智能峰会上发表开幕主题演讲。有很多优秀的演讲者。所以来看看吧。你没有太多时间参与。所以如果你住在里士满地区,那就在明天。RVA科技数据与人工智能峰会。在那里见到你将非常棒。

当然,感谢Super Data Science播客团队的每一个人,我们的播客经理索尼娅·布雷维奇,媒体编辑马里奥·庞博,合作伙伴经理娜塔莉·谢斯基,研究员塞尔吉·马西斯,我们的作家扎赫拉·卡尔谢博士,以及我们的创始人基里尔·阿拉门科。感谢他们为我们今天制作了另一集有趣且内容丰富的节目,感谢超级团队为你们创造了这个免费播客。我们非常感谢我们的赞助商。你可以通过查看我们的赞助商链接来支持这个节目,你可以在节目说明中找到这些链接。

如果你想赞助这个节目,你可以在johncron.com/podcast上获得如何做到这一点的详细信息。否则,请与喜欢这个节目的人分享。在你最喜欢的播客平台上评价这个节目。订阅。随意将我们的视频编辑成你喜欢的短视频。但最重要的是,继续收听。我很感激你的收听,并希望我能够继续制作你多年来喜爱的节目。直到下次,继续摇滚吧。我期待着很快与你一起再次享受Super Data Science播客。