您好,AI 工程师们。我们很高兴能为您带来与 Bret Taylor 的特别对话,他是价值 45 亿美元的对话式 AI 平台 Sierra 的首席执行官,也是无需介绍的 OpenAI 董事会主席。他在科技领域拥有悠久的职业生涯,包括共同创建 Google 地图和 Facebook 的“赞”按钮,创办 Quip,以及担任 Salesforce 联席首席执行官和 Twitter 公司董事长。
纵观他令人眼花缭乱的成就,Bret 始终是一位 AI 工程师,并且对软件开发的未来充满热情,他认为我们正在从软件工程的“自动驾驶”时代走向自主时代。他同样能够轻松地谈论 JavaScript React 网络应用程序的内部结构,也能谈论 2023 年 OpenAI 董事会风波等高风险局面的处理。
他观察到了一种新的专业 AI 架构师角色的兴起,这是一种更资深的 AI 技术领导者,补充了 AI 工程师的角色,这在他担任 Sierra 和 OpenEye 的职务期间与高级 AI 领导者进行的多次高级对话中有所体现。
在 Bret 的整个职业生涯中,我们观察到他成功的秘诀在于:小型团队中产品管理和工程的紧密结合,通过“对结果的狂热关注”(引用)而非在价格表上展示实施细节来与客户保持一致。
我们在 2 月 20 日纽约市 AI 工程师峰会 AI 领导力专场上组织了这次对话,我们邀请了来自彭博社、领英等主要公司的 AI 首席技术官和副总裁,就他们的 AI 战略进行讨论,并密切关注技术细节。这是我们最后一次呼吁 AI 领导力与会者加入我们。
工程专场现已售罄,我们预计领导力专场的席位很快就会售罄。请在 apply.ai.engineer 申请邀请函。两周后见。请注意安全。
大家好,欢迎收听 Latent Space 播客。我是 Alessio,Decibel Partners 的合伙人和首席技术官,我的联合主持人是 Swix,Small AI 的创始人。嘿,今天我们非常高兴邀请 Bret Taylor 加入我们。欢迎。感谢你们的邀请。能在这里见到你真是太不可思议了。这些年来,我读过很多关于你的文章,甚至在 OpenAI 之前。我的意思是,我用 Google 地图来到这里。
所以,感谢你所做的一切。你辉煌的历史,我想人们可以了解你最伟大的成就。当你谈到你的职业生涯总结时,你通常是如何介绍自己的?你如何看待自己?是的,这是一个很好的问题。在我们开始录音之前,我们正在讨论这个播客的受众主要是工程师。我认为,根据受众的不同,我会用不同的方式介绍自己,因为我担任过许多
公司和董事会职务。但我可能更倾向于将自己定义为工程师。即使在我担任 Salesforce 联席首席执行官期间,我周末也在编写代码。所以我认为自己首先是一位工程师,然后才是我职业生涯中担任的其他所有角色。因为我确实觉得工程是一种思维方式,也是我处理大部分生活的方式。所以我首先是一位工程师,这就是我如何形容自己的。你是在 1998 年主修计算机科学的吗?我是高中时。我的大学学位是 02 年本科,03 年硕士。不算太老。是的,是的。我的意思是,我从 1998 年到 2003 年都在学习。但是......
那时工程还不是一个专业。我们没有高级工程师的头衔。它只是......你是一位程序员,或者可能是一位开发人员。斯坦福大学是什么样的?感觉如何?你是否感觉自己正处于一场伟大的计算机革命的风口浪尖,或者那只是一个利基兴趣?好吧,正如你所说,我从 1998 年到 2002 年都在斯坦福大学。
1998 年接近互联网泡沫的顶峰。所以,那是在大多数人都在计算机实验室里编写代码的日子,仅仅是因为那里有 Sun Microsystems 的 Unix 服务器,我们大多数人都必须在上面完成作业。每天都有一家 .com 公司为每个人买披萨。我不必......我头两年大学都吃免费的食物。
然后,互联网泡沫在我大学生涯的中间破裂了。所以到了最后,招聘会上就像长满了荒草一样,你知道的,因为除非你当时就在那里,否则很难描述当时的炒作程度,在斯坦福大学主修计算机科学就像有成千上万的机会。
然后当我离开的时候,就像微软、IBM 一样,然后我申请的两家创业公司是 VMware 和 Google。我最终去了 Google,很大程度上是因为一位名叫玛丽莎·梅耶尔(Marissa Meyer)的女性,她在我担任所谓的“部门负责人”(类似于初级助教)时曾担任助教。
一门大型入门计算机科学课程。她去了那里,她正在招聘我,我认识她,感觉很安全。你知道的,就像......我不知道。我并没有多想,但这最终成为一种真正的福气。我意识到,你知道的,你总是想认为如果可以选择的话你会选择 Google,但在当时没有人知道。
我想知道如果我在 1999 年毕业,我会不会说:“妈妈,我刚在 pets.com 找到了一份工作。很好。”但是你知道的,最后我没有其他选择。所以我想,我是想去 VMware 做内核软件呢,还是想去 Google 建立搜索引擎呢?我选择了 Google,50/50 的概率。我并不是真的 50/50 的概率。所以事后看来,我感到非常幸运,因为经济崩溃在某种程度上让我进入了一家有史以来最伟大的公司之一,但我认为我有点侥幸。
所以关于 Google 的一个著名故事是,在收购 MapQuest 地图后的一周内,你重写了 Google 地图的后端。当时的情况如何?是
这实际上是真的吗?这是被夸大了的吗?这究竟是怎么发生的?也许 Paul 之前没有分享过什么细节?这基本上是真的,但我可以补充一些细节。所以实际上是前端,而不是后端。但事实证明,对于 Google 地图来说,前端是比较困难的部分,因为 Google 地图是......
很大程度上是第一个真正具有交互性的网络应用程序。我说“第一个”,我认为 Gmail 当然也是,尽管 Google
Gmail,很多非工程师可能并没有意识到它的交互性水平。它只是速度很快。但是 Google 地图,因为你可以拖动地图,而且它是一种图形化的地图,真正意义上的主流,我认为。那时是 MapQuest 吗?你上下移动箭头?是上下箭头。每张地图都是一张单独的图像,你只需点击左侧,然后等待几秒钟,新地图就会加载。它也很小,因为在当时的计算机上生成大图像
成本很高。所以 Google 地图在这方面确实具有创新性。关于它的故事,有一家名为 WhereTo Technologies 的小公司,由两兄弟 Lars 和 Jens Rasmussen 创立,他们现在是我的两个最亲密的朋友。他们制作了一个名为 Expedition 的 Windows 应用程序,该应用程序拥有精美的地图。即使在 2008 年,
当我们收购或兼并他们的公司时,Windows 软件并不是特别流行,但他们对地图绘制非常热情。我们制作了一个本地搜索产品,其受欢迎程度中等,有点像黄页搜索产品。所以我们想真正进入地图领域。我们已经开始着手进行这项工作。他们的团队规模很小,但似乎对这项工作充满热情。所以我们说,加入我们吧,我们可以一起构建它。
事实证明,他们开发了一个 Windows 应用程序是一件幸事,因为在进行原生代码开发时,你受到的技术限制比构建 Web 浏览器要少得多,尤其是在当时,几乎没有真正具有交互性的 Web 应用程序。
最终改变了我们想要达到的应用程序质量水平,因为我们的目标是制作一款感觉像原生 Windows 应用程序的产品。所以,他们的非常规技术选择最终成为最大的福气,这真是太幸运了。所以我们花了大量时间来讨论,如何在 Web 浏览器中制作一个交互式、可拖动的地图?如何逐步加载,你知道的,新的地图瓦片,当你拖动时?以及
甚至像当时浏览器底层的东西一样,大多数浏览器,比如当时占主导地位的 Internet Explorer,一次只能从同一个域加载两张图像。所以我们最终让我们的地图瓦片服务器拥有大约 40 个不同的子域,这样我们就可以并行加载地图,就像很多技巧一样。
我很乐意深入探讨。哦,只是关于 HTTP 连接之类的东西?只有最大并行度为 2。所以如果你有一组地图瓦片,大约有 8 个。所以我们深入研究了浏览器。无论如何,所以有很多管道工作。我对浏览器的了解比大多数人都多。
但到了最后,这段代码上有很多胶带。如果你曾经做过一个工程项目,而你并不确定从 A 点到 B 点的路径,那就几乎像是通过一次建造一间房间来建造一栋房子一样。最后没有多少架构上的凝聚力。然后我们收购了一家名为 Keyhole 的公司,该公司后来成为 Google 地球,它就像那三个一样,它也是一个原生的 Windows 应用程序。
单独的应用程序,很棒的应用程序。但有了它,我们获得了所有这些卫星图像的许可证。因此,在 2005 年 8 月,我们将卫星图像添加到 Google 地图中,这增加了代码库的复杂性。然后我们决定要支持 Safari。当时还没有手机。所以 Safari 是 Mac 上的一个新兴浏览器。
事实证明,幕后有很多决定,这些决定在某种程度上受到了这个 Windows 应用程序的启发,例如大量使用 XML 和 XSLT 以及所有这些在 21 世纪初曾短暂流行的技术,现在每个人都讨厌它们,这是有充分理由的。
事实证明,Internet Explorer 中的所有 XML 功能在 Safari 中都不受支持。所以人们就像重新实现 XML 解析器一样。这就像一堆垃圾一样。我不允许在你的播客上说脏话。是的,当然。所以它从一个每个人都引以为傲的精美优雅的应用程序变成了一个可能包含数百 KB JavaScript 的应用程序,这听起来现在不算什么。我们当时谈论的是人们使用调制解调器,你知道的,不是所有调制解调器,但这确实是一件大事。
所以它很慢。加载需要一段时间,而且它并不是一个很好的代码库。所有东西都很脆弱。所以我对此感到非常沮丧。然后在一个周末,我重写了所有内容。当时“JSON”这个词还没有被创造出来,只是为了让你了解一下。所以都是 XML。是的。所以我们使用了现在你所说的 JSON,但我只是说,让我们使用 eval,这样我们就可以快速解析数据。再说一次,它就像 JSON 一样,但在当时它没有名字。所以我们只是说,让我们传递 JavaScript。
来自服务器并对其进行 eval 操作。然后突然间重构了整个东西。我并不是什么天才。我只是,你知道的,如果你知道你一开始就知道的所有东西,而我知道所有功能,因为我是 JavaScript 的主要作者之一。我只是......
我只是喝了很多咖啡,然后通宵达旦地工作了一个周末。然后我想我建立了一些声誉。很长时间以来,没有人知道这件事。然后是 Paul,他创建了 Gmail,之后我们还和他一起创办了一家公司,他在播客上谈到了这件事。现在它更低了。但这基本上是真的。我确实重写了它,这是我最引以为傲的事情,我认为 JavaScript 程序员会欣赏这一点,例如......
当我重写 Google 地图时,所有 Google 地图的未解压缩包大小为 20K。压缩后要小得多,整个应用程序的大小减少了 10 倍。所以 Google 发生了什么?Google 是一家非常主流的公司。所以我们的使用量激增,因为事实证明......
它更快。对于 Google 这样的规模来说,速度更快就意味着增长百分比的提升。所以你使用了多少现代工具?比如测试套件、编译器?实际上,那是不对的。我们确实有一样东西。所以实际上,Google,你可以下载它。有一个
Google 有一个......Closure 编译器。是的,Closure 编译器。我不知道是否还有人使用它。哦,是的,是的。是的,它已经过时了。Facebook 使用它。是的,即使直到最近,它也比大多数 JavaScript 代码压缩器更好,因为它更像......它做了更多的变量重命名等操作。现在大多数人使用 ESBuild,因为它速度很快。Closure 编译器是......
基于 Java 并且速度非常慢等等。但是,所以我们确实有这个。就这些了。哦,哇。好的。所以,这在内部被交易。你知道的,那是在 Google 的一个非常有趣的时期,因为当时有很多团队在做相当先进的 JavaScript 开发,而当时没有人这样做。所以。
Google Suggest,Kevin Gibbs 是它的技术负责人,我认为它是 Web 浏览器中第一个自动完成功能。现在它在搜索框中随处可见,你可以在那里看到自动完成功能。我的意思是,ChatGPT 刚刚添加了它。这有点像往返行程。完全正确。不,它现在作为一种 UI 功能已经很普遍了,但这只是 Kevin 的 20% 项目。
然后是 Gmail,Paul,你知道的,他比任何人都能更好地讲述这个故事,但他就像,你知道的,基本上是在满足自己的需求。但真正巧妙的是,电子邮件,因为它是一种生产力工具,需要更快。所以,你知道的,他是在满足自己的需求,只是让更多东西在客户端运行。然后我们,由于 Lars 和 Yen 设定了这个 Windows 应用程序的标准,我们就像,我们需要我们的地图是可拖动的。所以我们最终
不仅在拥有大型同步方面进行了创新,现在这被称为单页应用程序,而且还在所有图形方面进行了创新。你知道的,我们让 Firefox 崩溃了,就像它已经过时了一样,因为你知道的,当你制作一个文档对象模型时,它的理念是一个文档,然后你添加一些 JavaScript,然后我们基本上滥用了所有这些,它只是遇到了没有......
被充分利用的代码路径,你知道的,在这个时候。所以这非常有趣。而且,你知道的,在建筑物里,你拥有,所以你拥有编译器,人们实际上帮助压缩 JavaScript,但那里有很棒的工程团队。所以他们就像,这就是为什么 Closure 编译器这么好。它就像一个真正了解编程语言的人在做这件事,而不是,你知道的,编写正则表达式。然后是现在 Chrome 团队的团队,我相信,我不知道这是事实,但我非常确定 Google 长期以来一直是 Firefox 的主要代码贡献者。
而且很多浏览器人员都在那里。所以每次我们让 Firefox 崩溃时,我们都会走到楼上两层,然后说:“到底是怎么回事?”他们会在调试器中加载他们的浏览器,我们可以找出到底是什么东西坏了。你不能更改代码,对吧?因为它是浏览器。它很慢,对吧?我的意思是,更新很慢。所以,但我们可以找出错误的确切位置,然后在我们的 JavaScript 中解决它。所以这就像一个新的领域一样。就像一个超级、超级有趣的时刻。就像很多、很多优秀的工程师在发现新事物一样。而且,现在,你知道的,这个词,这个术语已经过时了,但“Ajax”这个词,它是异步 JavaScript 和执行 XML。因为我告诉你 XML,但请看那里出现的 XML 这个词,公平地说,
从客户端到服务器发出 HTTP 请求的方式是这个名为 XML HTTP 请求的对象,因为微软在制作 Outlook 网页访问时使用了这个对象。事实证明,它与 XML 没有关系。这只是发出 HTTP 请求的一种方式,因为 XML 是当时流行的东西。它就像,这就是你,你知道的,你所做的事情,但 JSON 是从那里产生的,你知道的,然后很多
构建 JavaScript 应用程序的最佳实践。这是在 React 之前。我认为 React 可能是我们需要的向前迈出的重要概念性一步。即使是我在 Google 之后创建的第一个社交网络,我们也使用了大量的 HTML 注入,而实时更新仍然是手工编码的。当你看到像 React 这样的概念性突破时,这真的很棒,因为它
我只是喜欢那些一旦你看到它就显而易见的事情,但在你做之前它却一点也不明显。实际上,我相信我们会谈到 AI,但我感觉我们会经历 AI 代理的相同演变。我觉得我们缺少很多核心抽象,我认为在 10 年后我们会说:“天哪,你以前是怎么制作代理的?”但这就像 Web 应用程序的早期一样。有很多 AI 的反应式工作的竞争者,但还没有明确的赢家。
我想说。我观察到的一件事是,我的意思是,我们有很多内容可以讨论。你刚刚讲了很多内容。我观察到的一件事是,我认为 Google 早期有一个有趣的 PM 和工程师的组合,这......
我认为你就是。你没有等待 PM 告诉你,这是我的 PRD,这是我的需求。哦,好的。我从技术上来说不是软件工程师。我的意思是,从头衔上来说,显然是。对,对,对。这就像一种混合。我觉得现在,产品是一个独立的学科,有自己的知识、自己的行业,工程也是一个独立的东西。这个过程中会发生一些事情,它们是分开的,但如果你把它们合二为一,你不会得到像那样好的产品。
我很想知道这是否与比较......
Google 早期与你目前看到的现代创业公司是否有关?我当然喜欢戴很多帽子。所以,你知道的,我对这一点有点偏见,但我真的同意,将产品设计和工程结合到尽可能少的人身上有很多好处,因为你知道的,很少有伟大的事情是由委员会创造的,你知道的?所以如果工程是产品的订单接收组织,我
你可以有时做出有意义的事情,但你很少会创造出极其精良的突破性产品。这些往往是由深入了解他们正在解决的客户需求、对结果有狂热关注的小型团队创造的。我认为原因是,我认为对于某些领域来说,如果你看看五年前的软件即服务,也许你可以将产品和工程分开,因为五年前创建的大多数软件即服务,我
我不会说大多数商业应用程序都需要大量的技术突破。如果你正在制作费用报告软件或其他什么东西,它很有用。我不是想轻视费用报告软件,但你可能只想了解一下财务部门的需求是什么?个人最终费用报告的要求是什么?好的。是的。
去实现它。而且你知道 Web 应用程序是如何实现的。你知道数据库是如何工作的,如何在你的 AWS 集群中构建自动缩放,等等,你知道的,你只是将最佳实践应用于另一个问题。当你遇到像移动开发早期或交互式 Web 应用程序早期这样的领域时,我认为 Google 地图和 Gmail 就代表了这一点,或者现在的 AI 代理,你正在与客户和利益相关者的需求以及与之交互的所有不同人员以及技术的性能进行持续的......
对话。当你不知道技术本身的局限性时,几乎不可能指定产品的需求。这就是我使用“对话”这个词的原因。它不是字面意思,在对话式 AI 时代使用这个词有点好笑。
你一直在说,理想情况下,你可以撒一些神奇的 AI 仙尘来解决世界上所有的问题,但这行不通。事实证明,实际上,我将举一个有趣的例子。我认为大多数听众可能使用副驾驶来编写代码,例如 Cursor、Devon 或 Microsoft Copilot 等。大多数这些工具都很出色。我现在无法想象没有它们该如何进行开发。
但它们还不是自主的。就像我不会让它在没有我的交互式检查的情况下编写大部分代码一样。我们正处于一个介于它是一个很棒的副驾驶和它是一个自主的软件工程师之间的阶段。作为一名产品经理,你对产品的期望是......
但如果你是一个产品人员,是的,你当然会说它应该是自主的。你应该点击一个按钮,程序就会从另一端出来。需求毫无意义。重要的是,它基于技术的细微限制。它的能力是什么?然后你如何最大限度地利用它为软件工程团队提供的优势,考虑到这些细微的权衡?
再加上这些细微的权衡变化的速度比我记忆中的任何技术都快,这意味着每隔几个月你就会有新的模型和新的功能。那么,你如何构建一个能够尽可能快地吸收这些新功能的产品呢?这需要技术深度和对客户的理解的结合,因此你确实需要更多集成技能
产品设计和工程。所以我认为这就是为什么在这些大型技术浪潮中,我认为创业公司比老牌公司更有优势,因为它们往往更能自我实现,就像将这些学科更紧密地结合在一起一样。特别是,我认为企业家
企业家,也就是那些众所周知的全栈工程师,也更有优势,因为我认为大多数突破性进展都发生在那些能够理解极其细微的技术权衡、对产品有远见的人身上。然后在构建它的过程中,正如我所说,与技术进行隐喻性的对话,就像,“天哪,我遇到了一个我没有预料到的技术限制。”
这不仅仅是更改该功能。你可能需要根据该功能重构整个产品。我认为这在现在尤其重要。所以,你知道的,如果你正在构建一个大型 ERP 系统,那么拥有产品和工程团队可能是有充分理由的。我认为,总的来说,这些学科的存在是有原因的。我认为,当你处理像当今大型语言模型这样的细微技术时,拥有技术
将这些学科更正式地整合在一起的个人或组织具有巨大的优势。这很有道理。我过去管理过很多工程团队,我认为产品与工程之间的矛盾一直更多地是关于工作量,而不是关于功能是否可行。但我认为,是的,今天你看到更多的是模型实际上无法做到这一点。我认为最有趣的事情是在创业公司方面,人们还不知道很多 AI 的价值将在哪里累积。所以你看到很多人在构建框架、构建基础设施、分层事物。
但我们并不真正了解计算的形状。我对 Sierra 的好奇之处在于,你是如何考虑构建内部工具来进行 eval 或构建代理以及所有这些工作的,以及你如何看待可能仍然存在的创业机会。我们在 Sierra 内部构建了大部分工具。并非全部。这不像“不是我们发明的”综合症,尽管我可能有点这种倾向,但是的,
因为我们正在尝试构建一个持久的平台,你知道的,我们真的希望能够掌控自己的命运,而且,
你之前说过,我们仍在努力弄清楚反应式代理是什么,而且结果尚未揭晓。我认为它还没有被创造出来。我不认为结果尚未揭晓。要使用这个比喻,我们正处于代理的 jQuery 时代,而不是 React 时代。这对听众来说是一个倒退。我们不应该操之过急。不,是的,这就是我的观点。所以,因为我们正在尝试在 Sierra 创建一家能够超越我们的公司......
我不确定我们是否想把我们的马车拴在一匹马身上,因为我们还不清楚我们已经弄清楚了。实际上,作为一家公司,我们正在尝试实现的目标,只是在高层次上,我将快速回到技术方面。在 Sierra,我们帮助消费品牌构建面向客户的 AI 代理。所以,是的。
从 Sonos 到 ADT 家庭安全系统再到 SiriusXM,如果你打电话给他们,AI 会接听。如果你在 SiriusXM 首页上与他们聊天,它是一个名为 Harmony 的 AI 代理,他们是在我们的平台上构建的。
使用 AI 和对话式 AI 构建端到端完整客户体验意味着什么?我们真的想深入研究所有权衡取舍。你在哪里使用微调?你如何将模型串在一起?你在哪里使用推理?你在哪里使用生成?你如何使用推理?
如何表达代理过程的防护措施?如何在根本上非确定性的技术上强加确定性?这有很多真正重要的设计空间。我可以坐在这里告诉你,我们有最好的方法,每个企业家都会这样说。但我希望两年后,我们会回顾我们的平台,并嘲笑我们当时是多么的天真,因为这就是变化的速度。总的来说,你谈论的是创业机会,对吧?
我并不完全怀疑工具公司,但我相当怀疑。每个规则总有例外,但我相信肯定有一个巨大的前沿模型市场,但主要面向拥有巨额资本支出预算的公司。所以OpenAI和微软、Anthropic和亚马逊网络服务、谷歌云,现在资金非常充裕。但我认为,
一家公司可以通过预训练基础模型来赚钱的想法可能并不正确。这很难,你正在与,你知道,不合理的巨额资本支出预算竞争。我只是喜欢云基础设施市场,我认为它将在很大程度上存在。我也非常相信人工智能的应用,并且
我将其定义并非像构建代理那样,而是更像你实际上是在为企业解决问题。这就是Harvey在法律行业所做的,或者Cursor在软件工程中所做的,或者我们在客户体验和客户服务中所做的。我相信这一点的原因是,我认为在人工智能时代,软件真正有趣的地方在于它实际上可以完成一项任务。它实际上可以完成一项工作,这与几年前软件的价值主张大相径庭。
到两年前的历史。因此,我认为构建解决方案和领域的方式与以前大不相同,这意味着它并不明显,例如,现有的公司不一定有优势,他们当然有一些优势,但提供解决方案的形式因素却大相径庭。
而且非常有价值。你知道,就像想想Cursor为软件工程团队节省了多少钱,或者它可以产生多少替代收入。
工具制作非常具有挑战性。如果你把云市场作为一个类比,就会有很多有趣的工具公司,Confluent、Monetized Kafka、Snowflake、Hortonworks。有很多这样的公司。许多公司都将Confluence混合使用,或者使用开源或开放核心,或者你称之为的任何东西。我不是这个领域的专家。
你知道,我认为开发人员是善变的。我认为在工具领域,我可能会默认开源是会胜出的领域。很难围绕这个建立公司。然后你最终会得到一些围绕开源构建的公司,这些公司也可以运作。不要误解我的意思。但我只是认为,现在工具变化如此之快,以至于我不完全怀疑工具制造商,但我只是认为开源将在很大程度上胜出。但我认为,
构建前沿模型所需的资本支出使得它将流向少数几家大公司。然后,我非常相信特定领域的代理,我认为这有点类似于这个新时代中的软件即服务。就像,如果你只是想想云,你可以租用服务器,这只是一个低级原语,或者你可以购买像Shopify这样的应用程序。大多数
构建店面的人会更喜欢Shopify而不是手工制作他们的电子商务店面。我认为人工智能也是如此。所以我倾向于,如果我有一个企业家向我寻求建议,我会说,尽可能向上堆叠,直到满足客户的需求。但它并没有减少我对构建代理的反应性是什么的兴奋,仅仅是因为它是一个正确的问题,但我认为它可能会在开源空间中发挥作用,而不是其他任何地方。
是的,这不是你的优先事项。这里有很多内容。我很好奇你对客户需求的想法,你碰巧将客户体验确定为你的需求,但它也可能是编码辅助或其他任何东西。我认为对于一些人来说,我只是很好奇自上而下,你如何看待世界上的潜在问题空间?因为有很多非常聪明的人选择了错误的问题。是的,这是一个很好的问题。顺便说一句,
我也很想谈谈软件的未来,因为尽管我没有选择编码,但我显然对此考虑很多。但我可以回答你的问题。你知道,我认为当一项技术像大型语言模型一样酷的时候,
你会看到很多人从技术开始,寻找需要解决的问题。我认为这就是为什么你会看到很多工具公司,因为作为一个软件工程师,你开始构建一个应用程序或演示,然后你遇到了一些痛点。太难了。很多人都在经历同样的痛点。如果我做一个东西来解决这个问题呢?这只是很小的增量。你知道,我一直喜欢用这样的比喻,比如
你可以卖咖啡豆,烘焙好的咖啡豆。你可以增加一些价值。你拿咖啡豆来烘焙它们。烘焙好的咖啡豆的价格主要取决于咖啡豆的成本。或者你可以卖拿铁。拿铁的价格很少直接与咖啡豆的价格成正比。事实上,如果你在机场买拿铁......
这是一个被俘获的受众,所以这是一杯非常贵的拿铁。而且有很多因素会影响拿铁的成本。我之所以提到这一点,是因为从种植咖啡豆到烘焙咖啡豆到,你知道,你可以在家自己做,也可以在机场买一杯。
机场卖拿铁公司的利润率远高于烘焙咖啡豆的人。这是因为你实际上已经解决了机场里一个更尖锐的人类问题。而且对那个人来说,在那一刻,它更有价值。
这有点像我思考技术的方式。把这比作咖啡豆听起来很可笑,但你是在大型语言模型之上销售工具。是的,在某种程度上,你的市场很大,但你可能会因为你是一种基础设施而价格下降,然后你还有开源以及所有其他与你自然竞争的东西。如果你去为某人解决一个真正重大的业务问题,那实际上是一个有意义的业务问题,人工智能可以促进,
他们会根据该业务问题的价值来评估它的价值。所以我实际上觉得人们应该停止。你就像,“不,这不公平。”如果你正在寻找一个想法,人们,我喜欢人们尝试各种事情,即使我的意思是,很多最伟大的想法都是没有人相信的事情。所以我喜欢,如果你对某件事充满热情,那就去做吧。我有什么资格说?是的。或者Gmail,就像Paul一样,就我而言,我现在的一些说法有点像传说,但Gmail很长时间以来都是Paul自己的电子邮件。是的。
很长时间以来。然后我开玩笑地,Paul可以纠正我,我很确定他发给她一个链接,第一个评论就像,“这真的很棒。”如果它不是你的电子邮件,而是我自己的电子邮件,那就太好了。我不知道这是一个真实的故事。我很确定。是的,我以前读过。所以满足你自己的需求,很好。这取决于你的目标是什么。如果你想做一家风险投资支持的公司,如果这是一个充满激情的项目,该死的激情,去做吧。不要听任何人的话。事实上,但如果你想开始,你知道,一家持久发展的公司,满足你自己的需求。
解决一个重要的业务问题。我认为在代理的世界里,软件行业已经发生了转变,你不仅在帮助人们提高生产力,而且还在自主地完成任务。因此,我认为可寻址市场已经大大扩展,仅仅是因为软件现在实际上可以做事情并实际完成任务。编码自动完成的价值是多少?
相当多的。最终的价值是多少,我确信我们会拥有它,软件代理实际上会编写代码并将其交付给你?这价值不菲。所以,你知道,我可能会从大型语言模型中抬起头来,开始思考经济,你知道,从第一性原理出发思考。我不想说得太远,但只是想想经济的哪些部分会从这种智能中获益最多,哪些部分能够最容易地吸收它。
最容易。在这个领域中,代理会是什么样子?谁是它的客户?这项技术可行吗?我会从这些业务问题入手。我认为,你知道,最好的公司往往拥有优秀的工程师,他们恰好对市场有深刻的见解。我认为这是某些人认为的最后一点,无论他们是否拥有它,人们都太专注于技术,以至于他们有点迷失了方向。你如何看待仍然销售某种软件的模式与销售更多打包劳务的模式?我觉得当人们销售打包劳务时,它几乎更
无状态,你知道,如果你只是输入一个输入并获得一个输出,那么它更容易交换。如果你考虑编码,如果没有IDE,你只是输入一个提示并获得一个应用程序。生成应用程序的人是谁并不重要。你知道,与你正在构建的平台相比,你的参与度较低。我相信在后端,客户必须添加他们的文档。他们有,你知道,他们可以整合的不同工作流程。这与你的托管客户支持团队有什么区别?
作为外包服务与这是你可以构建的Sierra平台。这个决定是什么?我会以某种方式将问题分开,那就是当你拥有一个代理时,使用它的人是谁以及他们想用它做什么?所以让我们先看看你的编码代理。我也会谈谈Sierra。
谁是实际生成软件的代理的客户?是软件工程经理吗?是软件工程师吗?是他们的实习生,可以这么说?我不知道。我的意思是,我们将在未来几年弄清楚这一点。那是什么?并且
它是否生成你随后要审查的代码?它是否生成一组通过单元测试的代码?什么是实际的,缺乏更好的词语,合同?就像,你怎么知道它做了你想要它做的事情?然后我会说,产品和定价,包装模型就是这样产生的。我认为世界还没有弄清楚。我认为这对于每个代理来说都会有所不同。你知道,在我们的客户群中,我们使用的是所谓的基于结果的定价。所以基本上,每次人工智能代理,
解决问题或拯救客户或任何事情,都会有一个预先协商的价格。我们这样做是因为我们认为这是
代理应该打包的正确方式。我回顾了云软件的历史,特别是浏览器的引入,这导致软件通过浏览器交付,就像Salesforce一样,他们著名的发明了软件即服务,这既是一种通过浏览器的技术交付模型,也是一种商业模式,即你订阅它而不是为永久许可证付费。
这两件事在某种程度上是正交的,但实际上并非如此。如果你考虑一下在浏览器中运行的软件的想法,这是一个你并不拥有的托管数据中心,你必须改变商业模式,因为你不能真正购买某个东西的永久许可证。否则,你如何负担得起对其进行更改?所以只有当你每年购买新版本时它才有效。所以在某种程度上,但是然后......
商业模式的转变实际上改变了我们所知的商业,因为现在像Adobe Photoshop这样的东西,你现在订阅而不是购买。所以最终你进行了一次技术转变和一次商业模式转变,它们非常合乎逻辑地交织在一起,实际上商业模式转变的结果与技术转变一样重要。我认为对于代理来说,因为它们实际上完成了一项工作,所以我认为
我不认为你应该为使用软件的特权付费,就像那个编码代理一样,如果它编写了非常糟糕的代码,那就解雇它。我不知道正确的比喻是什么。我认为你应该为完成的工作付费。我的意思是,这就是你支付软件工程师的方式,对吧?并且......
好吧,不完全是。我们给他们发工资,给他们期权,他们会随着时间的推移而获得期权。这是公平的,但我的意思是,你不会根据他们写的字符数量来支付他们,这是一种基于令牌的,你知道,无论什么。就像,有一个著名的苹果故事,我们要求报告你写了多少行代码,并且......
一位工程师带着一个负数出现了,因为他刚刚进行了一次大规模重构。这就像是对不了解软件编写方式的管理层的强烈抗议。你知道,我的感觉就像传统的基于使用量或基于席位的模式一样。它看起来真的过时了,因为它就像问你的软件工程师,你今天写了多少行代码?谁在乎呢?因为绝对没有关联。所以我的整个观点是,我不认为这在每个类别中都会有所不同,但我确实认为,
如果一个代理正在完成一项工作,我认为它会正确地激励该代理的制造商和客户为完成的工作付费。这并不总是完美的衡量标准。很难衡量工程生产力,但你可以,你应该做一些比你输入多少键更重要的事情,你知道,谈谈人工智能的扭曲激励,对吧?就像我可以编写非常长的函数来做同样的事情,对吧?
所以总的来说,你知道,我认为我们将看到软件商业模式向结果的转变。我认为你也会看到交付模式的改变。而且,你知道,在我们的客户群中,你知道,我们授权我们的客户真正掌握代理所做事情的方向盘。他们想要并需要这样做,但角色却有所不同。你知道,在我们的许多客户中,客户体验运营人员已将自己改名为人工智能架构师,我认为这真的很酷。而且,
这就像互联网早期一样,那时有网站管理员的角色。我不知道网站管理员是否不再是一个流行的术语,或者它是否不再是一份工作了。我只是,我不知道。人工智能架构师能否经受时间的考验?也许吧,也许不会。但我确实认为,再次,我喜欢,你知道,因为现在听众都是软件工程师,所以编码代理的形式因素是什么?实际上,我会深吸一口气,因为实际上我对它有很多看法,就像我在圣诞节前写了一篇关于软件开发未来的博客文章一样,并且
其中一件有趣的事情是,如果你看看我今天使用Cursor的方式,例如,它是在一个重新打包的Visual Studio Code环境中。我有时会使用它的代理部分,但它很大程度上,你知道,我已经养成了一种很好的习惯,通过正确地调整它来使其以我想要的方式自动完成代码。当它实际上可以编写时
我很好奇开发环境的未来会是什么样子。关于什么是软件产品,我认为它会在很多方面发生改变,这会让我们感到惊讶。但我用我博客文章中的比喻,你们都坐过Waymo吗?是的,每个人都坐过。而且有这些捷豹,非常好的汽车。但它很有趣,因为它仍然有一个方向盘,即使没有人坐在那里,方向盘也在转动等等。是的。
显然在未来,如果一旦我们达到这种普遍性,为什么还要方向盘,为什么所有座位都要朝前,也许只是为了防止晕车。我不知道,但你可以完全重新安排汽车。我的意思是,汽车的很多东西都是围绕驾驶员设计的。
所以对我来说,这似乎是合乎逻辑的,比如,软件工程的自主代理是否会通过Visual Studio Code运行?这似乎有点愚蠢,因为一次只打开一个源代码文件对于代码不是主要由你编写的情况来说是一种很愚蠢的形式因素。但这引出了一个问题,那就是你与该代理的关系是什么?我认为在我们的客户体验行业中也是如此,这就像,
谁在管理这个代理?他们需要什么工具?他们肯定需要工具,但这可能与我们以前使用的工具大不相同。这肯定与培训联络中心团队不同。作为软件工程师,我认为我希望能看到,尤其是在热情项目方面或研究方面,编程语言方面的更多创新。我认为
我们正在将编写代码的成本降至零。所以我们仍然使用人工智能编写Python的事实让我觉得很可笑,因为它实际上是为了方便编写而设计的,而不是为了安全运行或快速运行。我希望看到更多关于我们如何验证程序正确性的创新。我在大学里学习过形式化验证,并且
它并不流行,因为它真的很繁琐、缓慢而且效果不佳。如果很多代码是由机器编写的,那么我们可以提供的首要价值之一就是验证它是否确实按照我们的意图执行。我认为在软件开发生命周期中应该有很多有趣的事情,比如我们如何看待测试以及其他所有事情,因为......
因为如果你考虑一下,如果我们必须手动阅读从这些机器中出来的每一行代码,它只会限制机器可以执行多少操作。另一种方法完全不安全。所以我不会将没有经过适当代码审查和检查的代码投入生产。所以我的整个观点是,我认为存在一种人工智能原生。我认为编码代理还不够好,无法做到这一点。但一旦他们做到了,什么是人工智能原生的软件开发生命周期?你如何真正地......
使软件创建者能够生产出最高质量、最健壮、最快速的软件并知道它是正确的。我认为这是一个令人难以置信的机会。我的意思是,我们可以用Rust重写多少C代码并使其安全,从而减少安全漏洞?
我们可以拥有比以往任何时候都更高效、更安全的代码吗?你能拥有像电影《黑客帝国》中那个人一样的人吗?你知道,就像盯着那些小绿点一样,你可以在哪里让代码生成机的操作员像超人一样?我认为这是一个很酷的愿景。我认为太多人专注于像
自动完成,你知道,现在。我甚至不是,我认罪。我只是喜欢,我想看到一些更大胆的想法。这就是为什么当你开玩笑时,你知道,谈论什么是反应性的,无论什么,我认为我们显然处于局部最大值,你知道,比喻,某种概念上的局部最大值。显然它发展得很快。我认为我们正在摆脱它。
是的,在23年底,我写了一篇从语法到语义的博客文章。就像,如果你考虑Python,它正在采用C并使其更具语义性。LLM就像最终的语义程序,对吧?你可以直接与它们交谈,它们可以从你的语言中生成任何类型的语法。但同样,它们必须使用的语言是为我们而不是为它们而设计的。
但问题是,只要你仍然需要人工干预,你就无法改变它下面的语言。你知道我的意思吗?所以我很好奇,我们将需要达到什么样的自动化程度。我们将能够对底层语言进行更改,例如编程语言,而不是说,嘿,你只需要编写Python,因为我理解Python。而且我最终比模型更重要。但我认为这会改变。但我不知道是两年还是五年。我认为这实际上更细致入微。所以我认为......
一些更有趣的编程语言将语义带入语法。所以也许这有点简化了,但像Rust就是一个例子。Rust在静态上是内存安全的。这是一个非常有趣的概念性突破。这就是为什么很难编写Rust。这就是为什么大多数人编写Python而不是Rust。
我认为Rust程序比Python更安全、更快,编译速度可能更慢。但总的来说,如果你不必关心投入的劳动力,你应该更喜欢用Rust编写的程序而不是用Python编写的程序。仅仅是因为它运行效率更高。它几乎肯定更安全,等等,等等,这取决于你如何定义安全。
但大多数人不编写Rust,因为它有点麻烦,而且能够编写Rust的人群也较小,但在大多数情况下它更好。再说一次,假设你正在制作一个网络服务,而且你不需要关心编写它的难度,如果你只是获得了网络服务的输出,那么Rust版本的操作成本会更低。它肯定更便宜,而且可能更正确,因为Rust编程语言中隐含的静态分析有很多,因此它可能运行时错误更少,等等。
所以我只是举这个例子,因为Rust,至少据我所知,它来自Mozilla团队,因为浏览器中有很多安全漏洞,它需要非常快。所以他们说:“好吧,我们想在创作时增加更多负担,以便在运行时减少问题。我们需要静态完成的约束,因为浏览器需要非常快。”
我的感觉是,如果你只是考虑一下当今编程语言的需求,软件工程师的作用是使用人工智能来生成功能并审核它是否按预期工作,也许在功能上,也许从正确性的角度来看,某种组合。你将如何创建一个促进这一目标的编程系统?
而且,你知道,我之所以提到Rust,是因为我认为它是一个很好的例子,就像,我认为如果可以选择在C或Rust中编写,你今天应该选择Rust。我认为大多数人都会这么说,即使是C爱好者也是如此,因为C在很大程度上不太安全,对于非常相似的,你知道,系统的权衡。现在有了人工智能,就像,好吧,这改变了编写这些东西的游戏规则。所以就像,我只是想知道,如果将编程语言组合起来,更侧重于我们从人工智能生成的程序中需要的价值,可验证的正确性等等。如果对一个人来说很繁琐,那可能并不重要。但有一件事,如果我问你,这个Rust程序的内存安全吗?
你不需要阅读它。你只需要编译它。
所以这很有趣。我的意思是,这是一个非常温和的形式化验证的例子。所以我之所以提到这一点,是因为我认为你可以让人工智能检查人工智能,你可以让人工智能审查,进行人工智能代码审查。如果我们能得到的最好的结果只是人工智能审查Python,并且已经扩展了一些非常大的网站,这些网站是用Python编写的,我会感到很失望。这就像,你知道,很贵而且很贵。
这就像每一个,相信我,每一个用Python编写大型网络服务的团队都尝试过像PyPy这样的东西,只是为了使其比自然情况下的效率略高一些。你实际上并没有真正的多线程。无论如何,这很明显,你这样做只是因为它方便编写。我只是觉得我们,我不想说这很疯狂。我只是说,我认为我们正处于局部最大值。我希望我们创建一个编程系统,一个编程语言、形式化验证、测试、自动化代码审查的组合,在这里我们
可以使用人工智能以大规模的方式生成软件并信任它。而且你不需要受限于你阅读它的能力。我不知道这将采取什么确切的形式,但我感觉这将是一个非常酷的世界。是的,我们邀请了Chris Lattner参加播客。他正在使用Modular做伟大的工作。我喜欢LLVM。是的,基本上是合并Rust和LLVM。
这就是想法。但对他们来说,一个重要的用例是使其与Python兼容,相同的API,以便Python开发人员可以使用它。所以我很好奇,在什么时间点......至少据我所知,他们的目标是数据科学机器学习人群,他们都是用Python编写的。所以它仍然感觉像是一个局部最大值。是的,完全正确。我会强迫你做一个预测。Python大约有30年的历史了。从现在起30年后,Rust会比Python更大吗?
我不知道这个,但我甚至不知道这是一个预测。我只是在说一些我希望成真的事情。我希望看到一种人工智能原生的编程语言和编程系统。我使用“语言”这个词,因为我不确定语言是否是正确的东西,但是......
但我希望在30年后,我们会有一种人工智能原生的方式来制作软件,这种方式与当前的编程语言完全无关。或者不是不相关,但我认为当今大多数编程语言的设计都是为了让人们高效地编写,并且......
一些编程语言有不同的权衡。例如,Haskell 和其他一些语言的设计是为了实现抽象,用于并行处理等。还有一些编程语言,如 Python,设计得很容易编写,有点像 Perl 和 Python 的血统,这就是数据科学家使用它的原因。它有一个交互模式,诸如此类。我喜欢 Python,我非常喜欢 Python。尽管我说了很多 Python 的坏话,但我仍然非常喜欢 Python。我写的
至少有两家公司完全是用 Python 编写的。然后 C 语言诞生于 Unix 的诞生,它不是第一个,但绝对是汇编语言之后最突出的第一步,对吧?在那里,你有了比转向更高级别的抽象,转向像 for 循环和 while 循环这样的抽象。
所以我只是认为,如果编写代码的行为不再是一项有意义的人类活动,也许它会成为。我不知道。我只是说,感觉它可能是那些即将消失的历史部分之一。但软件工程师的角色仍然存在,就像实际构建系统的人一样,对吧?那么,这种形式因素的编程系统是什么样的呢?我有一个希望,就像我提到的 React 一样,我记得我当时在
早期的时候,现在被称为 React 的东西正在被创建。我记得它开源发布的时候,我已经离开了,我当时就想,这太他妈酷了。就像,你知道,基本上对你的应用程序进行建模,而与流经它的数据无关,这使得一切变得更容易。现在,你知道,我可以像前端软件一样,对我来说有点混乱,说实话。它就像现在对我来说有点像抽象汤。但其中一些核心思想感觉非常符合人体工程学。
我只是想,我期待着有一天,有人会提出一个编程系统,它既能给我带来一种“啊哈”的时刻,同时又完全陌生,因为他们是从第一性原理出发创建它的,认识到这一点。
在编辑器中编写代码可能不再是编程系统存在的主要原因。我认为这将是一个非常令人兴奋的一天。是的。我会说,关于这个讨论的各种版本都已经发生了。归根结底,你仍然需要精确地传达你想要的东西,作为一个管理人员,作为一个做过很多、很多法律合同的人,你知道这有多难。
然后现在我们必须与执行此操作的机器和解释我们的意思并有效地解读我们思想的 AI 交谈。我不知道如何跨越将人类意图转化为指令的障碍。是的,它可以更具声明性。
但我不知道它是否会从编程语言转变为超越它的东西。我同意你的观点。事实上,我认为如果你看一下法律合同,你会发现英语的不精确性可能会让人觉得这是一个系统缺陷。有多少漏洞。我认为,当你制作一个关键任务软件系统时,我不认为它应该是英语提示。我认为这很愚蠢,因为......
你需要编程语言的精确性。我的观点与其说是关于这一点,不如说是关于编写行为的实际行为,如果你......
我认为有些嵌入式系统确实使用形式化验证。我知道这在现在的安全协议中非常常见,这样你就可以,因为正确性的重要性非常大。我的智力练习是,为什么不对所有软件都这样做呢?我的意思是,这可能很愚蠢,只是字面意义上做我们对这些低级安全协议所做的工作。
但我们不做的唯一原因是因为它既困难又乏味,而困难和乏味不再是因素。所以,如果我可以,我的意思是,想想你手机上最愚蠢的应用程序吧。现在,认为该应用程序应该对其正确性进行形式化验证的想法似乎很可笑,因为,上帝啊,你为什么要花时间呢?但如果成本为零,那么,是的,我想也是。我的意思是,它从未崩溃过。这可能很好。你知道,为什么不呢?我只是想把我们的标准定得高一些。就像我们应该制造......
软件太棒了。就像马克·安德烈森的那篇博客文章一样,软件正在吞噬世界。你知道,我们的整个生活都在数字化的调解下进行,而这正随着人工智能而不断增加。现在,我们将拥有个人代理与 CRO 平台上的代理进行对话,而这将是代理一路到底。
你知道,我们的核心基础设施正在运行在这些数字系统上。现在我们有了,而且我一生中都面临着软件开发人员短缺的问题。因此,你知道,如果你看看,记得 healthcare.gov 的那个惨败,安全漏洞导致国家行为者获得对关键基础设施的访问权限。我想,我们现在已经创造了这样一个令人惊叹的系统,它可以像我们一样修复它,你知道吗?而我只是想......
我对经济的生产力增长感到兴奋,但我认为,作为软件工程师,我们应该更加大胆。就像我们应该设定目标,渴望修复这些系统,这样,总的来说,正如你所说,只要我们想在系统的规范中精确到什么程度,我们就应该更加大胆。
我们现在可以使它正常工作了。我有点含糊其辞,我认为我们需要一些系统。我认为这就是我们应该设定标准的地方,尤其是在我们的生活如此依赖于这个关键的数字基础设施的时候。所以我对它非常乐观。但实际上,让我们来谈谈你刚才说的内容,那就是规范。我认为这是人工智能代理的一个最有趣的部分,那就是
大多数规范都是不完整的。所以让我们回到我们的产品工程讨论。你会说,好吧,这是一个 PRD,产品需求文档。它非常详细。有模型和这个。当你点击这个按钮时,它会这样做。而且就像......
我百分之百肯定你能想到该文档中缺少的需求。假设你点击了这个按钮,而互联网断开了连接。你会怎么做?我不知道这是否在 PRD 中。它可能不在。你知道,总会有某些东西,因为人类很复杂,对吧?所以......
最终发生的事情是,我不知道你是否能衡量它,比如产品的实际功能有多少是由代码决定的,有多少是由规范决定的,就像传统产品一样?哦,百分之九十五。我的意思是,有一点,但很多都是。所以,就像代码就是规范一样。这实际上就是为什么,如果你只看看技术史,为什么开源胜过规范,比如
你知道,长期以来,W3C 工作组一直在制定 HTML 规范。然后,你知道,一旦 WebKit 变得流行起来,互联网的发展速度就快了很多。这并不是以牺牲标准组织为代价的。事实证明,让一个委员会的人争论比某人签入代码要低效得多,然后突然之间你有了矢量图形,你有了像
你知道,在谷歌地图时代,那个人就像,上帝啊,那会让我的生活更容易。你知道,就像 SVG 支持一样,生活会变得轻松很多。试着在没有矢量图形的情况下绘制一条行车路线。
所以,你知道,总的来说,我认为我们已经从在文档中定义的这些协议转向了基本上成为隐式标准的开源代码,就像 Linux 中的系统调用一样。就像有一个规范一样,POSIX 也是一个标准,但内核是,就像人们针对它编写代码一样。它既是......
已记录的行为,也是未记录的行为,无论好坏。这就是为什么,你知道,Linus 和其他人如此坚持二进制兼容性等等,就像这些东西很重要一样。
所以我真正思考的事情之一是,广泛地使用代理,你如何做到这一点,我不认为指定防护栏很容易,你知道,但是所有那些未指定的行为呢?所以,作为一名软件工程师,就像你到达这样一个地步,你就像互联网断开了连接,你从调用中得到了错误代码,你必须做些什么一样。
你知道,你有多大比例的时间会想,是的,我会这样做,因为它看起来很合理。你有多大比例的时间会给你的 PM 发一条 Slack 消息,说,在这种情况下我该怎么办?前者可能比后者多。否则,编写软件将非常低效。但是,当你的 AI 为你做出这个决定时会发生什么?这不是一个错误的决定。你没有对这种情况说任何话。
AI 代理,代理这个词来自代理这个词,对吧?所以它正在展示它的代理能力,它正在做出决定。它会记录它吗?这可能也很乏味,因为有很多隐含的决定。当你点击按钮并且互联网断开连接时会发生什么?它做了一些你不喜欢的事情?你如何修复它?我实际上认为我们正在进入一个新的世界,在这个世界里,我们向 AI 代理表达我们想要的东西的方式是,
总是会是一个不完整的规范。这就是为什么代理很有用,因为它们可以用相当数量的推理来填补空白,你如何实际调整这些东西,并想象一下,使用 AI 代理作为你的软件工程伙伴来构建一个应用程序。这是一个无限长的尾巴。无限可能有点夸张,但我保证有一个相当长的功能尾巴没有指定。如何
你如何实际调整它。这就是我所说的创建编程系统。我认为我们还不知道那个系统是什么。同样,我认为对于每一个代理领域,无论是客户服务、法律还是软件工程,公司构建这些代理所构建的基本上都是一个系统,通过这个系统......
你可以表达你想要的行为,无论它多么深奥和细微。无论如何,我认为这是一个非常令人兴奋的领域,因为我认为这就是魔法所在,或者说这就是这个领域的产品洞察力所在。就像,你如何遇到那些时刻?它有点融入到用户体验中,而它不能仅仅是,答案不能仅仅是更好的提示。
是的,我知道。这是不可能的。提示太长了。想象一下,获得一个 PRD,它字面意义上指定了代码所代表的一切的行为。答案将只是代码。只是代码。所以这是我的观点。提示很棒,但它实际上并不是任何东西的完整规范。它永远不可能是。我认为这是......
你如何进行交互,就像某种人机循环一样,何时以及如何进行。这就是为什么我真正相信特定领域的代理,因为我认为抽象地回答这个问题就像一个有趣的智力练习一样。但这就是为什么抽象地谈论代理会......
我对此不感兴趣,因为我认为它实际上没有任何意义。它的全部意义在于软件正在做出决定。这就是,你知道,至少以一种简化的方式。但在软件工程的背景下,它确实有意义,因为你知道,就像,首先你指定你想要的产品是什么,然后你使用它,然后你给出反馈的过程是什么。你可以想象构建一个产品,它实际上促进了这个闭环系统。然后它是如何表示的,完整的规范既包括你所知道你想要的东西,也包括你通过使用发现的东西,所有这些的结合是你所关心的,而其余的则与 AI 无关。
在法律背景下,我肯定有一种方法可以知道 AI 何时应该提问,何时不应该提问?当它出错时,你如何实际干预?当然,在客户服务案例中,这非常清楚,我们的客户如何审查每一次对话
我们如何帮助他们找到他们应该审查的对话,当他们有数百万次对话时,他们可以找到少数有趣的对话,当这些对话中出现问题时,他们如何提供反馈,以便下次可以修复它,这样我们就知道我做出这个决定的背景。但这取决于我们什么是对的,对吧?这取决于我们的客户。
所以这就是为什么我认为现在,当你考虑在某个领域构建一个代理时,你如何与人们互动来指定行为实际上就是很多魔法所在的地方。是的。如果这让你有点烦,请阻止我。
但我有点难以将特定领域的代理与 AGI 是真实的或 AGI 即将来临的信念联系起来,因为重点是通用智能。而看待“痛苦教训”的一种方式是,我们总能通过变得更特定于领域来取得进展。采用任何 SOTA,你都会在变得更特定于领域方面取得进展,然后你就会被淘汰。下一个进步发生了。显然,你并不相信这一点。但你如何......
个人看待这些事情?是的,这是一个非常沉重的问题。考虑到我在 OpenAI 的角色,我确实考虑了很多关于 AGI 的事情,但即使对我来说,也很难真正概念化。我喜欢花时间与 OpenAI 的研究人员以及社区中的人们广泛地讨论这些影响,因为存在一级效应和某些领域中超级智能的东西的影响。然后是二阶和三阶效应,这些效应更难以预测。所以首先,我认为这对我来说似乎很可能,你知道,首先,AGI 会擅长数字领域,因为......
它是软件。所以,如果你考虑一下像 AI 发现一种新的,比如说,药物疗法,那么这方面的障碍可能与其说是发现,不如说是临床试验。而 AI 不一定能帮助进行临床试验,对吧?这是一个......
独立于智能的过程,这是一个物理过程。同样,如果你考虑一下气候变化或碳去除的问题,那么该领域可能有很多方面需要伟大的想法,但是,无论你提出了什么伟大的想法,如果你想隔离这么多的碳,那么这可能会有一个很大的物理组成部分。所以它并不真正受智能的限制。它可能是,我相信它可以通过智能在某种程度上得到加速。
最近,我和一位名叫泰勒·科恩的经济学家进行了一次非常有趣的谈话。我刚看过他的一个视频,他当时正在谈论经济的哪些部分,智能是一种有限的资源,它将非常迅速地采用 AI/AGI,并将推动令人难以置信的生产力增长。
但经济的其他部分却没有。而这些将会相互作用。这回到了这些复杂的二阶效应,比如价格会在那些能够迅速吸收智能的领域上涨,这实际上会减缓速度。我认为它不会平均分配。我认为它可能不会像人们想象的那样迅速地影响经济的所有部分。我可能是错的,但我只是认为你可以根据其推理不同领域的能力来概括,我认为这就是 AGI 对大多数人的意义,但它可能不会真正地......
在世界上推广,直到因为有很多智能不是很多经济中的限制因素。所以回到你更实际的问题是,既然 AGI 即将来临,为什么还要制作软件呢?
我要这么说。我们应该学习编程吗?所有这些都有不同的说法。你知道,我的观点是我确实认为 AI 是一种工具,AGI 也是人类的一种工具。所以我的观点是,当我们谈论像......
作为软件制造商,你的工作是在编辑器中编写代码吗?我认为不是。就像一代人之前一样,你的工作不是在打孔卡上打孔。这不是你的工作。你的工作是制作数字的东西。无论是什么,你正在制作的软件的目的是什么?你的工作是制作它。所以我认为我们的工作将会迅速而有意义地发生变化
但是,
但我认为,像我们的工作是在编辑器中输入一样,这是我们所拥有的工具的产物,而不是我们被雇佣来做的实际工作,那就是创造数字体验,你知道,为烤面包机制作固件,或者我们正在做的任何事情。对。就像那是我们的工作一样。对。因此,我认为对于像 AGI 这样的东西,我认为软件工程肯定将是最受影响的学科之一,并且
而且我认为这是非常,所以就像,我认为如果你在这个行业,并且你通过你使用的工具来定义自己,比如你每天可以在 Vim 中输入多少个字符,那可能不是一个长期的稳定位置,因为这肯定是一些 AI 比你做得更好的事情。是的。
但你对构建什么以及如何构建的判断仍然适用。这将永远是正确的。而考虑这个问题的一种方式,就像有点简化一样,你知道,看看初创公司和大型公司。像谷歌和亚马逊这样的公司拥有的工程师比初创公司多得多,但有些初创公司仍然会获胜。为什么?好吧,他们做出了更好的决定,对吧?他们没有打字更快或编写更多代码。他们在正确的时间、正确的市场做了正确的事情。同样,
如果你看看一些伟大的公司,那不是因为缺乏,他们有一些独特的想法。有时,这就是一家公司成功的原因,但这往往是许多其他事情和许多其他形式的执行。所以,总的来说,大量情报的存在将会改变很多,它将会改变一切。
我们的工作比其他任何行业都要多。也许不是,也许这是夸大的说法,但肯定与其他任何行业一样多。但我认为这不会改变像为什么围绕数字技术存在的经济一样。因此,我认为我对......的未来非常乐观
软件行业。我只是认为,今天非常昂贵的一些东西将会变得几乎免费。但是,我认为,我的意思是,说实话,科技公司的半衰期并不像现在这样特别长。是的。我最近在一次谈话中提到了这个轶事,但是
当我开始在谷歌工作时,我们在山景城的一栋楼里,然后最终搬到了一个园区,这个园区以前是硅图的园区。那是谷歌搬迁的第一个园区,我很确定它现在仍然拥有那个园区。我认为它现在价值数十亿美元。SGI 是一家非常、非常大的公司,大到足以拥有一个园区,然后倒闭了。顺便说一句,它并不是一家很老的公司。它不像 IBM 一样。你知道,它大到足以在我的有生之年获得一个园区然后倒闭。你知道,那种事情。
然后在 Facebook,我们在帕洛阿尔托有一个办公室。当我加入时,我没有去最初的办公室。那是第二个办公室,斯坦福附近的一座旧惠普大楼。然后我们变得足够大,想要一个园区,我们买了 Sun Microsystems 的园区。Sun Microsystems 著名地诞生于斯坦福大学,发展迅速,是......之一。
点燃了互联网热潮的公司,然后最终以低价被甲骨文收购。是的。
你知道,像我一生中所有那些公司一样,它们大到足以上市,拥有一个园区,然后倒闭。所以我认为很多事情都会改变。我不是说这很容易,或者说没有一家公司的商业模式受到威胁,但是数字技术会继续保持重要性吗?拥有良好判断力的企业家是否仍然会将这项技术应用于创造经济价值?就像百分之百一样。我一直用这样的比喻,
如果你回到 1980 年,描述我们现在拥有的许多工作,人们很难想象。想象一下,我是一个播客主持人。这是什么意思?想象一下回到 1776 年,向本杰明·富兰克林描述我们今天的经济,更不用说科技行业了,仅仅是服务业经济。对他来说,这可能很难想象,就像谁种植食物一样,仅仅是因为这个国家这么少的人就足以生产这么多人的食物,这将违背......
他关于食物是如何种植的观念,这就像,这可能需要几个小时的解释。这有点像同一件事。就像我们现在对这个世界是如何运作的看法一样,这是基于现有的约束,但还会有很多其他的机会和其他事情。所以
我不知道。我的意思是,编写代码现在确实非常有价值,而且它可能会迅速发生变化。我认为人们只需要很大的灵活性。我一直用这样的比喻,就像一群会计师和微软 Excel 刚刚发明出来一样。你会是第一个放下你的 HP 计算器并说,我将学习如何使用这个工具,因为它只是我正在做的事情的一种更好方法的人吗?或者你会是那种,你知道......
拿出他们的计算尺和 HP 计算器,说,现在的孩子们,你知道,他们的 Excel,他们不明白。你知道,这有点简化了,但我只是觉得,我们所有人能做的最好的事情,不仅仅是在软件行业,但我认为这真的很重要
有趣的是,我们正在用这项技术扰乱我们自己的行业,就像其他任何行业一样,那就是顺应变化,尝试使用这些工具,比如安装最新的编码辅助工具。你知道,当 O3 Mini 发布时,用它编写一些你不想成为最后一个拥抱 Excel 的会计师的代码。你可能再也找不到工作了。是的。
我们有一些关于你如何跟上 AI 的个人问题,你知道,所有其他事情。但我还想,我会让你回答你的问题。我只是想说,你对食物的比喻非常有趣,并且引起了我的共鸣。我觉得我们有点像在农业经济中,像一种以情报为基础的易货经济。现在我们正在使情报工业化。这对我来说真的是一个顿悟的时刻。我只是想反映一下。
是的。你如何看待人被代理取代以及代理如何相互交谈?所以即使在今天的 Sierra,对吧,你正在构建人们可以与之交谈的代理。
但在未来,你将拥有代理,他们将向客户支持代理抱怨他们下的订单。乌龟一路到底。没错。而且,你知道,你是 Facebook 的 CTO。你在那里构建了 OpenGraph。我认为有很多优点,有很多事情正在实现,然后也许有很多缺点。你如何看待应该如何构建代理协议?考虑所有影响,你知道,隐私、数据可发现性等等。是的,我认为现在还为时过早。
为了制定一个协议。我已经阅读了一些尝试,也许其中一些会流行起来。大型语言模型真正有趣的事情之一是,因为它们是在语言上进行训练的,所以它们非常能够使用为我们构建的接口。所以我现在直觉是,因为我们可以制作一个对我们有效也对 AI 有效的接口,也许这就足够了。你知道,我在这里有点含糊其辞,但是
为代理制作一个对人们来说无法访问的机器协议,这有一些好处,但也有一些相当大的缺点。
我认为是 Andrej Karpathy,但我记不清了,但就像一位更著名的 AI 研究人员写道,就像我花了半天时间写英语一样,你知道,在我的软件工程中。我的直觉是,代理将在一段时间内使用语言与代理交谈。我不知道这是否属实,但有很多理由可以解释为什么这可能是真的。所以,你知道,当......
你的个人代理与 CIRA 代理交谈以帮助弄清楚为什么你的 Sonos 扬声器有闪烁的橙色指示灯时。我的直觉是它会在一段时间内使用英语。我认为这有很多好处。
我认为我们仍然处于像长期运行的代理的早期阶段。我不知道你是否尝试过刚刚发布的深度研究代理。我们有一个给你。我们深度研究。哦,太好了。这很有趣,因为它可能是我第一次真正收到 OpenAI 的通知,当时完成了一些事情。我之前提到过它的交互部分。
那是我现在最感兴趣的领域,那就是大多数代理工作流程都是相对短期运行的,而多利益相关者、长期运行、多系统的那些工作流程,我们在 Sierra 处理了很多这样的工作流程。但总的来说,我认为这些很有趣,因为我一直用这样的比喻,在手机出现之前,每当你从某个互联网服务收到通知时,你都会收到一封电子邮件。
不是因为电子邮件是通知你的最佳方式,而是因为它唯一的方式。所以,你知道,你过去会在 Facebook 上被标记在一张照片上,然后你会收到一封关于它的电子邮件。然后一旦这进入了每个人的口袋,每个应用程序都可以平等地访问你的口袋。现在,你知道,对于我使用的大多数应用程序,我没有收到电子邮件通知。我只是直接从应用程序中获取它。我想知道代理将使用哪些形式因素
您如何联系和联系其他代理?然后,它如何在正确的时间让您(代理的操作员)参与其中?您知道,我当然认为像 ChatGPT 这样的公司将成为主要的消费者平台之一。因此,这些服务具有很大的吸引力。
但是,如果我考虑一下特定领域的流程,我认为还有很多东西需要弄清楚。所以我对代理与代理的协议不太了解。实际上,我认为我可能是错的。我没有考虑太多。这很有趣,但实际上,它如何与所有参与其中的人互动,这正是我最感兴趣的事情之一,看看它将如何发挥作用。是的,我认为对我来说,核心问题是,你知道,就像我们的后端一样,例如,这个代理能否访问这个东西?我认为在客户支持用例中,这可能不太突出,但在企业中则更有趣。还有语言,例如,您可以压缩语言。如果人类不需要阅读它,您可以节省令牌,使事情更快。所以,说到能源......是的,是的。
您提到收到有关深度研究的通知。是否存在一个“OpenAI 深度研究已取得内部成果”的通知会发送给所有人,并且董事会会被召集,您也会看到它?您能否提供有关此过程的任何背景信息?OpenAI 是一个使命驱动的非营利组织,我主要将其视为一个研究实验室。显然,它不仅仅是这样。在某些方面,ChatGPT 是一种具有文化意义的产品。
但归根结底,其使命是确保人工智能造福全人类。因此,我们许多董事会讨论都与研究及其对人类的影响有关,这主要是安全问题。显然,我认为一个人不可能实现 AGI 而不考虑安全作为该使命的首要责任,但它也包括访问和其他方面。所以,
像深度研究这样的事情,我们肯定会讨论,因为如果您考虑构建 AGI 的意义,它是一个重要组成部分。但我们讨论了很多不同的事情,你知道,就像有时我们很早就听说过一些事情。如果它与使命的核心无关,或者与使命的核心相去甚远,那么它就更随意了。所以,成为其中一员非常有趣,因为我最喜欢的董事会讨论部分就是听取研究人员关于 AGI 的想法。
他们如何看待未来以及创造 AGI 的下一个里程碑。好吧,有很多里程碑。也许我们从一开始就开始了。你知道,很少有人像你一样参加过这些会议。这些对话是如何开始的?你是如何被引入 OpenAI 的?显然,如果你愿意,你可以谈谈一些戏剧性的事件。带我们进入房间。发生了什么?感觉如何?
当萨姆被解雇时,是星期四还是星期五?是的。所以我像其他人一样听说过这件事,就像在社交媒体上看到的一样。我记得我当时正在这里散步。我非常震惊,并给我的联合创始人克莱发了消息,我说:“天哪,我不知道发生了什么。”
然后在星期六,为了保护人们的隐私,我最终与亚当·丹格罗和萨姆·阿尔特曼进行了交谈,并基本上了解了正在发生的事情的概要。
我理解你可能需要向他们询问他们对这件事的看法,这基本上就像他们——董事会和萨姆都对我有一些信任。这是一个非常复杂的情况,因为公司对萨姆被解雇的反应非常消极,可以理解的是消极的。我认为他们并没有真正理解发生了什么。因此,董事会处于需要弄清楚前进道路的境地。他们联系了我,然后我和萨姆进行了交谈,基本上成为了调解人,这么说吧。并非正式如此,但从根本上来说就是这样。
当董事会试图弄清楚前进的道路时,我们最终进行了很多讨论,例如如何让萨姆重新担任公司首席执行官,但也对发生的事情进行审查,以便董事会的担忧能够得到充分的解决,因为
因为他们显然在进入时确实有一些担忧。所以最终就是这样。我认为总的来说,我就像一个知名人士一样,很多利益相关者都认识我,而且我认为我有一些正直。所以这就像,你知道,他们试图找到摆脱非常复杂局面的一种方法。所以我最终参与其中,并与萨姆和格雷格建立了良好的关系,这对公司来说是一段充满挑战的时期。我没有计划加入董事会。我因为发生的危机而被拉了进来。而且我认为我不会永远留在董事会。我加入时发布了一篇文章,说我将暂时这样做。那是一年前的事了。你知道,我真的很想专注于 Sierra,但我也很关心
我的意思是,这是一个了不起的使命。这是一个了不起的使命。我可能经历过两次类似的高风险情况,但显然没有那么高风险。但是,当你知道这是最高傲慢、最高风险、最高金额的时候,你有什么原则?无论是什么。你有什么原则可以进入这样的情况?显然,你拥有良好的声誉,拥有良好的网络。你的必做事项和必不做的事情是什么?
我不确定是否存在解决这些问题的策略手册,那样会简单得多。请分享。所以......
你知道,我可能会回到我通常的操作方式。首先是第一性原理思维。所以我认为存在危机策略手册,但没有什么是完全像这样的。你真的需要理解发生了什么以及为什么。我认为许多危机的时刻从根本上来说是人为的问题。你可以对人们的动机和这件事以及其他事情进行战略规划,但我认为真正重要的是要理解所有参与其中的人以及他们的动机和原因,这从根本上来说是一种同理心的练习,实际上。就像,你真的理解为什么人们在做他们正在做的事情吗?然后获得良好的建议,你知道,我认为人们,高调危机中有趣的一点是,每个人都想给你建议。所以建议并不缺乏,但好的建议是,我认为这确实需要判断力,即根据对情况的第一性原理分析,根据你的评估来判断哪些人,以及
你所知道的,所有参与其中的人,谁拥有真正的专业知识和良好的判断力,你知道,在这种情况下,你可以验证你的判断,如果你有直觉,或者如果这是一个领域,例如,一个你并非专家的法律专业领域,你想要世界上最好的人来给你建议。而且我发现人们经常寻求错误的人来寻求建议。在这些情况下,这一点非常重要。好吧,我的意思是,这非常成功。我还有最后一个问题,然后我们就可以结束这个话题了。微软的报价是真的,对吧?萨姆和团队在那个周末的某个时候搬过去。
我不确定。我从一个角度参与其中,那就是......实际上,有趣的是,我并没有特别参与其中。所以我以......
我现在仍然不拥有 OpenAI 的任何股权。我只是在这个过程中一个有意义的旁观者。我参与其中的原因,我会回答你的问题,但我参与其中的原因仅仅是因为我关心 OpenAI。所以,你知道,我离开了我在 Salesforce 的工作,巧合的是,下个月 ChatGPT 推出了,你知道,我和其他人一样被吸引住了。我想把我的生活花在这上面。这太棒了。而且
而且我不会,我不知道我是否会,我不敢肯定,如果 OpenAI 没有用 ChatGPT 激励世界,我是否会创办另一家公司。也许我会,我不知道,但这就像,它对你,对我们所有人都有非常重大的影响,我认为。
所以,它会在周末解散的想法让我非常困扰。而且我非常,我喜欢,我非常感谢 OpenAI 的存在。而且我认为这可能也为许多竞争对手的研究实验室所共享,程度不同。这就像涨潮抬高了所有的船。我认为它为人工智能创造了众所周知的 iPhone 时刻,并改变了世界。
所以有很多微软作为 OpenAI 的投资者,有既得利益,萨姆和格雷格有他们的利益,员工有他们的利益,并且有很多讨价还价。而且你不能对决策进行 A/B 测试。所以我不知道如果事情因此而崩溃了。我实际上不知道。而且你也不知道......
什么是真实的,什么不是。我的意思是,你必须和他们谈谈才能知道什么是真实的。说到顾问,我听说布莱恩·阿姆斯特朗似乎是......在整个过程中,一位令人惊讶的强大顾问。我的理解是,布莱恩·阿姆斯特朗和罗恩·康威都与萨姆关系密切。我最终与他们进行了交谈,但也试图......与董事会进行了很多交谈,试图成为......
我试图,你显然对此有立场。就像,我觉得,你知道,从外部观察,我只是真的想了解,为什么会发生这种情况?这个过程似乎,你知道,至少可以说......
但我试图保持冷静,因为其中一个原则是,如果你想把 Humpty Dumpty 重新拼凑起来,你就不能成为一个只关注单一问题的选民,对吧?就像你必须进去说,所以这是一个非常敏感的时刻。但是,是的,我认为布莱恩是一位伟大的企业家,也是萨姆在其中的一个真正的朋友和盟友。他也经历了很多。我之所以提到微软,是因为,我的意思是,显然是一个巨大的支持者。我们实际上与 David Luan 进行了交谈,他向......
我认为当时是萨蒂亚推销了对 OpenAI 的第一笔 10 亿美元投资。我的理解是,对微软来说,最好的情况是 OpenAI 保持现状。第二好的是微软
收购萨姆和格雷格以及其他任何人。那是当时的合作关系。非常紧密的独家关系等等。我认为现在情况已经有所发展,而且,你知道,随着星门的演变,关于微软和 OpenAI 之间关系的不确定性或虚假信息有所增加。我只是想,只是想提一下,因为我们也在努力,就像萨蒂亚一样,我们很幸运地让萨蒂亚成为 InSpace 的订阅者,我们正在努力采访他,我们正在努力弄清楚现在的情况是如何发展的。就像是什么,你会如何描述微软和 OpenAI 之间的关系?微软是 OpenAI 最重要的合作伙伴,你知道,所以我们在很多方面都与他们有着非常深厚的关系。所以我认为它一直在发展,仅仅是因为市场的规模在发展,特别是基础设施的资本需求远远超出了两年前任何人的预测,更不用说微软的关系开始的时候了。那是什么时候?
六年前?我实际上不知道。我应该脱口而出就知道。但那已经是很久以前了,在人工智能领域,更久以前了。我不认为有什么需要分享的。我的意思是,我认为这种关系之所以发展是因为市场发展了,但合作关系的核心原则保持不变。而且,你知道,这是 OpenAI 最重要的合作伙伴。再仔细看看,就像显然我们的许多听众一样......
你知道,非常关心 OpenAI 的优先事项。我听说 OpenAI 有大约五个最高级别的优先事项,例如始终拥有前沿模型,始终处于前沿,某种效率,成为某种多模式领域的先驱,无论是视频生成还是实时语音,任何类似的东西。除了最高级别的 AGI 之外,你会如何描述 OpenAI 的首要任务?
我总是回到你所说的最高级别的 AGI,这是一个使命驱动的组织。我认为许多公司都在谈论他们的使命,但 OpenAI 实际上就像使命定义了我们所做的一切。我认为重要的是要理解,如果你试图预测 OpenAI 将走向何方,因为......
如果它不符合使命,那么它极不可能成为 OpenAI 的优先事项。你知道,这是一个大型组织。因此,有时你可能会有一些副项目。你会说,“你知道吗?我不确定这是否会像我们想象的那样符合使命。让我们不要再做了。”但归根结底,人们在 OpenAI 工作是因为他们相信 AGI 可以为人类带来的好处。有些人来这里是因为他们想创造它。
而创造本身具有令人难以置信的智力回报。有些人来这里是因为他们想确保 AGI 是安全的。我认为我们拥有世界上最好的 AGI 安全团队。随着这些模型变得越来越强大,随着它们可以访问互联网,可以访问工具,这里还有很多有趣的研究问题需要解决。这就像......
非常有趣的事情。但每个人都在这里是因为他们对这项使命感兴趣。因此,我认为......
你知道,如果你看看像深度研究这样的镜头,这是很合乎逻辑的,对吧?就像,当然,如果你要考虑创造 AGI 的意义,让 AI 帮助推进研究事业是有意义的。你可以理解为什么许多 AGI 实验室都在研究软件工程和代码生成,因为如果你想创造 AGI,这似乎非常有用,对吧?仅仅是因为它很大一部分是代码,你知道吗?
这样做。同样,当你看到工具的使用和代理处于你需要做 AGI 的核心时,这就是公司的部分内容。我认为没有像顶级这样的东西,我的意思是,当然,可能有一个运营方面的十大清单,但它从根本上来说是关于构建 AGI 并确保 AGI 造福全人类的。这就是我们存在的原因。其余的就像不是分心,但这就像组织存在的唯一原因。
我认为值得注意的是,如果我四年前向你们两位描述过这个使命,你知道,有趣的事情之一是,你认为社会将如何使用人工智能?我们可能会认为几乎可能是工业应用、机器人,所有这些其他东西。我认为 ChatGPT 是最......
而且现在感觉并不违反直觉,但就像违反直觉的方式来实现这一使命,因为你可以访问 chatgpt.com 并访问世界上最先进的智能的想法。而且有一个免费层就像非常棒。所以实际上我认为其中一件很整洁的事情是,
ChatGPT 著名地是一个研究预览,它变成了这个品牌,你知道,行业定义的品牌。我认为它在很多方面都是使命中更关键的部分之一,因为它正是许多人将这种智能用于日常使用的方式。它不局限于少数人。它不局限于难以访问的形式因素。所以我实际上认为
看到这带来了多少变化真是太好了。AGI 的使命有很多不同的轮廓,但造福人类意味着每个人都可以使用它。所以我确实认为,就像你所说的成本重要吗?哦,是的,成本非常重要。如果人工智能非常昂贵,并且你需要 200 美元的订阅费,那么我们如何才能让全人类都能使用人工智能呢?我为此付费,因为我认为,你知道,O1 专业模式令人惊叹,你知道,但你想要两者兼顾,因为你需要高级研究方面
你还希望世界上每个人都能从中受益。这就是方法。如果你试图预测我们将走向何方,那就想想,如果我经营一家公司来构建 AGI 并确保它造福人类,我会怎么做?这就是我们优先考虑一切的方式。我知道我们很快就要结束了。我很想问一些私人问题。首先,也许......我一直在指导你的原则是什么?首先,在选择做什么方面。所以,你知道,你是 Salesforce 的联合首席执行官。你是 Facebook 的首席技术官。我相信你做了更多的事情。
但这些都是你做出的选择。你有没有使用过的框架?是的,让我们从这里开始。
我试图保持一种像现在一样存在和脚踏实地的状态。冥想?不,我希望我能做得更多,但我没有。我真的很想专注于影响,我想,在我所从事的工作上,但我也很享受它。有时我认为我们谈论过一点,你知道,如果企业家想创业,应该从事什么工作?我开玩笑说,有时最好的企业是充满激情的项目,对吧?
我肯定会同时考虑这两点。就像我一样,我想对世界产生影响。我也喜欢享受我正在构建的东西。如果我不每天都喜欢做这件事,我不会从事有影响力的工作。
然后我试图在我的生活中保持一些平衡。我有一个家庭,Sierra 的一个价值观是竞争强度,但我们还有一个名为“家庭”的价值观。我们总是喜欢说强度和平衡是兼容的。你可能身处非常紧张的境地。
人。我没有很多爱好。我基本上只是工作和与家人共度时光,但我在这里取得了平衡。但是,我确实试图保持这种平衡,因为,你知道,如果你俗话说,在你临终之际,你想要什么?我想被我爱的人包围,并为我所产生的影响感到自豪。
我知道你也喜欢做手工意大利面。我是意大利人,所以我非常想听听你最喜欢的意大利面形状,也许还有酱汁。哦,这很好。我不知道你在哪里找到的。那是深度研究还是其他什么?这是深度研究。这是一个深度剪辑。对不起,这是从哪里来的?它来自,我忘了。来源已链接。我确实喜欢烹饪。
所以我开始做意大利面的时候,我的孩子们还小,因为我发现让他们参与厨房活动可以让他们更好地吃饭。所以,参与制作食物的行为。让他们更欣赏食物。所以我们做了很多像意大利面、细意大利面这样的东西,仅仅是因为它很容易做。
而且曲柄在转动,对我来说,制作意大利面的一部分是,他们可以操作曲柄,我可以把它穿过去,这很有互动性。酱汁我做了很多,可能,我的意思是,像用非常好的西红柿做的非常简单的玛丽娜拉酱,就像......
经典之作,尤其是如果你做的是非常好的意大利面,但我喜欢所有这些,但我的意思是,我只是,你知道,这可能是首选,因为它很简单,所以我只是对我们说,当我看到它出现在研究中时,我说,我的意思是,你必须作为意大利人在这里权衡一下,是的,我会这么说,有一种叫做 alla chitarra 的意大利面,它有点像......
几乎是方形的。这些都很好。就像,你用油做樱桃番茄酱。你可以再次使用 on do。是的。我们可以对意大利面做不同的播客。就像意大利科技黑手党的头目一样。非常好的餐馆。我强烈建议和他一起去意大利餐馆吃饭。是的。好的。那么我的问题是,你如何跟上人工智能的步伐?有很多,
正在发生的事情。你有没有使用过其他人没有使用的特殊新闻资源?没有,但大多数早晨我会尝试阅读,查看社交媒体上发生的事情,就像围绕论文的任何讨论一样。但我没有......
我真正喜欢的事情是,我们在 Sierra 有一个小型研究团队,我们会对有趣的论文进行研讨会。我认为这非常好。而且,你知道,通常是某人深入研究了一篇论文,并做了一个,你知道,你带上午餐,然后做一个朗读。我发现这是最有益的,因为,你知道,我喜欢研究,但有时,你知道,一些简单的概念被很多华丽的语言所包围,你会说,让我们再加几个东西。
你知道,希腊字母在那里,让它看起来像我们做了一些聪明的事情,你知道,有时只是从概念上谈论它,我可以更容易地理解所以是什么,你知道。所以这也是很有趣的。然后只是谈话,你知道,我总是尝试,当有人说我不熟悉的事情时,就像我克服了感觉愚蠢的事情一样。我说,我不知道那是什么。向我解释一下。
而且,是的,有时你只是能找到简洁的技术、新的论文等等。如果你想说答案,这是不可能跟上的。当然。我的意思是,如果你在挣扎,那么想象一下我们其他人。但是,你知道,你进行了非常有特权和特殊的对话。根据你在内部听到的讨论,你认为人们应该关注哪些研究方向?你知道吗?
这对你或任何人来说都不足为奇,但我认为总的来说,推理模型。但这很有趣,因为两年前,你知道,链式思维推理论文非常重要,你知道,总的来说,链式思维从那时起就一直是一件有意义的事情。我认为这是一篇谷歌论文,对吧?如果我没记错的话。谷歌作者,是的。我认为......
它一直是获得更可靠模型结果的一种方法。真正有趣的是,蒸馏和推理的结合使得相对性能。而且我会说,实际上,性能是一个模棱两可的词。基本上,
这些推理模型的延迟更合理。因为如果你考虑一下,比如说 GPT-4,我认为这是一个巨大的智能飞跃,它在很长一段时间内都非常慢且非常昂贵。所以它限制了应用程序。一旦你到达 4.0 和 4.0 Mini,你知道,它为许多不同的应用程序打开了大门,无论是成本还是延迟。
当 01 推出时,质量方面非常有趣,但它非常慢,非常昂贵。所以只是有限的应用程序。现在我刚看到有人发布,他们蒸馏了一个 DeepSeq 模型,并将其做得非常小。而且它正在以如此快的速度进行这些链式思考。
它实现了延迟数字,我认为,有点类似于当年的 GPT-4。现在突然之间你就像,哇,这真是太有趣了。而且我认为,特别是对于很多听众来说,他们就像应用人工智能人员一样,它基本上就像价格性能质量和性能一样。
很长一段时间,市场如此年轻。如果你真的必须为用例选择哪个象限,那么能够在三分钟内获得相对复杂的推理的想法令人惊叹。如果你没有尝试过,它的速度让我比 01 更频繁地使用它,仅仅是因为 01,我实际上经常使用 4.0 来制作我的提示,然后将其放入 01,因为它太慢了。你知道,我只是不想像周转时间一样。是的。
所以我对它们非常兴奋。我认为我们正处于早期阶段。就像从 GPT-3 到 3.5 到 4 的快速变化一样,你只是看到了......而且我认为对于这些推理模型来说,我们如何使用推理时间计算以及围绕它的技术,它的用例,感觉就像我们正处于这种寒武纪生命大爆发时期一样。所以我认为这真的很令人兴奋。是的。
当然,如果你看看我们正在讨论的一些用例,例如编码,这些正是这些推理模型存在的领域。
并且应该有更好的结果。当然,在我们的领域中,有一些问题需要更稳健地思考,我们一直都在这样做,但这就像这些模型开箱即用时包含了更多电池一样。所以我对它们非常兴奋。任何最后的行动号召?你在招聘,团队在发展吗?显然,更多人应该使用 Sierra。我们正在发展团队,
我们正在招聘软件工程师、代理工程师。所以给我发邮件,[email protected]。我们发展得很快。我们的工程团队只在旧金山办公,尽管我们确实在其他办公室,例如伦敦,有一些前沿部署的工程师。所以。太棒了。非常感谢您抽出时间,布雷特。感谢您的邀请。