We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode "Software should be soft" - Meter Command with Anil Varanasi

"Software should be soft" - Meter Command with Anil Varanasi

2024/9/30
logo of podcast Hallway Chat

Hallway Chat

AI Deep Dive Transcript
People
A
Anil Varanasi
F
Fraser
N
Nabeel
Topics
Fraser: 我认为过去十年,软件创业公司过于关注效率提升,而忽略了软件的创造性。 Nabeel: 我同意Fraser的观点。过去十年,软件创业公司主要关注效率提升,而非技术创新,这阻碍了对AI的探索。 Anil Varanasi: Meter Command 结合了命令行接口和仪表盘的优点,旨在改进软件与基础设施交互的方式。软件开发历史较短,仍处于手工制作阶段,很多软件设计停留在十多年前的水平。大型语言模型已经足够强大,可以用于创造新的软件交互方式,但目前这方面的探索还不足够。软件应该易于使用和修改(“软件应该柔软”)。企业软件通常针对特定用户群体设计,忽略了其他用户需求,Meter Command 试图解决这一问题。Meter Command 通过自然语言接口,帮助用户快速查询、操作和生成网络基础设施相关的软件。在现有产品中引入AI技术时,应关注解决问题而非技术本身。要构建成功的AI驱动型产品,需要拥有整个技术栈,从架构到数据,再到用户行为。我认为未来软件将根据用户的特定需求即时生成。未来十年,AI将彻底改变各个行业,这需要持续的努力。应该重新设计操作系统,以适应未来AI驱动的软件。

Deep Dive

Shownotes Transcript

当年轻人问我什么是企业软件时,我会告诉他们这很重要。过去十年,我们初创公司学习如何更好地运营,实际上都是为了提高效率。你正处于新生儿带来的恍惚状态中,你的创造力正在流失。你谈到了“软件应该柔软”这样的口号,但显然你还有其他的想法。欢迎回来,大家好,我是弗雷泽,我是纳比尔,今天我们请到了一位嘉宾,来自Meter的阿尼尔。

嘿,纳比尔·弗雷在这里。非常感谢你们的邀请。很高兴见到你们。这是在我一个月前(明天算一个月)看到一条推文后联系阿尼尔的。

是的,METR是公司名称,但真正吸引我们的是METR Command。它的基本描述是:它接收关于你的网络基础设施的问题,然后除了回答这些问题外,它还会构建一个实时可视化和仪表板来增强这种体验。它就像一部分生成式AI,一部分可变软件,一部分爪状工件,Command K魔法,画布设计,我相信我们会涵盖所有这些。这就像是你看到了软件未来的一个时刻。

它当时还没有广泛发布。所有这些都来自一家网络基础设施公司。我有很多朋友都在问我关于它的事情。这是什么?这太疯狂了。我们今天只想和你聊聊它是如何诞生的。当然,当然,我真的很兴奋。也许你可以介绍一下这个产品,并告诉我们它的起源。

正如纳比尔提到的,我们是一家网络公司,构建路由、交换、无线、硬件、操作系统、固件,所有这些好东西。都是性感的东西。是的,世界上的一切都运行在数据包上,希望这些数据包都运行在Meter的硬件和软件上。从历史上看,你与基础设施交互的方式是CLI。CLI的好处是:

你可以非常快速地获取信息。缺点是你必须一遍又一遍地学习每个CLI的各种术语。

在过去的10到15年中,从一家名为Meraki的公司开始,他们推动基础设施拥有仪表板。这很有趣,因为他们是一家这样做的网络公司,但这在某种程度上也蔓延到了每个基础设施领域,人们惊呼,如果网络可以有仪表板,我们也应该有,包括存储、计算、服务器和其他东西。仪表板非常好,因为你不需要学习任何东西,你只需要点击一下就可以快速上手。

但缺点是,如果你知道自己在做什么,它们会比较慢。而且,特别是如果你有功能请求,

可能需要三个月或六个月,因为你提交了一个功能请求,然后某个产品经理会接手,把它交给设计师、工程师和测试人员。我们不可能注定要在这个但丁式的版本中一遍又一遍地制作仪表板,就像每个公司一样,接下来会发生什么?所以这就是很多探索开始的地方,也是我们很多想法的来源。Command的很多灵感都来自于此,我们实际上在一年前或两年就有了这个想法,

我们能否将CLI和仪表板的优点结合起来,真正思考软件未来的发展方向?你用我认为基本上是一份宣言来介绍这个产品,它认为软件最初是为了各种目的而产生的,然后在许多方面变得像硬件一样僵化。

令我着迷的是,这竟然会来自你们这样的公司。你们是如何让团队有权限去探索这个的呢?软件的早期作品,无论是HyperCard、VisiCalc还是Engelbart,或者任何你想到的东西,以及Bret Victor的作品,纳比尔,你提到了Jeffrey Litt的可变软件以及你提到的所有这些。关于什么是软件,有很多值得思考的地方,而且仍然有很多人在思考这个问题,对吧?是的。

总的来说,我认为我们都倾向于忘记软件的几件事。第一,它是一种手工制作的产品。就像那些你知道的,它确实是手工制作的产品一样。我们做这件事的时间并不长。我们只做了大约40到50年。所以这并不是一个拥有数百年的历史和知识以及其他东西的工艺。

总的来说,我们在我们的行业,尤其是在网络和基础设施领域,软件并不是那么好。它有点停留在10、15、20年前。有趣的是,METO混合了一些来自非常硬核的基础设施网络公司的人员,这占公司员工的50%。

然后公司另外50%的人员故意不来自这个领域。他们只是来自定期构建产品的公司。所以我认为在Meter,我们构建软件的方式与其说是权限问题,不如说是这些想法的碰撞,即,哦,我们正在构建这个硬件。构建软件实际上是如此具有挑战性,对吧?在我们的案例中,当

当我们构建一个硬件时,我们必须考虑固件、操作系统、其上的分布式系统以及API。然后我们才能在最终用户可以使用的顶部构建软件。在这个过程中,不同团队之间实际上有很多来回和碰撞,我认为这与纯粹的软件公司相比有点独特。我的意思是,你这样说,但是。

但这也是一个有意的选择,对吧?你是在说这是产品的内在属性。但如果这是真的,那么我们就会看到每家基础设施公司都在进行疯狂的、令人惊叹的UI实验和新的用户界面设计。例如,视频游戏就是一个很好的例子,它们创造了这种探索的源泉。可以说,最早的可变软件例子是像

英雄联盟和魔兽世界这样的游戏,在这些游戏中,真正有竞争力的玩家正在构建自定义仪表板和自定义键盘命令以及所有其他东西来增强他们的体验。而大多数基础设施公司并非如此构建,对吧?措辞就像人们关注鲜花,而不是土壤。我很想知道为什么你们公司是这样构建的。就像,你显然坐在一个组织内部。在某个地方有一个长期的产品路线图和线性规划,等等。就像,就像,你就像,是的,我

是的,但我也想玩弄这个界面。这是如何发生的?当然。你是对的。这是经过深思熟虑的,对吧?就像我们有知道如何操作操作系统的人员一样,我们的第一位产品设计师是第一批罢工的设计师之一。他在那里工作了九到十年。没有多少机会让你在同一个地方拥有这些类型想法和操作系统方面的碰撞。所以这是非常有意的。至于采用路线图并说你想尝试一些东西,

我认为当你遇到新的证据时,你应该改变你的想法。新的证据是,模型已经足够好了,可以做很多事情,很多事情。有趣的是,这实际上是给你们两个人的一个问题。我们在一年前或一年半前认为Command是可能的,并且其他人也会做类似的事情。

我们必须构建许多我们没有的实时数据管道,我们的团队正在从我们每一件硬件开始构建这些管道,以便能够发送实时数据。因为我们的Command版本是,你知道的,它可以获取信息,它可以采取行动,它可以编写软件,但这都应该植根于实时数据。但我很好奇你们两个,为什么你们认为没有探索?因为

今天模型的足够能力,大约是,你知道的,GPT-4,云,一年前或一年半前。为什么我们没有看到更多?你们都在这个领域的边缘,并且可以说看到了每个被创建的公司。我很想知道你们两个的想法。

好吧,我认为纳比尔的问题是想从这里出发。但是纳比尔,我不同意你的观点。我认为他没有说得足够远。阿尼尔,为了回答你的问题,我认为这只是我们还没有看到人们对这些模型能够做什么进行足够广泛的创造性探索。

你会认为,一些历史上专注于更具创造性的事情的产品会拥有以这种方式进行探索的权限。我认为他们没有,对吧。这就是我对你的回答,我认为我们已经看到很多可预测的事情出现在产品路线图上,而你交付的东西感觉不同。所以纳比尔的问题是文化上的不同。

在过去的一年中,你做了什么让这个有创意的东西不仅能够扎根,而且,我相信有一个想法必须脆弱地被带入现实。我可以尝试一下吗?我的意思是,我会尝试的。是的,请。我很想听听。是的。我认为可能有两个原因。

同样地,我同意你的观点。我认为实际上甚至我和弗雷泽已经讨论了一年多了,比如,为什么我们看到更多这样的迭代,为什么我们看到更多这样的实验?你可以在黑客马拉松和聚会上看到它,但它并没有真正出现在初创公司和真正的软件中。我认为有两件事,而且这两件事都是文化上的,这就是为什么我们支持文化上的答案。首先,我认为我们已经经历了超过10年的……

我会称之为软件的“构建人们想要的东西”阶段,如果你回顾10年前,你会看到后移动爆炸,你会看到大量的博客都在试图给你提供产品开发框架、OKR、如何更快地构建初创公司、如何避免犯错。它表面上都是套利,对吧?过去十年,我们初创公司学习如何更好地运营,实际上都是为了提高效率,对吧?

因为我们没有新的东西爆炸式增长,对吧?我们没有重大的平台转变。我们没有重大的技术转变。所以它真的归结为,我能否比你更快地运行我的策略,在市场营销、销售和病毒式传播以及所有其他方面?我认为我们并没有真正将这视为我们作为初创公司生态系统十年来一直在转动的曲柄。对。

然后,很明显,几年前GPT和AI发生了如此巨大而惊人的事情,每个人都可以看到它,并且可以对此感到非常兴奋,也许可以做一个关于它的周末项目。但我们仍然生活在我们周围的水域中,将它转化为“不,实际上它是具有颠覆性的”可能非常困难。它不仅仅是“我现在可以对我的数据库进行更好的查询”,而是

我的SQL查询可以是自然语言级别的创新,或者我的小型聊天机器人提示可以对我的文档进行rag搜索之类的创新。但是,不,它实际上将创新到堆栈的顶层,也许一开始会效率低下。也许一开始需要在沙漠中漫游一段时间才能弄清楚它将如何表现出来。

好消息是,去年我对这个问题相对感到沮丧。考虑到世界上的情况,我去年做的投资比我想象的要少得多。而且感觉我们正在好转。与去年相比,你现在看到的东西中是否有让你更兴奋的向量?或者它比这更广泛?

我只能就个人而言。对我来说,它比这更广泛。我认为这更像是每个人都意识到,如果你喜欢AI,我可以向Main Street和Wall Street销售AI,我可以获得一个季度的收入增长,并且感觉很好。所以你有一大堆公司因为追逐闪亮的便士而获得了季度收入增长。当然,这些东西都没有被保留下来。

所以他们都和他们的创始人朋友们谈论这有多难,以及在他们筹集了巨额资金后,他们如何无法再增加收入了。因此,下一波创始人或这些创始人自己正在更深入地挖掘,并提出更基本的问题。我认为这老实说是一件好事。在快速和浮华的世界中,深刻而缓慢是作弊代码。是的。

我完全同意。我认为内部快速迭代,但外部是经过良好打磨的东西。你提到了一些事情,对吧?潜水员潜入很深,在那里遇到一条传奇的鱼,并说,你觉得水怎么样?这条鱼就像,你是什么意思?我在这里。水是什么?对吧。就像……

与此相关的是,我认为我不同意或可能从正交角度思考的一件事是“构建人们想要的东西”这件事。我认为我们需要稍微反过来一点,更多地构建你想要的东西,尤其是在新工具可用时,而不是人们想要的东西。我们可以单独讨论OKR,但我完全不同意完全使用OKR。布道!

是的。Hunter Walker写了一篇很棒的文章。我甚至不知道他是否还记得十多年前写的。我认为这是在他离开谷歌之后写的,内容是,你知道的,谷歌有能力使用OKR。你没有。是的。看,你没有。就像,他们是前所未有的印钞机。不。

他们遇到的问题可能不是你的问题。是的,他们所做的事情对你没有任何作用,对吧?我认为对我们来说,特别是它开始的地方,苏尼尔和我兄弟在过去几年里一直记在心里的一个说法,弗雷泽在开头提到了,那就是我们认为软件应该柔软易用。

这就是我们的出发点和开始的地方,就像,我们能否让软件再次变得柔软,并真正使其具有可塑性或任何你想要称呼它的名称。我们在今年1月份迎来了我们的第一个女儿。就在那时,我们完成了许多API工作和实时数据工作。

这使得像这样的事情成为可能。所以,你知道的,我没有睡那么多觉。你反正也睡不着。你有一个八个月大的孩子。是的,没错。你知道的,她才两周大,我就想,这意味着什么?我再也睡不着了。我开始质疑一切。然后我从团队那里得到更新,比如,嘿,我们过去一两年一直在做的事情,它即将完成。我想,哦,

最终我们可以做我们一年半前就想做的事情了。所以最初Command的很多灵感都来自于我睡得不太多时的涂鸦、草图和原型。然后在我休假一段时间后回来时,我只是从一两个同事那里得到了一些帮助,一起制作了一个原型,然后把它展示给公司。我字面意义上有一天录制了一个Loom视频,然后把它放在公司的Slack上。

没有人知道我说,嘿,这可能是Meter Command。我们在Meter是一个非常怀疑的群体。我认为这在大多数基础设施公司,尤其是在Meter都是如此。我们比普通初创公司人群要老一些。流行语就像,

反Meter以及我们所代表的一切。所以,你知道的,我必须谨慎行事,对吧?所以我只是录制了一个Loom视频,把它放在那里。即使考虑到我们的人群和高标准,我认为我的同事们的反应非常好。人们说,我可以使用它吗?

这通常不是我们从事情中得到的反应。大多数时候,它就像,好吧,这里有一件小事很糟糕。那又怎么样?那又怎么样?用户体验如何?你是怎么做到的?但最初的反应是,我可以使用它吗?或者这看起来真的很酷。这给了我比任何事情都更大的安慰。然后我的兄弟,他往往对任何事情都有很高的标准,

在过去20年中,我们一起工作,能够发布任何产品都是一个奇迹。他说,哦,是的,这很好。我想,哇,自从我出生以来,我从未从你那里听到过这句话。所以,这很好,可以尝试一下。但这就是它的开始方式,即认为软件是柔软的,并且实际上只是制作原型并展示它。因为我注意到我认识的其他创始人或其他产品人员有很多东西,

是很难解释的,因为你是在使用模型构建东西,所以没有参考点。没有什么你可以说像这样或那样。所以我特别觉得,即使它是一个……

你知道的,如果你愿意的话,一个粗糙的原型,展示比讲述要好得多。这就是我们的开始方式。我认为我们需要在这里做两件事。很明显,你没有为公司设定OKR,然后进行第二季度的规划,然后带着“让我们从将该指标提高20%的目标倒推”的想法回来,这就是我们要做的事情。你正处于新生儿带来的恍惚状态中,你的创造力正在流失。你谈到了“软件应该柔软”这样的口号。

但显然你还有其他的想法。你试图解决你自己的问题或组织中的某种问题。也许在告诉我们那是什么的同时,你试图表达的想法的萌芽是什么?也许还可以谈谈Command的功能,以便人们了解它是什么。我们有安全设备、交换机、无线接入点,

电源分配单元,所有这些都是由Meter设计和制造的,然后是顶部的操作系统、固件和API。然后通常我们有一个漂亮的仪表板,我认为团队做得很好。我们试图解决的问题实际上是,由于某些类型的软件的构建已经变得如此出色,我们现在倾向于为新手或专家构建软件。

你会被告知,你的角色是谁?选择那个角色。为它而构建。忽略其他人。所有这些,你知道的,一遍又一遍地重复出现的格言。我注意到的一件事是,我们开始拥有一个真正的杠铃用户,即世界上一些最大的组织。

实际上,IT团队比Meter整个公司都大的公司也在使用Meter。然后是一些最小的公司,可能是你们正在资助的初创公司或其他发展非常迅速的公司,他们实际上没有IT团队,他们只有产品人员,他们也在使用Meter。杠铃的两端。对吧?

我们在零售和酒店业也看到了这一点,这些行业距离技术更远,他们甚至没有技术团队。所以我们试图解决的最初问题是,我们不可能同时为两者构建。我们能否使用模型来解决这个问题?所以这是一个问题。

第二个问题是,在基础设施中,很多东西都来自大量的日志,对吧?这可能是来自硬件的日志,也可能是来自连接到网络的客户端的日志,任何类似的东西。用户和我们的工作是能够构建一些东西,以便你能够真正理解正在发生的事情。这是第二个问题。

然后是第三个问题,如果你想采取行动,这可能会很慢。你必须学习你想做什么,并且你必须弄清楚确切的术语。如果有一个行业充斥着首字母缩写词,那就是网络。所以Command本质上是位于我们的API之上。它了解我们的硬件、架构、API,以及我们如何设计软件以及我们如何编写软件。

Command的这些构建块。然后它能够解决我们想要解决的三个问题,而不会超出这些问题。首先是能够提出问题。这就是很多UI探索开始的地方,我们的客户可能有数十万件从Meter获得的硬件。我们都经常使用Slack、电子邮件和其他东西。所以我们开始做的一件事是,我们能否直接点击并与某个位置交谈?

或者与任何地方的任何硬件交谈,并对硬件进行人格化,就像,我现在只想与这件硬件交谈,因为我现在出于任何特定原因都关心它。这在演示中,你就像在约克街570号,你说,那是我们的地址。我只想查询一个位置。是的,那是我们在演示中展示的办公室网络。我只想查询一个位置。

然后第一个问题就是,我们只想让用户能够提出问题。这可以是任何东西。这可以是任何东西,从“这件特定硬件或位置或一个特定客户端发生了什么”到“安全方面发生了什么”、“吞吐量、带宽、使用情况发生了什么”,任何你能想到的能够提出问题的东西。

第二个是采取行动。你想执行复杂的安全性防火墙规则,因为你正在经历新的合规性或你正在处理的一些新的大型交易,或者在大公司的情况下,他们不断添加新事物。你能不能非常快速地采取行动,否则可能需要点击五到十次或访问两到三个不同的页面?所以,

用户会在工单中输入什么,他们能否直接输入到Command中并完成?而不是必须提交工单,然后有人查看它,然后有人做一些事情。他们能否直接在那里输入,对吧?这就是我想做的,做这个。

给我结果。所以这是第二个问题。Command解决的第三个问题是,我们应该更深入地讨论整个界面,但我能否按照我想要的方式获取软件?我们注意到的是,大多数企业软件最终都是关于合规性或报告的。对吧。我需要向其他人提交关于我购买的这个东西的报告。对吧。

就是这样。这就是企业软件。当年轻人问我什么是企业软件时,我会告诉他们这是报告。所以我们实际上想要能够做到的是,而不是让每个人都必须弄清楚如何获得他们想要的报告,或者能够理解他们的基础设施或按照他们想要的方式创建仪表板。

软件,尤其是模型,已经变得特别好。如果你在训练和保持模型较小方面做得很好,你可以渐近地达到100%的准确率。我们看到了这一点。事实证明,这是一种令人难以置信的新架构,我的一个同事Natan最终只是……老实说,这三个月他每天七天,每天15个小时都在工作,一直如此。所以……

我们能否让软件被构建出来?Command就是这样。你只需要进去,与任何硬件交谈,提出任何问题,采取任何行动,并为你即时编写软件,就像你拥有你自己的工程师一样。你之前问我,为什么这件事还没有发生?对吧。答案是,真的是短期思维与长期思维之间的区别。

我认为如果我要进行下一轮融资,我需要让我的收入增长正确。AI看起来可能能够帮助实现这一点。我必须追逐它。但我还必须在三个月或六个月内解决这个问题,以便达到我的OKR或进行融资。我希望Shmooby Shmooby Ventures看到快速增长的速度,并给我更高的估值。是的。

因为我害怕,或者反过来,那就是,再说一次,我刚刚进入种子轮融资或YC,是三个月。请向我展示我的周同比增长率。是的,我该如何让AI解决我的短期问题?我现在明白你为什么对我的评论反应如此积极了。在快速和浮华的世界中,缓慢和长期是一个巨大的优势。如果你倒着想,

那么关于AI的讨论就不会从UI层开始。关于AI的讨论是从数据和基础设施层开始的。我不仅仅是指你作为一家公司,我的意思是对于每个人来说。核心问题是,我作为一家公司正在收集什么数据?所以如果我是你,我正在收集大量关于网络配置以及人们如何解决问题的所有这些方面的数据。如果我是Replit,那么我正在收集大量数据,不仅关于AI代理生成的代码,还包括人类如何解决这些问题?我有很多日志,表面上是人类执行这些行为的行为。

然后是核心模型问题,如果我真的关心AI的长期发展以及它如何改变我的业务,首先是从“我如何构建我的API和数据以捕获这些见解”开始的,这样人类和计算机(即模型)都可以随着时间的推移访问这些数据,采取行动,执行这些操作。然后,正如你提到的那样,知道什么

什么格式才能寻求帮助,以便模型最终能够自动完成越来越多的任务,并能够寻求帮助,对吧?是的,当然。你必须充分假设,模型会以某种指数速度变得更好。你可以说,增长速度可能会放缓,我们都可以同意或不同意,这并不重要。但我认为我们都可以同意,在我们可以看到的足够长的时间范围内,它会继续变得更好。如果是这样的话,

你能构建什么,只有你能构建的东西才能为你的客户带来巨大的价值?这在整个故事中感觉如此重要。公司运营者意识到这是一个重大的拐点,然后

我不知道,允许你对你将要做的工作抱有极大的雄心壮志。我不禁想到,这很大一部分也来自于这样一个事实,即你显然正在尝试这些技术。它们处于边缘,并试图理解它们。是的,我试图阅读每一篇发表的论文。好的。

对,对,对。就像你不是,你并没有像隔了两步远。好吧,这就是破解它的方法,对吧?你给你在OpenAI、Anthropic和所有地方的朋友们发消息,告诉他们你读到的所有内容,这……

你最关心哪些?在一个星期内,他们都提到了同样的事情。那么你应该完全深入地理解这一点。你需要一个关于人工智能论文的Reddit,只有少数特定资质的朋友才能投票。事实上,令人惊讶的是,尽管谷歌发布了Transformer论文,并且有点,双关语,改变了,但就研究而言,他们仍然在做一些最好的工作。而且一些最好的工作仍然是由他们完成的。

也许其他人正在做更好的工作,可能吧,但这并没有公开。而在谷歌的情况下,我从中受益匪浅,因为他们所做的事情,很多仍然是公开的。是的,他们仍然是那些文化是发布……

我们不会稍微偏离一下,担心所有论文文化都走向封闭,这对未来创新意味着什么,所有这些东西。也许以后再播客。也许这是弗雷泽应该为我们解答的问题。弗雷泽,发生了什么事?

我不知道。我会告诉你一个我喜欢的梗/我不能说。我要说一个梗。我相信你们两个都看到了,但那是DeepMind的研究员,当他们同意发表他的研究时,他感到沮丧,因为他意识到它不再重要了,或者说它微不足道了。这既滑稽又对我们目前所处的科学阶段做出了严厉的评论。所以……

我假设你当时正在进行原型设计和黑客攻击,你构建的概念验证是在云端或重新打开AI API上。你什么时候决定要训练你自己的模型?这是一项非同小可的任务。

我开始为Command专门意识到我们只需要合适的人才。在我的脑海里,它从不意味着几十个人,如果你愿意的话。它只意味着几个人。我开始问所有认识的人。幸运的是,参与Meter的很多人都在运营这个领域最好的公司,并正在为世界构建大型模型。在几个月的时间里,我最终遇到了大约

大约40到60人。我正在寻找的独特组合是那些真正理解模型如何工作以及如何构建模型的人。当我看到像训练后这样的东西时,这就像我正在寻找的反面,训练后就像提示工程的另一个粗略等价物,如果你愿意的话。而实际上深入了一点的人,但实际上关心构建产品的人。

我和我遇到的人有很多问题,他们对这些问题非常感兴趣,从学术角度和研究角度来看。但是将它们转化为产品基本上意味着你必须涵盖所有边缘情况。

并非所有时候它都能工作。实际上,人们总是会破坏它。我最终遇到了我之前提到的一个人,我的同事尼廷,他根本不是来自这个世界。他在麻省理工学院最好的生物实验室之一工作。我要把这位传奇女性的名字弄糟了,但雷吉娜·巴齐尔。她在生物学和麻省理工学院的世界里就像一个传奇人物。他来自那里,但他对构建产品特别感兴趣。

我很幸运在正确的时间遇到了他。我让他坐在办公室里,就在我旁边。谈论文化,就像字面意义上坐在我旁边,这样我至少可以通过渗透尽快学习他所知道的一切。所以,

它从那里开始。然后,你知道,我把他扔进了我们拥有的这个原型代码库中。然后他就开始做了。我在这里没有夸张。有很多个星期,你知道,我们每天晚上都到凌晨3点。

我们经历了这个过程。我是一个创始人。让我们假设我是一个正在听这个的创始人,或者产品副总裁或工程副总裁。我现在正在考虑人们如何使用我的软件,我正在考虑软件内部发生的所有数据、位和用户行为。我正在考虑这需要……哦,我们甚至没有记录所有这些东西。我们正在愚蠢的日志中记录。我甚至没有捕获到一半的东西。我甚至要捕获什么行为?我该如何进行模型构建?我会回到,我昨天确实与一位首席执行官进行了这样的对话,你

没有说出公司名称,他们实际上有一些人工智能工程师。他说,我认为我需要重置团队,或者有什么问题,或者也许我需要一个新负责人,因为

因为我觉得我拥有一群人工智能研究人员,还有一群人正在告诉我并给我建议,我不再需要研究人员或模型构建者了。我真正需要的是像在产品层工作的优秀AI提示工程师,让他们开始工作。大部分这些事情都可以在提示级别发生。我觉得你正在反对工程。

它不是这两者中的任何一个,对吧?你谈论的是一个不是核心人工智能研究人员的人,也就是你不是在与将获得数百万美元奖金的人竞争,这些人将去DeepMind或OpenAI,并试图挖走那个人。好吧,这个人本来可以,但幸运的是他们在Meter。但他们并没有在DeepMind研究10年,然后被OpenAI或Claude挖走,对吧?正确。

但他们也是模型构建者。我试图进入创始人的模式。你现在正在与其他三位创始人讨论他们如何尝试执行这个想法。他们想要构建新的界面集。他们想要构建下一阶段的可塑软件。他们知道这不仅仅是一些提示工程的事情。它实际上必须降低到实时访问数据。它必须降低到自定义模型。感觉很多。我该如何招聘和配备人员来应对这种情况?你刚才提到的一些事情,我对此有一些……

文化上的反反应。我喜欢它。一个实际上是,我不知道人们是否应该说人工智能,以至于我们根本没有在任何地方使用它。这是真的。你在整个谈话中只使用了“模型”这个词,对吧?你不会在任何地方找到它。因为事情是这样的,对吧?我现在已经足够老了,技术总是会出现的。

它大致感觉像是告诉人们我使用Postgres、MySQL或ClickHouse之类的数据库。我认为用户不在乎。我真的不在乎。我还没有遇到一个普通人,不是我们硅谷的疯子,他们会说,“哦,伙计,你使用什么数据库?”这件关于艺术家聚在一起谈论松节油的老事。好吧,实际上,大多数人实际上并不关心松节油。他们只是……

他们只是想看艺术。所以我认为,就像我对这样的反应一样,如果你正在接管一家现有公司、现有产品,而不是一个新的,我认为新的,你可以做任何你想做的事情。我已经很久没有创办新公司了,不记得那是什么感觉了,我想。但我认为对于现有公司来说,我甚至认为你不应该向你的公司介绍人工智能。我认为你必须谈论你试图解决的问题是什么?这个工具可以帮助解决它。

因为我认为如果你带着人工智能这样的说法大张旗鼓地出现,首先,我个人认为这是错误的。其次,这似乎并不具有战略意义。这就是你在公司中介绍事物的方式。这是一个老生常谈的例子。假设明天,某个首席执行官、创始人或首席技术官来到一家过去5年或10年一直在使用Postgres的公司。然后突然他说,我们明天要改用MySQL了。

很多人都会辞职。很多工程师。就像,第一,我们为什么要这样做?第二,这不像是一件足够有趣的事情,或者它可能对业务有害。所以……

我对说人工智能甚至根本不说人工智能有这种反感。我认为构建它的人可以这么说。而且只有少数几个实验室或几家公司,其他人,我不知道。对我来说,说出来感觉很疯狂。然后第二,我也不同意我们所有人对真理的接受速度有多快。

也就是说,我们最终都会说些什么,不知何故,它就变成了甲壳虫乐队,变成了现实,对吧?也就是说,每个人都说,你不需要模型。你什么都不需要。只需使用API。只需提示它。不知何故,人们最终相信了这一点。而你实际上从大型模型中得到的是创造力,答案的创造力,而不是精确的创造力。

我认为这实际上是下一个标记预测或任何你想要表达的方式带来的最伟大的事情之一,那就是你实际上可以从过去只有确定性的机器中获得创造力。但正因为如此,你实际上不能在企业产品中拥有创造力。你想要的是准确性和速度。

如果你在数据中富有创造力,你就会回报你的用户。好吧,他们不会成为你的用户很长时间。因此,真理,每个人都会重复,你知道,我不出去的时候。这些是我通常完全不同意的东西。第三件事,可能正在发生的事情是你有点暗示了这一点。我认为你必须拥有整个事情,特别是如果你不玩短期游戏的话。

如果你相信你正在做的事情,并且你认为你可以在足够长的时间范围内解决对你的客户和用户来说独特的问题,那么你必须拥有从架构到数据到如何标记它的一切,人们如何使用它。基本上,如果你去看OpenAI做什么,例如,他们煞费苦心地做所有这些事情来获得他们想要的模型。

我只是不认为其他人有什么不同,其他公司有什么不同。你只需要拥有它,就像真正拥有它一样。我大多同意你的观点。我内部进行的一些更有趣的对话发生在我礼貌地指出我们非常关心模型的泛化能力,但我们的许多客户发现它是一个错误而不是一个特性时,对吧?是的,它可以在我正在执行SQL的过程中将法语翻译成德语。但我认为,

如果你非常关心你正在交付的产品,并且它正在以非常有意义的方式使用这项技术来及时实现这一点,我认为很多团队都会有你的观点,对吧?就像我们学到的。看,如果我插话。当然。我完全不同意你的观点。去做吧。让我们听听。我实际上认为这是相反的,

之所以今天要拥有它,是因为生态系统还不够成熟。随着时间的推移,你可以不必拥有它,因为围绕它的所有东西都会出现,你不需要这样做。今天,情况并非如此。未来5年或10年也不会如此。你们可能还记得EC2或RDS推出的时候。

使用EC2来获得你想要的结果是一件痛苦的事情。所有这些不同的公司都作为顶部的工具存在,以帮助你实现目标。或者很多公司最终在内部构建它。很多。谈论说唱歌手,如果你愿意的话。10年前,那些是说唱歌手,对吧?所以我不同意你的观点,我实际上不认为随着时间的推移,人们会认同我的观点。我希望人们现在认同我的观点。随着时间的推移,他们不必这样做,如果这说得通的话。

你谈论的是从创新到商品化的过程。我还记得Zynga早期的日子,我们就在那里,Farmville推出了。它正在疯狂地扩展。我们是亚马逊AWS上最大的客户。由于我们的增长速度如此之快,我们一直在破坏他们的基础设施。因此,许多人实际上正在联系AWS的人并让他们修复错误,而我们是唯一遇到他们的人。因此,你最终会得到大量

世界上不存在,并且在Zynga内部存在了一段时间的自定义软件,现在它无处不在,要么内置在AWS中,要么有其他独立的公司可以提供它作为中间件公司等等。你只是说,听着,如果你稍微领先于曲线,这自然意味着你最终会得到更多定制的东西。然后随着时间的推移,这些东西的一部分停止成为战略性的,

因为其他人可以构建它们,他们已经意识到了这一点,然后你实际上可以,如果它们不是非常非常具有战略意义的话,那么当然,这是一个API调用,它是一种商品,它的成本是每……0.001美分,它不再重要了。这并不意味着在此期间这样做不重要。是的,我只是认为今天这些都不存在了。

即使你去和实验室谈谈,我相信你认识你的同事,即使是在Okneon,他们也在快速发布东西,对吧?他们知道有很多东西需要构建,那就是脚手架、工具和基础设施。时间不够。如果你是一家使用所有这些东西的公司,我认为我主要提出的观点不是你应该自己预训练数百亿个参数并自己做这件事,而是至少在顶部构建脚手架

以及它与你的数据一起需要做的一切。例如,我们正在谈论创造力,你提到,弗雷泽,关于泛化能力是一个错误,而不是一个特性。我们在架构中做的一件事是,在命令中发出答案之前,有一个我们称之为“拒绝者”的东西,即使在经过整个架构之后,也应该有一个机制来拒绝答案,因为它不是一个好的答案

例如,当你问Command,勒布朗·詹姆斯是谁时?唯一的答案是它与网络无关。我不知道。这是唯一的答案。你刚刚回答了你自己的问题,为什么我们没有看到

更多公司正在做你一直在做的事情,这很简单,因为它很难,而不仅仅是提示工程,对吧?就像你可以看到软件的未来在哪里,但为了实现这一点,你正在做很多不同的事情,从内部自定义模型构建,但你正在构建提示的拒绝者,这是……

我见过几家CCH公司将其作为外包来做,但它们还处于早期阶段。真的吗?难以置信。我不知道。很多小型模型构建者,但他们都还处于早期阶段。就像你要弄清楚如何在右侧构建一个可塑的软件画布,以便在我输入命令后,它会变成一个小的UI框架,然后我可以将其交换到这个画布中并四处移动。

还有一些公司,如TL Draw和其他公司,正在帮助作为API基础设施层来解决这些问题,但它们还处于早期阶段。因此,我相信对于许多创始人来说,他们会看到这些东西,他们会原型设计一天或几天,

然后他们会说,“是的,但实际上它有点笨拙,而且有点破损,它只有80%是正确的。它给了我错误的回应,这似乎有很多工作要做。与此同时,我必须达到下个月的目标。因此,他们所说的就是,这感觉还为时过早。

就像我尝试过一样。在原型设计中感觉还不错。感觉有点神奇,但将其从不错的演示转变为实际工作的路径有很多定制的东西。

而且,你知道,如果我是一个创始人,我会说,“是的,为什么我不等等呢?感觉还为时过早。为什么我不等两年呢?但这不正是构建公司的完全相反的方式吗?你们告诉我,你们想领先两年,对吧?我认为如果你等两年,其他人也有可能做到吗?哦,我们非常反对初创企业的OKR化和短期主义。我们同意这一点。是的。

我保持沉默,不是因为我觉得自己被狠狠地打击了。我保持沉默是因为,当一个对某个问题思考得很深入的聪明人强有力地提出与你观点不符的世界观时,你应该停下来找出分歧在哪里。也许在这次谈话中这并不有趣,但我仍然觉得我是对的,我无法弄清楚我与你不同意的地方。我们应该离线争论,当然。我会来看你。

我总体上有很多问题要问你,但我猜回到你们刚才问的一些关于Command本身的问题,我对聊天界面也有同样的感觉,对吧?所有构建界面本身的人都专注于文本。而且,你知道,这就像更漂亮的文本、更多标记的文本或更好的字体文本。但归根结底,它只是文本。这也很让我们惊讶。是的。

但我们在Artifacts出现之前就已经完成了所有这些工作,很久以前。从那时起,我们一直在完善它并使其变得更好。因此,令人惊讶的是,为什么没有人只是做内联软件?我们都是视觉生物。这就是软件存在的全部原因。我们不是给客户备忘录。是我们提供的软件。那么,为什么没有与技术一起出现的内联软件呢?我们开始这样做。

然后在查看界面时,我们觉得,聊天风格界面中的所有内容都是非常短暂的。感觉我与这件事没有任何关系,我做了,它就消失了。而你真正想要的,如果你与产品人员交谈,Zynga,你们知道这一点,Nabil,你希望人们拥有收藏夹、书签,你希望人们拥有所有这些东西,因为它们会失败。

形成某种联系。是的,这很好,因为你想要参与度,所有这些东西和指标看起来都很好。但实际上信号是,无论软件最终做了什么,它都是某种信号,表明它对用户来说有点价值,只是一点点。所以我们一直在考虑的是,为什么所有这些界面都是短暂的?就像我正在做所有这些事情,模型正在做很酷的事情,但它就像蒸汽一样消失了。所以我们正在做内联软件。然后我一直在考虑

我们能不能把它捡起来,然后把它移到说,我在乎这个,然后说,这就是我想要的东西。

这就是很多画布的来源。一旦我们把它捡起来并移到那里,我就受到了过去5年、10年,特别是Victor的工作以及他们在Dynamic Land和其他方面所做的事情的强烈影响,那就是你关心的对象应该在一个可塑的画布上,就像你手中的橡皮泥一样。

所以我们说,好吧,如果我能把东西放在那里,我的同事也能把东西放在那里吗?而它最终实际上只是让人想起的是,当我学习网络时,它是在工程大楼的一个黑暗房间里,没有其他人进去。但是当你执行CLI命令和其他事情时,其他人会从你的肩膀上窥视,并说,“你试过这个吗?”或者“这个怎么样?”或者类似的东西。我们希望画布完全是多人模式的。

我非常喜欢Figma从可用性和在网络上发明新事物到它的性能所取得的成就。以及它的纯粹本质。但也非常惊讶的是,这并不是其他软件中使用的正常模式。即使你把模型放在一边,我认为即使所有这些你都应该现在拥有,因为这些组件实际上并不存在于外部。是的,我认为我们可以对……感到沮丧。

为什么我们没有看到更多这样的情况。但这只是,人们从聊天界面开始,因为这是我们开始的地方。这并不让我感到惊讶,这是我们开始的地方。这些可转移的模型输出文本。所以,我的意思是,弗雷泽比我们更了解这是如何实现的。但对我来说,这就像你一开始说的那样。你从命令行界面开始,

这意味着你从,如果你真的退一步,你从MS-DOS开始。你开始在一个ASCII字符表上输入一个小命令行。在我们进入图形界面之前,你从图标开始,对吧?在Microsoft Word的顶部只有几个小图标。

或者当时的WordPerfector。现在我可以点击五个按钮,这就是界面。然后我们想,“为什么整个东西不是一堆按钮?”为什么我没有很多选择,我不能四处移动东西?这就是我们进入仪表盘的地方。我只是觉得在人工智能中,对不起,使用了你不想要的词,但我认为在人工智能中,我们正在得到完全相同的

历史模式缓慢地随着时间的推移而上演。你从命令行开始,你从文本开始,你转向,我可以按下几个按钮。我可以采取一些行动,这就是你现在在像Notion这样的界面中得到的东西,对吧?我右键单击,我可以点击缩短文本或改进文本。你正在走向一种情况,即随着时间的推移,你正在构建更可塑的软件。感谢你,

我认为,也许为其他一些创始人、产品构建者提供了一个窗口,让他们了解未来可能是什么样子。是的,我认为还有很多事情要做。我们也试图进行一些推断,那就是如果我们推断5年或10年,大多数软件是否可能只是为你即时生成的?我认为这是真的。但是……

然后我开始考虑的是,让我们想象一下,所有最先进的模型开发今天都停止了,这是世界上发生的事情。我们在此之后不再构建任何新模型。而我们今天拥有的就是我们所拥有的。

我仍然认为所有这些都是可能的。这就是我们今天所拥有的。即使我们将所有事情都冻结在时间里,我认为实验室所做的和这些公司所做的,在他们取得的进展方面仍然是了不起的。这实际上回到了,当你与真正构建这些东西的人交谈时,弗雷泽,如果你错了,你可以纠正我,很多用例也让那些人感到惊讶,因为你实际上并不知道模型可以做的一切。

对吧?就像,真的很令人惊讶。人们用它做了什么?他们非常坦率地表示,在上周的01版本中,他们说,“嘿,这感觉就像GPT-2,它将指向一个新的范例。我们不确定会发生什么。这将是令人惊讶和伟大的。让我们去旅行吧。”

是的。我知道为什么我们没有在其他地方看到它,而我们在Meter中看到了它。就像,是你,这是一次很棒的谈话,因为你很罕见。你是一位面向长远目标的创始人,你真正沉浸在你正在改变事物技术的深处,并且你以产品为导向,并且拥有良好的产品品味。所以我认为这些都是,都是罕见的。是的。

某个部门的某个产品经理正在尝试制定路线图,无法做到这一点。想想你刚才说的所有事情,你必须解决这些事情才能使这一切成为可能,以及你的长期方向。是的,我认为真正幸运的是,底层核心产品对于这样的事情来说非常有趣。它本身就蕴含着可能性。这是另一件事,那就是

你只能用你所得到的东西去做。我认为,就像我们得到真正有趣的硬件、操作系统和我们控制的数据一样,而且,

对人们至关重要的基础设施。几年前,一位用户告诉我,如果Meter宕机,我可以粗略计算一下我损失了多少钱。好吧,这总是让我警醒。因为在这些仓库、学校、实验室、零售店和办公室等等地方,都存在着关键的基础设施。我认为我们拥有构建模块,也许如果我正在构建——不是为了挑剔人力资源软件,但如果我正在构建人力资源软件,我可能没有

这些底层的数据和构建模块?哦,我相信我们可以一起讨论。实际上,我相信如果我们在这里再花20分钟,虽然我们不会,我们可以讨论你可以捕获哪些用户行为,围绕它构建模型,针对它构建操作,以及何时寻求帮助以使用你之前的框架。因为我认为事实是,存在着我们经常谈论的创始人市场契合度。然后还有创始人产品契合度。我没有一个很好的

标题来形容这个,但是也存在着创始人与时代的契合度。我们现在所处的境况是,正如我们之前所说,现在不是时候去运行……

你的套利策略,对吧?现在是时候进行长期思考了,这对于这家企业来说能带来多大的变革?然后倒推回去,看看我们现在能做些什么,对吧?感谢你抽出时间和精力。我认为这是一个很好的结束点。最后一个问题,请问两位,如果你今天可以召集最优秀的人才,你们每一个人,让他们去做一件事情,这可以是堆栈的任何一层,

你会把他们指引到哪里?让我们假设你可以随意支配世界上最优秀的五到十个人。他们只会听从你的吩咐。你们希望将他们指向哪里?我先说。我现在的情况非常无趣,但这却是实话。我们的应用程序很快就会自己编写了。我非常相信你在这里多次谈到的未来,我们将拥有能够

及时满足我们特定需求的软件。我认为当这种情况真正发生时,我们仍然大大低估了它对我们生活的影响。我认为,如果你让世界上最优秀的人才去解决一个如此雄心勃勃、影响如此巨大的问题,这就是你应该做的事情,即使每个人都在朝着这个方向努力。我认为我回答这个问题的方式是

我非常兴奋地做我们现在正在做的工作的原因之一是

就像在我们的历史上某个阶段,你必须重建整个后工业化时代的经济一样,我们将在未来十年内遍历所有行业并完成这项工作。这感觉就像值得帮助创始人度过十年的工作。事实上,它不是一件事情,坦率地说,这就是为什么我现在没有创办公司的原因。我实际上喜欢所有这些工作。但我不会回避你的问题。不。

如果我必须选择一件事情,标题将是人工智能以及你在教育中的学习方式。但我认为这比这更细致入微。我正在和我的儿子进行一次谈话,他说了一些非常有见地的东西,我将重复一下,那就是,所有的学习基本上都是编码和

写作、艺术或数学的微观层面。宏观层面可能是我的专业是哲学,但微观层面是我在写作。宏观层面可能是我的专业是经济学,但微观层面主要是数学和一点点写作。

所以当他在思考他想学习什么时,他正在思考微观层面如何与宏观层面相匹配。他说,好吧,我喜欢编码、写作、艺术和数学中的大部分是编码。所以如果有人要问我,我必须每天做八个小时的事情是什么,那么我会选择编码。所以现在这意味着我将进入数据科学或进入等等,我被要求做这些事情,这样我每天都会喜欢我正在做的事情。

但尤其是在我们拥有可以将一件事转移到另一件事的核心转换器,并且我们拥有可以做到这一点的模型的世界中,构建一个宏观和微观层面分离的教育范式将非常有趣。

如果我通过艺术或数学而不是写作来学习哲学,那会是什么感觉?学习计算机科学的感觉会是什么样的,但至少在微观层面,至少最初是通过写作?

这是非常非常可能的。它可能处于模型能力的边缘。但感觉上,你可以将作为一个对周围世界充满好奇的人,并从……中获取事物,例如,我恰好12岁,而且我现在恰好比数学更擅长艺术,这应该不会阻止我学习关于世界上的某些事物。

真的很酷。感谢两位抽出时间。这是一个很好的答案。但这只是我答案的一个子集。我的软件会去编写那个。问题又回到了你这里。你不允许像这样把这个问题转回给我,哦,我会去构建我现在正在构建的Meter版本。你会做什么?我会从头开始重写操作系统。

而且我认为没有足够的人对此抱有雄心壮志。我对Nabil的最后评论是轻率的,但我在这里的评论是真实的。难道我和你说的不是同一件事吗?是的。非常非常同意。

看,如果你遇到一个,请让我们知道。我会先招募他们,当然。如果我遇到一个,我会让你知道的。非常感谢,Anil。我认为这是一个很好的结束点。感谢你今天花时间与我们在一起。非常感谢。谢谢两位。非常感谢。