We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
A
Alessio
A
Anshul
V
Varun Mohan
Topics
Varun Mohan:Codeium 的扩展程序已拥有超过 80 万开发者用户,并获得了许多大型企业的认可,在企业市场取得了显著进展。Windsurf IDE 是 Codeium 的最新产品,旨在为所有开发者构建最强大的 AI 系统,支持多种平台和编程语言,克服了 VS Code 平台的限制,并具备强大的代码执行和推理能力,目标是帮助开发者从最初的想法到最终代码的整个过程。Codeium 的战略随着时间的推移而演变,从专注于模型推理到关注更高级别的抽象,目前在自动补全和超级补全等方面仍然使用自研模型,并在检索系统中应用了强大的大型语言模型。Codeium 认为,目前将重点放在大型企业客户上,而不是个人开发者身上,因为大型企业客户的切换成本更高,并且可以为其提供更具差异化的服务。Codeium 的评估方法侧重于处理不完整代码,并预测开发者的意图,致力于创建更有效的软件开发评估指标,并对现有的基准测试进行改进。Codeium 认为,端到端代码创建需要在 IDE 中实现,并且需要在保证安全性的前提下逐步实现,目标是减少人工干预,并提高执行速度。Codeium 的产品策略是为个人开发者和大型企业提供相同的系统,这使得其能够快速响应企业需求。Codeium 认为,开发者对产品的喜爱是企业客户接受该产品的重要因素,并致力于构建开发者喜爱的产品。Codeium 认为,尽早考虑企业级需求可以避免后期重构的麻烦,并强调了公司在安全、合规性、个性化、使用情况分析、延迟预算和可扩展性等方面的投入。Codeium 认为,在构建软件时,需要权衡“构建”和“购买”的利弊,并根据公司核心竞争力做出选择,同时关注个人开发者和企业客户的需求,是公司成功的关键。 Anshul:Windsurf IDE 通过理解开发者的编辑轨迹来预测其意图,从而提供更精准的代码建议,并克服了 VS Code API 的限制,整合了知识检索系统、工具访问和上下文感知系统。Cascade 是 Windsurf 的核心功能,能够根据人类和 AI 的行为轨迹提出代码更改建议并执行代码。Codeium 的目标是最终实现端到端代码创建,但需要解决安全性和效率等问题,并计划改进 Windsurf 和 Cascade 的知识检索、工具集成和用户界面等方面,并计划推出更多功能,例如多代理系统。Codeium 使用用户偏好数据来改进其超级补全功能,并认为其在用户体验方面取得了进展,并计划进一步改进。Codeium 认为,构建可扩展的销售团队需要具备技术理解能力和对产品发展的敏锐洞察力。

Deep Dive

Key Insights

Why did Codeium decide to create Windsurf, an AI IDE?

Codeium created Windsurf to build the most powerful AI system for developers, recognizing the limitations of the VS Code ecosystem in providing a seamless, agentic experience. They wanted to offer a tool that could reason about large code bases, execute code, and provide a more intuitive and magical user experience.

Why do Codeium's extensions continue to gain popularity despite the existence of alternatives?

Codeium's extensions are popular because they are platform-agnostic and work across various source code management tools, including GitLab, Bitbucket, and others. This flexibility allows developers to use Codeium regardless of their preferred development environment, which is crucial for enterprise customers with diverse tech stacks.

Why did Codeium decide to keep their autocomplete free and focus on the enterprise market?

Codeium kept their autocomplete free to build a strong user base and differentiate their product. They focused on the enterprise market to drive durable revenue and ensure their technology can solve complex, high-value problems for large organizations. Individual developers can switch products quickly, while enterprise customers provide a more stable and significant business opportunity.

Why are Codeium's future plans for Cascade and Windsurf exciting?

Future plans for Cascade and Windsurf include improving knowledge retrieval, suggesting and executing terminal commands, and providing more detailed insights into developer actions. The team aims to make the AI more intuitive and powerful, with features like Clippy-style suggestions and better handling of multi-step tasks, enhancing the overall developer experience.

Why does Codeium emphasize the importance of developer love in their enterprise strategy?

Codeium believes that developers loving their tools is crucial for enterprise adoption. Unlike many enterprise software products that developers dislike, Codeium ensures its tools are intuitive and valuable. This approach builds developer loyalty, which is essential for long-term success and minimizing churn.

Why does Codeium avoid launching products with a waitlist?

Codeium avoids waitlists to remain accessible and focused on delivering a polished product. They prefer being seen as a reliable, boring company rather than one that launches with a lot of hype and uncertainty. This approach helps them build trust and ensure that their products are ready for immediate use.

Why does Codeium hire both AI believers and skeptics?

Codeium hires both AI believers and skeptics to balance innovation and realism. Believers push the boundaries of what's possible, while skeptics, who often have high standards and a background in complex technology, ensure that the product meets rigorous quality and security requirements. This mix helps the company avoid unrealistic expectations and focus on practical, effective solutions.

Why did Codeium choose to build their own inference runtime instead of using third-party solutions?

Codeium built their own inference runtime to maintain control over core competencies and ensure high-quality, low-latency experiences. They believe that certain aspects of their technology, such as autocomplete, require proprietary solutions to achieve the best results. This approach allows them to optimize performance and user experience, which is essential for their product's success.

Why does Codeium find it challenging to hire a sales team for their AI products?

Hiring a sales team for AI products is challenging because it requires individuals with intellectual curiosity and a deep understanding of the technology. Codeium ensures their sales team can scale and maintain a high level of product knowledge, which is critical for explaining and demonstrating the value of their AI solutions to customers.

Why did Codeium choose to support multiple IDEs and not just focus on Windsurf?

Codeium supports multiple IDEs to meet developers where they are, ensuring their AI tools are accessible regardless of the development environment. This strategy is particularly important for enterprise customers who use a variety of IDEs, such as JetBrains for Java and Eclipse for older projects. By supporting multiple IDEs, Codeium maximizes the value of their AI for a broader developer audience.

Chapters
This chapter covers Codeium's incredible growth, highlighting its expansion from 10,000 to over 800,000 users and its success in the enterprise market. It also touches upon the challenges of supporting diverse development environments and the reasons behind Codeium's decision to build its own IDE.
  • Codeium's user base grew from 10,000 to over 800,000 developers.
  • Awarded JPMorgan Chase's Hall of Innovation Award.
  • Significant traction in the enterprise space with clients like Dell.
  • Recognized the limitations of relying solely on VS Code extensions.

Shownotes Transcript

嘿,大家好,欢迎收听Latents-Based播客。我是Alessio,Decibel Partners的合伙人和CTO,和我一起的是我的联合主持人Swix,SmallAI的创始人。嘿,今天我们很高兴能成为,我认为,新Codium办公室的第一个播客。所以感谢你们的邀请,欢迎Varun和

谢谢你们的邀请。是的,谢谢你们的邀请。这是硅谷办公室吗?是的。背后的故事是什么?故事是这样的,这个办公室以前……所以我们以前在卡斯特罗街,这是在山景城。我认为公司里很多人以前是NSF,或者现在仍然是NSF。实际上,如果你注意到公司的一个特点,那就是它距离Caltrain只有两分钟的路程。我认为我们不想把办公室搬离Caltrain太远。那可能会……

惹恼很多住在旧金山的人,包括这位先生。所以我们在附近地区考察了很多地方,然后这个地方出现了。它以前被Facebook/WhatsApp租赁,然后紧接着是Ghost Autonomy,然后

现在我们来了。而且,你知道,我想房东告诉我们的一件事是,这里就是他们拍摄《硅谷》所有场景的地方,至少是外部场景等等。所以这成了一个梗。相信我,这并不是我们这么做的主要原因。但我们已经接受了它。这并没有坏处。是的。显然,这也对你们的Windsurf发布起了一点作用。让我们来回顾一下。你是第四位嘉宾吗?我想是第二位。也许是第二位。第二位。是的。

从那时起发生了很多事情。你们进行了一轮大规模融资,还发布了你们的IDE。自从InSpace的人上次见到你们以来,过去一年左右取得了哪些进展?是的,我认为发生的最大事情是Codium的扩展程序继续获得了大量的

普及率。我们有超过800,000名开发者使用该产品。许多大型企业也使用该产品。我们最近获得了摩根大通的创新殿堂奖,这通常不是一家公司在部署企业产品一年内就能获得的奖项。像戴尔这样的公司也使用该产品。所以我认为我们在企业领域看到了很多吸引力

但我认为我们最近推出的最令人兴奋的事情是这个名为Windsurf的IDE。我认为,对我们来说,我们一直在思考的一个问题是如何为全世界的开发者构建最强大的AI系统?我们一开始使用扩展系统的原因是,我们觉得很多开发者不会在一个平台上。顺便说一句,这仍然是事实。在硅谷以外,很多人不使用GitHub。

这是一个非常令人惊讶的发现,但大多数人使用GitLab、Bitbucket、Garrett、Perverse、CVS、Harvest、Mercurial。我可以继续列举下去,但可能还有10个。GitHub在财富500强中的渗透率可能不到10%,完全渗透率。非常小。而且,最重要的是,GitHub的源代码管理工具切换成本非常高,对吧?因为你实际上需要切换所有依赖于此工作流程软件的系统。这比切换数据库还要难得多,对吧?

因此,我们实际上找到了方法,无论客户将源代码存储在哪里,我们都能成为更好的合作伙伴。然后更具体地说,在IDE类别中,很多开发者,不出所料,不仅仅编写TypeScript和Python。他们编写Java。他们编写Golang。他们编写许多不同的语言。高质量的语言服务器和调试器很重要。非常诚实地说,JetBrains拥有最好的Java调试器。

甚至都不接近,对吧?这些都是极其复杂的软件。我们的客户中有超过70%的开发者使用JetBrains。因此,我们希望无论开发者在哪里,都能提供良好的体验。但我们发现缺少的一件事是,你知道,我们在VS Code生态系统和VS Code平台上构建时遇到了限制。我认为我们觉得有机会为我们构建一种优质的体验,对吧?

而且这在团队的能力范围之内,对吧?团队已经完成了所有工作,所有基础设施工作,以构建最佳体验,对吧?并将其插入每个IDE。为什么我们不自己构建一个IDE,它拥有迄今为止最好的体验呢?随着这些自主代理产品开始变得越来越有可能,以及我们在代码检索和代码库推理方面所做的所有研究越来越接近现实。我们想,嘿,如果我们在我们没有太多控制权的系统之上启动这个自主代理产品,对吧?

它只会限制产品的价值,而且我们无法获得最好的工具。这就是为什么我们对发布Windsurf感到非常兴奋。我认为它确实是目前功能最强大的IDE系统,对吧?而这仅仅是个开始。我认为我们怀疑我们还可以做更多的事情,而不仅仅是自动完成之类的方面,对吧?当我们最初谈话时,自动完成可能是产品实际拥有的唯一功能。从那时起,我们已经走了很长一段路,对吧?这些系统现在可以推理大型代码库,而无需你添加所有内容,对吧?

就像你使用谷歌时,你会说像《纽约时报》的帖子,等等,然后问它一个问题吗?不会。我们希望它成为一种神奇的体验,你不需要这样做。我们希望它能够实际执行代码。我们认为代码执行是一个非常非常重要的部分。

当你编写软件时,你不仅仅是提出一个想法,软件的创建方式是这样的:软件最初是一个无定形的团块。随着时间的推移,你有了想法,团块和云逐渐消失,你看到了这座山。我们希望是这样的:一旦你看到这座山,AI就会帮助你到达山顶。一旦你看到这座山,AI就会为你创造这座山。

这就是为什么我们不相信这种模式:你只写一个任务,它就会出去执行。这对于从零到一的应用程序来说是好的,我认为人们已经看到Windsurf能够做到这一点,我会让Anshul对此多谈一些。但我们在真实的软件开发中看到了真正的价值,也就是说,这并不是说目前的工具做不到,

但我认为更多的是在从一个非常基本的想法演化代码的过程中。代码的构建方式并非你有一个PRD,然后你得到一些输出。更像是你有一个总体愿景。是的,当你编写代码时,你会对哪些方法不起作用和起作用有越来越清晰的认识。你不断地否定想法并创造想法。我们认为Windsurf是这种模式的正确选择。你能详细说明你在VS Code中无法做的事情吗?因为我认为当我们进行光标剧集时,解释一下,然后AgriNews上的每个人都像,哦。

哦,你为什么分叉?你可以在扩展程序中做到这一点。你能否解释一下这些限制?我的意思是,我认为围绕API的许多限制都已记录在案。我不知道我们是否需要深入探讨这个兔子洞。我认为当我们开始思考时,好吧,我们需要为AI提供哪些部分才能获得Bruin谈到的那种涌现行为?

是的,我们正在讨论我们一直在为企业构建的所有知识检索系统。这显然是其中一个组成部分。我们正在讨论我们可以让它访问的所有不同工具,以便它们可以执行终端执行等操作。

我们意识到,第三个主要类别将是那种神奇的事情,你不会在那里写PRD,你不会为AI确定问题的范围,那就是如果我们能够真正理解开发者在编辑器中所做操作的轨迹,对吧?如果我们能够真正看到,哦,开发者刚刚打开目录的这一部分并尝试查看它,然后他们进行了这些编辑,他们尝试在终端中执行一些命令。如果我们真正理解了这种轨迹,那么AI能够立即像,哦,我

哦,我理解你的意图。这就是你想做的,而无需你全部说明。这是一种会真正发生的神奇体验。我认为这是这种直觉。我认为你对API的限制已经记录在案。我们对我们需要连接到什么以真正展现这一点有自己的设想。我认为正是这两种因素的结合让我们觉得,我

我认为是时候做编辑器了。编辑器本身并不是一个新想法。我认为我们已经讨论编辑器很久了。我认为这就像,当然,我们只是在过去几个月里把它整合在一起,但这始终是我们心中的一件事。只有当我们开始意识到,好吧,模型无法做到这一点时。我们实际上可以查看这些数据。我们有一个非常好的上下文感知系统。我们想,我认为现在是时候了。我们继续执行了它。所以现在很忙。

这不像你无法执行的一个操作,而是你如何将所有这些整合在一起。这就像VS Code的沙盒,可以这么说。是的,让我甚至更深入地探讨Anshul谈到的各个方面。让我们从API方面开始。所以现在,我给你举个例子。Supercomplete实际上是一个我认为非常令人兴奋的产品功能。它可以建议代码重构。

我认为你可以快速而有效地做到这一点。在VS Code上,对我们来说,问题实际上并不是能够实现该功能。我们已经有一段时间拥有该功能了。问题是,即使要显示该功能,VS Code也不会向我们公开执行此操作的API。所以我们最终实际做的是动态生成PNG来实际展示这一点

它并没有真正对齐。我们最终自己做了,我们花了几个小时才实现这一点,对吧?这并不是因为我们是糟糕的工程师。不,我们优秀的工程时间花在了与系统对抗上,而不是成为一个好的系统。另一个例子是,我们需要找到重构代码的方法。VS Code API会不断地中断我们的工作。

我们不断需要展示越来越糟糕的体验。这实际上归结于Anshul提出的第二点,那就是我们可以提出伟大的工作和伟大的研究。我们这里的所有工作都不像Cascade的研究那样只是一两月的事情。这是我们公司已经研究了九个月到一年的事情。投资于评估,对吧?即使对此进行评估也需要付出很多努力,对吧?实际上需要很多系统工作才能做到这一点。但最终,这需要成为开发者实际使用的产品。

我认为,你知道,让我们以Cascade为例,看看轨迹。你能定义Cascade吗?因为这是你第一次提到它。是的,Cascade是产品的实际自主代理部分,对吧?它能够从人类轨迹和AI轨迹中获取信息,人类最终做了什么,AI最终做了什么,以实际提出更改并实际执行代码,最终获得最终的工作输出,对吧?我甚至会谈论一些非常基本的事情。Cascade会给你一堆代码。我们希望开发者能够非常轻松地审查这段代码。

好吧,然后我们可以向开发者展示他们不想看到的难看的UI,没有人会真正使用这个产品。我们认为这是让我们使产品在本质上变得更好的一个基本构建块。如果人们甚至不愿意使用这个构建块,那会怎么样呢,对吧?我们只是觉得我们的上限受限于我们可以提供的体验。有趣的是,JetBrains比……

比VS Code更易于配置。但我们在Anshul所说的方向上都感到非常受限,我们只是想,嘿,如果我们真的消除了这些限制,我们可以更快地前进。我们相信这是我们必要的步骤。我对评估集更感兴趣,因为你提到了它。每当有人提到评估时,我们都必须问到评估。你如何评估这样一个多步骤且……

跨越如此多上下文的事件?所以你可以想象我们可以做些什么,而这正是代码的优点之一,代码是可以执行的。我们可以获取一些开源代码,我们可以找到一些提交,我们实际上可以查看其中一些提交是否与测试相关联。我们可以开始剥离提交,剥离提交的方法是

很好,因为它测试了代码处于不完整状态的事实,对吧?当你编写提交时,目标不是提交已经为你编写好了。它处于一个尚未完全编写完成的状态。我们能否出去实际检索正确的代码片段,并实际提出一个连贯的计划和迭代循环,让你达到代码实际通过的状态?所以你可以实际分解这个复杂的问题,分解成规划、检索和多步骤执行问题。你可以在每一个轴上看到它是否变得更好。如果你在足够的存储库中这样做,

你已经将这个高度不连续和离散的问题——使PR工作与使PR不工作——变成了一个连续的问题。现在这是一个你可以实际攀登的山丘。这是一种你可以实际应用研究的方法,就像,嘿,我的检索变得好多了。这使得我的评估变得更好。对吧?

然后注意评估的工作方式,我对纯粹是提交消息并且你完成了整个事情的评估并不那么感兴趣。我更感兴趣的是代码处于不完整状态,甚至没有给你提交消息,因为这是关于开发者的另一件事。他们不愿意告诉你他们脑子里到底是什么。这是这个问题的真正重要部分。我们相信开发者永远不会完全提出问题陈述。

因为问题陈述存在于他们的脑海中。你和我曾在咖啡区进行的对话。我在Slack上进行的对话。我在Jira上进行的对话。也许不是Jira,让我们说Linear。现在很酷。我们正在谈论Jira。我在Linear上进行的对话。所有这些事情最终结合在一起,最终提出了一个解决方案,这就是为什么我们要测试不完整的代码。如果状态是不完整的,我是否能够在没有提交的情况下使它通过?我是否能够实际猜测你的承诺?

好。现在你可以将问题转换为掩码预测问题,你希望同时猜测高级意图以及使实际测试通过的其余更改。你可以想象,如果你构建了所有这些,现在你可以看到,嘿,我的系统正在变得更好。检索质量正在提高。你实际上可以开始在越来越大的代码库上测试它。

我想这是我们,说实话,我们本可以做得更快一点。我们拥有技术,可以非常快速地构建这些从零到一的应用程序。我认为人们正在使用Windsurf来做到这一点。这令人印象深刻。但我认为真正的价值远不止于此。它实际上是你获取一个大型代码库,它实际上是一个非常好的第一遍。我并不是说它完美无缺,但它只会越来越好。我们拥有深层的基础设施,实际上可以验证我们在这一维度上正在取得进步。对。

我们提到了我们为系统进行的端到端评估,我认为这非常酷。但我认为你甚至可以分解这些步骤中的每一个。例如,只获取检索。我们如何才能使检索评估真正出色?我认为这是我们公司一直以来都非常关注的一件事。大多数现有的软件开发评估和基准测试都是有点虚假的。

没有更好的说法。就像,好吧,你有SweBench,这很酷。没有实际的专业工作看起来像SweBench。像人类评估一样。这些东西有点破损。因此,当你试图针对一个有点破损的指标进行优化时,你最终会做出一些次优的决策。因此,我们一直非常关注的一件事是,好吧,我们想要测试这个系统部分的实际指标是什么?所以以Redrival为例。这些基于嵌入的系统的许多基准测试都像是大海捞针。

问题。就像我想从所有这些潜在的上下文中找到这一个特定的信息。

这并不是进行软件工程真正需要的东西,因为代码是一个超级分布式的知识存储库。你实际上需要从代码库的许多不同部分提取代码片段才能完成工作。因此,我们构建的系统不是将检索视为一个,而是将检索视为50个。你可以实际检索到的50个最高的东西是什么,你是否捕获了所有必要的片段?所有必要的片段是什么?好吧,你可以再次查看旧的提交,看看为了进行提交而编辑的所有不同文件,因为这些在语义上是相似的,如果你实际尝试绘制代码图,这些可能不会显示出来。因此,我们实际上可以构建这些金牌集。我们甚至可以对整体任务中的子问题进行此评估。

因此,现在我们有一个工程团队可以迭代所有这些事情,并确保我们试图构建的最终目标非常强大,以便我们对我们正在推出的内容充满信心。顺便说一句,让我们再谈谈SweBench的事情,只是为了展示这些现有的指标。我认为基准测试并不是一件坏事。你确实需要基准测试。实际上,我更希望有基准测试,而不是说一切都是感觉,对吧?

但感觉也很重要,顺便说一句,因为它们展示了基准测试不值钱的地方。因为实际上,感觉有时会向你展示基准测试中存在犯罪问题的地方。但是你看看人们优化WeBench的方式。这就像,确保每次X发生时都运行PyTest。这就像,是的,当然。你可以开始以每一种可能的方式提示它。如果你删除了它,它突然就不擅长了。

这就像,这里真正重要的是什么?这里真正重要的是,在广泛的任务中,你正在为人们提供高质量的建议,人们喜欢使用该产品。我认为实际上这些事情的工作方式超出了某个点,因为是的,我认为它超出了某个点是有价值的。但是一旦它开始达到这些基准测试的峰值,

获得最后10%可能与基准测试的实际目标背道而驰。就像你可能应该找到一个新的山丘去攀登,而不是对如何在基准测试中获得更高的分数进行p-hacking或真正优化。

是的,我们与Anthropic做了一期关于他们最近的套件代理、套件基准结果的节目。我们讨论了人工评估与套件基准。人工评估有点像一个绿地基准。你需要擅长这一点。套件基准更现有。但这听起来像,我的意思是,你们的评估创建与套件基准类似,因为它使用了GitHub提交和类似的历史记录。但它更像是提交级别的掩码,而不是仅仅测试该事物的输出。没错。

酷。我们实际上有一些听众关于Windsurf发布的问题,显然我也想让你们有机会回应Hacker News。是的。

哦,伙计。让我告诉你一些非常非常有趣的事情。我和其他人一样喜欢Hacker News,但是当我们发布产品的那一刻,第一条评论,这是在一年以前,第一条评论是,这个产品是一个病毒。这是两年前最初的Codium发布。我正在分析二进制文件。我们会报告回来的。然后他说,这是一个病毒。我说,伙计,它不是病毒。是的。

我们只想提供自动完成建议。这就是我们想做的。是的。哇,我没有想到。然后就像Teodrama。发布时有足够的戏剧性可以涵盖,但我不知道我们是否想把它变成一个级联片段。但是我们在我们的Discord中有一些人试用了该产品,并提供了很多反馈。人们的一个问题是,

对他们来说,Cascade已经感觉非常自主了。这是你们想做的更多的事情吗?你知道,既然你刚刚发布了一个IDE,你就像,你专注于让人们编写代码。但这也许是完全端到端的特洛伊木马,就像,代码创建。Dev-in风格。是的,我认为这就像,你如何以……

以一种真正有原则的方式做到这一点。企业显然一直在问我们,哦,什么时候才能实现端到端的运作?现实情况是,好吧,如果我们在IDE中有一些东西,再次,可以看到你的所有操作并获得很多你实际上在IDE之外无法获得的意图,如果

代理必须始终获得人为干预才能继续修复自身。它可能还没有准备好成为一个完全自动化的端到端系统,因为那样我们只会变成一个linter,它会产生很多东西,但没有人会查看任何东西。这不是伟大的最终状态。但是如果我们开始看到,哦,是的,人们做的一些常见模式,就像,

永远不需要人为干预,端到端完全无需任何基于意图的信息就能工作。当然,这可以变得完全自主,我们会很快了解这些任务是什么,因为我们有很多数据。也许可以补充一点。我认为如果答案是完全自主的DevIn,我认为是的,答案是这个产品应该变得完全自主

并且人为干预有限是目标,是100%的目标。老实说,我认为在所有可用的IDE产品中,我们现在是最接近的。现在,让我补充一点,我认为还有很多尚未解决的难题需要我们去解决才能实现这一点。例如,我认为产品中最烦人的部分之一是你需要接受每个执行的命令。

这实际上相当烦人。我希望它能够执行。不幸的是,我执行任意二进制文件有一些问题,如果它像RMR我的硬盘一样,我不会……它实际上是一个病毒。我不会……它是一个病毒。黑客必须和你在一起。是的,它确实变成了一个病毒。我认为这可以通过复杂的系统来解决。我认为……

我们喜欢处理复杂的系统基础设施,我认为我们会解决这个问题。现在,解决这个问题更简单的方法是在其他地方运行它,而不是在用户的机器上运行它,因为如果你购买了那台机器,你就会完全没事。但是我认为,也许在本地运行与远程运行之间存在一些权衡。我认为我们可能会改变主意。但我认为这个目标不是最终状态。我认为这个目标是,A,它实际上能够以有限的人为干预来执行非常复杂的任务,但它需要知道何时返回给人类。

此外,压缩代理正在运行的每个周期。现在,实际上,我甚至觉得产品有时对我来说太慢了。即使它运行得非常快,它客观上也相当快,但我仍然希望它更快。对吧?

因此,在检索端和生成端都需要进行系统工作,可能还需要进行建模工作,以使产品更快。最后,我认为这里另一个非常重要的关键部分是,如果我们能够被动地为用户建议整个更改,那么明确要求人们做事情可能更像是一种反模式。所以几乎可以想象,当用户使用该产品时,我们将建议PR的其余部分,而无需用户向我们提出请求。

我认为这只是一个开始。但是,是的,这些都是难题。我无法给出具体的截止日期。我认为这比我们过去所做的,尤其是在过去,有了很大的进步。但我认为Anshul所说的100%是正确的。但我们的目标是做得更好。我的意思是,远程执行这方面很有趣。你写了一篇关于localhost结束的文章。是的。

现在几乎就像那时我们有点像,“好吧,不,也许我们需要互联网,人们想要运行东西。”但现在就像,“好吧,不,实际上,我不在乎。我希望模型去做这件事。如果你说,你可以端到端地完成一项任务,但它需要远程运行,而不是在你的电脑上,我相信大多数人都会说,是的。

不,我同意这一点。我实际上同意它远程运行。这不是安全问题。我完全同意你,有可能一切都可以远程运行。在大多数大公司,比如Facebook,都是这样。没有人本地运行东西。没有人这样做。事实上,你连接到一个……你说的对。也许我认为对这些系统来说比较重要的,不仅仅是远程运行,而是

基本上,当你查看这些代理时,它有点像轨迹的展开。我有点想把这个轨迹回滚。在某种程度上,我希望有一个系统的快照,我可以不断地检查点并来回移动。然后,最重要的是,我还可能想要多次展开这个。所以基本上,我认为需要一种方法来向前和向后移动,并且

无论是在本地还是远程,我认为这是必要的。但是每次你向前移动系统时,它都会破坏你的机器。这可能是一个很难的系统,或者可能会破坏你的机器。这根本不是一个可行的解决方案。所以我认为本地与远程,我认为你仍然需要解决这个问题,即这个东西不会在每次执行时都破坏你的机器,如果这说得通的话。是的。有一类新兴的基础设施提供商正在研究时间旅行虚拟机。

如果Varun在这个播客中的第一集有任何迹象的话,我们喜欢基础设施问题。是的,好的。哦,所以你要去那里。好吧。好的。好吧,这很有趣,对吧?就像我们第一次邀请你时,你做了很多关于实际模型推理、优化等等的事情。而今天,它几乎就像……

它是云,它是4.0。就像,你知道,人们好像忘记了模型,你知道,现在一切都处于更高层次的抽象。是的。所以也许我可以稍微谈谈我们在这方面的策略是如何演变的,因为它客观上确实如此,对吧?如果我说没有,我会撒谎。

像自动完成和超级完成这样的功能在每次按键时都会运行,完全是我们自己的模型。顺便说一句,这仍然是因为像FIM(中间填充)这样的属性,在当前模型中仍然相当糟糕。不存在。它们非常糟糕。不存在。它们实际上并不擅长。

因为FIM实际上是,就像,你如何排序标记。

当它们进行点更改时,它们会有点偏离这里和那里。因为,是的,当你进行多点对话时,应用精确的GIF甚至还不是完美的科学。所以我们关心这一点。我们实际上已经训练了我们模型的第二个部分,实际上是在检索系统上。这甚至不是为了嵌入,而是能够使用高性能LLM来进行更高质量的检索。

在整个代码库中,对吧?所以这实际上是Anshul所说的。对于许多系统,我们确实相信嵌入有效,但对于复杂的问题,我们不相信嵌入可以封装特定查询的所有粒度。例如,假设我对一个代码库有一个问题,找到这个代码库中所有二次时间算法。我们真的相信嵌入可以封装这个函数是二次时间函数的事实吗?不。不。

我认为它不会。所以你会在这个任务中得到非常糟糕的精度召回率。所以我们需要应用一些更强大的东西来实际完成这项工作。所以我们实际上已经构建了大型分布式系统来实际大规模运行这些系统,在大规模代码库中运行自定义模型。所以我认为这是一个更多的问题。现在的规划模型,毫无疑问,我认为云和OpenAI

拥有最好的产品。我认为Llama 4,取决于它的发展方向,它可能会更好。很明显,他们愿意投入与OpenAI和Anthropic类似数量的计算资源。所以让我们拭目以待。如果它们变得非常好,我会非常高兴,但目前还不清楚。别忘了Grok。嘿,伙计,我认为Grok也是可能的。

我认为不要怀疑埃隆·马斯克。好的,所以我实际上不知道。当我使用Cascade时,这并不明显。我还应该提到,我是预览版的一部分。感谢让我加入。我已经维护Windsurf很长时间了。这实际上并不明显。你没有明确表示你正在运行你自己的模型。我觉得你应该这样做。这样我觉得它……

有更多的差异化?就像,我只能通过你的IDE独家访问你的模型,而不是像云和4.0那样有下拉菜单,因为我实际上认为这就是你所做的。不,实际上它的工作方式是模型中正在进行的高级规划实际上是使用像云这样的产品完成的。但是,

极其快速的检索以及将高级计划实际应用于代码库的能力是内部运行的专有系统。然后是你关于嵌入不足的说法,你熟悉延迟交互的概念吗?不,我实际上从未听说过。是的,所以这是Colbert,或者来自斯坦福大学的Omar Khattab,我认为他一直在大力推广这个。它基本上就是你所做的。这是一种

嵌入检索而不是预嵌入。好的。从非常宽松的意义上说。我认为这听起来是一个非常好的主意,与我们正在做的非常相似。听起来是个好主意。我认为我们会这么说。这就像奥巴马给自己颁奖的梗。

从对比这些想法和观察研究意见差异中,可能有一些东西可以学习。它也被非常有效地应用于视觉理解,因为视觉模型倾向于只消耗整个图像。如果你能够根据查询关注图像,我认为这可以让你获得更多额外的性能。使用计算的基本思想……

以分布式方式对整套原始数据进行操作,而不是对物化视图进行操作。这没有什么新奇的。我认为这就像,对于LLM来说,它是什么样的?当我听到你说构建大型分布式系统时,你有一个非常奇怪的产品策略,即面向单个开发者,也面向大型企业。在所有方面都是一样的吗?

我认为答案是肯定的。答案是肯定的。而答案是肯定的唯一原因是。老实说,如果我们只想服务个人,我们的公司要复杂得多。我会告诉你这一点,因为我们不喜欢支付其他提供商来为我们的索引做事情。我们不支付其他提供商来服务我们自己的客户模型。对。

我认为这是我们公司内部已经决定构建的核心竞争力,但这也有助于我们确保当我们在适合这些大型企业的环境中提供这些产品时,我们不会出去说,“我们需要为你们构建这个自定义系统。”这是为我们的整个用户群提供服务的同一个系统。这是一个我们公司做出的非常独特的决定,并且

我们承认,可能还有更快的方法可以做到这一点。我在想,你知道,当我为你处理你的企业部分时,我在想这种“慢速前进才能快速前进”的理念,即为正确的抽象级别精心构建,以便服务于你真正想要的目标市场。是的,我的意思是,我会说,当我写这篇文章时,回头再读一遍,事后看来这听起来如此显而易见。并非所有这些都是我们有意识做出的决定。我首先承认这一点。但这确实有帮助,对吧?当我们去一家拥有数万名开发人员工作的企业时

他们会说,“哦,哇,我们有数万名开发人员。你的基础设施能支持数万名开发人员吗?”我们可以转过身来说,“好吧,我们有数十万名开发人员使用个人计划,我们正在为他们服务。”我认为我们能够支持你。因此,能够做到这些事情,我们一开始只是说,“让我们把它提供给个人。让我们看看人们喜欢什么和不喜欢什么,然后学习。”但随后这些就变成了我们走向企业时的价值主张。总而言之,当你第一次来到播客时,它是这样的:自动完成是免费的。Copilot是每月10美元。

你说,看,我们关心的是在代码完成的基础上构建东西。你如何决定不专注于个人开发者的短期增长货币化并构建其中的一些?因为另一种选择是,嘿,所有这些人都正在使用它。就像,我们将制定另一个每月5美元的计划,进行货币化。我认为……

我认为这可能是公司具有一些商业本能,并且不清楚商业本能是否正确。我认为现在,优化从个人开发者那里赚钱可能是错误的策略。很大程度上是因为我认为个人开发者可以很快切换产品。

除非我们有一个非常大的领先优势,试图优化从个人开发者那里获得大量利润,否则这可能是其他人可以很快抹去的事情,然后他们会转向另一个产品。我会非常诚实地说,对吧?就像当你使用像Codium这样的个人产品时,没有什么可以阻止你自动切换

到另一个产品。我认为随着产品越来越好、越来越深入,这种情况会随着时间的推移而改变。我不断地说这句话,就像有一本关于商业的书叫做《七种力量》。我认为我们这样的企业需要拥有的力量之一是真正的转换成本。但就像你首先需要产品中的一些东西来让人们切换并保持不变,然后再考虑如何让人们切换?我认为

我认为对我们来说,我们相信通过与这些大公司以一种对他们来说有趣且可扩展的方式合作,我们可以在企业中获得更多差异化。我在这里可能会更具体一些。个人开发者更倾向于小的价格变化。

他们更关心,对吧?就像我们的产品是每月10美元、20美元而不是每月50美元或100美元,这对他们来说非常重要。对于已经花费数十亿美元用于软件的大公司来说,这就不那么重要了。你实际上可以为他们解决更深层次的问题,你实际上可以从这个角度提供更多差异化。而我认为……

我认为个人开发者可能会流失,除非我们拥有最好的产品。所以专注于成为最好的产品,而不是试图通过价格从人们那里赚很多钱。我认为在可预见的未来,我们不会试图成为一家试图从个人开发者那里赚很多钱的公司。我的意思是,这很有道理。那么,Windsurf为什么每月10美元?每月10美元实际上是专业版计划。所以我们在Windsurf存在之前就推出了我们的个人专业版计划。因为我认为有

我们也必须在财务上负责。是的,我们不能没钱。有很多事情是因为我们的基础设施背景。我们可以免费提供基本上无限的自动完成、我们更快模型上的无限聊天。我们实际上有很多东西是免费的。

但是,是的,当我们开始做超级完成、大量索引和所有这些事情时,这里有真正的成本。我们不能忽视这一点。因此,我们只是创建了一个每月10美元的专业版计划,主要只是为了支付成本。我认为我们在那里的利润率也不是很高,但是,好吧,只是为了支付我们的费用。所以对于Windsurf来说,结果也是一样的。在最初的,我

我忘了,大约几周,比如两周免费下载Windsurf的人。让我们让人们试用一下。让我们知道他们喜欢什么,不喜欢什么。这就是我们一直以来的运作方式。我和很多财富100强公司的CTO谈过,他们的大多数工程师实际上并没有做什么。问题不在于开发人员的成本是20万美元,而你节省了8000美元。而是这个开发人员不应该获得20万美元的薪水。但这有点像基本价格。

但是你有一些开发人员的薪水是20万美元,而应该支付50万美元。所以这几乎就像你在平均价格,因为大多数人实际上并没有那么高效。所以如果你让他们提高20%的效率,他们仍然效率不高。我不知道将来,初级开发人员的薪水……

5万美元,你知道,这就像底端被挤压了,然后高端被挤压了。是的,也许Alessio,我经常思考的一件事,因为我确实在思考这件事,Perseat,任何东西,所有这些东西,我都考虑了很多。让我们以Office 365这样的产品为例。我会说Codium的一名律师比我使用Microsoft Word多得多。我仍然支付同样的账单。但他从Office 365中获得的价值可能高达数万美元。

顺便说一句,每个人都知道,Google Docs,很棒的产品。Microsoft Word是一个疯狂的产品。它使得你一旦在Microsoft Word中审核任何内容,唯一可以审核它的方法就是与Microsoft Word中的其他人一起审核。所以它就像一种病毒,渗透到一切事物中。它不仅渗透到公司内部,也渗透到公司之间。它带来的价值对他来说要高得多。对于这些类型的产品,对于这些类型的产品,在谁从这些产品中获得价值之间总是会有差异。

你是对的,这几乎就像一个混合体。因为你完全正确。这家公司可能应该支付那个开发人员四倍的薪水。但奇怪的是,软件就像这种团队活动一样,有很多混合的结果。但是,嘿,20%的四倍,有四个人仍然可以支付这四个人的成本,对吧?这就是这些产品大致定价的方式。

我的意思是,与其说是关于定价,不如说是关于软件工程师的未来。我们也可能完全错了。是的。我认为没有人知道。保留被认为极其错误的权利。是的。我的意思是,商业模式确实会影响产品。产品会影响用户体验。所以这一切都是一体的。我不介意。我们与科技本身一样关注科技的业务。这很酷。

说到这里,还有其他听众的问题。向Daniel Enfeld致敬,他在我们的Discord中非常活跃,一直在问这些问题。多代理。非常非常热门和流行,尤其是在微软研究的角度来看。你们在那里做过任何探索吗?我认为我们

我们有,我认为我们没有称之为多代理,这更像是,一旦你,这个拥有许多可以衍生的轨迹的概念,它可以验证一些不同的假设,你可以选择最有趣的那个。这些是我们公司内部实际分析过的事情。顺便说一句,我们没有实际添加这些东西的原因部分是因为我们不能同时出去并行执行一些随机的东西。嗯,

与此同时,在其他方面。因为副作用。因为副作用,对吧?所以有些事情有点依赖于我们在内部解锁越来越多的功能。然后另一件事是短期内,我认为也存在延迟组件。我认为所有这些都可以解决。我实际上相信所有这些都是可解决的问题。它们不是不可解决的问题。

如果你想并行运行所有这些,你可能不想让N台机器去执行它。我认为这是不必要的,特别是如果它们中的大多数是IO绑定型操作,你所做的只是读取少量数据并写出少量数据。它不是非常计算密集型。我认为这是一个好主意,可能我们会追求,并且会出现在产品中。

我仍在处理你刚才关于事情是IO绑定型的说法。对于某种类型的并发性,你实际上可以在一台机器上运行所有这些。是的,为什么不呢?因为如果你查看对其中一些进行的更改,在每棵树上散布几千字节,也许是几万字节,这并不多。

非常小。Cascade或Windsurf的下一步是什么?哦,有很多。我不知道。我们做了一个内部民意调查,我们只是说,“你对这次发布更兴奋,还是对一个月后发生的发布更兴奋?或者我们一个月后要推出的东西?”结果几乎是一致的,一个月后。我认为有一些显而易见的东西。我不知道,Bryn,你想说多少。我不想……

说,但我认为你会看到系统的相同轴线,对吧?例如,我们如何改进知识检索?例如,我们将始终继续寻找如何改进知识检索的方法。在我们的发布视频中,我们甚至展示了一些关于寻找其他数据源的早期探索。这对于构建零到一应用程序的个人开发者来说可能不是最酷的事情,但你可以真正相信,企业客户真的认为这非常酷,对吧?我认为在工具方面,我认为我们还可以做很多事情。我的意思是,当然,Vern谈到了

不仅仅是建议终端命令,而是实际执行它们。我认为这将是巨大的。锁定后,你会查看人们正在执行的操作,例如人类操作、我们可以构建的轨迹,我们如何使它更详细?

我认为所有这些事情,你制作了一些更简洁的UI,例如查看未来轨迹、尝试一些不同的东西以及建议可能要采取的后续操作的想法,这实际上还不存在,但我认为这看起来会是什么样子是很明显的。你打开Cascade,而不是开始打字,它就像,“这里有一些我们想做的事情。”我们开玩笑说Clippy要回来了,但也许现在是Clippy真正闪耀的时候了。所以我认为有很多方法可以做到这一点,我认为

我认为这是非常令人兴奋的部分。我相信我们称我们的每次发布为浪潮,因为我们想真正加倍关注水生主题。哦,是的,公司里有人真的玩风帆冲浪吗?那是……我不这么认为。

我们正在实现我们足够酷到可以乘风破浪的梦想。我认为我们做不到。是的,好吧。这实际上是我们学到的一件事,因为我认为我们没有人是风帆冲浪者。就像在我们的发布视频中,我们有人像在风帆冲浪板上使用Windsurf一样。你看到了,对吧?你在视频开头看到了。有人有一台电脑。我们没有意识到,现在显然是一年中风力不足以进行风帆冲浪的时候。所以我们试图弄清楚如何用风帆冲浪板上的Windsurf制作这个发布视频。是的。

我们与之交谈的每个风帆冲浪者都表示,“是的,这是不可能的。”并且有一个疯狂的家伙说,“是的,我认为我们可以做到。”我们做到了。哦,好的。你有什么想获得反馈的吗?例如,可能有一条岔路。你想要反馈。你希望人们……

回应这个播客并告诉你他们想要什么是的,我认为有很多事情我认为可以使我们的产品更完善,我们想改进……我们将改进性能的许多不同环境,我认为我们很乐意听到……从各个方面来看,例如,“嘿,如果你有这个环境,你使用的是Windows X版本,它不起作用,或者这种语言,哦,是的,它非常糟糕”,我认为我们很乐意听到……

是的,我因为我的Python问题而狠狠批评了Prev和Kevin。是的,是的,是的。我认为在环境方面有很多东西需要改进。我认为,例如,即使只是一个愚蠢的例子,我认为这是一种常见的例子,例如,“是的,像虚拟环境,终端在哪里运行,所有这些东西是什么?”这些都是基本的事情,老实说,这不是火箭科学,但我们需要修复它,对吧?我们需要修复它。所以……

我们很乐意听到来自产品的所有反馈。它太慢了吗?它在哪里太慢了?它可以在哪些环境中工作得更好?有很多事情我们不知道。幸运的是,我们在内部每天都在使用该产品,因此我们在内部获得了大量反馈。但我必须说,其中有一点硅谷式的想法,那就是我们很多人都在Mac上开发。再次,超过80%的开发人员都在使用Windows。所以,是的,有很多东西需要学习,并且未来可能会有很多改进。作为公司的CEO,你个人是否尝试过切换到Windows只是为了感受……

一些东西。你知道吗?也许我应该这样做。实际上,我认为我会的。你的客户,每个人都说它是89%的Windows。你生活在Windows中,你永远不会看不到遗漏的东西。所以我认为一开始,我们犹豫不决的原因部分是

我们许多在每个IDE中工作的架构决策都是因为我们构建了一个在用户本地机器上运行系统的平台无关方式,这只能在特定类型的平台上存在的开发容器上轻松构建,所以Mac对此很好。但现在如果没有理由了,如果我可以对UI等进行更改。是的,WSL也存在。这实际上是我们需要添加到产品中的东西。我们还没有实际添加它,这就是它有多早。

我们没有,像远程……关于Codium的其他内容,对吧?例如,你仍然拥有企业Codium的核心业务。那里有什么变化,或者人们应该知道什么?我认为那里仍然有很多变化,对吧?我认为这有点像,你知道,非常自负地说,“哦,我们现在有Windsurf了。我们所有的企业客户都将切换到Windsurf,这是唯一……”不,我们仍然支持其他……我本来想说,你刚才谈到你的Java人员喜欢JetBrains。他们永远不会离开JetBrains。他们不会。我的意思是……

忘记JetBrains吧,仍然有大量的企业用户使用Eclipse。就像,我们仍然是唯一一个在Eclipse中拥有扩展的代码助手。多年来,这仍然是正确的,对吧?但那是因为那是我们的企业客户。我们一直思考的方式是,我们如何才能最大限度地为每个开发人员提供AI的价值?我认为这部分

自从一开始以来,我们是谁就没有改变,对吧?并且有很多像在开发者所在的地方与他们会面一样。所以我认为在企业方面,我们仍然非常投入地这样做。我们有一个工程师团队专门致力于使企业取得成功并思考企业问题。但是,如果我们从宏观的角度来看,如果我们可以为企业解决所有企业问题,并且我们拥有开发者真正真正喜欢的产品,那么我们就从两方面解决了这个问题。

我认为这是一件这样的事情,我认为当我们开始与企业合作并开始构建开发工具时,对吧?我们最初是一家基础设施公司。现在我们正在为开发人员构建开发工具。你很快就会理解并意识到,

开发人员对工具的喜爱程度如何使我们在企业中取得成功。有很多开发人员讨厌的企业软件。我想画这个飞轮。但是,我们正在为人们提供一个工具,让他们完成最重要的工作。他们必须喜欢它。这不像我们试图说服这家公司的管理人员,他们也经常问他们的开发人员,“你喜欢这个吗?”这几乎总是Codium是否被接受的关键因素。

进入组织。我认为,如果我们没有一个开发者喜欢的产品,我们不可能在不到一年的时间里将企业产品的年经常性收入从零提高到 1000 万美元。所以,我认为这就是为什么我们只是,IDE 更像是一种开发者喜爱类型的产品。它最终会进入企业市场。我们仍然解决了企业问题。再说一次,我们可能完全错了,但我们希望我们正在解决正确的问题。

很有趣,在我开始录制之前,我问过你这个问题,但团队是一样的,边缘团队也是一样的。在任何一家普通的公司,或者我通常对公司架构的理解中,如果你要拥有像这样的两个产品,你将会有两个不同的团队来满足不同的需求,但我们的团队是一样的。

是的,我认为我们公司可能独特的一点是,它一直都不是一家公司,对吧?就像我们最初是一家 GPU 虚拟化公司,然后转向了这个方向。在那之后,我们做了一些改变。我认为公司有一种多功能性,以及这种能够根据我们的直觉做出改变的能力,我们有一种直觉,顺便说一句,这种直觉可能是错的,但如果我们嗅到了一些东西,我们会快速行动。

我认为这更多的是对工程团队的证明,而不是我们中的任何一个人。我相信你在 2022 年 12 月 19 日,有一位嘉宾发布了关于构建 Copilot for Rx 需要什么的内容。估计推理以确定延迟质量。构建第一方而不是使用第三方作为 ABI。找出实时性,因为 chat GPT 和 DALI 在 RFP 中太慢了。好的。

优化提示,因为上下文窗口有限,这现在可能不太准确了。然后将模型输出与 UX 合并,使产品更直观。你还有什么要补充的吗?我会给自己打个 B-。其中一些部分是准确的。甚至是你指出的上下文。是的,模型现在有更大的上下文链接了。这绝对是正确的。它增长了很多。但是看看企业代码库。它们有数千万行代码。那是数千亿个代码标记。

永远不会改变。仍然擅长将这种分散的知识整合在一起非常重要。所以我认为这里有一些数字我认为仍然相当准确。可能也有一些不太准确的。第一方与第三方。第一方与第三方。我认为我们在这方面错了。我认为我会将其细化为:有些事情非常重要,必须由第一方来做,比如自动完成。你有一个非常具体的应用程序,你不能仅仅通过提示工程来解决,或者甚至在之后进行微调。你就是做不到。我认为这里面有道理,但是

让我们也现实一点。如果大型语言模型提供商没有快速改进 4.0 和 3.5 Sonnet,那么 Cascade 和 Windsurf 这样的产品就不可能实现。这根本不可能。所以我给自己打个 B-。我会说我及格了,但是,是的,两年后了。需要明确的是,我们不是在打分。更像是一种,你会怎么做?你想什么?是的,我的意思是,像那篇第一篇文章,对吧?就像我们当时真的,我认为那是在我们推出 Codium 之后几周,我认为那是,你知道,Swix 和我当时在谈论,也许我们可以写这个,因为我们是第一个可以实际使用 AI 的产品之一。这很酷。我特别喜欢 Copilot for X 这件事,因为每个人都非常热衷于此。每个人都只是说,你知道,这就是全部。但我认为,你知道,我们没有企业产品。我甚至不认为我们当时一定在考虑企业产品。对吧?所以,所有这些经验教训

就像,你知道,我们从企业角度学到的东西,这就是为什么我喜欢第三次回到博客上。我认为我们中的一些,我们实际上是倒着走进去的。在很多方面都必须走运。就像我们有很多,我们做了很多。就像有很多机会和交易我们因为各种原因而错过了,我们必须从中吸取教训。还有很多东西需要补充,我根本不可能在 2022 年就做到这一点。我可以提一件我认为的事情吗?希望这不会太有争议。

但这是关于我们整个工程团队的真实情况。我认为我们大多数人并没有从 ChatGPT 中获得太多价值。很大程度上是因为我认为问题是,这可能有点不同,就像公司里很多编写软件超过八年的工程师,这并不是说他们知道 ChatGPT 知道的一切。他们不知道。他们已经足够擅长……

搜索 Stack Overflow 了。在搜索代码库方面投入了很多,对吧?他们可以非常快速地浏览代码,就像每个工具一样。他们花了八年时间掌握了这项技能。而 ChatGPT 作为你需要提供大量上下文的东西,我们实际上无法获得,我的联合创始人根本没有使用过 ChatGPT。真的从来没有用过。

正因为如此,当时我们可能的一个错误假设可能是,嘿,像很多这些被动系统都需要变得更好,因为它们总是存在,而这些主动系统将落后。我认为 Cascade 才是真正重要的东西。这是一家每个人都在使用它的公司。字面意义上的每个人。最大的怀疑者。我们公司有很多对 AI 持怀疑态度的人。

我认为这实际上很重要。你为什么雇佣他们?不,我认为这里很重要的一点是。那些以前对 AI 持怀疑态度的人曾在自动驾驶汽车领域工作。他们不是加密货币人士。他们是关心技术并希望从事未来工作的人。他们对优秀产品的标准非常高。他们不会从事未来工作。

他们不会形成一种崇拜,认为这太棒了。这将改变世界。他们不会成为那种在推特上说,“是的,这改变了一切”的人。软件,我们知道它已经死了。不,这些人会非常诚实。我们知道,如果我们达到了对他们来说足够好的标准,我们就找到了特别的东西。我认为当时我们可能有很多这样的情绪。现在这种情况已经发生了很大的变化。我认为拥有既有远见卓识的信徒,又有能够控制局面的人实际上很重要。

因为否则你只会拥有,你知道,这就像自动驾驶汽车。你有一个非常具体的问题。人们只是在真空中工作。没有信号能够让你回到现实。你没有好的方法来扼杀想法。

我们会想出很多糟糕的主意。但我们需要想出糟糕的主意。否则,好东西从哪里来呢?我不想称这些人为怀疑者。怀疑者暗示他们不知道。他们是现实主义者。当他们在网上看到产品的候补名单时,他们根本不会相信。他们根本不会考虑它。赞扬你没有候补名单就发布了。顺便说一句,我们永远不会推出候补名单。我们永远不会推出候补名单。这是公司的一件事。我们宁愿成为一家被认为是无聊的公司,也不愿成为一家偶尔发布产品,并且希望它足够好的公司。

我的笑话是,生成式 AI 已经非常擅长生成候补名单了。另外,需要澄清的是,我们俩以前都在自动驾驶汽车公司工作,所以不会让人觉得……哦,是的,是的。我们喜欢这项技术。我们喜欢它。我喜欢困难的技术问题。这就是我生活的动力。

太棒了。首先,与你们合作非常愉快。我确实与许多客座博主合作,但并非每个人都能坚持到最后,而且没有人做过三次。所以,太棒了。记住我们的帽子戏法。这次更像是赚钱的一次,这很有趣,因为我认为开发者对金钱不太感兴趣。这很奇怪吗?

是的,我的意思是,我不知道这是否是我们公司的本质。我认为有些人说,所有像旧金山的 AI 公司,每个人都在互相吹捧技术等等,这很好。技术非常重要。我们在山景城,办公室很漂亮。我们只是真正关心创造价值和赚钱。

这有点像公司的核心部分。我认为,一种自私的说法,或者更无私的说法是,是的,我们可以永远成为一家风投支持的公司。但最终,你知道,如果我们真的想改变软件的开发方式,我们需要这部分能够产生现金的业务,这使我们能够真正地投资于软件。这需要是持久的现金,是明年能够周转的现金。

我们希望将自己定位为一家持久且能够真正解决这些问题的公司。是的,是的,非常好。对于那些……

第一次收听的人。我很难给这篇文章命名。所以我们最初称之为,你就像如何赚钱之类的。对不起。我非常粗心。我认为我当时在飞机上。所以,对不起。

他的标题中有 3 个美元符号。哦,我绝对有 3 个美元符号。我想我不能那样做。所以要么是为企业构建 AI。然后我还说,AI 初创公司能做的最糟糕、最危险的事情就是为其他 AI 初创公司构建产品,我认为你们俩都会同意。我认为基本的论点,我非常喜欢,就像慢下来才能更快。就像,如果你从一开始就为安全、合规性、个性化、使用情况、分析、延迟预算和规模构建,

那么你将现在支付这笔费用,但最终它将在长期内得到回报。这是真正的见解。你以后不能这样做。如果你首先构建简单的东西作为 MVP,就像,是的,只需使用任何容易做的事情发布它。然后你添加企业就绪的 12 个你需要的东西,你最终会得到一个不同的产品,或者你的结果会比从一开始就那样做更糟糕。所以我以前从未听说过。

是的,我的意思是,我们反复看到这种情况。我的意思是,就像现在,例如,我们在国防领域有很多客户。我们现在正在进行 FedRAMP 认证。与我们合作的人,他们看到了所有事实,例如,“哦,是的,我们已经有了一个容器化系统。我们可以以这些方式部署。我们已经完成了安全认证。”他们说,“你们比大多数公司更容易做到这一点,这些公司只是说,好吧,我们有一个大型 SaaS 块,现在我们需要做所有这些事情。”

这听起来可能是一件非常深刻的事情。我认为任何在公司某个项目上工作过很长时间的人可能都见过这种情况。技术一直在改进。然后你意识到你必须重新架构你的整个系统才能改进某些东西。当你投入了如此多的努力后,再进行这种改变。人们投入了宝贵的时间。他们投入了感情。无论是什么,做出这种改变都很难。

所以我相信我们也会遇到这种情况。是的,我认为我们比大多数公司做得更早一些。我认为我们会遇到一些点,我们会看到我们系统的一些部分,我们会说,“哦,我们真的需要重新架构它。”实际上,我们肯定已经遇到过这种情况了。我认为这是在项目级别,产品级别,还是整个公司?我认为这里的论点在某种程度上是,你的公司需要从一开始就拥有这种 DNA。我认为这样你就能更顺利地度过这些坎坷。

并能够创造价值。我可以说两点吗?所以我想说的第一点是,这是我和我的联合创始人道格拉斯经常谈论的事情。就像,有一种持续的构建与购买的问题。我认为答案是,很多时候答案应该是购买。我们不会去构建我们自己的销售工具。我们应该去购买 Salesforce。这有点蠢。这是没有差异化的。你选择购买而不是构建的原因是,嘿,看看,现有产品的投资回报率很高。

从机会成本的角度来看,实际上购买它比构建它并做得更糟糕要好,对吧?有一家公司实际上正在专注于此。但这里有一个我认为非常重要的隐藏之处。当你出去购买时,你正在失去公司内部的核心竞争力。这是你永远无法获得的核心竞争力。这很难。初创公司的时间非常有限。让我这么说吧,假设作为一家公司,我们没有投资于,我不知道,模型推理。是的,我们有一个自定义推理运行时。我们现在放弃了它。我们永远不会再得到它了。

要把它拿回来会非常困难。

你不能只使用 VLM 和 TensorFlow 2.0。那将是我们的唯一选择。如果我们使用 VLM,我们现在就不会和你谈话了。但关键是,这更多的是一个问题,我试图从第一性原理来思考这个问题。谷歌是一家伟大的公司,赚了很多钱。如果他们实际上将产品的搜索索引变成了其他人为他们构建的东西会发生什么?他们可以。也许其他人可以做得很好。这可能是一个不好的例子。特别是由于谷歌是一个搜索索引,但是,

很难获得那样的核心竞争力。你已经失去了它。对吧?我认为对我们来说,这更多的是一个问题,即我们公司内部需要哪些核心竞争力?是的,有时这很痛苦。有时这些核心竞争力实际上很烦人。有时我们会落后于现有产品。对吧?我们需要,只需要非常诚实。这就是公司追求真理的重要性。就像,

我们对这个核心竞争力真的诚实吗?我们真的能跟上吗?答案是我们真的跟不上,那么我们为什么要继续这场骗局呢?我们应该买,对吧?我们不要构建。答案是我们能,我们认为这将从长远来看使我们的公司成为一家更好的公司。那么答案是我们需要。

我们需要,因为这场比赛不是在明年赢得的。这场比赛是在未来五到十年赢得的,对吧?甚至更长的时间,对吧?所以这可能是一件事。然后第二件事,实际上,从企业的角度来看,我认为现在公司独特的部分是我们既有个人方面也有企业方面,而通常公司只坚持其中一个。我认为这需要成为 DNA 的一部分,我认为,正如 Anshul 所说,在公司早期。我的意思是,有像 Dropbox 这样的公司的例子,他们尝试过。Dropbox 是一家令人惊叹的公司,一家很棒的公司……

有史以来增长最快的消费公司之一。消费更多的是软件公司。但是,是的,当你所有产品都面向消费者时,企业只是,它正在勾选许多最终根本无助于消费者的框。无助于你的增长指标。实际上,如果最初的那群人不在乎,那么让他们以后在乎就非常困难了,对吧?这非常困难。为什么要这样做?

你需要感觉,嘿,这对公司的生存能力很重要。所以我认为有一点是构建与购买的部分,还有公司的文化 DNA,我认为这两点都非常重要。是的,这是我们一直在思考的事情。我有幸在节目之外与你们成为朋友。我不觉得,我认为我知道你们的职业生涯。你说文化 DNA,但这并不意味着你以前建立过大型企业 SaaS,对吧?是的,我认为是这样。

我认为,是的。所以,你从哪里得到这个?是的。事实上,我认为唯一其他的,我想,你知道,当我回顾我以前的实习经历时,Anshul 可能会提供一些背景信息。就像,我在 LinkedIn、Quora 和 Databricks 工作过。老实说,我对 B2B ETL 软件并没有那么感兴趣。

那不是我晚上醒来时推动我的东西。正因为如此,我决定在之后立即去一家自动驾驶汽车公司工作。我认为部分原因可能与公司的独特方面以及我们作为一家公司转型的事实有关,就像我们想成为一家持久发展的公司。

然后问题是,你如何从这一点倒推回去?有很多事情是关于非常诚实地对待我们擅长什么和不擅长什么。就像,我认为,令人惊讶的是,企业销售并不是,就像,它天生就知道如何做。我真的不知道。正因为如此,很明显,很多销售发生在 Anshul 和我帮助与公司合作的人之间。但很快,我们实际上聘请了一位销售副总裁。并且

我们实际上已经深入参与了扩展大型市场营销团队的过程。我认为这更多的是一个问题,即什么对公司很重要,以及你如何真正地去构建它。我认为我经常思考的人实际上是像 Alex Wang 这样的人。他大学辍学。他在麻省理工学院比我们小一岁。

并且他已经弄清楚如何不断改变公司的方向。实际上,它最初是一个人机界面,然后是一家自动驾驶汽车标注公司,然后是一家编目公司,现在是一家生成式 AI 标注公司。每次,公司的收入都会增加 10 倍,即使业务正在做的事情大相径庭。我的意思是,现在都是关于军事合同了。是的,现在可能是军事,然后在那之后,它可能会接管世界。他只会不断提高赌注。对于这到底是如何运作的,没有一个剧本。它只是……

有点像,你知道的,解决一个难题,然后从那里倒推回去,对吧?我们会一路走来,幸运地得到一些东西。我不认为,你认为一切都是从第一性原理出发,尽我们所能,但是有很多变量未知数,是的,就像我们不知道每个公司都在发生什么,每个人都知道人工智能领域发展得有多快。就像,

我们必须非常擅长适应。我想双击一下,因为你提到了它,这就像一个很少触及的话题。销售副总裁。我们实际上并没有,我们主要与非常早期的创始人交谈。他们通常没有一个非常完善的销售职能。建议,什么类型的销售对你们有效?

在这种领域?什么不起作用?你能与其他创始人分享任何东西吗?我认为在销售方面招聘人员的难点之一,格雷厄姆·安舒尔也可以证明,我们在公司有一位很棒的销售副总裁。其中一件事情是,如果你纯粹是一个开发者,销售人员,他们的工作就是说得很好,

非常得体。我的意思是,如果你听到我说话,这很明显,我不是一个非常有修养的人。顺便说一句,你很棒,我不知道。或者与大多数纯粹的、纯粹的销售人员相比。所以实际上只是根据他们说话的方式来检查并不是那么有趣。我认为,你知道,在我们这样一个发展非常迅速的领域,我认为重要的是,

求知欲非常重要。智力马力。理解如何建立一个工厂。我并不是想小看它,但在某种程度上,你需要在这里建立一些非常可扩展的东西,对吧?这几乎就像你每年都在把这个工厂扩大两倍、三倍,也许更大,对吧?

因为在某种程度上,你有一些承担配额的人,你需要一定数量的人,你需要让数学计算成立。而你实际上,建立工厂的过程并不是你可以随便找一个在另一家公司表现出色的人,然后让他们去建立工厂。这实际上是一项非常不同的技能。你如何确保你有数百人真正深入了解产品?实际上,安舒尔也与销售部门密切合作,以确保他们得到适当的支持。

确保他们了解这项技术。我们的技术也在迅速变化。让我们举一个例子,说明我们的公司与MongoDB这样的公司有何不同。当你销售像MongoDB这样的产品时,公司没有人会对数据是如何存储的感兴趣。这并不有趣,对吧?我喜欢数据库。我会感兴趣的。但是大多数人都会说,解决我手头的应用程序问题。

人们对我们的技术是如何工作的感到好奇。人们对RAG感到好奇,对吧?购买我们技术的人。想象一下,我们有一个规模不断扩大的销售团队,没有人了解这些东西。我们不会成为客户的优秀合作伙伴。那么,你如何创建一个不断壮大的工厂,能够真正地分发软件……

以一种对我们的合作伙伴来说是真实的方式,同时也承担我们产品的所有新部分,对吧?就像他们实际上能够阐述我们产品的新部分一样。对不起,这更像是一个问题,更像是一个关于建立一个可扩展的销售团队的陈述。但是就你雇佣谁而言,你只需要有一种感觉

就像在某种程度上,这可能是一个例子,与足够多的人交谈,找出在你所在的类别中什么是好的,并找到一个优秀、谦逊且愿意与你合作的人。是的,这只是普通的招聘。这只是普通的招聘。我认为这里,有针对人工智能的销售。是的。

或者针对人工智能基础设施的销售。然后还有销售以我们在这里讨论的方式融入产品,对吧?他们基本上会告诉你他们需要什么。我想很多这样的事情都发生了。我认为很多这样的事情都发生了。我的意思是,仍然有,瓦伦提到了像瓦伦、我自己,以及其他一些从事开发工作的工程师。就像我们非常参与销售过程,因为有很多东西需要学习,对吧?就像我们,在我们出去招聘销售主管之前,

如果我们想要的只是我们两个人以前从未为Codeium做过任何销售,我们试图去寻找一位销售主管,我们可能不会招聘到合适的人。那时我们已经向30或40个客户销售了产品。我们自己亲自完成了数百笔交易周期。我们读了很多书,我们做了很多事情,我们了解了哪些信息有效,我们需要做什么。然后我认为我们找到了合适的人。其次,格雷厄姆很棒。我们聘请他担任我们的销售副总裁。

这必须是其性质的一部分。而且现在并没有停止。仅仅因为我们有销售副总裁和专门从事销售的人员,并不意味着我们不能参与其中,或者工程部门不能参与其中。我们有很多员工。我们雇佣了很多部署工程师。我认为Palantir让这一点非常出名。部署工程师与销售团队在非常技术性的方面密切合作,因为他们也可以理解人们试图用人工智能做什么?

就像,他们在Codeium担任部署工程师?是的。好的。然后他们与我们的客户主管合作,使我们的客户取得成功,并了解人们实际上从人工智能中获得了什么价值。这是我们不断收集的信息。这就像,我们都会跳进任何交易周期,只是为了学习更多,因为这就是我们将继续构建最佳产品的方式。它回到了同一件事。

关心我不知道,希望我们能构建正确的东西,伙计们,感谢你们的时间,很高兴你们再次来到播客,是的,非常感谢你们邀请我们,希望一年后我们能再做一次,是的,到那时你们将达到100亿美元,是的,以这个速度,那么明年我们将尽量不去想这件事,尽量不要成为一家零亿美元的公司,好吧,就是这样,是的,好的,太棒了