We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Scott Wu - Building Cognition - [Invest Like the Best, EP.402]

Scott Wu - Building Cognition - [Invest Like the Best, EP.402]

2024/12/17
logo of podcast Invest Like the Best with Patrick O'Shaughnessy

Invest Like the Best with Patrick O'Shaughnessy

AI Deep Dive AI Insights AI Chapters Transcript
People
K
Katie Ellenberg
P
Patrick O'Shaughnessy
S
Scott Wu
Topics
Patrick O'Shaughnessy: 探讨了 Devin 的当前能力、早期应用案例、与 IDE 助手相比的优势、以及对软件工程行业的影响。 Patrick O'Shaughnessy: 询问了 Devin 的定价模式、AGI 的影响、以及未来 AI 在各个行业的应用前景。 Patrick O'Shaughnessy: 探讨了软件工程的历史、未来发展趋势,以及优秀程序员的特征。 Patrick O'Shaughnessy: 探讨了 AI 代理的概念、Devin 的构建方式、以及与基础模型的关系。 Patrick O'Shaughnessy: 探讨了 Devin 在 Cognition 内部开发中的应用,以及对软件工程行业未来发展趋势的预测。 Patrick O'Shaughnessy: 探讨了软件开发成本下降对企业的影响,以及对未来软件业务模式的思考。 Scott Wu: 介绍了 Cognition 公司及其产品 Devin,一个能够执行完整软件工程工作流程的 AI 软件工程师。 Scott Wu: 详细解释了 Devin 的当前能力,相当于一名初级软件工程师,能够处理 bug 修复、代码编写、测试和提交代码请求等任务。 Scott Wu: 介绍了 Devin 的定价模式,以及用户可以同时运行多个 Devin 实例来并行处理多个任务。 Scott Wu: 分享了 Devin 的一些意外应用案例,例如代码迁移、平台重构和版本升级等。 Scott Wu: 比较了 Devin 与 IDE 助手之间的区别,强调了 Devin 的异步工作方式和更高的效率。 Scott Wu: 回顾了软件工程的历史,并预测未来 AI 将超越世界上最好的程序员,并使软件创建更加民主化。 Scott Wu: 解释了 AI 代理的概念,以及 Devin 如何利用语言模型进行决策和与现实世界交互。 Scott Wu: 详细解释了 Devin 的构建方式,包括与各种工具的集成、代码库学习和逐步决策过程。 Scott Wu: 探讨了 AI 对软件工程就业市场的影响,以及对未来软件业务模式的思考。 Scott Wu: 分享了 Cognition 如何在内部使用 Devin,以及对未来 AI 技术发展趋势的预测。 Scott Wu: 探讨了 AGI 的概念,以及对未来技术发展趋势的思考。

Deep Dive

Key Insights

What is Cognition and what does it do?

Cognition is an applied AI lab that has created the first AI software engineer, called Devin. Devin functions at the level of a junior software engineer and can handle complete engineering workflows, from bug fixing to submitting pull requests.

How sophisticated is Devin currently, and how is this measured?

Devin is currently at the level of a junior software engineer. When Cognition started, Devin was comparable to a high school CS student. Six months later, it was like an intern. Today, it's an entry-level junior engineer. Its capabilities are measured by its ability to handle tasks such as debugging, testing, and submitting pull requests.

What are some unexpected use cases of Devin that Cognition has observed?

One unexpected use case is in software migrations and modernization. Many older companies with decades-old codebases are using Devin to update their technology stacks, making their software faster, more efficient, and more secure.

What is the key difference between IDE assistants and Devin?

IDE assistants typically offer synchronous autocomplete features that speed up coding by 10-20%. Devin, however, operates asynchronously, handling complete tasks and workflows, which can save 90% of an engineer's time. Devin can test code, run commands, and integrate with various tools like Slack and GitHub.

What is the historical evolution of computer programming according to Scott?

Programming has evolved from punch cards and gas tubes to assembly, BASIC, C, and modern languages like Python. The core goal has always been to tell the computer what to do, but the form factor and complexity have changed over time, making programming more abstract and easier for humans to manage.

What qualities distinguish a 10x software engineer?

A 10x software engineer deeply understands abstractions, can solve complex problems, and efficiently translates customer needs into technical solutions. They focus on the creative and strategic aspects of software, which typically account for only 10% of an engineer's time, while the rest is spent on debugging, implementation, and other routine tasks.

What is Scott's prediction for AI in competitive programming?

Scott predicts that AI will surpass the world's best competitive programmer, Gennady Korotkevich, within one to two years. This will mark a significant milestone, similar to AlphaGo's victory in Go.

How does Cognition approach the democratization of software creation?

Cognition aims to make software creation accessible to everyone by enabling non-programmers to describe what they want to build in natural language, and Devin will build it efficiently. This shift will likely happen within five to ten years, transforming software development.

What is the impact of agents on software engineering?

Agents like Devin can handle iterative, real-world tasks, such as debugging and setting up databases. They can take a first pass at tasks, allowing humans to focus on higher-level creative work and decision-making, which significantly increases productivity.

What are the technical challenges in building Devin?

The main challenges include enhancing model capabilities for step-by-step decision-making, integrating with various tools and workflows, and maintaining a consistent state for the AI. Cognition focuses on solving these problems to make Devin more effective in real-world software engineering.

Why does Cognition charge $500 per month for Devin, and how does this compare to other AI models?

Cognition charges $500 per month because Devin performs end-to-end tasks, which are much more complex and resource-intensive than simple text completions. The price reflects the value of saving 90% of an engineer's time on routine tasks and the costs associated with running multiple Devins in parallel.

What is the competitive landscape for Cognition?

The landscape is greenfield, with the technology being very early in its development. Software is a vast and complex field, and there are many niches and use cases that can support multiple businesses. Scott believes that the focus on specific, high-impact use cases will drive success.

What is the most significant lesson Scott learned from building Lunch Club?

The most significant lesson is that it can be easier to solve a bigger problem than a smaller one. Solving a big, exciting problem helps attract a passionate and dedicated team. This was evident when building Cognition, where most of the team members are experienced founders but chose to join because of the vision and impact.

What is the defining aspect of Cognition's team dynamic?

The team has a strong foundation of trust and friendship, which makes working together and having tough conversations easier. Most team members have known each other for years, and this camaraderie is a key factor in their success and ability to move quickly.

What is the kindest thing anyone has ever done for Scott?

The kindest thing was the mentorship he received from various individuals, especially during his competitive programming days. One mentor, in particular, invested a significant amount of time and effort into pushing Scott to excel, providing guidance and harsh criticism when necessary.

Chapters
Cognition, founded a year ago, has created Devin, the first autonomous AI software engineer. Devin functions at a junior engineer level, handling workflows from bug fixing to pull requests. The key difference between Devin and IDE assistants is its asynchronous, holistic approach, offering a 10x improvement over traditional methods.
  • Cognition built Devin, the first autonomous AI software engineer.
  • Devin handles complete software engineering workflows.
  • Devin's asynchronous approach provides a 10x improvement over IDE assistants.

Shownotes Transcript

作为投资者,我一直在寻找能够真正改变我们业务工作方式的工具。AlphaSense 利用尖端人工智能技术和海量顶级可靠的商业内容,彻底改变了研究流程。自从我开始使用它以来,它彻底改变了我的市场研究。我现在每天都依赖 AlphaSense 来发现见解并做出更明智的决策。

随着最近收购 Tegas,AlphaSense 继续成为一流的研究平台,提供更强大的工具来帮助用户更快地做出明智的决策。真正让 AlphaSense 脱颖而出的是其尖端人工智能技术。想象一下,搜索速度提高五到十倍,能够提供最相关的结果,帮助您充满信心地做出高确定性的决策。

AlphaSense 提供超过 3 亿份高级文档,包括来自上市公司和非上市公司的公司文件、收益报告、新闻稿等等。您甚至可以上传和管理您自己的专有文档,以实现无缝集成。凭借超过 10,000 个高级内容来源和来自高盛和摩根士丹利等公司的顶级经纪商研究,AlphaSense 为您提供了充满信心地做出高确定性决策的工具。

以下是最好的部分。Invest like the best 的听众现在可以获得免费试用。只需访问 alpha-sense.com/invest,亲身体验 AlphaSense 和 Tegas 如何帮助您更快地做出更明智的决策。相信我,一旦您尝试过,您就会明白为什么它是市场研究的必备工具。

每个投资专业人士都知道这个挑战。您热爱投资的核心工作,但运营复杂性却吞噬了宝贵的时间和精力。这就是 Ridgeline 的用武之地,它是一个专为投资经理设计的全合一操作系统。Ridgeline 创建了一个全面的云平台,可以实时处理所有事务,从交易和投资组合管理到合规和客户报告。过去需要同时处理多个遗留系统,

并且花费无尽的季度末时间来编制报告的日子已经一去不复返了。值得联系 Ridgeline 来了解使用单一平台的体验。访问 RidgelineApps.com 安排演示,我们将直接听到从切换到该平台的人那里听到他们的经验。您将听到我与 Katie Ellenberg 的对话片段,她负责日内瓦资本管理公司的投资运营和投资组合管理。她的团队在短短六个月内就实施了 Ridgeline,在本集之后,她将分享她的完整经验以及他们看到的关键好处。

我们使用了之前的供应商超过 30 年。我们拥有从投资组合会计到交易订单管理的整套产品,

报告、对账功能。我认为我们永远无法切换到其他任何东西。我们的首席交易员 Andy 建议我和 Ridgeline 见面。他们一开始并没有介绍他们的公司,而是介绍他们正在招聘的人。这引起了我的注意。他们几乎是在组建一个技术专家的梦幻团队。然后他们开始谈论这个单一数据源。我想,这是什么?我

我甚至无法想象,因为我已经习惯了所有这些不同的系统和彼此叠加的不同模块。所以我想要了解更多关于这方面的信息。当我查看其他公司时,他们只能解决我们拥有的部分内容和我们所需的部分内容。

Ridgeline 是整个软件包,而且他们是专家。我们不再只是一个数字。当我们打电话给服务部门时,他们知道我们是谁。他们完全支持我们。我知道他们不会让我们在这个转型过程中失败。大家好,欢迎大家。我是 Patrick O'Shaughnessy,这是 Invest Like the Best。本节目是对市场、理念、故事和策略的开放式探索,将帮助您更好地投资您的时间和金钱。

Invest Like the Best 是 Colossus 系列播客的一部分,您可以访问我们所有的播客,包括编辑后的文字记录、节目说明和其他资源,以便在 joincolossus.com 上继续学习。Patrick O'Shaughnessy 是 Positive Sum 的首席执行官。Patrick 和播客嘉宾表达的所有观点仅代表他们自己的观点,并不反映 Positive Sum 的观点。

我今天的嘉宾是 Scott Wu。Scott 是 Cognition 的联合创始人兼首席执行官,Cognition 是一家应用人工智能实验室,它创造了第一个 AI 软件工程师,他们称之为 Devin。在

Cognition 成立一年后,Devin 的功能相当于一名初级软件工程师,能够处理完整的工程工作流程,从修复错误到提交拉取请求。Scott 曾是竞技编程冠军,他将工程领域简单地描述为“告诉计算机你想要它做什么的艺术”。Scott 预测,人工智能将在 1-2 年内超越世界上最好的竞技程序员,并将这项技术视为并非取代程序员,而是使软件创建民主化。

我们讨论了软件开发中的瓶颈、人工智能在各个行业的未来以及提升 Devon 的挑战。Scott 的工作及其本身的含义是巨大的。

请欣赏我和 Scott Wolf 的精彩对话。Scott,由于并非所有听众都熟悉 Cognition,您能否首先描述一下这家公司及其业务?它非常年轻。它取得了非常非常迅速的进展,这将是我们对话的主题。但也许首先为听众描述一下 Cognition 的业务。

是的,当然。非常感谢您邀请我。我们实际上是在大约一年前开始的,我们专注于构建人工智能来自动化软件工程。我们正在构建的产品称为 Devon,Devon 是第一个完全自主的软件工程师。这意味着 Devon 基本上能够完成软件流程的所有部分。

因此,您可以像与同事一起工作一样与 Devin 一起工作。Devin 位于您的 Slack 中,Devin 位于您的 GitHub 中,使用您所有的工具并在您的本地开发环境中工作。因此,您可以标记 Devin,您可以说,“嘿,Devin,我在前端遇到这个错误,你能弄清楚是怎么回事吗?”Devin 不仅会编写代码的部分,还会完成所有相关部分,包括运行本地环境、重现错误本身、查看

日志、找出问题所在、测试错误、添加一些单元测试,然后为您作为工程师进行代码审查创建一个拉取请求。如何正确看待 Devin,如果我认为 Devin 是一位真正的工程师,那么它的复杂程度如何?也许您可以用薪水或经验年限之类的术语来表达,或者其他一些事情来帮助我管理我对它在没有任何人工参与的情况下可以完成多少工作的期望。是的。

它今天非常像一名初级工程师。这就是我们对它的看法。这就是我们对它的描述。我认为在我们刚开始的时候,高中 CS 学生之类的说法可能比较公平。也许六个月前是实习生。我认为今天它非常像一名入门级初级工程师。

会有很多任务。例如,如果您想说,“好吧,我需要您重新架构我的整个代码库,重写整个代码库,使其效率提高 10 倍,然后我会在一周后检查。”这可能不是使用 Devon 的正确方法。而实际上,它确实起作用了,它将每个工程师都变成了工程经理,您可以与您自己的 Devon 团队一起工作并分派任务。因此,您想委托的许多这些小事情

和分发,你会说,“嘿,Devin,看看这个,先试一下。”也许您必须修复一些东西,或者 Devin 提出了一些您必须回答的问题,或者诸如此类的事情。但整个想法是,当您做自己的事情或单独做事情时,您可以与您的 Devin 团队异步工作。我应该将 Devin 视为单数还是复数?设置方式是

我们按使用情况收费。我们有一个计划。该计划默认情况下每月为工程团队收取 500 美元。然后显然,随着您的使用量增加,我们也会增加。显然,它的整体想法是您可以拥有自己的 Devin 大军。每个 Devin 都是独立的。假设您今天要处理五个不同的错误或问题。我们的许多用户都这样做,他们只是启动五个不同的 Devin

每个 Devin 都在处理不同的问题。显然,当他们有问题或提交代码供您审查或诸如此类的事情时,他们会询问您。但是现在,您实际上是在不同的 Devin 之间跳转并并行处理这些任务。

GPT 看起来像是 GPT,通用技术。通用技术很酷的一点是,很难预测世界将如何利用它们来构建其他事物。现在 Devin 已经在私下和公开可用了一段时间,人们使用它来做事情的方式中最让您感到惊讶的是什么?许多新兴的用例……

是我们自己无法预测的事情。我们合作的公司首先使用 Devon 进行的许多工作实际上是这些迁移、重新平台化、

现代化和版本升级等。例如,我们与银行、医疗保健公司合作,他们中的许多人都有几十年前的代码。他们希望使用最新的技术堆栈,使事情更快、更高效、更安全,这也会使他们的开发人员更容易工作。但这太痛苦了,您可以想象,如果您的代码库有 30,000 个文件,

要实际完成这种现代化工作。因此,这是一件非常乏味的事情。它需要一点积极的思考和努力才能深入了解,但显然它的数量非常庞大。这是我们真正看到人们使用 Devon 的第一件事之一。我们的许多客户都对使用情况进行了内部研究,他们发现,工程师使用 Devon 的每一小时相当于实际上没有使用 Devon 的 8 到 12 小时。

所以看起来就像您只是在提问和审查代码,而不是自己编写代码。因此,在许多这些使用模式中,许多需要完成的例行任务,Devin 都能够一举完成。您可以解释一下关键区别吗?

那些在 IDE 中进行创新的人,例如光标或其他东西,这使得程序员更容易编程,与像 Devon 这样的东西相比,它感觉更全面,就像我将整个事情移交出去,然后回来获得完整的工作一样。自从我们开始以来,我们一直在进行这种所谓的代理方法,即完全自动化。我这样描述它,我认为最大的阶跃式变化是关于

异步与同步。因此,许多这些代码助手工具(您提到了很多很好的例子,老实说,都是很棒的工具)。显然,发生的事情是您使用语言模型进行自动完成,或者您有一些简单的事情,它会为您编写某些文件或函数,等等。如果它编写了正确的内容,您就会点击 Tab 并确认这些内容或确认给出的建议。

节省了您打字的时间。我认为总的来说,人们对这些类型的技术所看到的现象是,他们看到的是在整个领域大约有 10% 到 20% 的改进。因此,他们所做的所有不同的软件工作,它使他们成为速度提高 10% 到 20% 的工程师,基本上就是这样。顺便说一句,工程学是巨大的。

这绝对不是一个小数字。但是对于 Devin,我们所看到的是,Devin 能够承担一定程度的任务。您不会要求它进行整个重新架构或类似的事情。但是对于 Devin 可以完成的任务,它更像是 10 倍而不是 10%,因为它实际上是您只需移交

任务给 Devin,然后您继续做自己的事情,您处理其他事情,也许您也在运行其他 Devin。与此同时,Devin 实际上只是您分配了任务的同事,它会处理该任务,并为您提供完整的审查和完整的代码。产品体验中有很多有意义的差异都源于此。

因此,Devon 必须能够测试自己的代码,实时运行,查找文档,能够自己调出网站等等。您必须能够在您的 GitHub、Slack、Linear 或您团队用来相互沟通的任何技术中与它交谈。这是一种截然不同的产品体验。老实说,我们从人们那里看到的是互补的。我们也使用 Assistant 工具套件。然后我们也使用 Devon。很多人同时使用两者。

由于您所处的位置和您个人的经验,我很想利用今天与您聊天的机会,真正谈谈软件工程的过去、现在和未来。我很想从过去开始。也许,在我看来,这是一个不断增长的抽象层,它变得越来越简单,您需要了解越来越少的东西,才能更接近半导体的裸机本身来做到这一点。

做你想做的事情在计算机系统中。也许您可以描述一下您对迄今为止软件工程史的看法,以及在我们讨论今天和未来之前我们已经取得的主要里程碑。好吧,我喜欢您刚才描述的方式,我认为软件工程一直以来,编程或我们想称之为的任何东西,一直都只是告诉计算机你想要它做什么的艺术。这就是目标。它

真的就这么简单。这有点滑稽,显然,因为它的形式因素已经发生了如此巨大的变化。显然,很久很久以前,它都是关于穿孔卡片的。但在此之前,它甚至还涉及这些气体管或类似的东西。那是编程。然后是汇编。汇编,那是编程。有 BASIC,有 C,还有其他语言、框架和技术。我们有云,我们有移动设备,技术发生了很多重大转变。我认为

贯穿这一切的暗流是,在过去的 50 到 100 年里,我们已经能够自动化我们经济中所需的许多流程。自动化实际上归根结底就是能够向计算机准确解释你想要计算机为你做什么。研究它的历史真的非常引人入胜,因为我认为通常情况下,许多这些技术实际上都是

在它们出现的时候,它们是非常有趣的技术。然后问题就变成了如何使它有用?用例是什么?然后有时会令人惊讶。我认为人们最熟悉的例子可能是 40 年代的 ENIAC,它是第一台真正的自动化计算机。显然,真正让它实现这一目标的最初用例是导弹弹道、弹道学以及您想要用它计算的所有物理学。

如果您想要非常非常精确并进行 10 位精度计算,那么您就不想手动进行。例如,对于穿孔卡,真正使其变得有价值的第一件大事是美国人口普查。这是需要自动化的东西。

例如,第一台 Macintosh,许多最初的用例实际上是为平面设计师准备的。然后第二件事实际上是电子表格,它是使其有用的杀手级应用程序。对于每一个这样的例子,都出现了一种技术,然后需要一些时间才能真正使其有用。我们在这里看到了一个非常相似的范例,语言模型出现了,显然它们席卷了世界。

2022 年 11 月的 ChatGBT,大约两年前,那一刻每个人都意识到什么是可能的。现在我们正在看到所有这些技术的自然应用是什么。我认为其中之一显然是软件本身。加速软件本身就是一个递归的过程,您可以获得如此巨大的持续收益。

我不知道你当时几岁。我认为你当时 17 岁左右,赢得了竞技编程挑战赛。因此,从某种意义上说,你当时是世界上最好的程序员,或者至少在某种程度上是最好的程序员。那时,也许是今天,什么区别,你听说过这种 10 倍或 100 倍工程师的想法,是什么品质使他们比其他人更好?在那些比赛中,你试图在那个领域超越对手的是什么?

好吧,非常感谢您的赞美。这些比赛更像是算法问题。有软件。但在所有这些事情中,老实说,我认为编程的灵魂贯穿始终,即使我们说它的形式因素已经发生了如此巨大的变化,我认为它的灵魂实际上只是能够深入理解这些

抽象并在这个抽象级别上工作。我认为这在今天的软件中是正确的,软件工程的灵魂在于将客户的问题或您自己产品的问题或类似的东西,真正弄清楚,好吧,这就是我需要构建的解决方案。

这就是我将如何表示它。这就是我将如何设计它。这就是我需要考虑的所有情况和细节。也许这就是我将在我的网站上设置的流程。这就是将使所有这些工作并使其高效的数据库模式,等等。有趣的是,显然,这是每个工程师都喜欢软件的部分。我认为,正如您所说,这实际上是将某人从 1 倍工程师区分开来成为 10 倍或 100 倍工程师的关键。

同时,这可能只占普通工程师工作时间的约 10%,因为他们其余 90% 的时间显然是调试、实现、设置测试、处理他们的 DevOps、找出他们的数据库出了什么问题,无论是崩溃还是所有这些各种事情,这些事情看起来更像是实现而不是这种创造力。但我认为即使是这样,创造力和解决问题的能力实际上也真正定义了编程。

在那些比赛中,你是如何变得更好的?也许只是带我了解一下比赛本身,它们的结构,你为了获胜所做的事情,以及你如何获胜。我对您人生的这一章非常感兴趣。这场比赛被称为 IOI,即国际信息学奥林匹克竞赛。它非常像编程奥运会。因此,每个国家都会派出他们最好的选手。

有金牌、银牌、铜牌。您在当地级别获得资格,然后进入您所在国家的团队选拔,并获得资格。是的,我的意思是,这实际上是我长大的全部生活。我来自路易斯安那州巴吞鲁日。路易斯安那州巴吞鲁日并没有那么多人热衷于竞技编程,但我真的非常喜欢它。我的哥哥实际上是第一个做这件事的人,我通过他非常喜欢它。老实说,在人生的前 17 年里,这是我生活的首要目标。它的核心是解决问题,

您使用代码作为构建解决方案以及您周围设计的所有事物的媒介。但其核心是您能否弄清楚这些算法问题并理解正确的方法。我想知道您能否为我们勾勒一下您对未来 5 到 10 年在这个世界中将会发生什么的最佳猜测。大型软件编程,显然,您正在直接试图影响其轨迹和答案是什么。

但您也占据了与其他 5 到 10 位处于最前沿的人相同的绝佳位置。因此,您不仅在推动这一前沿,而且它也可能让您有机会看得更远一些。当您展望未来时,您看到了什么?你认为呢?也许您可以为我们绘制置信区间或类似的东西,最佳情况、最坏情况或类似的东西。但是,如果您展望五年后,我们在工程方面可能会有哪些可能性?我

我的意思是,首先,您问的是竞技编程。历史上最好的程序员实际上是一个名叫 Gennady Korotkevich 的人。他来自白俄罗斯。我想象一下,在未来一两年内,我们将拥有能够击败 Gennady 的人工智能。

在这次编程比赛中击败世界上最好的程序员。我认为这将会发生。我认为这将是一个 AlphaGo 式的时刻,这显然是,“哇,这真的存在”。今天的技术,老实说,已经有人发布了一些东西。谷歌在 IMO(数学奥林匹克竞赛)上发布了一些东西,OpenAI 在 IOI 上发布了一些东西,但它们已经达到了与世界上一些最好的竞争对手竞争的水平。达到第一名实际上并不遥远。我认为整个软件工程将会发生什么,我确实回到了我们所说的这一点,即所有编程实际上都只是关于告诉你的计算机该做什么。许多正在使用人工智能和人工智能代理进行的工作实际上只是下一代人机界面。我的意思是,如果您考虑一下编程语言,例如 Python,它可能是目前最流行的语言,

Python 很好,它很漂亮,等等。但是如果您真的仔细观察,它是一个如此明显的折衷方案,您必须从两方面做出妥协。从人的角度来看,显然您必须学习如何编码。世界上 99% 的人不会编码。学习所有这些细节需要数年时间。这就是您如何使用 Lambda 函数的方法。这就是您如何做这个特定的事情的方法。所有这些都是您必须学习的东西,才能与您的计算机对话。

从计算机的角度来看,即使与其他语言相比,Python 本身也臭名昭著地慢且低效,等等。但是显然,与您在裸机汇编上真正运行事物速度相比,如果您知道这正是我想要做的,那么您可以使所有系统诚实地提高 10 倍或 100 倍的速度。我认为 Python 是目前最好的语言。

根据许多人的定义。实际上,这是我们必须做出的尴尬妥协,因为这是人类和计算机今天真正沟通的唯一方式。我认为人工智能将真正解决的一件伟大的事情是,基本上解决了这种翻译问题,任何一个人,不必是经过代码培训的人,都可以精确地描述他们想要构建的内容。计算机将构建该内容的有效且功能齐全的版本,该版本实际上可以工作并执行所有这些操作。

显然,实现这一目标需要一些时间。我认为这就是我们前进的方向。也就是说,举个简单的例子,我使用自然语言想要一个非常非常具体的应用程序粘在我的手机上,或者在五年内可能达到这样的程度,我没有任何特定的 CS 经验就可以准确地得到我想要的东西,并且以高保真度工作,而无需依赖人类程序员。你认为这可行吗?我认为这是对的。

如果我现在必须写下一个数字,这显然很难预测。我认为 5 到 10 年是合理的范围。我想就此说明一点,即使是我们谈论应用程序的方式,我们也显然假设存在某种必须泛化的应用程序。一种说法可能是,今天的软件工程非常昂贵。它非常非常昂贵,因此您实际上可以构建的值得构建的软件基本上是面向数百万人的应用程序。就像,“好吧,构建 Facebook 是值得的,因为每天有多少人使用完全相同的软件。”YouTube 或其他什么,或者 DoorDash 或其他什么。显然,还有一些比较利基的东西,但老实说,那里有很多东西,如果使用代码会更好。有很多社区对话

称之为几千人。有一些小群体或小众群体或类似的东西。甚至还有针对一个人的个性化产品。因此,无论您每天的琐事是什么,它们实际上都更适合使用代码。该代码可以执行您可能需要执行的所有操作,并使所有这些操作的执行更加简洁。我们没有它的原因显然是因为……

世界上实际上没有人认为每次他们想要做一些新的事情时,为他们自己个人的用例编写自定义软件是有意义的。但我认为我们将达到这样的程度,您只需执行这些操作即可。也许后端是代码,但从我们的角度来看,这实际上是,是的,只是向计算机解释我们想要什么,并看到这种情况发生。将会有很多中间步骤,但是是的。我很想知道您对下一层或上一层的想法,这取决于您如何看待它,这是一个相同的问题

特别是对于代理,以及所有这些系统是否会导致应用程序本身变得不那么常见。我们通过语音、文本或其他方式与代理互动,以完成我们目前使用应用程序完成的越来越多的工作。由于您正在构建代理系统,我很想让您教我们关于代理的信息。现在每个人都在这么说。你听到

你每次通话都会听到“agent”(代理)这个词。我觉得这就像《宋飞正传》里谈论税收抵免的那一幕,你就像,你真的不知道那是什么意思,对吧?告诉我们对你来说 agent 的含义是什么,以及为什么它在这个即将到来的技术时代是一个如此重要的结构。就像我们刚才说的,GPT 两年前问世。这对每个人来说都是一个巨大的惊喜。我认为有一段时间,

所有由此产生的产品基本上都是我所说的基于此的文本补全产品。顺便说一句,这很明显是有道理的,因为语言模型的原生形式是输入文本,告诉我输出文本是什么。但这正是你一开始看到每个应用程序的地方。GPT 本身显然就是这样。你有很多问答产品、营销、文案写作。嘿,我需要你为我写一段解释 X、Y 和 Z 的段落。你能把它写得漂亮点吗?砰,这就是输出了。客户支持。

部分客户在提问,然后就像,你会在这里说什么?这是你需要知道的所有信息。砰。代码,也是一样的,对吧?最初的那些大型代码产品,我的意思是,GitHub Copilot 可能是其中最大的一个,它是一个文本自动补全工具,它就像,这是到目前为止的文件,预测我下一行是什么。如果正确,我就按 Tab 键。它显然可以节省我输入代码的时间,但它不能节省我想代码的时间,因为显然仍然是我在决定什么正确什么不正确,但它确实节省了输入代码的时间。我认为

我们现在正在看到,而且现在每个人都在谈论 agent,尽管当然还处于早期阶段,这是一个新的范例,模型实际上可以在现实世界中采取行动并做出决策。这里面有很多东西,人类也是这样做的。这不像一个人只是产生一个完美的范例

段落。这是我需要给你的所有东西,然后你就完成了。很多时候是去与现实世界互动,查找网站或其他东西,尝试一些东西,看看什么有效什么无效。在代码的情况下,显然是运行代码并查看输出或查看日志等。我认为也许

也许最简单的说法是在所有这些垂直领域,我认为我们将看到这一点,基本上,嘿,拥有一个法律问答机器人很棒。但下一步是拥有一名律师。拥有可以回答关于数学问题或你所拥有的问题的东西很棒。下一步是拥有一位完整的老师。显然,在软件方面,也是一样的,拥有代码的文本自动补全确实可以让你自己作为一名工程师更快。但是,如果你有一个和你一起工作的工程师呢?这就是这种代理工作的核心。

也许你可以描述一下 Devon 是如何构建的。在这个问题背后,我还很好奇,将你作为一名使用核心基础模型作为其构建的关键部分的构建者的经验作为建议,并以一种补充这些底层基础模型的方式进行构建,而不会被它们所取代。每个人都问到这个问题。

我相信每个风投都会问每个创始人,比如,O1 怎么不会这样做?所以,告诉我们 Devon 是如何构建的,以及你如何看待与这些不断发展的基础模型一起和并行构建。我们 100% 专注于解决软件工程过程中遇到的所有问题。事实是,软件工程非常混乱。我的观点是,例如,存在这样一种想法,即在真空中解决这些数学问题。有很多研究正在朝着这个方向发展。

但也存在一个完整的线索,即如何将智商转化为对软件工程师的日常工作真正有意义的东西。因此,在适应特定工具和特定堆栈的功能方面,需要做大量的工作。然后,在产品方面也需要做大量的工作。我将举几个这方面的例子。一个简单的例子是,显然,Devon 必须插入你所有的工具中。在真空中解决问题很棒,但 Devon 必须在你的 GitHub 中工作。它

它必须在你的代码库中工作。它必须使用你的 Confluence 文档或任何其他文档。这就是信息所在的地方。它必须阅读 Jira 上的错误。最重要的是,Devon 需要随着时间的推移学习代码库。因此,即使是一位非常非常非常优秀的软件工程师,他们在第一天加入你的公司,他们可能也不会那么高效,至少与

与已经在那里工作了五年并了解整个代码库的人相比。Devin 需要学习同样的理解方式,嘿,这就是这个文件的作用。这就是这些函数的作用。如果我想进行模式迁移,这就是完成此操作的第一、二、三步,等等。然后显然还有所有实际的分步决策过程,这有点不同。我们正在讨论修复错误时

我认为修复错误的一个非常自然的流程是,好的,我收到了一份关于错误的报告。我要做的第一件事是尝试自己重现错误并查看发生了什么。我必须在本地运行所有代码并尝试使错误发生。如果错误确实发生了,我将查看日志并查看错误是什么或确切发生了什么,变量是什么。然后从那里,我将阅读相关的文件。也许你可以进行一些编辑,测试一下等等。然后我将再次测试它,看看它是否有效。

如果这一切都有效,那么我将添加一个单元测试以确保它不会再次失败等等。所有这些分步决策,这显然与文本补全不同,互联网上一个真正聪明的人会说什么?你如何使用你所拥有的工具并做出一系列决策来最大限度地提高你的成功几率?我认为你问的另一个问题是,作为一个构建者,如何考虑这与显然不断改进的模型相关。这是一个非常有趣的问题,因为

我们拥有的许多其他技术都更像阶跃函数。手机问世了。第一个问题是,当每个人口袋里都有智能手机时,你会怎么做?在某种程度上,Uber、Airbnb、DoorDash 或所有这些东西的核心。你可以考虑一下,好的,这是技术转变。让我们考虑一下,有了这种转变,未来几年会发生什么。人工智能更像是一个非常渐进的事情。谢谢。

这是 GPT-3、3.5 和 4。每项小技术都会随着时间的推移而变得更好一点。我认为,部分原因在于,真正考虑一下模型随着时间的推移不会自己做什么。我们关心的许多堆栈和许多事情显然都围绕着构建

专门用于软件的功能和产品体验。我毫不怀疑,基础模型的智商将继续提高,智商将继续提高,等等。但是,你使用的所有工具的许多细节,你如何使用所有这些工具做出决策,甚至你如何与用户沟通,你与 Devin 交谈并提供反馈的用户界面是什么,以及查看 Devin 在做什么,检查并确保一切正常,所有这些事情。

有很多很多细节,显然,在该流程中真正发挥了内在的智商,这么说吧。我们一直是这样考虑的,我们如何确保我们所做的一切都与模型的改进相辅相成?顺便说一句,与其他一切相辅相成。硬件一直在变得越来越快。整个堆栈在各方面都变得更高效。我们拥有我们自己的堆栈部分,我们一直认为,我们如何在我们自己的堆栈部分中尽可能做好,特别是对于软件?

你希望基础模型公司做出哪些改进,才能使 Devon 在未来比今天更有效?

顺便说一句,我应该提到,基础模型实验室都对 agent 非常非常兴奋。这很有道理。我认为一件有点有趣的事情,实际上是,假设你问 GPT 一个问题。第五任总统是谁?你问一个问题,你得到一个答案。这是一个单模型查询。显然,存在消费者定价等等。但是,如果你按照 API 定价来计算,那要花费百万分之一美元或类似的东西,非常低廉。

而如果你问 Devin,嘿,我有一个新功能需要你构建。你能构建它、测试它并确保它看起来不错吗?在此过程中,Devin 可能在接下来的半小时内会做出数百甚至数千个决策,同时它正在构建它。从实际意义上讲,这也意味着它实际上只是对 GPU 的更多推理

因此,出于这个原因,老实说,即使是在未来一年内,我认为 agent 将会变得更加普遍。我们实际上会看到的是,我认为这些 GPU、这些语言模型等等的主要用途将是 agent,主要是因为每个 agent 查询的底层语言模型调用的数量级都比单个问答查询大得多。我认为接下来会发生什么,我认为这些基础模型实验室都在考虑的是,是的,我们如何构建我们的

我们的模型以最适合 agent 的方式进行优化。因此,我认为这些与多轮跟踪一起工作的事情,例如能够处理长上下文输出,上下文是人们花费大量时间思考的一件大事。对于 agent 来说,同样,就像,你有半小时的决策吗?显然,了解过去半小时发生了什么会有很大帮助。因此,一些能够真正帮助解决这些问题的特定技术。你如何在构建 Devon 时使用 Devon?

我们在构建 Devon 时实际上使用了大量的 Devon。这真的是一个新的工作流程,一个非常异步的工作流程。因此,我将举一个例子。我们所有的沟通都在 Slack 中进行。我们有一些频道。我们有一个崩溃频道,每个生产崩溃都会在此处报告。我们有一个前端频道,我们讨论任何前端功能请求,或者像,嘿,让我们这样改变流程,或者嘿,这个设计有点偏离了,或者诸如此类的事情,前端。

出现的事情。我们有一个错误频道,用户在此处提交错误报告,嘿,这件事不起作用,或者这件事坏了,或者其他什么。在所有这些频道中,每次报告出现问题时,我们都会标记 Devon。你可以浏览频道。嘿,这个东西坏了。在 Devon。嘿,有人请求这个。在 Devon。嘿,我们刚刚崩溃了。在 Devon。Devon

Devin 并不完美。Devin 是一名初级工程师,通常需要很多指导。我想说,大约 50% 的时间,Devin 在这些方面输出的只是可以直接合并的拉取请求代码。在另外 50% 的时间里,显然你可以做出决定,好的,我想不想与 Devin 交谈并指导 Devin 完成这个过程?我想不想自己做一些更改并触碰一下

触碰一下需要修复的内容,或者如果它特别偏离了,我想不想从头开始?但是,让这成为我们工作流程的一部分,无论如何你都必须报告错误。因此,你最好在最后添加一个应用程序 Devin,然后你就可以免费获得第一遍。因此,有很多这样的工作流程,很多都是考虑如何将其放入异步工作流程中。

老实说,类似的一个是,如果我们的一位工程师正在构建一些大型新项目,并且他们正在实施某些东西或构建 IDE,例如,这作为一名工程师经常发生。你将浏览代码,你会看到所有这些小事情,就像,伙计,我们为什么这样写?这太乱了。或者像这件事在技术上是正确的,但这不是最稳定的方法,或者很多小事情。在你构建更大的项目时,你会被这些小事情所困扰。它确实会分散注意力,并会分散你的注意力,对吧?

我们现在所做的是,你只需从 IDE 中启动 Devin 来完成这些操作。它就像,嘿,你能快速重构一下这个吗?嘿,你能把它改成类型安全的吗?嘿,以不同的方式排序,这样就不会出现竞争条件等等。你正在进行所有这些小的修复,并且你正在异步地启动它们。同时,你也在进行你自己的项目。在这两种情况下,很多都是真正弄清楚这些异步流程。

看起来短期内的一部分答案是,你之前说过,也许工程师 10% 的时间花在了我一个朋友所说的积极工程上,构建事物,创造性部分,90% 可能花在了确保事物正常工作上,更像是一个机械师而不是一个有创造力、高效率的工程师。

那么,这是否意味着短期内,Devin 和其他类似系统将帮助我们做的是吃掉这 90%,让程序员专注于 10%?然后会发生什么?如果我们在两年内击败了世界上最好的程序员,为什么我们需要程序员?会有程序员吗?他们会做什么?

所以,我认为这是完全正确的。吃掉所有杂七杂八的实现、调试、迭代等等的 90%。我认为接下来会发生的事情是,老实说,你只需要做 10 倍的 10%。我认为关于它很酷的事情是,我们应该直接说出来,显然,人工智能有很多关于将会发生什么以及接下来会发生什么的恐惧。但是我

我认为软件真正美好的一点是,如果我们有 10 倍的能力,实际上还有 10 倍的软件需要编写。在过去的这么多年里,我们一直受到供应的限制。如果你与任何工程团队交谈,我还没有遇到一个团队说,是的,我们构建了我们想要构建的所有东西。实际上没有软件可以构建了。每个团队都有 20 个他们想做的项目。他们必须

他们必须选择三个在本周进行,因为软件工程师太少了,软件的构建时间太长了。我老实认为,我们将看到很多这种杰文斯悖论,随着软件变得更容易,我们将构建越来越多的软件。这是我们已经看到的情况,但规模可能小一些。现在构建软件与在 80 年代构建软件相比,可能大约容易 10 倍左右。这种转变显然会发生得更快。但在过去的 40 年里,我们已经获得了更多的程序员,并且我们已经构建了更多的软件。我认为我们也将看到类似的转变。

我认为从长远来看,我认为软件工程的灵魂是,每个人都可以决定自己想要解决什么问题,以及自己想要构建的确切解决方案是什么。人工智能不是魔术。显然,它不会为你解决所有问题,但它将赋予你指定你想要拥有的确切解决方案的能力,并且能够做到这一点并构建出来。你认为总的来说,这一切是否意味着企业人士需要开始更努力地思考需求和分销?如果我们一直受到供应的限制,

而且这即将消失。这是否意味着未来将获胜的人是那些拥有更好需求和分销的人?我认为,尤其是在软件方面,我们一直受到供应而不是需求的限制。显然,有很多东西的需求更加固定。我认为关于这将对经济产生什么影响以及许多有趣的二阶效应有很多有趣的问题。最简单的说法是,科技界的所有资金都流向哪里?风险投资的资金流向哪里?或者

它流向哪里?它主要流向软件工程师。因此,当你为每位新聘用的软件工程师获得 10 倍的投资回报时,它确实会改变人们可以用产品构建多少以及人们可以做多少的格局。然后我认为,从长远来看,你会看到企业有很多非常有趣的影响。我看到几类不同的企业。

如果我们直言不讳,我认为最难经营的企业是严重依赖转换成本和市场的企业。很多企业,软件企业,它们之所以能够获得所有收入,是因为切换到其他产品或其他技术或其他东西非常痛苦。如果 Devin 能够完成所有这些实施和迁移,并且这些成本降为零,显然它将更多地关注拥有更好的产品。我认为这将是公司将面临的真正转变。与此同时,这并不是一种虚无主义的观点。有很多事情将

同样强烈,甚至更强烈。我认为网络效应将永远是黄金法则。我认为数据和个性化将更加强大。因此,例如,拥有基础设施的企业或拥有所有个人关系和数据等的企业,能够为每个人提供真正针对他们优化的个性化产品,而不是那种对每个人都有效但对任何人都不是完美产品的笨拙产品。我认为很多这样的企业都能够做得很好。

当你花时间与大型成熟科技公司的高层人士交谈时,哪些问题变得最常见?肯定有很多人都问,我该如何考虑我的工程人员数量以及我该如何与之合作?我认为我们正处于这样一个范例中,人们喜欢说这是

人工智能不会取代你,但使用人工智能比你更好的人可能会取代你。因此,很多都是你如何变得聪明以及如何确保你掌握最新技术并为这场转变做好准备,这场转变实际上比大多数人想象的要快得多,并让你的整个团队为此做好准备并为此构建东西。我认为这些科技企业本身实际上也有一个特殊案例,那些正在构建解决方案的人

SaaS 产品或类似产品,我们谈论 agent 很多。我实际上认为一种有趣的产品变化是,许多这些公司实际上将为 agent 服务,而不是为人类服务。很多优秀的企业基本上是为了这种协作、协调、大量的交互而设计的。我们谈到了像 Slack、GitHub、Datadog、Atlassian 等公司,它们做了很多工作和编译。而且很多都是关于人类如何互动界面的。

我认为我的想法是,现在,这些对于 agent 使用也是非常有价值的工具。当然,你可以想象这种虚无主义的观点,即 agent 只是从头开始构建一切。但事实是,我们之所以以这种方式查看日志,是因为有原因的。我们之所以以这种方式设置我们的文档,是因为有原因的,它确实使事情变得更容易。它使获取所需上下文的问题变得更容易。因此,实际上会发生的事情是,我们将拥有许多也使用这些产品的 agent。

因此,处于该领域的企业,很多人实际上都在考虑如何使我的产品为我的新一代 agent 客户做好准备,以及所有的人类客户。我曾与 Martin Casado 讨论过技术创造的这些不断攀升的成本曲线。人工智能中已经明确发生的第一件事是,各种形式媒体的边际内容创作成本已经开始走向零。

看起来,你和你的作品中,软件本身的成本也发生了同样的曲线故事。你如何在这样的现实中建立一个软件业务?如果我快进 10 年或足够长的时间,为什么 Devin 应该收费?为什么不会有一个开源的 Devin 为我做所有事情?如果我们正在进入边际软件创建成本非常接近于零的时代,我需要为软件支付什么费用?是的。

我的意思是,我认为现在,Devin 确实是市场上唯一一个这样做的。但正如你所说,我相信很快就会有许多竞争对手。并且那些想要在代码中做类似事情的人对消费者来说很棒。我们刚才谈到了 10 倍工程师等等。事实是,

你可以在软件工程师中拥有的每个级别的决策质量和每个级别的技能实际上确实具有这种指数级的回报曲线,并且它会产生很大的影响。我们获得的一件事显然是能够真正真正地将 Devon 个性化到他们的每个客户。因此,像 Devon 一样,我今天有很多客户,当我们与 Devon 合作时,例如,它就像,Devon 了解整个代码库。Devon 编写了代码库中的一半文件。

因此,其中包含所有这些细节。显然,这不仅仅是代码行,还有 Devon 已经内化并与整个工程团队一起工作的决策过程和思维过程等等。这确实是一种权衡,它关乎的是,这里有一位工程师,他可能聪明而敏锐,等等,但今天才开始使用你的代码库,而这里有一位工程师,他已经在你的代码库中工作了很多年,并且了解每个文件,并且已经

已经构建了所有这些东西,并且知道你的工程师在询问某些事情时是什么意思。这里面存在真正的权衡。它归结于这些事情,这有点像纯粹的技术转换成本,例如将所有文件迁移到某些新事物或迁移到某些不同的平台。是的,我认为随着时间的推移,这将变得越来越便宜。与此同时,显然,如果你拥有个性化水平,如果你拥有网络效应或其他什么,那与成本转换无关。它实际上只是关于你能够提供更好的产品。

也许可以谈谈定价。这是一个非常有趣的问题。看起来 OpenAI 的某个人举起手指,决定 20 美元是一个合理的收费价格,并且整个商业生态系统已经发展起来,这似乎是默认的定价。你做出了一个非常不同的定价选择。每月 500 美元。OpenAI 刚刚发布了每月 200 美元的选项。所以我们正在向上发展,但请向我介绍一下你如何考虑以及如何在新的世界中考虑定价。是的,我们显然会看到更多这样的情况。我的意思是,我认为对我们来说,

很有趣的是,例如,在我们的发布时,我们有很多问题,例如,我们如何拟人化 Devin?我们如何解释它的结构等等?但我确实认为这是一个非常不同的范例,对于 agent 来说,它确实取决于使用情况,无论好坏。这对于输入和输出都有原因。但是输入,就像我们所说的那样,我的意思是,

运行它确实更昂贵。情况就是这样。你正在进行更多查询和更多工作。每个作业或每个任务或类似的东西都需要更多的 GPU 计算。但我认为,对于输出也是如此,显然,当你开始承担真正端到端的任务时,衡量这样的事情产生的具体影响要清晰得多。

我认为我们基本上想要拥有的代理是基于价值的定价,它基本上是,我们希望使你正在构建的许多项目或错误或功能或其他东西的构建成本降低 10 倍。因此,我们希望 Devin 在这些项目上运行的成本降低 10 倍。显然很难为此找到一个完美的代理,但我们拥有的代理基本上是使用情况。我们有一个名为 ACU 的单位,即 agent 计算单元,它基本上……

Devin 做出的所有决策,Devin 使用的框,Devin 运行的代码或类似的东西。它大致对应于你正在进行的每小时 Devin 工作。同样,这取决于不同的机器,但你支付大约 8 到 12 美元左右。显然,Devin 在一小时内可以做很多事情。设置是这样的,我们希望它比你自己做这些事情便宜 10 倍。但我认为,当我们开始拥有执行任务而不是回答问题的 AI 时,这将成为普遍的新范例。

关于这个大型有趣的、几乎已经成为鸡尾酒会风格的问题,即我们是否已经实现了 AGI,以及这是否是你关心的问题,你有什么想法?我很想知道你对此的看法。我在该阵营的第二类中。我们已经拥有 AGI 了。

有人在2017年10月说过,如果你问我们是否拥有AGI(通用人工智能),答案是否定的。在2024年,如果你问我们是否拥有AGI,答案是,好吧,你得定义AGI,这取决于这样那样。我认为AGI有一个有点递归的定义,显然,人们喜欢说,哦,它完成了80%的人类劳动。这就像,好吧,如果你能做到这一点,那么人类就会做剩下的20%。所以它就不再是80%了。这里面有一些递归性。但我实际上的说法是

我认为将会出现这样一种情况,我们将提升能力,我们将提升能力。一段时间内,会有很多小事,人们会说,好吧,人类在这件事上仍然更好。然后我们将解决这个问题。然后人们会说,哦,好吧,人类实际上仍然可以做这件事。我们人类显然对自己物种有着很多自豪感,想要找到使我们与众不同的事情,等等。但我认为实际上,

对世界来说重要的是,人工智能足够好吗?它是否被很好地整合到产品中并得到广泛分发,从而真正影响世界、影响经济以及影响人们的日常生活?从某种意义上说,这个问题比它是否完成了95%、96%或97%的人类工作流程更重要。它是

更多的是一个问题,即由于人工智能技术,人类是否实际上正在做25倍的事情?我认为这实际上是一个更实际的问题。从某种意义上说,这就像我们在谈论智商之类的事情。这些基础人工智能已经能够解决的数学问题,老实说,在人类中,如果还不是世界第一的话,那也属于人类的顶尖水平。我认为最大的区别实际上不在于我们是否是世界第一,或者只是排名前0.1%的人类,或者诸如此类。区别在于这种水平的智力是否真的被

世界上每个人都使用,并且以一种真正为他们带来很多价值的方式使用。这将是真正使我们实现巨大GDP增长、巨大效率提升、生活质量提升(无论你称之为什麽)的重大转变。

投资者大多沉迷于规模损失,因为它对上市股票、私募市场中构建新产品的公司都有着巨大的影响。所以这就是他们倾向于关注的地方。如果你正在关注基础模型领域正在发生的事情,你会花时间思考什么,向你的朋友询问什么,学习什么?你在那个世界里关注的是什么?

是的,我对这一点的看法是,我认为规模法则有点像神话。我认为我们在这些模型上取得了持续的进展,并提升了能力等等。显然,我们已经想出了很多新技术。后训练方面有了很大的改进,而且显然还有一些增强学习之类的事情正在发生。当然,规模回报是存在的,但是

我认为我们看到的大部分内容基本上也是新技术的引入,这些新技术使效率更高,或者使其能够超越规模增长。因此,人们有时喜欢谈论规模法则,就好像它是

你只需坐等,只要你有足够的硬件,它就会越来越好,越来越好。我认为实际上,我们确实需要越来越多的硬件,但也是创新使我们达到了这一点。我认为,对于基础模型来说,我们总是希望能够了解正在发生的事情以及接下来会发生什么。我们与所有基础模型实验室密切合作。我们与他们一起对早期模型进行评估。我们与他们一起进行模型的定制训练,诸如此类。它是

就像我们所说的那样,这是一个渐进的过程。这些事情会变得更好。作为决策者,很多问题实际上只是对哪些能力会变得更好,以及哪些能力、产品或其人类体验将始终需要补充这些能力才能为客户提供有价值的东西有一个非常清晰的认识。

我真的很想知道一些关于你作为商人的形成性经历。显然,你已经,我们已经谈了很多关于你作为技术人员的形成性经历,建立认知以及IOI和其他比赛是你生命的前一部分。

我相信每个人都看过你12岁左右赢得数学竞赛的视频。显然,你有一些非常酷的形成性经历。在商业方面,这些经历是什么?例如,我很想知道你与Lunch Club的经历,你正在构建什么,你为什么构建它,以及你商业生涯的这一章教会了你什么。

是的。Lunch Club是我的第一家公司。我实际上辍学创办了这家公司。这是一次很棒的经历。首先,它是针对专业人脉的人工智能。我们促成了数百万次会议,这是一个非常有趣的团队和产品。我想说,老实说,我学到的一件大事是,这听起来很简单,但它确实归结为基本原理。我觉得每个人都在谈论的创业智慧的共同点,从某种意义上说,它们是如此显而易见,以至于如果人们这样认为,那就根本不值得一提,就像

如果人们这样认为,那就根本不值得一提,就像尽可能快地行动。每个人都这么说。每个人都知道。永远不要在招聘上妥协。尽可能地靠近你的客户。专注于构建人们喜欢和想要的产品。这些几乎是同义反复的真理。但是,

现实情况是,你总能用你的基本功来提升一个档次。这就是我现在亲眼所见后思考的方式。简单的例子,每个人都说你可以很快。就我们而言,我们在1月份注册了公司。我们正在构建产品的第一个版本。我们在2月份将其交付给第一批初始用户。我们在3月份进行了发布。我们在4月份进行了一轮大规模融资。我们在5月份与微软达成了重要的合作关系。在此期间,我们获得了许多企业客户。

我们扩大了团队规模。无论你行动多快,硅谷的每家创业公司显然都认为自己行动很快,但仍然值得努力争取更快。无论你与客户的距离有多近,无论你对他们问题的理解有多深,你可能都不会后悔花更多时间与他们相处并更深入地了解他们。无论你对招聘的要求有多高,你可能都不会后悔尝试寻找更高要求的人才。我认为这是我在创业中吸取的最大教训。

竞争格局,感觉是广阔的、令人兴奋的绿地,还是

战线正在形成,竞争异常激烈,每个空缺职位都竞争激烈,而且手段强硬。描述一下现在的竞争环境。你们都在我曾经去过的那栋令人惊叹的房子里工作。这是一个非常酷的环境,感觉非常像创业公司。然而,第二天你却和微软在一起。这里真正的初创公司、初创公司住宅和正在兴起的原始文化之间的对比

他们在几个月内与世界上最大的科技公司互动,就像你一样。这是一系列奇怪的情况。你会如何向局外人描述这个竞争环境?是的。

我认为它仍然是绿地。我的意思是,这项技术本身还处于早期阶段。从某种意义上说,所有这些东西真正变得有价值并实现目标才一两年。我经常思考的一件事是,软件规模如此之大。我们显然知道这一点,但软件有很多方面,有很多细节,可以做很多不同的事情,可以构建很多不同的事情。因此,我思考的一种方式是,我们正在谈论的每个用例,都有巨大的、真正有意义的业务建立在其中,并且只做那个用例。

很多人都在谈论用于数据可观测性的人工智能。例如,Datadog是一家伟大的公司。它的营收达数十亿美元,市值约为500亿或600亿美元。它发展得非常好,而且增长迅速。正如你所想象的那样,数据可观测性方面有很多事情可以用人工智能来做。事件响应是一件非常重要的事情,而且只会越来越重要。这个领域有很多优秀的公司,比如PagerDuty就是一家优秀的公司。但人工智能将使这些事情再次扩大几个数量级。测试也是如此,现代化项目也是如此,微型计算机也是如此。

迁移。像微软、亚马逊、谷歌或任何公司这样的大公司,即使在今天,他们必须为将客户迁移到其平台上所付出的努力也是巨大的。每年都是数十亿美元。所以所有这些都是如此巨大的空间。即使关于产品形式因素,仍然有很多问题。随着技术的不断进步,我们能够支持的用例种类只会越来越大。

你认为现在世界对你的整个世界,对软件工程自动化程度的估计过高还是过低?速度可能是一个很大的因素。我一直思考的一件事是,如果我们只是纵观人工智能,例如,我认为代理商总体上将在各行各业发挥作用。代码有很多原因是第一个,但我几乎可以说,如果你愿意的话,第一个代理商实际上是自动驾驶汽车。

它是一个在现实世界中做出决策、接收反馈并与之迭代的实际人工智能。人们熟悉自动驾驶汽车的故事,我实际上在2014年住在山景城。我会经常看到Waymo的汽车四处行驶。我没有驾照。我当时刚开始工作。我不需要驾照。它们基本上已经存在了。我相信我能够使用它。

我们最终做到了。我认为仍然有很多增长空间,但确实花费了很多时间。我认为自动驾驶和代码以及老实说,在未来一年中我们将看到的许多其他应用程序之间的区别在于,我认为对于自动驾驶来说,你真的、真的需要它达到99.99999%的充分性。而且没有一个世界是这样的,或者有,但区别没有那么大,就像人类和机器结合在一起可以做更多的事情一样。

我认为这就是人们典型的例子,好吧,你知道,会有很多边缘情况需要弄清楚,等等,顺便说一句,这是真的。但软件的好处是,实际上确实有一种非常好的方法可以将人和机器结合起来,并做得更多。Devin就是这样。Devin并不是99.9999%的解决方案。它看起来更像2014年的Waymo,或者老实说,甚至比那更早。但事实是,

让Devin先试一试,或者让Devin给你发送代码,然后你查看一下并进行审查,或者类似的事情,Devin完成了90%,如果你做的是一个九而不是六个九,它仍然非常非常有用。

它实际上确实为你节省了90%的时间,而你不会乘坐一辆只有90%一致的汽车。因此,我认为在实际软件真正转型方面,在速度上会有一个真正的形式因素差异,这不仅是因为能力,还因为产品空间更适合这种情况。

Lunch Club教会了你关于创业世界的什么教训?是关于市场的什么?是关于产品的什么?如果你回顾这段经历,最大的收获是什么,你如何将这些经验教训应用到你在Cognition的工作中?可能最突出的一点,老实说,是Cognition。

有时解决更大的问题比解决更小的问题更容易,这就是为什么人们会谈论这一点。如果你追求的是真正巨大的东西,而且是那件事,而且是最令人兴奋的事情,你将能够召集一群人,他们都非常兴奋地让它发生,并且真正热情和致力于推动前沿,以一种实际上有时会更容易的方式。例如,我们的团队,

我们的团队现在大约有20人。在这20个人中,我认为有14个人以前都是创始人。这是一个有趣的情况,我们都做过公司。老实说,这是一个非常、非常有才华的团队。如果他们想这样做的话,很多这些人都会得到一张空白支票来筹集资金。他们想做自己的事情。但很多事情只是我们如何走到一起并构建一些真正伟大的东西?我认为这是我的一大教训。

在为期一年的认知之旅中,最困难或最紧张的时刻是什么?哦,有很多这样的时刻。那我们就说几个吧,我喜欢这些。我最喜欢的之一……

所有这些发布,你知道创业公司的情况,显然如此。事情总是非常仓促。所以我们本周进行了GA发布,然后我们在3月份进行了最初的产品发布。对于这两次发布,发布前的几天都是最紧张的,但也最难忘的经历。我们3月份的发布非常重要。你必须做很多事情才能做到这一点。显然,有产品本身,以及与早期用户的测试,并确保一切都能真正……

按照预期的方式工作,为其准备信息,设置好一切。然后显然还有其他一些事情,比如拍摄视频,考虑发布博客文章,发布内容,与客户合作以获得推荐等等。实际上,我们在3月份的发布中,除了我们在发布前也进行了一轮融资之外,我们还做了所有这些事情。所以我们当时正在做这件事,我们有候选人正在进行中,非常重要的候选人,我们当时正在努力寻找和弄清楚。所以那个周末,

那是一段非常有趣的时光。那次发布实际上是一篇由Ashley Vance撰写的文章,一篇关于我们公司的彭博社文章。显然,正是这篇文章标志着发布的开始。它应该在星期二早上6点发布。

我们要求他们稍后再发布。我们把它改成了星期二早上9点,而不是早上6点。我们需要那几个额外的小时。到那天晚上1点或2点,我们还没有完成发布视频的拍摄。我们还在录制台词。然后还有所有博客文章以及将所有这些内容整合在一起。那是一个疯狂的周末。是的。那天晚上几乎没有睡好觉,基本上。

这真的是一个非常有趣的时刻,可以走到一起,真正一起做所有事情。实际上,我认为我们都住在一起并一起工作的原因之一就是这一点。因为共享体验、共享深夜的能量等等,有一些特别之处。我觉得在办公室里不会完全一样。是的,这次发布也是如此,你知道,实际上,我们都在犹他州。

这实际上有点滑稽。最后一刻的决定,就像,好吧,我们要用这个。我们那天上了飞机,找到了一间可以容纳我们所有人的小屋,住进了那里。我们都在忙着发布。故事总是这样。即使做了这件事,我们也没有得到任何帮助。所以我们还在前一天晚上2点拍摄,为发布准备东西,准备所有内容,准备信息。显然,在这种情况下,这也是一件完整的事情。所以它

我们必须准备好处理10倍甚至更多的负载。所以我们必须做所有这些事情来做好准备。老实说,这些都是一些最有趣的时刻。我只是非常热衷于发布东西。我认为其中包含了很多东西,就像商业的缩影一样。回顾一下,你能告诉我这两次发布中最好和最糟糕的部分吗?老实说,与团队一起的经历是最好的部分。只是能够一起构建它,并与团队一起构建它。这真的是灵魂所在

是的。最糟糕的是,我的意思是,总是会发生一些令人害怕的事情。前一天晚上,就像,嘿,我们做了负载测试。这完全不起作用。所有信息都消失了。我们不可能处理这么大的负载。我们预计每分钟可以处理这么多并发Devon会话。这根本不起作用。我们必须做的最后一刻的事情,例如入门流程,我们必须做的最后一刻的更改。我的联合创始人Steven实际上发布了一篇文章,谈论我们如何发布了一个可以让你与我们进行Slack连接并与

直接与我们的团队合作。这大约是在发布前一天凌晨1点开始的,并在发布当天早上完成。Devin构建了很多这些内容,因为显然我们需要Devin的额外带宽。当时,你优化的每一件事都是如何让我们所有人不至于非常尴尬?有时你只需要把它发布出去,尽你所能。

你怎么看待像01 Pro Mode这样的东西,以及人们使用它进行编码与Devin相比?是的,我认为这些工具很棒。我认为很多公司都在考虑代码,并且专注于代码。就像我们所说的那样,代码是一件非常重要的事情。有很多情况是,是的,当然,就像你想构建一些东西,一个开箱即用的单个代码文件,并且你想仔细考虑特定问题或其他任何问题,并让它成为一个真正优秀的单个代码文件或类似的东西。

在那里,是的,你可以直接去Olin Pro咨询它,或者说是一个AI Stack Overflow,如果你愿意的话,你可以粘贴错误,它会根据它所拥有的内容给出它最好的猜测。这就是我认为错误是什么。

对于Devin来说,有很多迭代流程非常自然。因此,例如,如果它不仅仅是编写单个文件,而是像,嘿,我需要你在我的代码库中工作并构建一个新功能,并将其插入所有现有内容并进行测试以确保它有效,那么显然所有这些迭代步骤都是Devin为你做的事情。

同样,如果这是一个调试问题,例如AI Stack Overflow问题,实际上,我想说的是我们最初的Devon时刻之一是,我们开始将其构建为更像研究类型的技术,只是试图理解多轮代理、迭代决策等等。最终,将其构建到Devon产品中是有意义的。但真正让我们信服的第一件事是,我们试图为我们自己的工作设置数据库。我们正在设置MongoDB,任何做过的人都知道这个流程是什么样的,基本上,它只是

给你一组命令,你尝试一下,然后它不起作用。然后你阅读错误,复制粘贴它,并试图弄清楚,你在谷歌上搜索发生了什么。你找到了一些东西,然后运行它,然后你遇到一个不同的错误。你这样做10次,直到事情成功。

每个人的设置总是有点不同,总有一些细节会让你陷入困境。在这种情况下,我们花了一段时间试图设置MongoDB,但它不起作用。所以我们把它给了Devin。我们说,嘿,你能让它在本地工作吗?然后Devin做到了。这就是重点。所以我们前面说过,它不仅仅是一个Stack Overflow,它只会给你一个答案,哦,你遇到了这个错误。哦,也许你应该试试这个。

就像Devon看到错误并说,好吧,让我看看发生了什么。让我们检查哪些端口是打开的。让我看看这个数据库的模式是什么。让我看看套接字连接是否已设置。它正在运行所有这些命令来查看这一点。然后它使用这些信息来决定,好吧,接下来我要尝试什么?然后它尝试一下。如果它遇到一个新的错误,那么它就可以调试它。集成的自主流程我认为是最大的区别。构建起来有多难?我没有足够的专业知识来提出这个问题的最佳版本,但是

但是,如果我认为部分秘诀在于整个事情的迭代代理性质,那么构建这种能力最困难的部分是什么?显而易见的是模型能力本身。

这些模型大致是这样的:互联网上一个聪明人可能会这么说。但是,如果你现在在想,好吧,我正在一步一步地制定决策,以最大限度地提高我的机会,不是现在,而是在一百步之后,我将解决这个问题,那么你解决的目标显然是完全不同的。因此,很多内容都与能力有关。但我认为除此之外,还有很多基础设施和整个体验方面的事情会变得非常复杂,正如你所想象的那样。因此,例如,Devin有它自己的机器来工作。

而且你想要支持的许多功能,例如回滚机器状态或快速处理热加载,能够立即使用新机器启动Devon实例,能够浏览所有之前的决策并在这些不同的事情之间来回切换,或者能够并行使用不同的Devon等等。是的,还有很多基础设施问题需要解决。我认为这归结于这样一件事,那就是

软件工程是如此混乱。因此,它与在真空中解决问题以及构建所有这些与现实世界高度相关的组件确实非常不同,在现实世界中你实际上能够做这些事情。你实际上能够使用所有你的集成。你实际上能够维护你自己的机器状态或在你的get checkout中工作,或者所有这些事情。

我认为真正从我们只专注于软件工程中体现出来的很多混乱之处。如果你必须戴上你最科幻的眼镜来看待未来世界中的技术,你会怎么做?

你可能会和你的团队一起谈论一些目前似乎不可行,但在未来可能可行的事情,这些事情让你最兴奋?我的联合创始人Walden有一句很棒的话,我一直都很喜欢,那就是我们玩我的世界生存模式已经很久了,现在该玩我的世界创造模式了。

- 描述一下对于那些没有10岁男孩的人来说这意味着什么。- 是的,是的。基本上,我的世界是一个沙盒开放世界游戏,它旨在模拟生活。你可以去种植食物,你可以去觅食,你可以采矿,你可以做所有这些不同的事情,你可以建造东西。

这有点滑稽,因为它有两种主要模式。一种是生存模式,你实际上必须应付向你袭来的敌人。你必须去建造自己的住所,确保你有足够的食物来维持生命,以及所有这些事情。显然,其中也包含创造力,你可以做的事情,但你也受到你自己的角色有多饿或是否受到攻击等因素的限制。而我的世界创造模式基本上是一种模式,

你可以组合任何你想要的东西。这不像我今天没有找到任何铁矿石,所以我无法建造这个东西。这就像,我想建造这个东西。我想尝试这个新东西。我想设置这个非常酷的东西。有些人已经在我的世界中设置了完整的计算机和计算机程序,这太疯狂了。它基本上只是专注于想法和想象力,而不是执行。

这不是关于,好吧,我现在必须再花两个小时去收集金矿石,因为我想建造这个东西。这就像,我知道我想要建造什么。现在我有自由去实现它。老实说,我认为人工智能的伟大梦想是能够解放人类。人工智能的目的不是去解决我们所有的问题,然后让我们一无所有。我认为这是赋予我们力量,或者赋予我们想要解决的问题或想要构建的东西,赋予我们能够将这些变成现实的能力。

是的,想象一下真是太有趣了。我将用我自己的经验来说明。当我拜访你时,你问,我认为演示非常强大。所以你让我提出一个应用程序的想法。我认为它花了8分钟来构建,我们看着它构建。观察它的迭代性质感觉就像一个真正的顿悟时刻,因为它确实看起来像是在超高速地做一个人会做的事情,因为它正在构建一些东西。但也许我更有意义的认识是,它用自然语言构建了我描述的东西。

但直到我看到那个东西,我做出的那个小程序,我才意识到为什么那个想法不好。当我提出这个想法时,它听起来不错。当我看到那个东西时,我知道它为什么不好。所以我想说,让我兴奋的不是我能让我的想法听起来

而是我能得到更好的想法,我认为这是整个事情中被低估的部分,就像计算机程序现在会更快一样,任何有想法的人都会变得更好更快,因为他们可以看到那个东西,并看到它为什么很糟糕。你认同吗?这是一个很好的观点。这非常类似于将你能花在想法上的时间从10%提高到100%,而之前

你必须组建一个团队。他们会去构建整个东西。你花几天时间来构建整个东西。然后你就可以进行下一步的想法迭代。顺便说一句,Devin 仍然有很多提升空间,要达到这个未来,还需要很大的进步。但要达到一个点,基本上你只需要做构思工作,你可以针对它进行迭代,你可以提出新的想法,你可以提出新的想法,等等。而不是在这些90%的实现中夹杂着10%的小块,你只需要将所有精力都集中在想法上。我对此非常兴奋。

Cognition的一个决定性特征似乎是领导者之间的高度友谊和信任,这非常不寻常。也许你可以描述一下它的起源。但当你快速发展时,信任非常宝贵。我只是好奇地想听听你到目前为止的构建体验的这一方面。团队中的几乎每个人都认识彼此多年。Steven、Walden、Russell,我认识这些家伙很久了,还有整个团队。

我一直想知道,好吧,和朋友一起工作会不会很尴尬?有很多事情会发生。如果有什么不同的话,实际上恰恰相反,更容易进行艰难的对话,因为你知道,显然……

我们在此之前就是朋友。我们正在做的所有事情都源于我们只是试图互相照顾,一起创造一些伟大的东西。当你们都知道这是真的,并且这种基调始终存在时,更容易直接指出一些事情,例如,“嘿,我认为这完全错了”,或者“我们需要立即更改此内容”,诸如此类。根据你与投资者的交流经验,包括在座的各位,

人们没有问你关于产品、公司或愿景的问题,而他们应该问你什么?是的,这是一个好问题。我认为一件肯定不同的事情是谈论它与感受它,人们有时谈论或询问的是团队的体验。我认为日常工作是将产品推向市场,看看人们对它的评价,与我们的用户交谈等等,这很明显。但就我们自己而言,我认为……

我们如何做到这一点以及我们如何作为一个团队来构建它,我不得不说,这确实是特别的。我认为我们拥有一些最聪明、最雄心勃勃、最能干的人,但不知何故,他们都是如此低姿态的人。我认为这才是它的精髓,对我的来说,就是我们20个人在一个房子里一起努力做一些有意义的事情。我认为,谈论它与真正地看到它运行起来,两者之间存在很大的差异,所以

我们经常做的一件事,当我们真的在努力推进它时,就是让房子里的人过来看看情况。可能是凌晨1点或2点,人们仍在建设,有很多讨论,事情进展很快,等等。这可能是我对公司建设最感激的事情。什么不确定性?

最让你感兴趣的是什么,而这又超出了你的控制范围?有趣。是的。我实际上经常思考的一个不确定性是广泛采用

现在对我来说非常清楚的是,这项技术将会实现,或者在很多情况下已经实现了,它将产生极其重大的影响。我认为我们在不同行业中看到它发生的速度将会非常引人入胜。我们都可以想到医学、法律等方面的事情,你当然可以想象这需要时间。然后显然还有整个分销领域。

我会称之为胜利,路易斯安那州巴吞鲁日的所有人都因为人工智能的工作而生活得明显更好。

每个地方的曲线都不同。显然,我认为我们在软件方面很幸运,开发人员天生就很好奇,总是想尝试去做。但我确实认为,采用率将是这项技术的一个真正的问题,因为我认为进步的速度将如此之快,以至于某些地方的技术将远远领先于现实。当我们第一次在一起时,你做了这个令人难以置信的纸牌戏法。你愿意为我们表演吗?是的,让我们来做吧。告诉我们这个戏法的起源。是的。这是一个纸牌戏法。

所以我甚至不会称之为纸牌戏法。它更像是一个纸牌游戏。从小到大,我一直玩一个叫做24的游戏。这是一个小小的数学游戏。我认为它实际上非常有助于提高数学的熟练程度。我认为学习加法、乘法等等是一回事,这显然是超级基础的构建块。

但也有很多是这种创造力和这种用数字推理和试验数字的能力。所以我将展示这个游戏的样子。所以这个想法是你有四张牌,有四个数字。顺便说一句,J是11,Q是12,K是13。所以我们将处理的四个数字是4、7、8和12。这个想法是你可以按任何顺序、任何组合使用这四个数字。你可以加、减、乘、除任何这些数字。你的目标是

组合一个方程式,使用所有这四个数字,得到数字24。所以在这里,我会这样做:12减8等于4,4乘以7等于28,28减4等于24。所以你可以看到它如何利用很多这种创造力,就像,“嗯,弄乱这个数字4,

24是4的倍数。所以如果我能从其他三个数字中得到一个6,那么也许我可以做些什么。事实证明你不能完全做到这一点,但你可以得到一个7,然后减去另一个4,诸如此类,你正在玩这些想法。所以在这些数学营和编程营中,我们总是玩这个游戏。最终我们达到了这样的程度,你学会了24的所有组合。你只需要知道大约1300种组合。并非所有组合都是可能的,但对于那些可能的组合,你都知道了。所以我们接下来做的事情是,我们拿六张牌,得到163。

所以我将再拿六张牌。例如,在这种情况下,我会这样做:11乘以2等于22,22减3等于19,6加10等于16,16乘以9等于144,144加19等于163。

所以你可以想象,这很有趣。我们会在数学营期间,在为美国队进行团队选拔训练时玩这个游戏。基本上在比赛之间,我们会一直玩这个游戏。最终你达到了这样的程度,你掌握了163的很多模式,你看到了很多东西。所以我们接下来做的事情是,我们用八张牌得到当前年份。所以现在是2024年。所以让我们继续这样做。

所以13减12等于1。这实际上相对容易。我只是取1乘以1乘以1,我们仍然得到1。13加10等于23。23乘以11等于253。253乘以8等于2024,乘以1仍然是2024。难以置信。最终你学会了所有这些模式。所以很明显,接下来有趣的事情是我们必须做一个自定义数字。几位数?四位数?是的,是的。让我们做7532。

7、5、3、2。好的,所以它有点大,所以我们将使用九张牌,好吗?好的,所以11乘以7等于77。77减2等于75。我们这里有两个10,这是一个很好的100。所以这就变成了7500。

然后从这里,9乘以4等于36。3加1等于4。36减4等于32。所以7500加32等于7532。太神奇了。我不知道你是怎么做到的。你在做什么?计算背后的方法是什么?或者有多种方法?我想这其中很多是直觉,是你随着时间的推移而建立起来的。

例如,对于163,很多这些小事情,我知道,好吧,11乘以15等于165。所以如果我能得到一个11和一个15,然后我可以得到一个剩余的2,那么我可以做165减2,然后我就在寻找那个。所以根据我看到的数字,我正在求解类似的东西。

这很大程度上取决于你得到的模式等等。我认为这实际上是一个非常适合孩子们的游戏。这是我最喜欢的游戏,作为一个三岁的孩子,或者其他什么,玩四张牌的24,因为其中很多东西真的推动了数字感。这不仅仅是一个你能否加两个数字的问题,而是你能否真正地围绕它进行推理?就像,你知道这意味着什么吗?并且对你的数字有创造力,我认为这是你真正想要学习的核心技能,而不仅仅是机械的部分。

我认为你正在构建的东西对我来说非常酷,因为实际上你下游正在做的事情是释放比目前能够通过计算机科学和编程来构建事物的人更多的创造力。我只是认为这对世界来说是一件非常酷和令人惊奇的事情。我希望你和其他人能够成功地做到这一点。当我做这些采访时,我会问每个人同样的传统结束问题。别人对你做过最善良的事情是什么?

在我的一生中,我最常想到的事情是,老实说,就是我所拥有的一切导师,以及他们付出的巨大努力。即使是一个孩子,你可以想象,就像为美国队的国际比赛进行训练一样。这很有趣,因为我从来没有教练。我从来没有正式的“这个人”。但我确实有几个人,特别是其中一个人,他真的投资于我,并且相信我。你知道,他真的是那个真正推动我的人。我是一个高中生。我有

除了整天做数学之外,我还想做很多其他事情。他会一直鼓励我,说,“你必须练习,你必须做这件事。”每当我做错什么事情时,他都会说,“是的,你不能犯那个错误。我们将这样做。”他投入的所有时间,老实说,一切都是从那来的。我觉得我实际上只是我所接受的所有指导的总和,

我认为初创公司也是如此。我可以想到几个人。同样,我可以想到一个人,他真的指导我度过了很多难关,引导我度过了很多事情,并且是那个给我严厉批评和反馈,以及告诉我重要的事情,并鼓励我做得更好、做得更多的人。人们通常认为善良是牺牲。但我确实认为,实际上,很多最伟大的善良是关于一起构建更多东西,一起做更多事情。Scott,非常感谢你的时间。非常感谢你,伙计。谢谢。

如果你喜欢这一集,请查看joincolossus.com。在那里,你会找到这个播客的每一集,包括完整的文字记录、节目笔记和学习资源。你还可以注册我们的时事通讯Colossus Weekly,我们会在其中将剧集浓缩成重要的想法、引言等等,并分享我们每周在互联网上找到的最佳内容。

希望你喜欢这一集。接下来,敬请期待我和日内瓦资本管理公司投资运营和投资组合管理主管Katie Ellenberg的对话。Katie详细介绍了她使用Ridgeline的经验以及她从他们的产品中获得的最大益处。要了解更多关于Ridgeline的信息,请务必点击节目说明中的链接。

Katie,首先描述一下你在日内瓦关注的是什么,以便在投资方面尽可能地做好事情。我是日内瓦资本的投资运营和投资组合管理主管。我的重点是为公司、为投资团队提供最佳支持。你能描述一下日内瓦做什么吗?我们是一家独立的投资顾问,目前管理的资产超过……

超过60亿美元。我们专门从事美国小型和中型成长型股票。所以你有一些高端投资者,他们想买卖东西。而且你肯定以各种方式收集了各种投资者的资金。介于两者之间的一切,我都感兴趣。你解决为投资者构建基础设施这一挑战的时代是什么?我们使用了之前的提供商超过30年。他们为我们做得很好。我们拥有全套产品。

从投资组合会计到交易订单管理、报告、对账功能。在我们现有的系统上使用了30年后,我认为我们永远无法切换到其他任何东西。所以这甚至不在我的脑海里。我们的首席交易员Andy建议我和Ridgeline见面。他接到了Nick Shea的电话,

他与Ridgeline一起工作,Andy和我都不知道Ridgeline。我更像是为了帮Andy一个忙才这么做的,而不是因为我真的很想见他们。我们刚刚搬进了我们的办公室。我们没有任何家具,因为我们刚刚搬家。所以我同意在楼下的自助餐厅与他们会面。我想,好吧,这将是一个简短的会议。老实说,Patrick,我甚至没有盛装打扮。我穿着牛仔裤。

我的头发扎起来了。我完全是出于帮忙才这么做的。我下楼到自助餐厅,我想我和Nick见面,结果和他一起走进来两个人,Jack和Allie。我就像……

现在有三个了。我这是给自己找了什么麻烦?我的真正意图是想让它快点结束。他们一开始就介绍了他们的公司,以及他们正在招聘谁。这引起了我的注意。他们几乎是在组建一个由技术专家组成的梦幻团队来开发这个完整的软件系统,从查尔斯河和Faxit、彭博社招募人才。我想,招募最优秀的人才,这有多么聪明?

然后他们开始谈论这个单一数据源。我当时想,这是什么?我甚至无法想象,因为我太习惯于所有这些不同的系统和彼此叠加的不同模块了。所以我想要了解更多关于这方面的信息。当我与许多其他供应商会面时,他们总是给我一个非常高级别的推销。哦,过渡到我们的公司,这将非常容易,等等,

好吧,我知道30年的数据不会很容易过渡。所以我喜欢立即给他们提出具有挑战性的问题,在大多数情况下,其他供应商甚至无法回答这些细节。

所以我心想,好吧,我要尝试对Ridgeline采用同样的方法。我问他们一个关于我们的证券主文件的问题。是Allie立即以如此专业的知识回答了我的问题。她立即知道我在谈论这些旧证券,并告诉我他们将如何解决这个问题。所以,当我第一次遇到Ridgeline时,这是我第一次回到办公室,做了一个笔记,说,“现在这是一家值得关注的公司”。

所以我们确实继续与我们的供应商续签了几年的合同。当他们与一家更大的公司合并后,我们注意到我们的服务有所下降。我知道我们需要更好的服务。

与此同时,Nick 一直与我保持联系,并告诉我Ridgeline的最新情况。所以他们邀请我参加Basecamp。我会告诉你,那是我真正下定决心要走哪个方向的时候。在那次会议结束后,我感到很舒服,并且知道,好吧,我认为这些人……

真的可以解决未来的问题。他们正在解决我需要的所有关键任务,我对他们提供的一切都感到非常好奇和印象深刻。我最喜欢的三个方面,显然,是单一数据源。我必须提到即将到来的AI功能。客户门户,这是我们以前没有的东西。这将进一步提高我们季度末处理的效率

但另一方面,是我们与Ridgeline团队建立了这些关系。我的意思是,他们是专家。我们不再只是一个数字。当我们打电话给服务部门时,他们知道我们是谁。他们完全支持我们。

我知道他们不会让我们在这个过渡中失败。我们现在能够比以往任何时候都更进一步。现在我们可以真正开始跳出框框思考,我们可以把它带到哪里去?Ridgeline是整个包。所以当我查看其他公司时,他们只能解决我们拥有的部分内容和我们需要的部分内容。

Ridgeline是整个包。而且不仅仅是这些,再次强调,它是为整个公司构建的,而不仅仅是运营方面。Ridgeline团队已经成为我们的家人。