Superhuman工程主管Loïc Houssier加入我们,讨论AI和大型语言模型如何重塑邮件体验。他重点介绍了与用户提示的可变性和基础设施优化相关的挑战。Loïc强调,专注于用户体验和真实的人工流程是构建人们真正喜欢使用的AI工具的关键。 特色: Loïc Houssier – 领英 Chris Benson – 网站、GitHub、领英、X Daniel Whitenack – 网站、GitHub、X 链接: Superhuman 免费试用一个月推荐码 赞助商: 思科的Outshift – AGNTCY是一个开源集体,正在构建代理互联网。这是一个协作层,AI代理可以在其中通信、发现彼此并在框架之间工作。对于开发人员来说,这意味着标准化的代理发现工具、无缝的代理间通信协议以及组合和扩展多代理工作流的模块化组件。</context> <raw_text>0 欢迎收听Practical AI播客,本播客旨在使人工智能对所有人来说都实用、高效且易于访问。如果您喜欢这个节目,您会喜欢The Change Log。周一发布新闻,周三进行深入的技术访谈,周五则是一个适合您周末欣赏的精彩脱口秀节目。您可以在收听播客的任何地方搜索The Change Log来找到我们。
感谢我们在Fly.io的合作伙伴。在五分钟或更短的时间内启动您的AI应用程序。在Fly.io上了解详情。♪
欢迎收听Practical AI播客的另一期节目。我是Daniel Whitenack,PredictionGuard的首席执行官,一如既往地由我的联合主持人Chris Benson加入,他是洛克希德·马丁公司首席AI研究工程师。Chris,你好吗?我很好。期待在这个美丽的春日里聊一些有趣的事情。是的。
是的,是的。我一直希望人工智能能让我成为超人。所以,今天真的非常兴奋地听到Loic Oussier关于这方面的内容,他是Superhuman的工程主管。Loic,你好吗?我很好。
我很好。我很高兴能与你们聊天。过去我与一些非常谦逊的嘉宾在一起。所以我很高兴有机会详细讨论。是的,太棒了。我知道这很有趣,因为我知道超人……
我认为是第一个真正集成的AI优先工程工具之一,我记得我见过。当然,在那段时间里,AI领域已经取得了很大的进步。也许你能给我们一些关于
AI在电子邮件或更广泛的生产力方面的现状,如果你想考虑的话。但我的意思是,显然我们将讨论很多关于电子邮件和消息传递的内容。所以你能让我们了解一下目前的形势以及Superhuman是如何融入其中的吗?是的,完全正确。我们现在所处的时代令人难以置信。
当然,就像每个人在看到这些大型语言模型的第一个版本时一样震惊,比如做一些疯狂的事情,比如分析文本、总结和做各种神奇的事情。当然,电子邮件在大多数情况下都是基于文本的。
所以它是一个非常好的测试平台,可以尝试所有你能做的很酷的事情。有趣的是,这也帮助了这个类别,比如电子邮件客户端类别。
在相当长的一段时间内蓬勃发展。Superhuman几乎是唯一一个增强Gmail和Outlook的工具。我们是这个领域唯一一个让用户更快地处理电子邮件的人,等等。随着大型语言模型、代理和所有其他事物的兴起,现在有很多人说,哦,这是一个非常棒的环境,可以用来玩耍和改进。
现在,这就是我们看到的。我们看到很多,我想说的是,其他工具试图用大型语言模型做一些事情,以创造更好的电子邮件体验。这确实……
对我们来说很有趣,因为这证明了这个类别需要存在,它之前就存在,但我们是唯一一个在那里的人,现在越来越多的人来到这里,表明人们对此有浓厚的兴趣,而且很有挑战性,而且非常有趣,我们可能会讨论它,但这也会
帮助我们理解什么构成了一个好产品,仅仅是大型语言模型和人工智能就足够了吗?或者你需要在它上面添加某种秘密调料?我很乐意讨论这个问题。正如你一样,我很好奇,接下来是Daniel对你们在该领域处于早期阶段的看法
显然,我们不仅有大型语言模型,而且人工智能总体上一直在以光速发展,在那段时间里稳步增长。
情况如何?从成为早期唯一的参与者到进入其他参与者的领域,这个领域对你们来说发生了怎样的变化?它正在变得拥挤,不仅在你们所在的领域,而且在所有领域。这对你们来说在保持差异化等方面改变了世界吗?是的。所以,所以这非常有趣,因为我们可以讨论多个维度,比如,
首先,这些AI功能和能力的兴起带来了你可以实现的新功能,而这些功能在过去是无法实现的。在过去,人工智能主要用于分类,比如添加标签等等。这几乎是人工智能对所有基于文本的内容所能做的极限。所以典型的分类器,典型的……
这样的模型。现在你可以做更多聪明的事情了。所以我们从一个地方转移到了另一个地方
与Outlook相比,与Gmail相比,我们让用户更快地工作。但现在我们可以做更多的事情,所以我们可以让事情变得更聪明,这可能是我们在为用户创造价值方面的一个范式转变。另一个维度是这提高了不同用户的期望。
很长一段时间以来,他们都认为,这太快了。我每周能节省四个小时来处理我的电子邮件。但每个人都习惯了与GPT聊天。每个人都习惯了复杂性。每个人都喜欢用Sora创作图像甚至电影等等。所以,对技术的了解和理解程度大大提高了。所以对于我们的用户来说,期望水平是,嘿,超人,
我现在期待这个。我现在期待这个。另一个维度是从工程的角度和构建的角度来看,我们的工具集完全不同。工具已经改变了,三年前甚至两年前,甚至六个月前工作的工程师,现在,工作流程和所有设置都发生了巨大的变化。也许像
我认为真正难以理解的最后一个维度是感知质量。Superhuman被认为并建立在一个单一维度上,那就是它具有很高的质量。我们负责质量,因为我们掌握一切。因此,您可以拥有零错误策略。您可以花时间提供价值,但它必须完美无缺。现在有了大型语言模型,
很多感知质量取决于你的提示。所以你有一些用户使用不同的技能或不同水平的技能来提示,而这个提示的结果可能会被认为是低质量的,但这很难控制。它正在创造一些像
从工程的角度来看,令人难以置信的事情。我的意思是,我们都在科技领域工作,工艺、错误等等,有一些过程可以限制错误的数量。但是现在,质量不仅仅是错误。它也是基于用户的这种感知质量。这是一个有趣的问题,我很想知道,当你……
你提到了这样一个事实,即对于一些提示和不同的用户来说,他们的技能水平等等。你能谈谈你是如何解决这个问题的吗?从我的角度来看,这是一个有趣的事情,因为在这个世界上有很多小问题
一个普通人永远不会想到提前考虑。所以,作为那些事情之一,提示本身在技能方面是相当多样化的。你能谈谈一下,当你试图制作一个产品并关注质量问题时,你是如何处理这个问题的吗?老实说,
我不会想到要考虑解决这种问题。你能谈谈这个吗?我会告诉你我们在第一季度发布的一个特定功能。所以我们有这些自动标签。所以自动标签基本上会标记你的……
你的电子邮件,根据标签,你可以决定完全跳过你的收件箱,典型的例子是来自想要联系你以销售其产品的公司的随机推销邮件,我每天大概收到30封这样的邮件,我想查看这些邮件并回复所有这些邮件吗?可能不会
可能不会。所以我希望它们基本上被完全跳过。所以对于这些,我们构建的分类器不依赖于用户提示,这样我们就可以控制质量、精度、召回率等等。但我们也允许用户创建和设计自己的标签。
假设你想说,哦,我想让我的所有播客邀请都具有相同的标签。但是你不能只使用确定性规则来做到这一点,因为我不知道所有播客的人等等。所以你不能像Gmail那样进行过滤,你不能说如果……那么……那么……所以你必须提示它,你必须允许用户设计一个提示来显示所有这些。但是
但是这个提示很棘手,因为如果你有人只写一行,你就会遇到一些问题,因为基于单行提示的精度和召回率不是很好。我想,正如你的听众一样,他们一直在使用Chat GPT或一般的提示,
结构越完整、越广泛,结果越好。如果你只有一行,就会发生很多幻觉,因为缺乏上下文和缺乏所有这些。所以当然,你会做一些系统提示来围绕这个用户提示,以避免太多
太多的问题。但你也需要进行一些教育。我们现在正在研究这个问题,那就是,你的提示看起来很有趣,但你可能想这样来组织它。所以我们正在研究一些这样的东西。此外,共享提示,比如提示库,是我们越来越关注的事情,因为
不是每个人都能设计一个好的提示,也许你的团队中的某个人会设计一个你非常乐意使用的提示,如果你可以访问它的话。所以它有点像,我的意思是,它非常以产品为中心,所以它不是以人工智能为中心,你需要解决这个问题,是的,
我希望我们有一个简单的答案来解决这个问题。但我认为我们是在边走边学。但这非常有趣。我想知道,我一直对理查德·哈明写的一本书很感兴趣。他谈到的一件事是,如果你重新思考一个以前非常人工和手动完成的过程,那么你将这个过程变成一个增强型或机器驱动型过程的方式通常与原始人工过程非常不同
在电子邮件客户端中,
我们都期待电子邮件客户端具有一定的流程和外观,这些都是随着时间推移而发展起来的。在向用户呈现与以往大相径庭的电子邮件客户端方面,你发现了什么?需要保留哪些内容?哪些内容是可以改变的?应该扩展哪些用户?哪些需要保留?你是如何考虑这个问题的?
这真的很有趣。这是一个非常有趣的问题,因为我们正处于这样一个时刻,用户与计算机、与系统的交互方式正在发生巨大变化。
人们不再期望点击不同的窗口。期望是不同的。比如Chat EPT或其他类似的工具,你基本上有一个聊天框,你可以在那里询问所有内容。即使你正在处理文档,你也会询问……
在聊天机器人上,哦,你在我的文档中找到了什么,并重写我的精确摘要?哦,让我的语气更像X和Y和Z。你不会期望有一个按钮,就像过去的Microsoft world一样。所以,嗯,我们才刚刚开始这个……这个转变。所以我认为,嗯,
就像竞争等等一样,现在进入几乎任何SaaS应用程序或给定的消费者应用程序的门槛非常低,因为至少构建POC非常容易,至少构建POC非常容易。我不会说像
比这更远。而真正能产生差异的是产品测试,以及你如何了解你的用户以及你如何了解他们的用户交互。这就是我觉得在Superhuman工作感到自豪的原因,因为我们的首席执行官在用户交互和愿景方面是一个怪才,并且已经在考虑这个问题以及未来交互将如何发展。而且
它会改变。它会不同。那么什么会保留?什么会略有不同?我很确定对话方面将是一个强大的范例。现在,你不会说太多话。
无论是通过键盘还是麦克风,你都不会真正与你的系统交谈。你不会与应用程序交谈。也许你开始与ChatGPT交谈,因为它们有很好的语音交互。也许你使用WhisperFlow或这些类型的工具来编写你的电子邮件或在Slack中编写你的消息。但你还没有真正命令设备在你说话时做事情。但越来越多的人这样做。我
我现在可能比打字更多地与我的电脑交谈,这很有趣。所以这是一个变化。我们过去所做的一切大多是点击、点击、点击。Superhuman从像常见的键和键盘为中心的方式开始,为那些真正想要提高生产力的人提供服务,因为像使用鼠标切换一样,
相当慢。现在越来越多的人开始使用语音。所以所有这些都会改变你的思维方式、你呈现数据的方式、你与数据交互的方式以及你集中注意力的方式。所以这是一个有趣的领域。但我相信有一件事会保留下来,正如你所说,Daniel,
我会特别谈谈电子邮件。收件箱的概念,比如拥有某种你需要浏览并处理的事情的时间线,以及处理那些最需要关注的事情的概念,某种程度上来说,任务列表会保留下来。现在,它将如何呈现,你将如何浏览它,将会随着时间的推移而发生巨大的变化。我们已经看到了这一点。
朋友们,使用Agency(A-G-N-T-C-Y)构建多代理软件的未来。Agency是一个开源集体,正在构建代理互联网。这是一个协作层,AI代理可以在其中发现、连接并在框架之间工作。对于开发人员来说,这意味着标准化的代理发现工具、无缝的代理间通信协议以及组合、集成和扩展多代理工作流的模块化组件。加入Crew.ai、Langchain、Lambda Index、Browserbase、思科以及其他数十家公司。Agency正在发布代码、规范和服务。没有任何附加条件。你现在可以与其他关心高质量多代理软件的工程师一起构建。访问agency.org并添加您的支持。那是
agntcy.org。
所以当我们进入休息时间时,我们正在讨论重新思考的概念。我很想知道,当你考虑重新思考时,你也在应对你团队用来实现某些东西的技术本身的演变。
我们随着时间的推移所看到的一件事是,这并不是一个平稳的增长。你可能会在一段时间内对模型能力进行进化式改进,但你也会在沿途发生一些跳跃。
对于你的产品团队来说,当你正在展望你的产品的未来,并且你遇到了这些时刻,它从模型的可预测改进转变为这些跳跃时,这会如何影响你内部的产品开发周期?正如我们讨论重新思考一样,你是否会有一些时刻,
也许是时候进行一次深思熟虑的重新思考了,因为上周发生了一些我们没有预料到的技术能力方面的变化。我们将这样做。当你们身处这个行业时,你们是如何处理这种情况的?不,这非常有趣。Daniel,你提到了一本书,但当我问这个问题时,想到的一本书是乔·弗雷默的《胜券在握》。它谈到了持续创新和颠覆性创新。
这可能就是我们正在讨论的内容。我们不断创新,不断向产品中添加更多功能和新内容。有时你会有机会提供一些具有颠覆性的东西,无论是底层技术具有颠覆性,还是因为你有一些
哇的时刻,你就像一个有远见的人,这就是前进的方向,我们需要转向,或者我们需要做一些非常不同的事情。我们特别在人工智能领域看到的现象是,这些颠覆性创新的速度
我想说,在某种程度上,在人工智能出现之前,技术创新可能是一年一次,每两年一次,就像你有一些全新的东西,并且像,“天哪,使用这个”,请原谅我的法语。但大型语言模型的有趣之处在于,每两周或三周,如果你不在Twitter上,不在Hacker News上,你可能会错过新的重要内容。
比如大型语言模型,比如多模型、推理、MCP,这些都在六个月内出现。
所有这些都带来了一套新的功能,你可以决定在你的产品中实现这些功能。所以回到你的问题,对产品开发有什么影响?你是如何处理这个问题的?首先,你最好敏捷,意思是真正的敏捷。你最好能够停止你正在做的事情。
然后说,哇,我们需要坐下来一会儿,因为这件事来了。我们该怎么办?你需要拥有,这就是为什么我喜欢规模较小的公司,因为很容易让每个人都听,这是一个新事物。我们需要做些什么。让我们现在就改变路线图。
如果你在一个更大的公司,那就更难做到这一点,因为你会有你的年度计划,这就像进入季度计划一样,你必须报告所有这些OKR等等。所以你基本上需要一个大约六个月的商业计划来解释为什么你想转向并做其他事情,这显然不是你规模较小的公司的情况。
Superhuman的工程、产品和设计团队可能大约有,我不知道确切的数字,但大约是40人。
也许是50人,但就是这样。这就是规模,你可以非常敏捷。你可以让每个人停止做某事,因为有些事情出现了,我们需要关注它。当然,我们可以做得更好。如果我的工程师正在收听这个播客,他们会说,Loic,也许你像你在夸张一点。所以我可能有点夸张。当然他们是,对吧?我的意思是,当然他们在听。当然他们在听。不,所以这是,
理解现在一切都在变化。所以你几乎每两周,几乎每两周都需要重新评估你的优先级。MCP来了。人们现在正在对其进行标准化。
我们该怎么办?我们该怎么办?我们应该疯狂投资吗?我们应该停止我们正在做的一切吗?我们应该,我想说,我们是否仍然相信这个愿景,它是否提供了更多价值?你需要每两周做出这些决定。所以几乎每周。所以要接近,我想说,一个紧密的团队
每天都在沟通,以确保你做出了正确的决定至关重要。顺便说一句,对于听众来说,你可能已经听到了MCP。如果我们做了一期节目来解释什么是MCP。所以任何不熟悉它的人,你应该回顾几期节目并听一听。这会给你一些背景信息。
是的。谢谢。谢谢,Chris。如果我使用了一些行话,我很抱歉,但是行话,行话,没关系。但是我们总是试图介入并向人们指出这一点。所以这是完美的。这是完美的。我认为展望未来,其中一件事,
我真的很想知道的是,我们已经,好吧,我们已经解决了人工智能和电子邮件的一些更大的问题,但我很好奇,你知道,如果我们深入研究Superhuman的特定功能,你知道,什么,
你如何看待你目前正在发布或正在考虑的未来最有用的人工智能电子邮件功能?你知道,当你深入研究产品时,你是如何开始考虑这个问题的?我想说的是,所有用户都在谈论的一个功能,因为他们非常喜欢它,那就是一个名为Autodraft的功能。
你收到一封电子邮件作为线程的一部分。有人问你一些问题,或者你发送一封电子邮件说,嘿,我们下周能见面吗?两天后,你没有得到答复。你通常想把它放到他们的收件箱里等等。我们构建了这个功能,它可以为你创建准备发送的草稿。
在大型语言模型的使用方面,这并不令人震惊。你提供上下文,你使用与那个人一样的语气等等。你起草了一个听起来像是回复它的好方法的草稿。结果令人难以置信。用户发现它非常令人上瘾,因为它
相对准确,而且他们节省了很多时间。这只是关于节省时间。我们的用户大多是首席执行官、首席执行官、销售人员以及一些咨询公司。他们每天都在处理电子邮件。所以每天
你可以让他们节省10秒钟,对他们来说是一个巨大的胜利,考虑到他们收到的电子邮件数量。所以这是一个非常有效的功能,即使它听起来很简单。所以Loic,即使根据你刚才的描述,为每封电子邮件创建自动草稿,也许是一个大型语言模型调用,进行分类,自动标记,也许还有其他调用,
我不知道每封电子邮件有多少大型语言模型调用或链式调用,但这可能很多。如果你对一封电子邮件这样做,没问题。你对我的所有电子邮件都这样做,那就更多了。如果你对成千上万甚至数十万人的所有电子邮件都这样做,那就太多了。作为一家
更多的人工智能应用程序公司,Superhuman是如何考虑基础设施优化或人工智能、生成式人工智能的使用、托管你自己的模型、微调你自己的模型以及使用更小的模型的?你是如何考虑这些问题的?
不,这是一个很好的问题,在某种程度上这是一个真正的挑战,有时甚至是一个问题。我想说我的工程师们非常热衷于财务。他们了解推理成本、输入成本和输出成本。他们了解不同模型之间的区别。所以我们必须制定一些高级原则来保持快速发展,以便他们知道
我想说的是如何默认以及只有升级。他们有一些问题。我会给你举一些例子,但如果这是一个新功能,我们不知道它是否有效等等。所以仍在测试,我们希望它很棒。所以我们采用最昂贵的模型。它有效,我们有牵引力,并且
很好,这是一个好问题。现在是时候开始考虑优化成本了。也许你会切换到一个更便宜的模型,也许是更微调的模型。也许你会完全切换到不同类型的模型。例如,我们讨论过的分类,大型语言模型在分类方面还可以,但对于相同的质量,你可以使用像BERT类型的模型,成本要低得多。
推理成本只是它的一小部分。一小部分。所以长话短说,这就是我们为最终用户提供价值的方式。我们尝试使用最好的工作方式。我们事后进行优化。这回答了你的问题吗?不。
总的来说,我认为这始终是正确的方法,那就是现在不要关心成本,如果它没有成为问题,因为你总是想提供最好的体验。如果你没有牵引力,那就太糟糕了。因为如果你试图从小处着手,因为你害怕成本,你就会使用一个更便宜的模型。用户的反馈会是,伙计,
他们不会使用你的功能。然后你不知道是因为这个功能没有很好地定位,还是因为模型的原因。以最好的方式定位,你可以得到更好的答案和更好的见解。
从我的角度来看,这是一个非常有趣的答案。你明确地指出,当你获得这个功能并继续使用最好、最昂贵的东西时,然后将其拉回到效率将会是什么。
再一次,我们在节目中经常提到的一个问题是,人工智能方面的软件工程应用以及类比。所以我只是,我只是想指出这一点,因为我认为这是一个你提出的很好的见解,并且它有影响。我很抱歉打断你,Chris,但它对构建应用程序的方式有重大影响,因为你想能够切换模型,切换应用程序
你想要得到的输出相关的启发式方法。所以你必须投入一些时间来找到一种相对容易切换的方法,可能对不同的人群进行 A/B 测试,以衡量感知差异。因为再次,存在……
并非所有事情都是非黑即白的。就感知质量而言,现在存在灰色细微差别。因此,你需要采用更多统计方法来了解一个模型与另一个模型的影响。当然,我们有内部评估等等来进行我们的研究。
我们自己的测试,例如使用我们的黄金数据集。但现实情况是,我们有一批多样化的客户,每个人都不同。因此,我们需要比仅仅依赖我们自己的数据集更广阔的视角。
是的,Loïc,我很感谢你深入探讨了一些技术方面的内容,并谈论了你对这些优化的思考方式。显然,你领导着 Superhuman 的技术工作。我想知道你是否从长期的 AI 工程中吸取了任何教训。我们有很多从业者在收听。你有什么想传授的通用原则或经验教训吗?是的。
这是一个好问题。也许我学到的一件事是,作为一个 CTO,我需要与我的其他领导团队讨论,我们讨论功能的成功以及所有事情。谈论质量的典型方式通常是根据错误数量等等。现在,我早些时候就谈到了这一点,但感知质量
就像我们身处一个使用 LLM 具有更多细微差别的世界。因此,设定正确的期望,基本上解释了该功能的构建方式,有时由于反馈不佳而失败,这可能不是因为它没有很好地实现。但也许还有更多原因。也许其中一部分是感知。也许提供的最终用户自由度太大。也许在提示方面有一些工作要做。这就是立即影响到我的事情。
在一开始,人们对该功能的看法是,“哦,这是,这是糟糕的工作。它不起作用。人们在抱怨,伙计们。你们做了什么?”而这项工作做得很好。它实现得很好,等等。呃,但是,呃,此类功能的感知质量可能完全不同,这取决于,呃,呃,那些,呃,那些新的方面。所以也许我的经验教训是,呃,
现在只是在你基本上发布新功能时非常明确地说明感知质量的风险,以及错误的来源在工程方面较少,而在用户方面可能更多。在用户教育、产品内教育方面需要做很多工作。因此,在产品主导的增长方面投入更多努力,这将对未来成功产生巨大影响。这可能是一个。第二个是,这很有趣,因为我每天都能看到它,我们正在向上游市场发展。
我们有很多正在向上游市场发展的初创公司。因此,你开始拥有属于财富 500 强的一部分的公司,他们想要使用你的产品。我来自一个将企业迁移到企业非常繁重的地方。你需要很多功能。你需要进行大量的合规性检查。你需要……
基本上,很多事情并非直接改进你的产品,而是提高这些公司对你是与他们合作的正确合作伙伴的信心。现在发生了转变。在 1400 美元,以及所有企业市场中,这种转变是显而易见的,尤其是在 AI 方面,与
较低的合规性或你是一家小公司,我们是否应该信任你,完全被错失机会的风险所抵消。机会成本太大了。现在我们肯定看到来自首席执行官对其安全团队的推动,这些 AI 工具和生产力工具,基本上说,“伙计们,你们需要让它发挥作用。”
你们需要让它发挥作用,因为它极大地提高了高管的效率。
以及公司其他人员的效率,你知道吗?我们可能已经准备好承担风险了。即使它是一家 A 轮、B 轮、C 轮公司,而且可能尚未完全成立,或者也许,是的,他们正在处理我们的电子邮件,这是我们业务的核心数据集,我们需要对此坦诚相待。也许他们更乐意接受。当然,我们需要做这项工作。你需要像……
你需要证明你是合适的合作伙伴。但最初的方法正在改变,动态也在改变。因此,它基本上偏向于“让我们让它发挥作用”,而两年前,它可能是“向我们证明你是一个可靠的合作伙伴,然后我们将看看我们是否进行这个概念验证”。现在完全相反了。所以是的,这是一个有趣的动态,它对现在构建产品的方式很有用。
我很想知道。而且,你知道,我们可以谈论 AI 领域发生的所有这些非常酷的事情,以及它们如何影响产品和服务。而且,你知道,LLM 现在可以做很多事情。而且,你知道,我们正在进入 AI 的代理时代,而且这种情况正在加剧。
但是,你知道,工作流程中仍然有人类。而且,人类仍然带入工作流程的关键因素是什么,而不是我们能够利用的所有这些令人惊叹的技术?鉴于你拥有如此强大的技术能力围绕着他们,你如何看待未来的人类工作流程?
这是一个有趣的问题。我想答案几乎就在问题中。这就像难以复制的人类部分。所以,我的意思是,创造力、定义能力、检测模式等等。所以我认为 LLM 的兴起正在帮助我们摆脱所有平凡的事情。我过去,我会给你举一个例子。
我进行很多面试,因为我招聘工程师。作为每次面试流程的一部分,你会为团队撰写一份简报供其使用。撰写一份有见地的简报需要时间。这需要时间。我可能在每次面试后都会花费 20 到 30 分钟来列出优缺点。
问号,例如需要深入研究的领域。现在我们几乎都在使用会议记录,例如,使用成绩单,以你想要的方式进行格式化。你只需要在这里和那里添加你的快速想法,并像那样加下划线。所以现在,从 20 到 30 分钟,这只需要我三分钟,然后,它就会上传到任何 ATS 工具,例如 FormHR。这是一个例子。
与我的人员进行会议记录。我进行一对一会议。我想要跟踪我们所说的一切。我过去会做笔记。在某种程度上,我仍然会做一些笔记。但是现在的成绩单非常好,我不必记录所有内容。所以我只记下我想保密的一些关键要点。其余内容已共享。
现在它正在为我构建一个数据库,例如我可以在任何时间查询以查找信息的桌面信息。因此,这取代了我过去所做的所有平凡的工作。我可以专注于一定程度的脑力。
这绝对正在改变。我的工程师也是如此。我的工程师们经历了,我认为,从填充转移到填充转移,并随着时间的推移改变了他们构建软件的方式。由于这些新工具,他们的速度不断提高。他们也必须以不同的方式思考,但这在某种程度上仍然很愚蠢。所有这些工具,基本上就是一个实习生。
这是一个实习生。所以你需要审查。你需要花时间审查输出是什么,例如
例如你的新 ID 是 Cursor,是 C-line,是任何东西,例如这些工具,你需要审查所有内容,因为有时它会犯一些常规工程师不会犯的疯狂错误。但我认为这为我们的工程师节省了大量时间,他们可以专注于他们工作的核心,即了解用户,了解需要发生什么以及实现它的最聪明方法。
LLM 只是很好的助手,可以加快速度。但到目前为止,就是这样。但它每天都在变化。它每天都在变化。
是的,Loïc,你提到了编码和氛围编码,你知道,这让人想起。我几乎想知道,你知道,随着所有这些 AI 功能的出现,电子邮件将出现新的现实。我知道当我使用氛围编码工具时,我必须学习一种新技术。
一种新的工作方式,我必须管理不同类型的脑力负荷,例如大量的上下文切换,你知道,以不同的方式指导模型。这是一种不同的脑力负荷,一种不同的技能。你是否看到在以下方面出现了类似的情况,你知道,我与电子邮件的互动,以及,你知道,学习一种不同的
以良好的方式处理这些事情,但也以具有挑战性的方式来重新调整我的思维或重新训练我的思维,以这种氛围电子邮件的方式工作。不,不,这是一个好问题。是的,
然后我们讨论用户交互以及它的演变方式。我们的工作是使这种转变(如果有的话)尽可能顺利。我们需要将用户带到他们现在所处的位置,并将他们带到他们最终将通过这种氛围
电子邮件到达的地方,如果这甚至意味着某件事的话。我不确定它背后是什么,但显然我们面临着变化。有趣的是,我最近一直在谈论,但现在初创公司,我认为,初创公司通常会过度重视工程师的资历,因为你需要能够管理噪音、管理混乱的人。它总是在变化。你需要有坚韧的人来管理它。
也就是说,我们看到,现在对于新毕业生来说,进入这个市场更难了。但是他们拥有一种资产,这使得他们可能与众不同。那就是大脑的可塑性。今年的应届毕业生,就像过去三年一样,他们看到如此多的新技术每六个月出现一次。他们不得不重新适应,他们不得不重新学习。所以他们的大脑习惯了这种思维转变,对吧?
嗯,就像每六个月一样,“该死的,这是新的编码方式,该死的,这是新的编码方式”,就像在我那个时代,最大的转变是从 svn 转到 git,就是这样,或者你有一个新的框架,或者你有一种新的语言,但这就像老样子,只是不同的风格,呃,所以,呃,我认为,嗯
那些天生就具备这种能力的人。我们伴随着互联网出生。他们伴随着 LLM 或 AI 出生。他们拥有这种大脑可塑性。我认为这将可能是从业者(例如全球工程师)面临的挑战,即如何适应这一点。因为我现在 45 岁了。
我不确定我的大脑可塑性是否还在。所以我需要跟上。我仍然需要尝试新事物,并且每天都挑战自己,这与五年前相比,那时我只是在调整我自己的方式,并使其随着时间的推移变得更好。这是一种模式转变。如果我不赶上这趟车,我可能会迷路。工程师也是如此。所以,这是一个有趣的时代。绝对是一个有趣的时代。呃,我必须说,如果你没有,如果你没有故意透露你的年龄,呃,
透露你的名字,我会说,svn 到 git 的转变会为你做到这一点。我认为 30 岁以下的人不会知道 svn 是什么。所以。对不起。对于这一点我感到抱歉。这就像我们正在谈论的我的白发一样。不,我绝对认为大脑的可塑性也让我很在意。我比你年纪还大。所以,所以我很想知道,你知道,当我们结束时,你知道,
你知道,现在有很多领域正在被覆盖。而且,你知道,你谈到了产品的演变,以及,你知道,新技术,你知道,撞击到你的当前计划,并不得不进行调整等等。是的。
如果你退一步,或者,你知道,一天的工作结束了,你正在思考未来,你正在思考比我们一直在谈论的时间范围更长一点的时间范围,你知道,电子邮件和消息传递等等,在这些技术下,它可以去哪里,在更长的时间范围内,当你进入,你知道,只是让你的思想漫游,并梦想可能是什么。
你对未来的想法是什么,你知道,总的来说?我们应该考虑什么,这并不一定会在未来成为科幻小说,但,你知道,鉴于事情的总体发展方向,日常生活?不,这是一个,我希望我知道。我希望我知道。但是如果我必须做一些科幻小说,很明显,我看到全球沟通,人与人之间的沟通是如此分散。
如此分散。就像我的家人,我使用 WhatsApp。在工作中,我使用,与我的合作伙伴等等,我们使用电子邮件。在内部,我们使用 Slack。但我们也喜欢在 Google Docs 线程中讨论,例如在评论中等等。因此,沟通非常分散,而且在不同的地方,因此很难确保你拥有
属于同一主题的所有内容都位于某种统一的收件箱中。所以如果我必须……
猜测我们在哪里,我不知道,我会说十年,但也许有了 AI,这会在六个月内发生。我会说,可能需要一种统一和集中的沟通方式,这是你首选的界面,无论它最终会落在哪里。这样做就像一种带来关注的方式。当我想与像这样的合作伙伴合作时,
在 AI 领域与所有这些大型提供商等等合作。我只想关注这一点,但我并不关心信息在我的电子邮件中、在 Google Doc 中、在 Notion 中、在 WhatsApp 中还是在其他地方。我希望这些信息能够整合起来,这样我就能知道在一个地方发生的一切。所以我认为在这方面会有很多工作要做。另一个非常有趣的是 LLM 的位置。入口点是什么?
我们看到 ChatGPT 作为一种入口点,但所有工具都具有嵌入式 ChatGPT 等效项。因此,无论你使用 Confluence、Notion,还是 Salesforce,还是任何类型的 B2B 应用程序,它们都有自己的特定聊天机器人。然后你会有像 Glean 这样的参与者,例如……
以及其他一些试图统一一切的参与者。这是怎么回事?所以我很想知道这一点。我们是想成为人们工作的地方,还是想拥有某种统一的体验,无论人们从事哪个行业?嗯,
我很想知道。我的问题比答案多。可以肯定的是,它会发展?我相信 Superhuman 正在以一种很好的方式做到这一点,而且人们往往喜欢它。因此,基于这种经验和对用户的同理心,我相信我们将在这个竞争中占据有利地位。
但是很有趣,Bryce。感谢你的见解。非常感谢你今天来到节目中,不仅分享了 Superhuman 的现状,还分享了你们如何应对挑战以及对未来的思考。有很多见解。我真的很感激。谢谢,Chris。感谢你与 Daniel 的时间。谢谢。
好了,这就是我们本周的节目。如果你还没有查看我们的 ChangeLog 时事通讯,请访问 changelog.com/news。在那里,你会发现 29 个理由,是的,29 个理由说明你应该订阅。
我会告诉你第 17 个理由,你实际上可能会开始期待星期一。听起来好像有人得了星期一的病。changelog.com/news 上还有 28 个理由在等着你。再次感谢我们在 Fly.io 的合作伙伴、Breakmaster Cylinder 的节拍以及你们的收听。现在就到这里,我们下次再聊。