大家好,欢迎收听 Latent Space 播客。我是 Alessio,Decibel Partners 的合伙人和常驻 CTO,与我一起的是我的联合主持人 Swyx,Smol.ai 的创始人。嘿,今天我们工作室请到了我的好朋友兼前房东 Will Bryk。是的,室友。你好吗?Will,你现在是 ExaAI 的 CEO 兼联合创始人,以前是 Metaphor Systems。你的背景和故事是什么?
是的,当然。所以,是的,我是 Exa 的 CEO。我已经做了三年了。我想我一直对搜索感兴趣,无论我是否知道。就像从小我就一直对高质量信息感兴趣。而且,你知道,即使在高中,我也想改进我们从新闻中获取信息的方式。然后在大学里,我建立了一个小型搜索引擎。然后有了 Exa,你知道,这就像实现了儿时想要解决所有信息需求的梦想。是的,我想。我会说我的一生都在围绕这个问题旋转,这很酷。是的。你用什么进入 YC 的?我们带着“我们比谷歌更好”进入 YC。
谷歌 2.0。你为什么这么说?这太大胆了,一上来就这么说。是的,好的。所以你必须记住当时的时间。这是 2021 年夏天。GPT-3 已经问世了。这是一个你可以与之交谈的神奇事物,你可以输入整段文字,它就能理解你的意思,理解你语言的细微之处。然后是谷歌,感觉它十年没变过了,因为它确实没变。你会给它一个简单的查询,比如,我不知道,“没有条纹的衬衫”,它会给你一堆有条纹的衬衫的结果。所以,谷歌几乎无法理解你,但 GPT-3 可以。理论是,如果你能做一个真正理解你的搜索引擎呢?如果你能将 LLM 的见解应用于搜索引擎呢?从那时起,这个想法就一直如此。我们现在实际上更接近于做到这一点。
你有没有遇到让人相信的困难?显然,有一个 Sam Altman,YC 重叠。即使在 2021 年,YC 也相当关注 AI 吗?它与今天完全不同。但是,有一些 AI 公司,但我们绝对很大胆。我认为人们,风投通常喜欢大胆,我们确实有一些 AI 背景,并且我们有一个可用的演示。所以有证据表明我们可以构建一些能够发挥作用的东西。但是,是的,我认为基础是存在的。我认为当时人们都在谈论谷歌在很多方面都失败了。所以关于这一点有一些讨论,但 AI 当时还不是一件大事。是的。在我们深入探讨 Exa 之前,有什么有趣的背景故事吗?我知道你在 SpaceX 实习过,有什么 Elon 的故事吗?我知道你也在 Zoox 工作过,你知道,就像哈佛大学的机器人技术一样。你早期看到的一些你认为会被解决但也许今天还没有被解决的事情?
哦,是的,有很多这样的事情。比如,我从未真正学会开车,因为我相信 Elon 的自动驾驶汽车会实现。它确实实现了,我每天晚上都乘坐自动驾驶汽车回家,但这比我想象的要多花 10 年时间。你仍然不会开车吗?我现在会开车了。我两年前学会的。那本来可以很棒的,你知道的,是的,是的,是的。你知道吗?我迷恋 Elon。是的,我的意思是,我在 SpaceX 工作是因为我真的只想在他的一家公司工作。我记得他们有一条规定,实习生不能接触 Elon。
而且那条规定确实影响了我的行为。是?身体上?还是谈话?身体上,身体上。好的,有趣。他改变了很多,但是,我的意思是,他的公司很棒。如果你在 Diablo 2、Diablo 4 中击败了他呢?哦,也许。是的。是的。我想深入探讨一下,因为我知道有很多背景故事。它以前被称为 Metaphor Systems。而且你一直是一家杰出的公司,至少在旧金山的 RAI 圈子里是这样。是的,我真的很想知道 Metaphor 是如何获得其最初的光环的。你们发布的东西很少。是的。
我们发布的东西很少。有一张很大的宣传图片,上面是极光之类的东西,对吧?然后我想,好吧,这是什么东西,氛围很好,但我不知道它是什么。我认为它更面向消费者,而不是你今天的样子。你会这么说吗?不,它一直都是关于构建更好的搜索算法的,就像搜索一样,愿景一直是完美的搜索。如果你做到了,我们会以后再弄清楚下游用例。它始于这样一个基本信念:你可以对网络进行完美的搜索。我们可以讨论这意味着什么。我们发布的第一件事实际上只是我们的第一个搜索引擎,试图把它发布出去。就像 OpenAI 发布 ChatGPT 一样,他们没有
我不知道他们有多少计划。他们只是想发布一些东西。一个神秘的研究预览。是的,没错。在那之后,它从一家研究公司转变为一家产品公司。我认为对我们来说也是如此,就像我们一样,我们从研究工作开始,目光清晰,如果我们成功了,它将成为一项巨大的业务。这基本上就是发生的事情。我认为 Exa 和 OpenAI 之间有很多相似之处。我经常说我们是搜索领域的 OpenAI,因为我们是一家研究公司
我们是一家进行基础研究以某种方式为搜索创建 AGI 的研究初创公司。然后我们从中学到所有这些业务产品。
有趣。我想多问一些关于 Metaphor 的问题,然后我们可以全面了解 Exa。当我第一次见到你时,这真的很有趣,因为我确实住在你位于海斯谷的一个非常历史悠久的地方。你说你正在构建某种链接预测基础模型。我认为今天 Exa 中仍然有很多基础模型的工作。但这到底是什么意思?我不会是唯一一个对此感到困惑的人,因为词汇量有限。你告诉我,标记是链接?这不明确。是的,我们所说的链接预测是指你实际上是在预测,给定一些文本,你正在预测后续的链接。是的。这指的是,这是我们描述训练过程的方式,即我们找到网络上的链接。我们获取链接周围的文本,然后我们预测哪个链接是后续的。所以你就像,你知道,类似于 Transformer,你试图预测下一个标记。在这里,你试图预测下一个链接。链接。
所以你从 Transformer 中隐藏了链接。所以如果有人写,想象一下某篇文章,有人说,嘿,看看这家非常酷的航空航天初创公司,然后他们说 SpaceX.com,我们隐藏 SpaceX.com 并询问模型下一个链接是什么。通过这样做很多次,数十亿次,你实际上可以从中构建一个搜索引擎,因为然后......在查询时间,在搜索时间,你输入一个查询,例如“非常酷的航空航天初创公司”,然后模型将尝试预测最可能的链接。所以有很多类似于 Transformer 的东西,但是要让它真正起作用,确实需要不同的架构。是的。但它是受 Transformer 启发的。是的。
在这样做与提取链接和描述,然后嵌入描述,然后使用......典型的方法之间,设计决策是什么?是的。你需要预测 URL 还是仅仅描述?因为你在某种程度上做的是类似的事情,对吧?这有点像,基于这个描述,最接近的链接是什么?所以一件事是预测链接。另一种方法是,我提取链接和描述,然后根据查询,我搜索最接近的描述。是的,顺便说一句,链接在这里指的是文档。它不是......我认为一件令人困惑的事情是你实际上并没有......预测 URL 本身,是的,这需要系统记住 URL,你实际上是在获取实际的文档,更准确的名称可能是文档预测,我明白了。这是 Exa 训练的初始基础模型,但我们已经超越了这一点,类似于,你知道,训练一个真正好的语言模型,你可能会从预测下一个标记的这种自监督目标开始,然后从网络上的随机内容开始,但随后你
你想添加一堆合成数据和监督微调,诸如此类的东西,以使其真正可控且健壮。FRANCESC CAMPOY:是的。是的,我们刚刚从 Lindy 那里获得了 Flow。在那里,Lindy 开始像幻觉一样重新滚动 YouTube 链接,而不是像支持指南一样。所以——MARK MANDEL:哦,有趣。FRANCESC CAMPOY:是的。MARK MANDEL:大约在 1 月份,你们宣布了 A 轮融资并更名为 Exa。我一开始不喜欢这个名字——但它已经让我接受了。我喜欢 Metaphor。但显然,人们可以拼写 Metaphor。
你会说今天 Exa 的主要组成部分是什么?我觉得它过去非常依赖模型。然后在 AI 工程师大会上,Shreyas 就你们拥有的向量数据库做了一个非常好的演讲。
Exa 的其他主要活动部件是什么?好的,总的来说,Exa 是一个搜索引擎,我们试图将其打造成为一个完美的搜索引擎。为此,你必须构建很多......而且我们是从头开始做的,对吧?所以为此,你必须构建许多不同的子系统。你必须抓取大量网络。首先,你必须找到要抓取的 URL。它与爬虫程序相连,但是,是的,你找到 URL,你抓取这些 URL,然后你必须使用某些东西来处理它们......它可能是一个嵌入模型。它可能更复杂。但是你需要获取......或者过去,它就像一个关键字反向索引。你会将你收集到的所有这些文档处理成某个已处理的索引,然后你必须以高吞吐量和低延迟来提供服务。这就是向量数据库。所以它就像爬虫系统......
AI 处理系统,然后是服务系统。这些都是谷歌的数百甚至数千人的团队。但对我们来说,通常每个团队只有一两个人。你能解释 EXA 的含义吗?只是故事,10 的 16 次方。我认为是 10 的 18 次方。是的,当然。EXA 表示 10 的 18 次方,这与谷歌形成鲜明对比,谷歌是 10 的 100 次方。我们实际上有这些很棒的衬衫,上面写着:
10 的 18 次方大于 10 的 100 次方。是的,很棒。它很棒,因为它具有挑衅性。硅谷的每个工程师都像这样,“什么?不,这是错的。”是的。然后你问他们,好吧,这到底是什么意思?像有创造力的人会认出来。但是,是的,我的意思是,在搜索方面,10 的 18 次方比 10 的 100 次方更好,因为在搜索中,你想要与你所要求的内容匹配的实际列表。你不想拥有整个网络。你基本上想用搜索过滤掉人类创造的一切,只留下你想要的东西。所以这个想法是,规模越小越好。你想要最好的 10 的 18 次方,而不是 10 的 100 次方。像这样说的一种方法是,你知道谷歌在顶部经常会说,“找到 3000 万个结果”。这太疯狂了,因为你正在寻找旧金山从事硬件工作的首批初创公司,而这样的结果并非 3000 万个。你想要的是找到 325 个结果,而这些都是结果。这就是你真正想要的搜索结果,这就是我们的愿景。它就像,它只给你完美地提供你所要求的东西。我们正在发布之前录制这段内容。我们还没有发布,我们还没有确定发布的名称,但是你正在发布的产品是什么,我想,现在我们正在与这个播客同时进行。是的,所以我们基本上开发了 EXA 的下一个版本,它能够获得你想要的几乎完美的列表结果。这意味着你现在可以对 EXA 进行复杂的查询,例如,在旧金山从事硬件工作的初创公司,
然后只需获取所有匹配项的巨大列表。我们的目标是,如果匹配的初创公司有 325 家,那么我们会找到所有这些公司。这只是一个全新的体验,以前从未有过。我不知道你现在会如何使用当前工具来做到这一点。你可以将这种类型的技术应用于任何事物。假设你想找到所有谈论 Swyx 播客的博客文章,
在过去一年中发布的。那是 3000 万个结果。是的,对。
我相信这对你们来说将非常有用。而且我真的不知道你们将如何获得完整的完整列表。我只是喜欢,你们是怎么......好吧,关于你们如何知道它是否完整,有很多问题,对吧?因为你说只有 3000 万,325,无论什么。然后你如何进行语义理解,它可能需要,对吧?所以从事硬件工作,我可能不会使用“硬件”这个词。我可能会使用“机器人技术”这个词。我可能会使用“可穿戴设备”这个词。我可能会使用任何东西。所以是的,只是......我更......是的,是的,当然。所以这方面有点主观。所以当然提供......在某些时候,我们会向用户提供参数,某种阈值来衡量,好吧,这是一个截止点。这实际上不是我的意思。因为有时它是主观的,需要一个反馈循环。它可能会给你一些例子,然后你说......这是你想要的吗?是的,没错。所以你是在动态地创建一个分类器。
但这最终是解决问题的方法。所以存在主观性问题,然后存在全面性问题。这两个是不同的问题。因此,为了解决全面性问题,你基本上必须做的是,你必须将更多的计算投入到查询中,投入到搜索中,直到你获得完整的全面性。而且......
这里有一个有趣的观点,那就是并非所有查询都是平等的。有些查询,就像这篇博客文章一样,可能需要扫描、搜索整个网络,这需要更多的计算。
你知道,在某些时候,会有某种计算量,你就会变得全面。例如,你可以想象在互联网上运行 GPT-4。你可以想象在整个网络上运行 GPT-4 并说,这是一篇关于 Swyx 播客的博客文章吗?这是一篇关于 Swyx 播客的博客文章吗?然后它就会起作用,对吧?它需要一年时间,可能花费 100 万美元,或者更多,但是,它会起作用。重点是,如果计算量足够,你可以解决查询。所以这实际上是一个问题,即考虑到你的计算预算,你想要多全面?顺便说一句,我认为这与 O1 非常相似。思考我们构建内容的一种方法是将其视为搜索领域的 O1。因为 O1 是关于,你知道,有些问题比其他问题需要更多的计算。我们会根据需要将尽可能多的计算投入到问题中。因此,同样对于我们的搜索,我们将尽可能多的计算投入到查询中以获得全面性。是的。这意味着你有一种我可以指定的计算预算吗?是的。好的。那么上限和下限是多少?是的。
是的,这是我们仍在努力解决的问题。我认为每个人都有一个可变计算产品的全新范例。你如何指定计算量?当你用完时会发生什么?你可以继续使用它吗?你只是投入更多积分来获得更多吗?在非常大的计算查询中,这可能会变得复杂。我们所做的一件事是,我们会给你一个你将获得什么的预览,然后你可以启动一个更大的作业来获得更多。
更多结果。但是,是的,至少现在存在一些计算限制。人们认为搜索就像,哦,它需要 500 毫秒,因为我们已经习惯了需要 500 毫秒的搜索。但是像谷歌这样的搜索引擎,对吧?无论你的谷歌查询有多复杂,它都需要大约 400 毫秒。但是如果搜索可以花费一分钟、十分钟或一整天呢?你可以做什么?你可以做很多强大的事情。你可以想象编写一个搜索
去喝杯咖啡,回来后,你就会得到一个完美的列表。对于许多用例来说,这都可以。最接近我的用例是风险投资,对吧?所以,不,我的意思是,八年前,我构建了第一个基于数据的采购平台之一。所以我们会查看 GitHub、Twitter、Product Hunt,所有这些东西,查看有趣的东西,评估它们。如果你考虑人们的一些工作,它就像字面上的制作列表一样。如果你是一家风险投资公司的分析师,你的工作就是列出一些有趣的公司,然后你联系他们。你如何看待基础设施与产品?你可以说,嘿,这是一个查找公司的产品。这是一个查找事物产品,而不是像提供更多作为人们可以构建的空白画布一样。哦,对,对。我们是一家搜索基础设施公司,所以我们希望人们构建产品
在我们之上,在我们之上构建令人惊叹的产品。但是对于这个,我们试图构建一些东西,让用户可以轻松登录,投入一些积分,然后立即获得令人惊叹的结果,而无需等待构建一些 API 集成。所以我们都在做。
我们希望人们将此集成到所有应用程序中。同时,我们希望使其非常易于使用。再次与 OpenAI 非常相似。他们有 API,但他们也有 ChatGPT 界面。所以你可以,它非常易于使用,但你也可以将其构建到你的应用程序中。是的。我仍然试图理清
理清我脑海中许多含义。所以,很多企业都依赖信息套利,你知道的,就像我知道你不知道的事情一样,尤其是在投资和金融服务领域。所以是的,现在突然之间你有了这些工具,就像,哦,实际上每个人都可以同时获得相同的信息,与 API 调用相同的质量级别,你知道的,它只是改变了很多事情。
很多事情。是的,我认为我们在这里正在努力解决的问题,你正在思考的问题是,如果知识得到了解决,世界会是什么样子?如果像你想要的任何知识请求
都像这样直接出现在你的电脑上,这与智力得到解决时的情况有所不同,就像我之前写过的一样,关于不同的超级智能,超级知识。是的,我认为智力与知识之间的区别实际上是一个相当不错的区别,它们肯定以各种方式相互关联和相关,但确实存在区别。你可以拥有一个世界,我们将拥有这样一个世界,在这个世界中,你拥有像 GB5 级系统及更高版本的系统,可以回答任何复杂的请求,除非它需要一些,比如如果你说,
你知道,给我一份纽约市所有博士的名单,我不知道,他们以前是否考虑过搜索。即使这种超级智能会说,
我无法在谷歌上找到它,对吧?这太疯狂了。就像我们实际上将拥有使用谷歌的超级智能一样。所以如果谷歌找不到信息,他们就无能为力。他们找不到。但是如果你也有一个超级知识系统,就像,你知道,我称这个术语为超级知识,你只需要获得你想要的任何知识,那么你可以将其与超级智能系统配对,然后超级智能将永远不会因为缺乏知识而受阻。是的,你在我们吃午饭时告诉我这件事。
我不记得是怎么提起来的,但我们当时正在谈论 AGI 之类的事情,你说,即使是 AGI 也需要搜索。是的,对。是的。所以我们实际上是在引用你写的一篇博客文章,《超级智能与超级知识》。所以我建议人们阅读它。这实际上是我们在这个播客中讨论过几次的话题。有很多模型权重只是在记住事实。
有些可能已经过时了,有些是不完整或不正确的。是的,所以你只需要搜索和工具使用。所以我很好奇,是否存在一个最大语言模型大小,它将成为智能层,而其余的只是搜索?也许我们应该始终使用搜索,然后这种主力模型就像 1B 或 3B 参数模型一样,它驱动一切。是的。
是的,我相信这是一个更优化的系统,它拥有一个更小的 LLM,它实际上只是一个智能模块,它会调用一个搜索工具。这效率更高,因为如果,好的,我的意思是,相反的情况是 LLM 非常大,它可以记住整个网络。那就像
方式,你知道,这根本不实用。至少现在不可能训练它。Karpathy 实际上写过这方面的内容,他如何看到模型越来越转向使用各种工具的智能模块。是的,对于听众来说,那是他在 No Priors 播客上的内容。对我们来说,我们在 Xinyu 和 Harrison Chase 的播客上讨论过这个话题。我正在脑子里搜索。这很酷。我告诉你,3000 万个结果。我忘记了我们的 Neuralink 集成。自托管 Exa。
是的,不,我确实认为这是一个更高效的世界。我的意思是,你也可以让 GB4 级系统进行搜索,但这仅仅是因为推理成本,拥有一个非常高效的搜索工具和一个非常高效的 LLM 更好,它们是为不同的目的而构建的。是的。我只是很好奇,这仍然是一件如此大胆的事情,我不想
那就是你正在构建一个搜索引擎。你从哪里开始?你如何......是否有任何参考论文或实现会真正影响你的思考?诸如此类的事情?因为除了抓取一堆垃圾之外,我什至不知道从哪里开始。但是肯定还有更多见解。我的意思是,是的,还有更多见解,但是......
我总是对这样一件事感到惊讶,如果你有一群人真正专注于使用今天的工具来解决问题。就像软件中有很多一样。就像,有很多创造性的解决方案以前从未想过。尤其是在信息检索领域。是的。我认为很多技术实际上都很老了。就像,我知道谷歌和必应是如何工作的。而且......
他们只是没有使用新方法。有很多原因可以解释这一点。比如,谷歌必须对整个网络进行全面搜索。所以他们,而且他们必须在 400 毫秒内返回结果。这两件事结合起来意味着它们受到限制,而且成本不能太高。他们在可以大规模部署的算法类型方面受到限制。因此,他们最终使用的是
基于关键字的有限算法。此外,谷歌是在一个时代构建的,就像在 1998 年,我们没有 LLM,我们没有嵌入。所以他们从未想过要构建这些东西。所以现在他们拥有这个庞大的系统,它是建立在旧技术之上的。所以很多信息检索,
我们发现只是按照那个框架进行思考。而我们作为新手进入,只是这样想,好吧,这是 GB3。它很神奇。显然,我们将构建使用该技术的搜索引擎。而且我们什至从未想过要使用关键字。真的从来没有。像,
我们一直都是神经网络的。我们正在构建一个端到端的基于神经网络的搜索引擎。仅仅是整个框架就让我们提出不同的问题,例如追求不同的工作方向。而且有很多唾手可得的成果,因为没有其他人这样考虑。我们只是处于神经搜索的前沿。我们就是这样,对于网络规模而言。因为没有很多人这样考虑。是的。也许让我们解释一下,因为我们已经在讨论这个话题了。
房间里的大象是 Perplexity 和 SearchGPT。我认为它不再被称为 SearchGPT 了。我认为他们称之为 ChatGPT 搜索。根据我们对它们工作方式的了解,你会如何将你们的方法与它们进行对比?是的,只是这方面的事情。是的,所以这些系统,现在有几个。它们基本上依赖于传统的搜索引擎,如谷歌或必应。然后他们在最后将它们与 LLM 结合起来,以输出一些段落来回答你的问题。所以他们......
像搜索GBT、Perplexity一样,我认为它们有自己的爬虫,不,所以有一个重要的区别,那就是拥有你自己的搜索系统和拥有你自己的网络缓存。例如,你可以创建,你可以爬取大量的网页,假设你爬取了1000亿个URL,然后你创建一个键值存储,像从URL到文档的映射,这在技术上被称为索引,但它不是搜索算法,那么实际上像
当你向搜索DBT发出查询时,它实际上在做什么?假设它使用的是必应API,获取结果列表,然后它有这个缓存,所有这些结果的内容,然后可以调入缓存,索引缓存。但它不像他们是从头开始构建一个搜索引擎,在数千亿个页面上。这个区别清楚了吗?就像......
你可以有一个从URL到文档的映射,但随后依赖传统的搜索引擎来实际获取结果列表。因为这是一个非常难解决的问题。使用DynamoDB并将URL映射到文档并不难。要处理1000亿个或更多文档,并给出一个查询,立即获得匹配的结果列表,这是一个非常困难的问题,地球上只有极少数实体解决了这个问题。
完成。像谷歌、必应,你知道,还有Yandex,但是你知道,没有那么多公司疯狂到真的从头开始构建他们的搜索引擎,而你可以只使用传统的搜索API。
所以谷歌有PageRank作为重要的事情。有没有LLM等价物,或者你正在研究的任何你想强调的东西?链接预测目标可以看作是神经PageRank,因为你所做的是预测人们分享的链接。因此,如果每个人都在分享一篇关于筹款的保罗·格雷厄姆的文章,那么我们的模型就更有可能预测到它。因此,在我们的训练目标中,固有地存在着一种......
高质量的感觉,但它比PageRank更强大。它严格来说更强大,因为人们可能会以一千种不同的方式提及那篇保罗·格雷厄姆关于筹款的文章。因此,我们的模型学习了所有不同的方式。有人提到那篇保罗·格雷厄姆的文章,同时也学习了那篇文章的重要性。所以它就像,它就像兴奋剂版的PageRank一样。是的。我认为对我来说,这是当今搜索中最有趣的事情,就像谷歌等等。它就像,它主要像域名权威一样。所以如果你获得反向链接,如果你搜索任何AI术语,你会得到这个SEO垃圾,
网站上有很多东西。所以这很有趣。但是你如何考虑更多永恒的内容呢?如果你考虑一下,你知道,也许是创始人模式文章,对吧?它被很多人分享,但是你可能还有很多其他的文章也很好,但它们并没有真正获得很多关注,即使分享它们的人可能是高质量的。当你没有......
分享者的权威性时,你如何解决这个问题,他们是否值得提升。是的,我的意思是,你确实对训练数据有很大的控制权,所以你可以确保训练数据包含高质量的来源,这样,好吧,如果你的训练数据,我的意思是,这与语言模型训练非常相似。如果你在大量的垃圾上进行训练,你的预测就会是垃圾。我们的模型将匹配它所训练的训练分布。所以我们可以,有很多方法可以调整训练数据,以
参考我们想要的高质量内容。是的,我还想说这个,像
传统搜索引擎(如谷歌和必应)返回的垃圾,你拥有的垃圾随后会被转移到这些LLM中,在搜索GBT或其他类似的系统中。如果垃圾进来了,垃圾就会出去。所以,是的,这是我们与众不同的另一个答案,我们不像传统的搜索引擎。我们想提供最高质量的结果,并完全控制你想要的东西。如果你不想要垃圾,你就会得到它。然后......
如果你在其之上放置一个LLM,我们的客户就是这样做的,那么你就会得到更高质量的结果或高质量的输出。我经常使用ExaSearch,它非常好。你说BrightWave也使用它吗?是的,是的,是的,是的。就像垃圾无处不在一样,尤其是在AI方面,在投资方面,在所有这些方面,就像处于顶端是有价值的。而这个问题只会越来越严重,因为......是的,完全正确。工具包里还有什么?所以你有......
搜索API,你有ExaSearch,有点像网络版本。现在你有列表构建器。我认为你还有网络抓取。也许只是......
谈谈这个?就像,我想也许人们,他们想搜索,然后他们想抓取,对吧?所以这就是人们使用的用例吗?是的。我们的许多客户,他们不只是想要,因为他们正在构建基于Exa的AI应用程序,他们不只是想要一个URL列表。他们实际上想要像完整的内容,像清理、解析、markdown,也许是分块的,无论他们想要什么,我们都会给他们。所以这对客户来说非常重要,就像获取URL并立即获取每个URL的内容一样
你可以对10个、100个或1000个URL执行此操作,无论你想要什么。这非常强大。是的,我认为这是我第一次使用Exa时向你提出的要求。有趣的是,当我构建Exa的第一个版本时,我们碰巧存储了内容,前1024个标记,因为我只是保留了它,因为我认为,我不知道为什么,实际上是为了调试目的。所以当人们开始要求内容时,实际上很容易提供它。是的。
然后我们做了,Exa起飞了。所以音乐的内容非常有用。所以这很酷。是的。我想说还有其他参与者,比如Gina,我认为在这个领域。Firecrawl在这个领域。有很多抓取公司。很明显,抓取只是你堆栈的一部分,但既然你已经做了,你也可以提供它。是的,这是有道理的。拥有一个一体化解决方案很容易,而且,像
我们正在构建世界上最好的抓取工具。所以抓取是一个难题,很容易获得一个好的抓取工具。要获得一个伟大的抓取工具非常困难,要获得一个完美的抓取工具则超级困难。所以像
抓取对人们来说真的很重要。你有一个完美的抓取工具吗?还没有。网络越来越对机器人和抓取工具关闭。Twitter、Reddit、Quora、Stack Overflow。我不知道还有什么。你如何处理这个问题?你如何应对这些事情?就像,你知道,睁开眼睛,只是付钱给他们。是的。
是的,不,我的意思是,我认为这肯定会让搜索引擎变得更难。一个回应就是,开放网站的长尾中有很多价值。而且就像,即使只是搜索那些网站也能让你获得大部分价值。但是我的意思是,肯定有很多内容越来越不可用。所以你可以通过数据合作伙伴关系来解决这个问题。我们公司越大,就越容易建立合作伙伴关系。但是我的意思是,我确实认为这个世界就像未来一样,数据是
数据生产者,内容创建者将与查找这些数据的主体建立合作伙伴关系。还有什么其他的有趣用例,也许人们没有想到?是的。哦,我的意思是,有很多。你的客户。是的,是的。人们在AXA上做什么?好吧,我认为约会是一个非常有趣的主题
搜索的应用,因为它完全没有得到满足,因为网络上有很多个人资料,而且很多人想找到爱情。我会用它。给我一些,你知道,年龄范围,你知道,教育程度、位置。是的。我的意思是,你想,你想用约会做什么?你想找到一个符合这个教育程度的伴侣,谁像,你知道,也许之前写过这些类型的文章。如果你得到所有这样的人的名单,就像我想,
你会让很多人摆脱困境。我的意思是,我认为这绝对是一种非常硅谷式的约会方式。我很清楚这一点。但这只是一个有趣的应用,就像,你知道,我喜欢遇到一个像知识分子一样的伴侣,他喜欢分享很多想法。如果你可以通过更好的搜索来做到这一点。是的。但是杰夫是怎么回事?杰夫已经给我介绍了几个人了。所以杰夫,我认为是我的私人前妻。是的。
我妈妈实际上是一个媒人,她让很多人结婚了。开玩笑的。是的,是的,是的。搜索内置于书中。它在你的基因中。是的,是的,是的。除了约会,我知道你在大学里取得了相当大的成功。我只是想列出更多用例,以便我们的听众可以使用这些示例来考虑EXA的用例,对吧?因为它是一种通用的技术,很难真正确定我应该将它用于什么以及我可以使用它构建什么样的产品。
是的,当然。所以,我的意思是,Exa有很多应用,我们有,你知道,很多公司使用我们来处理各种各样的用例。但我只会强调一些有趣的内容。像一个客户,一个大客户正在使用我们来基本上构建一个写作助手,供想要撰写研究论文的学生使用。基本上,Exa会搜索像与学生正在撰写的内容相关的研究论文列表。然后这个产品有一个LLM,它像总结
论文,基本上它就像一个X字预测,但是,你知道,由Exa返回的20篇研究论文提示。它就像字面意义上为他们做作业一样。是的。是的。但关键点是,它,它,你知道,它,它,你知道,研究是一件非常难做的事情,你需要高质量的内容作为输入。哦,我们在播客上邀请过Illicit。我认为这非常相似。他们专注于,
几乎只专注于研究论文和这项研究用例。基本上,我认为约会研究,我只是想列出更多内容。就像大型垂直行业一样。是的,是的。不,我的意思是,有很多用例。金融,我们谈过了。是的,我的意思是,一个主要的垂直行业就是寻找公司列表。所以这对VC来说很有用,就像你说的那样,他们想找到一个......
他们正在调查的特定公司的竞争对手列表,或者某个领域的公司列表。有一个VC告诉我,他和他的团队一直在使用Exa长达8个小时,连续多天,只是进行各种不同类型的查询。就像,哦,AI在法律领域的所有公司,或者AI在建筑领域的所有公司,只是获取列表,因为你根本无法通过传统的搜索引擎找到这些信息。
然后寻找公司对于销售也很有用。如果我们想找到一个写作助手列表来销售,那么我们就可以自己使用Exa来查找。这实际上是我们找到许多客户的方式。哦,你可以使用Exa找到你自己的客户。哦,我的上帝。本着使用Exa来支持Exa的精神,招聘非常有帮助。这是一个非常好的Exa用例,因为我们可以得到一个考虑过搜索的人员列表,并获得一个长长的列表。
然后联系这些人。- 当你说考虑过时,你是指LinkedIn、Twitter,还是只是博客?- 或者他们写过,我的意思是,这很笼统。所以在这种情况下,理想情况下,Exo会返回真正由刚刚写过的人撰写的博客——- 所以如果我不写博客,我就不会出现在Exo上,对吧?我必须写博客。
这就像激励人们写博客一样。如果你在Twitter上写过关于搜索的内容,我们确实会索引大量的推文,然后我们应该能够提供服务。我的意思是,这是我告诉人们的事情,就像你必须让自己在网络上被发现一样。这叫做公开学习,但是
现在这更重要了。是的。因为否则你根本不存在。是的,不,这是一件非常重要的事情,就像搜索引擎完全影响......它们具有下游效应。它们影响互联网本身。它们影响人们选择创建的内容。所以......
谷歌,因为它们是一个基于关键词的搜索引擎,人们有点喜欢......关键词的东西。是的,他们有动力去创建那些只匹配很多关键词的东西,这质量不高。而Exa是一种搜索算法,它优化了高质量的内容,并真正匹配你的意思。因此,人们有动力去创建高质量的内容,就像......
他们创建的内容,他们知道会被合适的人找到。所以如果我是一个搜索研究人员,我想被Exa找到,我应该写关于搜索和所有我正在构建的东西的博客,因为现在我们有一个像Exa一样强大的搜索引擎可以找到它们。
因此,搜索引擎将以各种令人惊奇的方式影响下游互联网。搜索引擎优化的任何内容都是互联网的样子。你熟悉麦克卢汉主义这个术语吗?不,这是什么?这是一个概念,即我们首先塑造工具,然后工具塑造我们。所以,在我们搜索的东西和被搜索的东西之间存在着这种反射性联系。
是的。所以一旦你改变了搜索的工具,被搜索的东西也会改变。是的。我的意思是,谷歌的30年就是一个明显的例子。是的,完全正确。谷歌基本上训练我们去思考搜索。谷歌有,谷歌就像人们头脑中的搜索一样,对吧?Exa的一个难点是,像
让人们摆脱这种搜索的概念,并扩展他们对搜索可能是什么的理解。因为当人们想到搜索时,他们会想到几个关键词,或者至少他们过去是这样想的。他们会想到几个关键词,就是这样。他们不会想到要提出这些非常复杂的段落式信息请求并获得一个完美的列表。Chachupi Tea是一件有趣的事情,它扩展了人们对搜索的理解,因为你开始使用Chachupi Tea几个小时,然后你回到谷歌,你粘贴你的代码
谷歌根本不起作用。你会想,哦,等等,谷歌不那样工作。所以Chachapiti扩展了我们对搜索可能是什么的理解。我认为Exa也是其中一部分。我们想扩展人们的概念,比如,嘿,你实际上可以得到你想要的任何东西。是的。你怎么看待术语......
我会怎么说呢?所以我现在在Excel上搜索,人们写关于公开学习的文章。我想,它会出来吗?你不会,因为它与......有关。因为它认为公开学习,就像公立学校一样,更关注这一点。就像......
当存在这些高度重叠的事情时,这是一个基于查询的良好结果。但是我如何才能找到SWIX呢?所以如果你在这些亚文化中,我认为这在谷歌中也不起作用。但是我不知道你是否从中吸取了任何教训。不,我是谷歌上的第一个结果。人们写关于公开学习的文章......
我想你不再是第一个结果了。在谷歌上搜索公开学习。好吧,是的,是的,是的。但这就像在谷歌中一样,它也不起作用。这就是我想说的。就像当你有一个运动时一样。对你的意思,你的意图有点......是的,就像我正在使用我正在使用一个我并没有发明,但是我正在接管的术语。是的,但是关于这个术语已经有很多了,很难克服。
如果这是有道理的,因为公立学校就像,好吧,很难克服公立学校,你知道吗?所以这个问题的正确解决方案是更清楚地说明你的意思。我不指望你这样做,但是搜索的正确界面实际上是一个LLM。就像你应该与LLM讨论你想要什么,LLM将它对你的了解或对人们通常意思的了解转化为Excytin使用的查询。
你称之为自动提示,对吧?是的,但这只是一个非常轻量级的版本。实际上,正确的答案是这是一个错误的界面。很快,搜索的界面,实际上所有东西的界面都将是LLM。LLM完全了解你,对吧?所以我们正在为那个世界而构建。我们正在滑向冰球将要到达的地方。因此,既然我们正在进入一个LLM与所有事物连接的世界,你应该构建......
一个可以处理复杂的LLM查询的搜索引擎,来自LLM的查询。因为你可能太懒了,我也太懒了,无法写一整段话来解释,好吧,这就是我所说的这个词的意思。但是LLM并不懒惰。因此,LLM会吐出一段或更多的话来解释它到底想要什么。你需要一个可以处理这种情况的搜索引擎。传统的搜索引擎,如谷歌或必应,实际上是为输入关键词的人类设计的。如果你给谷歌或必应一段话,它们就会完全失败。
因此,Exa可以处理段落,我们希望能够越来越多地处理它,直到它变得完美。意见呢?你有列表吗?当你考虑列表产品时,你是考虑查找条目,还是考虑对条目进行排名?我给你举一个愚蠢的例子。所以在Lindy上,我一直在构建一个每周都会给我顶级奇幻足球放弃接球的点。但是每个网站的意见都不一样。我想,你应该接住这五个球员,这五个球员。当你制作列表时,
你是否也想对列表进行排名,并告诉人们什么是最好的,或者你主要关注的是呈现信息?在过滤到与你的查询匹配的内容和根据......进行排名之间有一个非常好的区别。
你的偏好。排名就像过滤一样是客观的。就像,这个文档是否与你要求的内容匹配?而排名则更主观。它就像,什么是最好的?好吧,这取决于你所说的最好的意思,对吧?所以首先是门槛,让我们将过滤带入一个完美的地方,你实际上,像,每个文档都与你要求的内容匹配。现在没有外科医生能做到这一点。然后排名,你知道,有很多有趣的方法可以做到这一点,就像,你可能,你知道,让用户,像,
更清楚地说明他们所说的最好的意思。你可以这样做,如果用户没有指定,你尽你所能,你根据人们通常所说的最好的意思尽你所能。但理想情况下,用户可以指定,哦,当我指的是最好的时候,我的意思是根据访问该网站的人数进行排名,比如说是一个排名示例,或者,哦,当我指的是最好的时候,比如说你正在列出公司。我所说的最好是指那些......
拥有最多员工的公司等等。有很多方法可以对结果列表进行排名,而这些方法并没有被像最好这样主观的东西所捕获。是的。我的意思是,就像,历史上最好的NBA球员是谁?就像,每个人都有自己的。对,对。但是我的意思是,搜索引擎绝对应该,即使你没有指定,它也应该......
尽可能做好工作,是的,是的,不,不,完全正确,是的,是的,这是一个新的话题,因为我们不习惯于一个可以处理非常复杂的排名系统的搜索引擎,就像你认为输入最好的篮球运动员,而不是更具体的东西,因为你知道那是谷歌唯一可以处理的东西,但是如果谷歌可以处理像,哦,根据每场比赛的平均得分进行排名的篮球运动员,那么你就会这样做,但是你知道他们做不到,所以
是的,这很有趣。所以你没有使用代理这个词,但你正在构建一个搜索代理。你认为这在功能上是代理的吗?你认为这个术语会让人分心吗?我认为这是一个好词。我确实认为最终一切都会变成代理。然后这个词就会失去力量。但是是的,我们正在构建的是代理,因为它采取行动。它决定何时深入研究某些内容。它有一个循环,对吧?这与传统的搜索不同,传统的搜索就像......
一个算法,而不是一个代理。我们的是算法和代理的组合。我认为我从在编码领域看到这一点的反思,那里基本上是经典的思考这些事情的框架,是自动驾驶的自主级别,对吧?一级到五级。通常五级都失败了。
因为有完全的自主权,而我们还没有达到。人们喜欢控制。人们喜欢参与其中。所以一级是副驾驶,现在是光标等等。所以我觉得如果它太像代理了,它就太神奇了,就像一次性操作一样,我把一段话粘贴到文本框中,然后它就吐回给我。我可能会觉得我与这个过程过于脱节,而且我不信任它。与我更密切地参与研究产品相反。
我明白了。所以像,等等,所以早期版本是......所以如果,尝试坚持篮球的例子,像最好的篮球运动员,但是不是最好的,你实际上可以用你们关心的任何指标来定制它。我仍然不是篮球运动员。是的。
但是,你知道,人们喜欢参与......我的论点是,五级代理失败了,因为人们喜欢拥有驾驶辅助,而不是完全自动驾驶。我的意思是,这与代理的好坏有很大关系。就像在某个时候,如果编码代理在所有任务上都比人类更好,那么人类就会被阻止。我们还没有达到。所以在我们还没有达到这个世界的世界里......你向我们推销的是,你有点说你要一路走到那里。我认为O1也是完全自动驾驶的。你无法看到计划。你无法影响计划。你只需发出一个查询,然后它就会消失几分钟,然后返回,对吧?这实际上就是你所说的你也要做的事情。你认为有一个......有一个中间地带。好的,所以在构建这个产品时,我们正在探索......
新的界面,因为启动一个需要10分钟的搜索意味着什么?这是一个好的界面吗?因为如果搜索实际上是错误的,或者它没有完全指定你的意思呢?这就是为什么你会得到预览。是的,你会得到预览。所以它是迭代的。但最终,一旦你准确地说明了你的意思,那么你实际上只想启动一个批处理作业,对吧?所以你可能指的是,像
与代理存在这种障碍,你必须解释你的意思的全部上下文。当你拥有时,就会发生很多故障模式,当你没有时。是的。代理不够聪明会导致故障模式。然后代理不理解你的确切意思也会导致故障模式。人类之间共享的很多上下文就像在人类和......之间丢失了一样,
新的生物。是的,因为人们不知道发生了什么。我的意思是,对我来说,系统提示的最佳示例是,你为什么要写你是个有帮助的助手?当然,你应该是一个有帮助的助手。但是人们还不知道,我可以假设你知道吗?现在人们写道,哦,你是一个非常聪明的软件工程师。你从不犯错误。你以前打算犯错误吗?所以我认为人们还没有
理解。就像驾驶一样,人们知道良好的驾驶是什么。就像,不要撞车,保持在一定的速率范围内。就像,按照指示去做。就像,我不需要解释所有这些事情,我希望如此。但是对于AI和模型以及搜索,人们会说,好吧,你到底知道什么?
你对如何搜索、你将如何搜索的假设是什么?我能相信它吗?我能影响它吗?所以我认为这是某种中间地带,就像在你继续进行所有搜索之前一样,我可以看看你如何操作吗?这可能会有所帮助。你的工作。就像,是的。是的。是的,不,我的意思是,是的。所以你是在说,即使你已经设计了一个很棒的系统提示,你也想成为这个过程本身的一部分,因为是的,
系统提示不会,它不会捕捉到所有内容,对吧?所以,是的。系统提示就像你可以选择你与之合作的人一样。就像,哦,我喜欢,我喜欢一个这样思考代码的软件工程师。但是即使你选择了那个人,你也不能只给他们一个高级命令,然后他们就能完美地执行。你必须成为这个过程的一部分。所以,是的,我同意。是的。
只是一个旁注,对于我的系统,我最喜欢的系统提示编程轶事现在是苹果智能系统提示,有人提示注入它并看到了它。而且苹果。智能系统包含这样的词,比如,请不要,不要产生幻觉。当然,我们不希望你产生幻觉。对。就像,这正是你所说的,我们应该将这种行为训练到模型中,但不知何故,我们仍然觉得需要注入到提示中。我仍然不认为我们对此进行了非常科学的研究。就像,我认为这几乎就像迷信一样。就像我们有这种神奇的,像转三圈,在你做某事之前把盐撒在你的肩膀上一样。而且,它上次有效。所以让我们现在也这样做。而且,我们这样做,对此没有科学依据。
我认为很多这些问题可能会在未来的版本中得到解决。对。所以,而且,他们可能会,他们可能会向你隐藏细节。所以它就像,他们实际上,所有这些都有一个系统提示。那就是,你是一个有帮助的助手。你实际上不必包含它,即使它实际上可能是他们在后端实现的方式。它应该在RLE AF中完成。是的。
只是一个旁注,关于我的系统,我最喜欢的系统提示编程轶事是苹果智能系统提示,有人提示并看到了它。苹果智能系统提示的字眼是,“请不要产生幻觉”。这就像,当然我们不希望你产生幻觉。对吧?所以这正是我们刚才讨论的,我们应该将这种行为训练到模型中,但不知何故,我们仍然觉得有必要将其注入提示中,我甚至不认为我们对此进行了非常科学的研究,我认为这几乎就像迷信一样,我们有这种神奇的,像转三圈,在你做某事之前把盐撒在你的肩膀上,就像上次有效一样,所以让我们现在也这样做吧。
这没有科学依据。——我认为很多这些问题可能会在未来的版本中得到解决,对吧?他们可能会隐藏细节。所以就像,他们实际上,他们都有一个系统提示,就像,“你是一个乐于助人的助手”。你实际上不必包含它,即使它实际上可能是他们在后端实现的方式。
它应该在RLAF中完成。好的,我很好奇一个问题。所以这一集是,我将尝试用一般人工智能搜索大战来解释这一点。你知道,你是其中一个参与者,有Perplexity、ChatGPT搜索和谷歌。但也有B2B方面。
我们邀请了Dropbox的Drew Houston,他与Glean竞争,我们也邀请了Glean的Didi。对于我公司的文档,EXA是否有需求?有需求,但我认为我们必须自律、专注、自律。我的意思是,我们已经承担了完美的网络搜索,这已经很多了。但是,我的意思是,最终我们想要构建一个完美的搜索引擎,这对于许多查询来说肯定涉及您的个人信息和公司信息。所以,是的,我的意思是,EXA最宏伟的愿景是真正覆盖所有内容的完美搜索。每个领域。你知道,我们将拥有EXA卫星,因为卫星可以收集公开无法获得的信息。明白了。我们可以谈谈AGI吗?是的。
我们从未谈论过AGI,但你发布了一条关于O1是朝着AGI迈出的最大一步的推文。为什么你认为它如此重要?我知道总有一些批评,说,“它并不那么聪明,它并不比......更好”。就像,等等。你看到了什么?所以你说这是Ilyas看到的,Sam看到的,他们将看到的。我只是,你知道,一直在连接这些点。我的意思是,这是许多实验室正在研究的关键问题,就像,你能创建一个奖励信号吗?你能根据奖励信号自学吗?无论你是否,如果你试图学习编码或数学,如果你能有一个模型说,“你已经成功地解决了这个编程评估”,然后一个模型,就像,“这是一堆编程评估”。你可以用它来训练。所以基本上,每当你能够为某个任务创建奖励信号时,你就可以为自己生成一堆任务,看看,哦,在这1000个任务中的两个任务中,你做得很好,然后你就在这些数据上进行训练。这基本上是,我的意思是,为自己创建自己的数据。而且,你知道,所有从事这项工作的实验室,OpenAI,
开发了最令人印象深刻的产品。现在很容易看出这如何扩展到解决问题,例如解决编程或解决数学问题,这听起来很疯狂,但我们当今世界的一切都很疯狂。所以,我认为,如果你去掉整个,“哦,这是不可能的”,并且你真正清楚地思考一下,像他们用O1所做的那样,现在有什么是可能的,很容易看出它是如何扩展的。你怎么看待
旧的GPT模型呢?人们是否应该继续研究它们?你知道,如果像,显然他们刚刚发布了新的Haiku,那么花时间改进这些模型是否值得,而不是,你知道,Sam在那天谈到了O2,所以显然他们正在投入大量时间,但你可能还有GPU贫困者,他们仍在努力改进Llama。
然后你还有那些还没有O1类似模型的追随者实验室。是的,这有点像,未来的模型生态系统会是什么样子?还有空间吗?所有的一切都会变成O1类似的模型吗?我认为,我的意思是,肯定有一个推理速度的问题,如果某些事情,像O1需要很长时间,因为它必须思考。
——好吧,我的意思是,O1有两件事。一件是它在引导自己,它在自学,所以基础模型更聪明。但它也有这个推理时间计算,它可以花费几分钟或几小时来思考。所以即使是基础模型,它也很快,
它不必花费几分钟,它可以花费的时间更少,它更好,更聪明。我相信所有模型都将使用这种范例进行训练,就像你想要在最好的数据上进行训练一样,但我相信会有来自不同、非常多不同公司的许多不同大小的模型。是的,因为像,我不,我的意思是,很难预测,但我认为OpenAI不会主导每一个可能的、用于每一个可能的用例的LLM。我认为对于很多事情来说,像
你只需要最快的模型,而这可能根本不涉及O1方法。我会说,如果你把EXA视为O1的搜索,从字面上看,你真的需要优先考虑搜索轨迹。
就像几乎可能是付钱给一群研究生去研究事情,然后你跟踪他们的搜索内容以及搜索的顺序。因为这似乎是这里的金矿,就像思维链或思维轨迹。是的,说到搜索,我一直对人工标记的数据持怀疑态度。好的。是的,请。我们最近在EXA公司尝试了一些东西,其中......
我和团队中的一些工程师标记了一堆查询。这真的很困难。你有一堆利基查询,你正在查看一堆结果,你试图确定哪些结果与查询匹配。它正在讨论......
一些生物实验的复杂性或其他什么。我不知道。我不知道什么匹配。像我这样的标记者倾向于做的就是按关键字匹配。我想,哦,这个文档匹配一堆关键字,所以它一定很好。但实际上你完全错过了文档的含义。而像GPT-4这样的LLM非常擅长标记。所以我实际上认为我们通过使用LLM作为标记器来实现这一点,特别是对于搜索,我认为这很有趣。搜索和GB5之间有所不同,因为GB5可能会受益于在大量博士论文上进行训练,因为GB5可能必须进行非常非常复杂的,像,问题解决,当它得到输入时。但对于搜索来说,这实际上是一个非常不同的问题。你正在问关于......
数十亿事物的简单问题。所以,就像GB5正在问一个非常困难的问题一样,它就像解决一个非常困难的问题,但这是一个,它就像一个问题,一个博士水平的问题。对于搜索,你正在问关于数十亿事物的简单问题。例如,这是一家初创公司吗?这个人写过关于搜索的博客文章吗?你知道,这些实际上是简单的问题。你不需要博士级别的训练数据。这说得通吗?是的。我们还有什么?午睡舱。哦,是的。是的。
所以总的来说,我认为EXA有一种非常有趣的公司建设氛围。你有一个表情包之王CTO,我想。我不知道。而且你通常在很多事情上都与众不同。EXA的文化是什么?是的。
——是的,我和Jeff是,我的意思是,我们一直是最好的朋友。就像,我们是在大学的第一天认识的,从那以后我们就一直是最好的朋友。我们有一个非常好的氛围,我认为这很强烈,但也非常有趣,而且说实话也很有趣。我们有很多,我们在EXA有很多笑声。我认为这就像,你可以在我们文化的各个方面看到这一点。我们并不关心世界如何看待任何事情。我和Jeff就是这样。我们只是在思考,真的就像,
我们应该在这里做什么?我们需要什么?所以在午睡舱的情况下,就像,人们在编码或做任何事情时都会感到疲倦。就像,为什么我们不能在这里睡觉或小睡一会儿呢?好的,如果我们需要小睡,那么我们就应该弄个午睡舱。对我来说,很多公司里没有午睡舱真是太疯狂了,因为我总是很累。我大概每隔一天就会小睡20分钟。我实际上从来没有真正睡着,我只是在思考一个问题,但闭上眼睛真的像
首先,它让我想出了更多有创意的解决方案,然后实际上也让我得到了一些休息。所以这太棒了。谷歌是最初在工作场所提供午睡舱的公司,对吧?哦,好的。好吧,在某个时候,谷歌也从第一性原理思考一切。这反映在他们的午睡舱中。但你也没有仅仅为你的办公室买一个午睡舱。你像从中国找到了什么东西,然后你说,“谁想参与这个?让我们弄一整集装箱吧。”是的,好吧,我们试图节俭。所以我们正在查看不同的午睡舱,然后......
在某个时候,我们想,等等,中国可能已经解决了这个问题。所以我们从中国订购了它。它实际上非常重。当它从卡车上下来时,重达500磅。卡车很难把它放到地上。所以我和送货员试图抓住它。然后我们不行了。我们很挣扎。所以街上有人出来帮忙。你没有受伤吧?不,这真的很危险,但我们做到了。这太棒了。这很有趣。我读到了TechCrunch关于它的文章。
有一篇TechCrunch关于午睡舱的文章?是的。然后Jeff解释说,他们引用了Jeff。这段话写道,“所以午睡舱保持了员工停止工作和睡觉的能力,而不是‘员工是奴隶’的想法。”哈哈哈哈哈。
我不知道。Jeff词不达意。我想,我确定这不是一个事件,你知道,但我很好奇,就像人们一样,我认为有一段时间,关于初创公司和所谓的奋斗文化等等,这种说法消失了。我认为现在有了人工智能,人们对人工智能有这些感觉,这有点像。我认为这是一种支持奋斗文化的文化,对吧?是的。但我认为,理想情况下,奋斗是人们只是玩得很开心,这是人们,人们只是玩得很开心。是的。但我认为从外部来看,人们不喜欢它。
我说的是不在人工智能领域和科技领域的人,他们有点像,“这些人又来了。这些人就像给了我们低薪司机的那些人一样。”所以看到他们试图让它听起来像Jeff说员工是奴隶,这很有趣,但就像,哦,是的,我不知道。这说不通。但是是的,我的意思是,好吧,我无法想象比从头开始构建一些与你的朋友们一起做的大事更令人兴奋的体验了。我们的团队将在10年后回顾过去,认为这是你一生中可能拥有的最美好的体验。
而且就像,这就是我思考的方式,是的,这只是所以它不是奋斗,也不是。就像,这是否满足了你像在世界上创造东西的核心愿望?是的。我们没有涵盖的其他内容?有什么临别的想法吗?你们在招聘吗?你们,显然你们正在寻找更多的人来使用它,但是。是的,是的。我们肯定在招聘。我们发展得很快,我们拥有一支非常聪明的工程师和研究人员团队。我们现在拥有,我们刚刚购买了一个价值500万美元的H200集群。所以我们有更多的计算能力可以使用。你们自己运行所有推理吗?我们混合使用我们的集群和AWS。推理,我们使用这些,所以我们有我们目前的集群,它就像
A100,现在我们已经更新到一个新的了。我们用它来训练和研究。训练与推理预算的比例是多少?
就像,是50-50吗?是?是的,对于搜索来说,会有更多的推理。我提到的另一件事,顺便说一句,我有点跑题了,但我只是想把它加进去,因为我一直都在考虑人工智能搜索的经济学。我认为,如果你查一下,上限将是你能够从广告中获利的东西,对吧?所以对于谷歌来说,假设是每千次浏览量一分钱,类似这样的东西。我不知道确切的数字,确切的数字在流传。这意味着这就是你的收入,对吧?那么你的成本必须低于这个数字。而且
所以在某个时候,对于每次页面浏览都要进行LLM推理调用,你需要让它低于你从该页面浏览中获得的钱。而且我对于Perplexity和Character也很惊讶的一件事是,他们无法让它低到合理的程度。我认为对于你们来说......
它是通过索引来预先加载的混合体。所以你只需要每月或每季度运行一次计算,无论你做什么重新索引。然后,当你进行推理时,也就是搜索实际完成时,只需要多一点,对吧?所以,我认为,当人们计算这种业务的经济效益时,他们必须考虑一下你把成本放在哪里,对吧?
是的,是的。我的意思是,你肯定必须,你不能在查询时在整个索引(数十亿个事物)上运行LLM。所以你必须使用LLM预处理事物,但是然后你可以对大约10、30、100,取决于1000,取决于你如何,你知道,你可以使用不同大小的transformer来计算成本。我的意思是,一件非常有趣的事情是,我们正在构建一个搜索引擎,在这个时代,LLM的成本正在急剧下降。当某个非常有用的工具在几年内成本下降200倍时,搜索领域将出现新的机遇,对吧?所以,不整合这一点并从中构建,不从头开始重新思考搜索,搜索算法本身,鉴于事实是事情正在下降200倍,这太疯狂了。非常感谢你来到这里,伙计。是的,谢谢。这太有趣了。真的很有趣。
谢谢。