We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

How To Build The Future: Aravind Srinivas

2025/2/21

Y Combinator Startup Podcast

AI Deep Dive AI Chapters Transcript

People

Aravind Srinivas

David Lieb

从 Bump 到 Google Photos 的创业之路和 YC 组合伙伴的角色

Topics

Aravind Srinivas: 我创办Perplexity的初衷并非要打败Google，而是想探索一个具有同样规模和雄心的想法。我最初在OpenAI实习时，受到Ilya Sutskever的启发，开始研究无监督学习和生成模型。在Google实习期间，我阅读了《In the Plex》一书，这进一步激发了我创业的想法。我意识到，搜索和自动驾驶是少数几个能够同时进行AI研究和产品构建的领域。Perplexity最初的版本是一个基于Twitter数据的搜索工具，用户可以通过聊天界面进行查询。我们后来意识到，让模型在推理时处理大部分工作，而不是在索引时处理，是更有效的策略。我们通过一个简单的启发式方法，利用搜索API的顶部链接和摘要片段，构建了一个快速原型。我们发布的后续问题功能显著增加了用户参与时间，这让我意识到我们找到了正确的方向。我们最初担心微软的Bing Chat，但后来意识到他们并不擅长消费者产品。我更担心的是Google，因为他们的广告业务将阻碍他们在AI搜索领域的创新。我认为Perplexity比OpenAI和Anthropic更有优势，因为我们更关注用户体验和产品细节。我们能够利用最新的开源模型，并进行微调和评估。我们不仅关注模型和推理，也关注产品设计和用户体验。 David Lieb: 我对Perplexity在不到三年内估值超过90亿美元感到惊讶。我很想知道Aravind是如何将AI研究与产品构建结合起来的，以及他是如何克服挑战，最终创造出这样一款成功的产品的。

Deep Dive

Chapters

Aravind Srinivas shares his background and journey into AI, leading to his involvement with OpenAI and eventual co-founding of Perplexity. He discusses his academic path and early influences in AI research.

Aravind Srinivas was an undergrad in India and pursued a PhD at Berkeley.
An internship at OpenAI with Ilya Sutskiver significantly influenced his career direction.
He realized the importance of unsupervised learning and reinforcement learning in AI research.
Aravind decided to focus on unsupervised and generative models, moving away from RL.
He interned at Google and was inspired by the company's origins and culture.

Shownotes Transcript

我们发布了提出后续问题的能力。这使我们网站上的参与时间翻了一番，也增加了每天的问题数量。所以我当时想，“好吧，这里面有些东西。不值得放弃并转向企业。”这不像我想去打败谷歌那样，那种动机。更像是，

像这样的想法具有怎样的规模和野心。今天，我对Perplexity的看法是一种更智能的谷歌搜索，在某些情况下非常有用。你想让我三四年后怎么看待它？

欢迎回到“如何构建未来”的另一集节目。今天，我们邀请到了Perplexity的联合创始人兼首席执行官Aravind Srinivas，这家公司在不到三年的时间里估值已超过90亿美元。感谢您的加入。感谢您邀请我，David。你是如何进入这个领域的？我对人工智能、深度学习研究非常感兴趣。这实际上是我进入美国的原因，

我在印度读本科，来到美国在伯克利读博士。当我开始在OpenAI实习时，生活发生了真正的改变，Ilya Sutskiver也在那里。我仍然记得我第一次见到他的那天，我准备充分，并且有很多我认为非常有趣的想法。他听了五分钟，然后说，所有这些研究都是无用的。听到这话感觉真的很糟糕。所以我习惯了，你知道，

听到正确的事情，即使它们让人不舒服。然后他告诉我，唯一重要的是他画了两个圆圈。一个大圆圈，他称之为无监督学习。然后在里面他说强化学习，另一个圆圈。他说，这就是AGI。其他所有研究都不重要。那是在他们构建GPT-1的时候。他们甚至没有称之为GPT-1。当我看到这项研究时，我回到伯克利说，嘿，我一直在研究RL。

那是当时因为AlphaGo和DeepMind而流行的东西。但这有点像追逐潮流。所以我回到我的教授那里说：“嘿，我们必须真正去研究无监督和生成模型以及生成式AI。”然后我就开始研究这个。

并在谷歌进行了更多实习。在我的谷歌实习期间，我偶然发现了一本名为“In the Plex”的书。所以我白天会启动工作，进行训练运行，然后去图书馆阅读这些书，因为实习生没有什么其他事情可做，对吧？而且感觉很棒，哦，就像这些人曾经也像我一样是研究生，而我现在在他们的办公室里实习。- 阅读关于他们的书。- 感觉很好。

将来能够创办像这样的公司真是太棒了，那里有很多研究，有很多AI。同时，它非常扎根于产品构建。

这很难做到。我花了很多时间思考这个问题。我甚至与Ilya Sutskever谈过这个问题，我们说可能只有两个问题你可以同时研究AI和构建产品。一个是搜索，另一个是自动驾驶汽车。因为你所有的产品发布都成为改进产品中底层AI的数据点。

这将使产品变得更好，这将导致更多用户，更多使用将导致更多数据点，它将成为一个飞轮。它也应该在AI完整性路径上。说这个有点像流行语，但它基本上意味着更好的AI应该不断使你的产品更好。这样你就可以继续经营你的公司，直到AI问题得到解决

一旦一切都解决了，好吧，当然，我们会担心所有这些影响。但是你的公司随着AI的改进而变得更好，而不是你的公司被其他人超越。没错。所以搜索就像其中一个问题。所以你正处于这样一个时刻，你意识到你想创办一家公司。你是如何获得这种……

启动能量来辞去你在OpenAI的好工作并去做这件事的？你是如何找到你的联合创始人的？我偶然发现了一篇博客，是由前YC合伙人Daniel Gross撰写的。但这就像如何构建下一个谷歌。我认为基本思想是，

你可以通过更好的查询改写做更多的事情。因此，你接受一个查询，然后添加一些后缀。如果有人正在寻找电影评论，只需添加后缀site:roddentomatoes.com。如果有人正在寻找某种新奇 gadgets 的评论，请使用 site:相应的 subreddit。你可以摆脱很多这些后缀和特殊的字符串来过滤结果。

并且即使使用现有的谷歌排名也能使谷歌变得更好，我甚至没有谈论广告问题，只是

简单的排名，然后你可以做更复杂的事情，例如对查询进行分类，他谈论大型语言模型如何自动找出这些后缀，我对这个非常感兴趣。好吧，这似乎是可以的，也许生成式AI可能像我过去一样称呼它为大型语言模型或生成模型，可能是构建搜索引擎的更好方法。我也非常有兴趣尝试做一些类似代理的事情。

当DeepMind构建了这个Android环境时，他们想使用知道何时使用哪些应用程序并控制应用程序的代理来制作移动应用程序原型。那时我与我的联合创始人兼首席技术官Dennis进行了交谈。我们在一天之内写了同一篇论文。所以我们彼此认识，他是我的实验室的访问学者。我们过去常常谈论，我们会提出一些关于如何构建代理来控制Android环境的想法。

所以我们一直在聊很多事情，但从未具体谈论过任何公司或产品。任何人都告诉你的第一件事是，为什么？为什么要做这个？当然谷歌会这样做，对吧？这甚至不像你去构建一个更好的谷歌文档，谷歌最终会这样做，因为这对他们来说是一件次要的事情。所以像Notion这样的公司仍然可以获得资金。

这是他们的核心王冠上的明珠。那么你为什么要尝试呢？我认为它实际上有意义的原因是，这又是，在发布产品之后，我们才意识到这一点，而不是之前。所以像有一些好处是无知的。无知是福。那是，

人们停止点击链接，广告经济就会消亡。现在你可以有很多，你知道这方面有很多细微之处，但这一核心见解只有在我们发布后才被我们意识到。所以一旦我们意识到这一点，我认为我们找到了方向，这让我们

花了我们过去两年时间。带我们回顾一下你实验的第一次迭代。我知道你做了一堆与Perplexity非常不同的演示。是的。我大胆到足以向我们的第一位种子投资者Elad Gill推销，说：“嘿，我想颠覆谷歌，但我有点想从

像素，从玻璃上做。我认为这就是你不会与在搜索栏中打字的人竞争的地方。他们只是看到——但即使在那时，你心里也知道，我想追赶谷歌？是的，这不像我想去打败谷歌那样，那种动机。更像是，什么是那种规模和野心的想法？就是这样。那也是多模态模型开始发挥作用的时候。

所以我认为，如果你走在改进技术的轨道上，你可以创造一些非常惊人的东西。我的投资者理所当然地说一开始不要做这件事。因此，我们更专注于搜索特定垂直领域或数据集或数据库，实际上是表格。我们是一家专注于企业的公司，但没有人想给我们他们的数据。我记得我曾经

为与PitchBook或CrunchBase的电话而奔波，因为我想构建一个对投资者有意义的演示。这样我们就可以继续筹集一些资金，然后真正招聘优秀的人才，然后去做真正的事情。CrunchBase拥有所有这些数据，PitchBook拥有所有这些数据，但他们就是不想给我们。所以- 下一步，Twitter。是的，Twitter。Twitter。

我们在埃隆·马斯克成为首席执行官之前的时刻。允许学术访问，合法。因此，我们构建了一个Twitter数据库。我们将其组织成表格的形式。我们尝试使用OpenAI Codex模型来做到这一点。这甚至在GPT 3.5之前。我们编写了很多模板。哦，对于这些类型的查询，这些是示例SQL。然后模型将执行某种RAG，从模板中提取相关的查询，然后根据模板SQL编写实际的SQL。

那是唯一一种使其可靠运行的方法。然后如果发生错误，我们会进行很多回调，它会自动更正。然后它将查询数据库，然后检索记录。这非常好。这是一个聊天界面。你可以聊天，你可以交谈，你可以绘图。这是你们做的第一个真正的产品或演示吗？是的，我们做得很快。这只需要一个月的时间，因为只有三个人。但一开始的能量是疯狂的。

他们向很多人展示了它，而且所有人都允许它。主要有两个原因。一，以前从未有过这样的事情。就像你永远无法继续前进。Twitter搜索。没错。直到今天。即使是今天，对吧？然后人们也允许找到所有这些，我认为是社交搜索，

了解其他人正在关注谁，他们喜欢哪些推文，他们不喜欢哪些推文，他们本周取消关注了谁？那些差异都很有趣。所以你推出了这个Twitter搜索功能。你是如何从那时过渡到我们现在都知道的Perplexity的？是的，我们有那个，对吧？然后我们试图为许多不同的数据库做类似的事情。GitHub。如果程序员可以去搜索关于存储库的信息。

或者LinkedIn，如果你几乎可以成为一名招聘人员，只需说，但即使现在也很难。我不会说，我想要所有曾在YC担任创始人的并且还在C或D创业公司工作过的人，因为他们会知道精打细算意味着什么。很难执行这些查询。哦，是的，使用LinkedIn UI来做到这一点。你做不到，对吧？由于各种原因，人们不想提供他们的数据，他们的付费墙。

如果这样的技术存在，我们将创造更大的价值。由于许多其他原因，它不存在。我们开始看到，即使在2022年当时的模型能力下，在3.5 turbo之前，

呃，事情实际上相当可靠，以至于人们会喜欢使用它并从中找到价值，我实际上读到了这条推文，我认为是保罗·格雷厄姆的推文，如果尝试

通常，当你找到更好的解决方案时，当你尝试解决更难的版本时，你最终会得到一个更简单、更通用和更可扩展的解决方案。这就是我们意识到的。就像，好吧，有一种方法可以做这些事情，我们可以访问这些领域中的每一个，并尝试构建其索引并将其放入特定格式（如表格），然后让大型语言模型以结构化语言（如SQL）读取它。

或者你可以采用另一种方法，即保持非结构化，并期望大型语言模型在推理时（在查询时）完成大部分工作，而不要在索引时完成所有这些工作。而且我们清楚地知道，如果第二种方法是世界前进的方向，模型会变得越来越智能，

这会给你带来优势，因为它更通用。你也有机会对抗谷歌构建的遗留系统，该系统更偏向于第一种风格。所以我们想，好吧，我们会尝试构建一个更通用的解决方案。然后我们实际上在一个周末制作了这个原型。实际上，John Schulman的团队当时已经发布了这个名为WebGPT的东西。所以我对此非常了解。我还在OpenAI工作时，他们甚至有一个名为TruthBot的机器人。

John和他的团队一起构建的，你可以向它提问，它会去搜索网络，然后它会给你一个答案，并附带一些来源。它非常慢，并且是用175B GPT-3模型构建的。所以非常慢且效率低下。它更具代理性，它实际上就像一个RL代理，它决定是否要点击链接并浏览它、滚动。它非常慢。

所以我们尝试了一个非常简单的启发式版本，但速度更快，即，好吧，你总是获取搜索API提供的排名前K的链接。你总是只获取索引已经缓存的摘要片段。所以没有滚动，没有点击。你总是将所有这些链接都添加到提示中。所以没有选择。要求它以学术格式编写带有来源的摘要。

就是这样。当这些模型达到3.5 turbo这样的程度时，各种模型开始出现，

这实际上开始运作得非常好。是的，指令遵循能力得到了足够的提高，你不需要做得非常非常严格。明白了。所以你采用了这种愚蠢的方法。是的，押注于AI会变得足够好，这将使所有这些都变得相关，我认为时机恰到好处，一年前，John和他的团队尝试过，模型只是快得多

更糟糕的是，如果你尝试了愚蠢的方法，它根本行不通。因此，你会得出结论，你需要一种更聪明的方法。但是当模型开始更好地遵循指令时，愚蠢的方法实际上有效。这解决了延迟的核心产品用户体验问题。你习惯于在传统的搜索中立即显示链接

对吧？顺便说一句，即使那时，我们推出的第一个版本，也就是答案版本，也花了七秒钟左右的时间……因为我们甚至没有这个流式传输答案的概念。我们会等到整个答案生成完毕。我们无法控制冗长性，因此有时答案会非常非常大。我们甚至不得不硬编码一个提示，说只写五句话或类似的东西，或者80个字。为了保持速度。是的，没错。好的，所以你推出了这个。

你是什么时候第一次想到，哦，我找到了方向。所以我们在推特上发布了它。好的。我在写这条推文时，心想，你知道，人们会嘲笑它。它会犯错误，等等。病毒式传播的第一时刻是当一位恼怒的知识分子学者搜索自己时。它说她，它用过去时给出了传记。她说，我还活着。搞什么鬼？

但实际上发生的事情是，有一个名字和拼写完全相同的人去世了，大型语言模型认为她去世了，并用过去时进行了描述。我实际上认为这是模型相当巧妙的推理，除了它甚至没有高阶能力来知道他们是不同的人。然后这让我们获得了大量关注。人们开始思考，好吧，看看，来源很好，但我们真的能相信这些东西所说的答案吗？然后……

这引发了人们搜索自己的趋势。这在所有消费产品中一次又一次地发生。当我偶然有机会与Mike Krieger谈话时，他说同样的话，即使你可以点击你自己的个人资料图标并返回你的照片，人们总是喜欢通过在搜索栏中键入他们的用户名来访问他们在Instagram上的个人资料。这是一种人类习惯。所以很多人开始输入他们的Twitter用户名或社交用户名，然后它会将他们在互联网上的所有活动混合在一起，包括他们在童年时期做的很多年前的事情。是的。

然后给出这些有趣的摘要，他们会截屏并分享。所以我认为那里有一些东西。所以有一些东西在驱动它。是的，但我仍然不确定。然后我们发布了提出后续问题的能力。这使网站上的参与时间翻了一番，也增加了每天的问题数量，以及每天的人数，每天的问题数量呈指数级增长。

所以我当时想，“好吧，这里面有些东西。不值得放弃并转向企业。”你有了最初的动力。你之前说过，直到事后你才想到，哦，我们实际上有机会与谷歌这样的公司竞争。这个认识是在旅程中的哪个时刻发生的？那是怎么发生的？说实话，我从未认真考虑过与谷歌的竞争，因为我知道，

他们无法在谷歌主页上制作这款确切的产品。很难知道查询是纯粹的信息性查询还是其他类型的查询。然后谷歌搜索页面已经非常混乱了。那是答案框、知识面板。有一些广告，有一些链接，有一些来自社交媒体的观点，所有这些社交卡片。信息已经太多了。所以很明显，感觉就像，你知道，快餐和健康餐。

即使对于信息性查询，使用谷歌和Perplexity的区别也是如此。我一开始更担心微软，因为他们正在推出必应聊天。事实上，在我们与风险投资公司NEA（位于桑德灵厄姆路）的一位投资者达成条款清单、握手的那天，经过一周痛苦的推销之后，

我们正在喝咖啡，然后泄露了必应聊天的截图。我想，“好吧，还有一个为期30天的尽职调查期。”另一位投资者会给我一份条款清单。他只是将其延长至45天。你可以看到差异。这是偷偷摸摸的。我清楚地知道原因。

他还发短信问，你怎么看待这件事？好的，好的，我明白了，我明白了。你有点害羞了。然后我与之握手的那个人，晚上给我发短信说，嘿，明天有时间打电话吗？很明显，就是这样，对吧？所以我告诉我的联合创始人，好吧，也许他们会退出或要求我们转向其他方向。所以

也许我们应该尝试出售公司，然后完成它。你知道，这不会有什么结果。实际上握手的那个人说，听着，我不会要求你转向其他方向。我不会要求你做任何不同的事情。

你们继续前进，我们已经言出必行。我想，哇，这太令人印象深刻了。然后下周谷歌还发布了来自桑达尔的博客，说他们宣布了一些名为Bard的东西，这是截图。所以我们知道这会变得非常大而且竞争激烈，但我们想

看，最后，微软很长时间以来一直不擅长消费产品。你不能突然改变这一点。所以在我看来，他们实际上错过了机会。谷歌，很明显，我知道。

他们会遇到自己的问题和挑战。所以我感觉这里还有其他人的空间。是的。我自己在谷歌工作了近十年，我看到了谷歌早期文化中的许多东西，比如我了解到的关于拉里或桑达尔的事情。我在你构建产品的方式中看到了很多这些东西。有很多细节需要注意。感觉你本人就是产品的首要用户。这是你故意尝试做的事情吗？是的，我确实故意尝试过。

拉里说过的一件事是，你知道，我一直提醒我们公司里的每个人。用户永远不会错。所以即使在今天，在测试新功能时，它不起作用。但是查询中存在一些歧义。所以我当时正在与工程师交谈，说，嘿，你知道，这不好。人工智能在这里还能做什么？而且

你知道人工智能应该做什么吗？它应该过来向我澄清并问我，“嘿，我不确定是这个还是那个。你实际上想要哪个？”然后我应该澄清，然后它应该去做。而不是说，“我不知道。”这就是用户永远不会错的原则。设计产品的另一种方法是，

让用户成为更好的提示工程师。责备用户，告诉他们成为更好的提示工程师。教他们，教育他们，让他们按照产品想要的方式去做。是的，没错。企业软件更像是第二种，但神奇的消费产品更像是第一种。我同意。就像在谷歌，为什么谷歌应该处理错别字？他们不必这样做，对吧？我们都应该擅长英语。

就像拉里说的，他从来都不擅长拼写，这就是为什么。我认为真实的故事是YC合伙人Paul Bukai，他只是为此感到恼火，他说应该有人来构建它。是的，没错。拼写检查校正器都在那里。同样，自动建议。它为什么在那里？更容易，对吧？同样，缓存结果。我甚至在某个地方读到拉里希望主页上模拟你家外面的天气。

这样你甚至不需要键入天气查询。它就在那里。所以我受到了这种设计风格的很大影响，包括Chrome搜索栏等细微之处。如果你已经访问过某个网站，它就在那里。在键入前两个字母后，你只需按Enter键即可。这影响了我确保我们的光标已准备好键入

在搜索栏中。你不需要用鼠标将其放在那里。听起来你最关心的主要指标是每天的查询次数，我认为这正是谷歌在早期所做的，对吧？如果没有保留率，很难做到这一点。从长远来看，我同意。你不能只为用户付费并提高这个数字。用户可以安装你的应用程序。

也许你甚至可以操纵它，当他们安装时，一个查询会自动提交，但不需要提交重复的查询。是的，我认为唯一的反例，我认为这在你的情况下不会发生，那就是产品无法满足他们的需求。因此，他们需要发出大量查询才能获得他们想要的东西，这与

拉里在谷歌的做法相反，你应该尽可能短地在谷歌上，因为我们试图让你去其他地方解决你的问题。是的，是的。所以这种情况没有发生。我的意思是，当然，我确定有一些错误等等，但是我们看到的大多数后续查询实际上与第一个查询完全无关，因为他们只是想继续会话或他们甚至不知道自己想问的问题，但他们想继续问。是的。

所以我认为你的团队已经壮大了很多，你已经筹集了很多资金。你是如何管理团队的？你如何以每周或周期为基础运营你的团队，每天的查询次数是我们的主要指标？因此，每次全体员工会议，我们都从这个数字开始。我不相信这种在电视上显示指标的做法

你知道，每天都能看到，因为我认为这也会分散注意力。但我确实认为每周查看一下，看看每周增长率，看看每月增长率，如果有什么下降，就讨论一下，找出真正令人担忧的方法，如果有什么下降，我们会这样做。如果有什么增长，那就看看为什么，在哪里。所以我们非常注重数据，并且在公司内部共享它。

实际上，我一直试图将其分享给用户，以便

他们感觉，你知道，这实际上就在他们眼前发生的事情，他们想成为其中一部分。存在等级制度。如果需要修复某些错误，如果我知道某个特定的人正在处理它，我可以直接与这个人交谈。没有人会感到受到威胁，因为我去和那个人谈话。不会因为我提出错误而产生这样的感觉，哦，他们会被解雇，因为我一天提出了50个错误。所以，你知道，像，

这更像是他们理解，让产品感觉很棒很重要。如果它对我们自己来说感觉不好，那么用户也不会感觉好。事实上，我们更有动力去使用我们自己的产品，但用户没有。所以用户的标准应该更高。所以总是感觉像用户。我认为这种文化存在于公司中。我喜欢这一点。你有没有……

在招聘时故意选择这一点吗？比如那些非常以产品为中心并且注重细节的人？我不会说我明确地将此作为标准，但我寻找的是那些关心做好工作的人。如果你不在乎，只是把它当作一份工作，那么

你很难对事情感到兴奋。我认为很多事情都来自创始人、你的文化和你的DNA。听起来你就是这样一种人，你会沉迷于细节，你自然会想要雇佣那些拥有这种特质的人。是的，如果答案错误，我会很生气。如果推特上的人说，“Perplexity正在退化”，我也会很生气。但是很多事情，有些事情实际上并不属实。

但我确实会尝试去看看，你知道的，抛开愤世嫉俗，即使是那些讨厌你的人。但如果那里有一些真实的东西，而我又想知道。是的。我喜欢看你如何在推特上与客户互动。这是你与用户交流的主要方式吗？还是还有其他很多方式与用户交流？所以我主要使用X，推特。人们在那里非常非常诚实。而且，是的，

我认为在电子邮件中，人们要礼貌得多。这也很好，我喜欢两方面。但我认为残酷的诚实会暴露最严重的错误。

以及人们不敢说的事情。——哦，当面是最糟糕的，你去向某人展示一些东西，他们只会告诉你好的方面。——是的，是的。——即使他们讨厌它。——我有点不喜欢那种，“嘿，告诉我你的想法？”你总是会说好话。——你可能会发展你的公司，大概你需要雇佣更多的人。你如何避免成为一家大型缓慢公司的命运？——嗯，这种情况已经开始发生了一点。

我们不像以前那样快了。我认为这部分原因不是因为人。这也是因为生产中出现故障，人们开始对产品失去信任。就像今天我们部署了一些更改，然后有人因为某个前端错误而感到沮丧。实际上是后端的问题，但人们只是假设事情。我认为像

快速加载，所有这些东西都很重要，并非每个新工程师都能完全理解代码库中的上下文。早期的工程师可以。如果你想发展到大众市场的使用，那么在快速发展和破坏事物之间存在一些张力。

所以我会说，这主要是在减慢我们的速度。我们还没有完全找到快速完成这项工作的最佳方法。我的意思是，我们确实有分阶段部署、部署测试、A/B 测试，所有这些都在发生。这自然会减慢我们的速度，并将产品广泛推向生产环境。除此之外，我会说那些痴迷于细节的人，世界上只有那么多人。所以显然你不能指望

第250位工程师会那样。但我尽力去标记任何正在处理任何新功能的人的错误。即使是这个规模，我也知道谁在做什么。我仍然尝试。我认为我们的联合创始人很棒。他们很关心，他们在组建团队时会推动这一原则。所以我们正在尽最大努力。我并不是说我们已经找到了解决方法或破解了它。

但至少我们正在努力对抗这里的熵。我认为这是你唯一能尝试的事情，对吧？是的。这是一场 uphill battle，但如果你坚持下去，是的。好的，让我们谈谈未来。我看到你最近的发布有点像朝不同的方向发展，更垂直化或更专注于购物或其他事情。你想把它带到哪里去？

今天，我对 Perplexity 的看法是一种更智能的谷歌搜索，在某些情况下非常有用。你想让我在三四年后怎么看待它？如果你去研究买什么最好的毛衣或哪个酒店在这个地方住宿最好，Perplexity 会给你一个很好的答案。但你实际上去哪里满足需求呢？你去谷歌。谁为此获得认可？

金钱上是谷歌。谷歌。我们什么也得不到。也许我们会给你一个专业版订阅，但其他人会以更低的价格提供免费服务，或者他们有更大的现金储备。

所以挑战在于，你想成为一个人们可以获得端到端体验的地方。他们从脑海中的一个问题开始，然后寻求你的帮助。你给他们答案，也帮助他们完成行动。这很难，因为人们认为，如果你有一个答案，比如，“贝索斯戴什么手表？”我认为他戴的是欧米茄之类的。

我个人认为，如果它不仅给出答案，而且还提供特定欧米茄手表的商品卡片和购买按钮，我只需点击购买即可完成，那就太棒了。但世界上还有其他人认为这是广告。它甚至不是广告，对吧？他们认为公司正在付钱让我们这样做。所以这就是早期采用者喜欢无广告信息体验的一些矛盾之处

与真正需要获得大众市场并在日常生活中真正有用所带来的矛盾之处。还有很多其他事情，比如查看比赛比分或快速访问网站。

如果你只想获得 API 的文档链接，或者只想在联合航空公司预订航班，答案可能只是一个链接。答案可能是明天的天气。那就是温度，或者某人的年龄应该是这样的，你会输入像埃隆·马斯克的网络。你只需不到一秒钟就能在谷歌上得到答案，对吧？而 Perplexity，它会提取正确的来源。也许它比谷歌更准确，但人们

人们不在乎这些细微的细节。所以你需要构建的是这个小型模型、典型的知识图谱、小部件、LLM 流式答案和更复杂的多个步骤推理答案的惊人编排

但用户不在乎。用户不会告诉你何时使用什么。你决定。人工智能，没有人谈论。何时使用什么，那种路由器，那种协调器。

我认为这是最难构建的东西。谁能构建它，并能以数十亿用户的规模运行它，并且知道如何很好地将其中一些查询货币化，谁将成为下一个谷歌。因为他们将拥有搜索栏，他们确切地知道该做什么，他们会去问澄清问题，它真正理解用户。

并且也为你完成任务，并且也让你以典型的方式浏览网络，所有这些都在一个体验中。你甚至可以说，也许没有人能够构建这个，因为它感觉像是一项艰巨的任务。

但我可以说，谷歌已经构建的任何东西都是最接近这种东西的系统。同意。所以下一代的这个显然是可以构建的。你只需要坚持不懈地在这个问题上工作十年或二十年。如果我和谷歌的人谈话，他们会说，是的，这就是我们正在构建的。事实上，我知道他们已经说了十多年了。OpenAI 也许一样，Anthropic 也许一样。当你看到你未来十年可能竞争的对手时，你认为……

哪一部分可能会让你获得获胜的优势？对用户的痴迷和良好的产品品味。很多事情都需要大量的领域知识。在你提到的列表中，谷歌是唯一一家真正拥有这种产品品味来做到这一点的公司。可以说，世界上所有的分销，一切，对吧？但困境也存在。这很有趣，就像

它是一家搜索公司，但它也是一家广告公司。搜索几乎是为了广告公司而存在，而不是相反。你可以争论说，这是每季度搜索收入之外的，大约每年 2000 亿美元。还有大约 1000 亿美元的其他地方，YouTube 和云，但利润率……

都来自搜索，对吧？云计算最近才盈利。YouTube 永远不会成为高利润的业务，因为首先，他们不会在订阅用户身上投放广告。其次，他们必须支付创作者，他们必须支付媒体合作伙伴。

所以它永远不会像搜索那样高利润。所以你基本上是在争论说股价将成为他们的累赘。正确。因为华尔街就像疯了一样。它会自动地，你知道的，如果搜索收入下降就会恐慌。

但在人们直接与人工智能交谈并且代理人正在为他们做事的世界中，搜索收入必须下降。这并不意味着他们不会采取任何措施。他们仍在构建 Gemini 和新的应用程序。假设是他们将无法轻松地将其放在他们已经拥有所有

数十亿用户的核心谷歌上。这是真的，对吧？对。是的。你认为从长远来看，谁能赢得这场胜利，就其定义而言，都需要提出一种新的货币化模式，一种新的商业模式。是的。还有很多其他问题需要解决。像

购物或旅行或所有这些事情，比如你使用哪些商家，或者你连接哪些酒店，或者中间商是谁，以及谁处理预订，如果客户想要取消东西。谷歌实际上也解决了这些问题中的许多问题，对吧？他们不仅仅是 PageRank 或 MapReduce，或者你知道他们在视觉深度学习方面取得的所有这些进步。

以及 BERT、Transformers。不仅仅是这些。这很好，但他们还做了很多其他枯燥的工作，比如推出谷歌财经、谷歌购物、谷歌航班。我觉得 Perplexity 比 OpenAI 和 Anthropic 更适合做这些事情，因为我们天生就关心用户和产品。我们不仅仅是在谈论推理和模型，对吧？但我们对所有这些事情都非常熟悉。

我们非常有能力利用最新的开源模型并自行提供服务，微调它们，进行后期训练并进行评估。我们不是人工智能文盲。我们不会把所有带宽都花在构建数据中心和芯片上，并试图仅仅谈论打破最新的编码和数学基准。我认为这很有价值，但这与构建下一代信息体验完全无关。好的，阿文德，非常感谢你加入我们。很高兴和你聊天。再次感谢你的邀请。

How To Build The Future: Aravind Srinivas 34:38 Share

Y Combinator Startup Podcast

Deep Dive

Shownotes Transcript

How To Build The Future: Aravind Srinivas