We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Should we stop talking about models?

2024/5/12

Hallway Chat

AI Deep Dive AI Chapters Transcript

People

Fraser

Nabeel

Topics

Nabeel: 我认为评估AI模型的长期竞争力是一个无法预测的难题，而非简单的智力挑战。如果AI产品的差异化在于产品体验而非模型本身，那么新兴公司更有可能胜出。如果AI产品的差异化主要体现在模型层，而用户界面保持相对一致，那么OpenAI等大型公司更有可能胜出。在大多数情况下，现有大型科技公司（Meta、Google、Apple）将在AI市场占据主导地位。AI模型只是一个使能技术，我们应该关注最终用户体验和实际应用场景。在AI领域，我们需要关注的是能够将技术应用于实际问题的工程师，而不是只懂理论的学者。评估AI产品成功的关键在于用户满意度，而不是模型本身的技术指标。AI模型的优劣取决于其在特定应用场景下的表现，而不是其整体性能。评估AI模型应该关注其在特定应用场景下的细微差别，而不是笼统的整体性能。评估AI模型的长期竞争力需要考虑其在未来几年内的持续性能和市场竞争力。判断AI模型的长期性能是一个未知的挑战，需要持续探索和实践。AI模型的竞争格局会随着时间的推移而变化，公司可能需要根据情况调整其模型选择。与客户的直接互动能够帮助公司获得宝贵的经验，从而改进产品，这比单纯关注模型本身更有价值。在评估AI初创公司时，我们应该关注其能否满足用户的短期需求，而不是预测未来的不确定性。即使投资基础模型公司，也应该关注其具体应用场景和使用案例。许多公司将自己的模型称为“基础模型”，但实际上并非如此，这导致了概念的混淆。即使是基础模型，其在不同任务上的表现也存在差异，需要针对具体应用场景进行评估。基础模型在特定领域的性能与其训练数据密切相关，并非所有基础模型都适用于所有任务。即使是基础模型，也需要根据实际应用场景评估其有效性。不同的基础模型在不同的任务上表现各异，用户会根据需要选择不同的模型。不同基础模型在产品体验方面存在显著差异，这表明基础模型并非完全通用。未来AI领域的竞争可能集中在少数几家大型公司之间。许多AI公司会结合使用多种模型，包括基础模型、小型专用模型和开源模型。消费者是否会为更先进的AI模型付费，以及大型科技公司是否会改变其商业模式，将决定未来AI市场的发展方向。未来AI市场的发展可能取决于新的产品体验的出现，这将改变用户对AI产品的价值认知。目前AI市场仍处于发展初期，未来仍存在许多不确定性。 Fraser: 在讨论初创公司时，我们应该关注用户体验和客户需求，而不是仅仅关注AI模型本身。许多AI初创公司过分关注模型本身，而忽略了用户需求和产品市场匹配度。评估AI初创公司应该关注产品市场匹配度、用户满意度以及公司从用户反馈中学习和改进的能力。基础模型与以往的AI模型不同，它是一种具有广泛应用潜力的基础技术。对基础模型公司的评估与以往的AI公司不同，需要关注其对世界的改变程度。在不同的市场中，关注模型的重要性有所不同，基础模型公司与其他AI公司有所不同。在API领域，少数几家公司（OpenAI、Anthropic、DeepMind）将主导最先进的模型能力。开源社区在模型能力方面落后于领先公司，但这为产品开发者提供了更易于访问的技术。AI在消费者领域的市场发展取决于当前的技术发展阶段（S曲线）。如果AI模型本身就是面向消费者的产品，并且用户重视其先进性，那么OpenAI等公司更有可能胜出。如果AI产品的差异化在于产品体验，而非模型本身，那么新兴公司更有可能胜出。如果AI产品的差异化主要体现在模型层，而用户界面保持相对一致，那么OpenAI等大型公司更有可能胜出。在大多数情况下，现有大型科技公司（Meta、Google、Apple）将在AI市场占据主导地位。Meta在消费者市场上的AI产品策略存在问题，类似于Google Wave。Meta将AI功能整合到现有平台的方式不够完善，缺乏与用户进行有效互动的机制。初创公司能够在与大型公司的竞争中胜出的关键在于发现大型公司犯错的机会。大型公司在整合新技术时，往往会优先考虑内部组织结构，而忽略用户需求。在深度搜索和信息挖掘方面，新的用户界面和产品体验将更有可能战胜现有大型科技公司的产品。目前，消费者在使用AI产品时，并不一定重视其先进性，他们更注重产品的易用性和速度。Meta等公司整合AI功能的方式不够自然，用户体验不佳。AI行业在向消费者解释不同模型之间的差异和价值方面做得不够好。许多用户使用免费版本的AI模型，导致他们无法体验到高级模型的优势。大多数用户对AI产品的需求相对简单，他们并不一定需要最先进的模型。 supporting_evidences Nabeel: 'I think we're joking ourselves if we think that that's a puzzle. It's a mystery...' Nabeel: 'I think if it's a chat-like experience where the differentiation happens at the model layer, but the UI remains somewhat consistent with where we are or simple, and the end user cares about the frontier of capabilities, I think it's going to be OpenAI or similar...' Nabeel: 'And then I think every other scenario, it's going to go to the incumbent. And I think we're going to see Meta, Google, and Apple all just have a big piece of that market on their platforms.' Fraser: 'last time we ended because we had to go. And it was a moment in time when you were talking internally a lot about how we just should stop talking about the models when we discuss companies...'

Deep Dive

Chapters

The discussion starts by questioning the excessive focus on AI models in startups. It argues that a customer-centric approach, prioritizing user experience and practical application, is more crucial than the specific model used. The core argument is that focusing on the "why" (customer needs) over the "how" (models) leads to better product development.

Prioritizing user experience over specific AI models is key for startups.
The model is an enabling technology, not the core product.
Focus on clear use cases to evaluate model effectiveness.

Shownotes Transcript

问题是，三四年后，它能否保持竞争壁垒？你知道，我用这个框架，就像，答案是一个谜题还是一个谜？因为我认为我们都试图变得非常聪明并解决一切问题。而谜题是可以通过蛮力思考解决的，智力马力就能解决。而谜团是只有通过旅程才能发现的东西。我认为，模型是否会随着时间的推移而保持最佳性能？

如果我们认为这是一个谜题，我认为我们在自欺欺人。这是一个谜。在这个世界里，我认为是新进入者获胜。所以，如果它不是一个聊天机器人，而你必须提供某种今天不存在的、我们从未见过的疯狂的产品体验，我认为这是一个全新的东西。

我认为，如果它是一种类似聊天的体验，差异化发生在模型层，但用户界面与我们现在的情况或简单的界面保持一致，最终用户关心的是能力的前沿，我认为这将是OpenAI或类似的公司。

然后我认为其他所有情况，它都会落入现有公司手中。我认为我们将看到Meta、谷歌和苹果都在各自的平台上占据很大一部分市场。大家好，欢迎回到Hallway Chat。我是Fraser。嗨，我是Nabil。欢迎来到Hallway Chat。我知道你有一些想谈论的事情，但我将从…

我们是否应该把它做成播客或一系列推文，我不知道你是否看到了，但风险投资公司USV上周发布了这个。基本上，我认为他们正在录制他们每周一的合作伙伴会议，作为他们介绍性播客的版本。我们喜欢这家公司，他们倾向于谈论很多不同的事情。他们刚刚发布了他们版本的Hallway Chat，我们本周讨论的内容。这是一个很棒的小读物。我不知道你是否读过。你读过吗？

我没有读，没有。不，我会发给你的。里面有一些内容，比如，“嘿，本周我们讨论了在人工智能世界中，对所有类型的数字内容进行数字签名以保持真实性的重要性。我们讨论了“不会作恶”的前端理论和“无法作恶”的后端理论，这是一种思考艺术的混合架构。这就像，这很酷。这让我想到，也许我们不应该…

让每个人都站着40分钟阅读这些内容，当他们只需阅读带有标题的推文时。我不知道。让每个人都更有效率一些。这是媒体消费的分裂，对吧？你既想要一个两小时的滚动对话，又想要尽可能简洁的摘要。

我认为这可能是对的。是的。也许答案是两者兼而有之。也许答案是我们应该有两个小时的版本。我们应该有3秒钟的版本。我们可以有8秒钟的版本，你只需选择你的媒介，我们将用人工智能将其剪辑成55种不同的方式。

也许吧。我迫不及待地想看到它。我非常尊重他们。他们都很聪明。所以，赞扬一下。尽管如果我们在所有不同的媒介中做所有媒体的事情，这意味着我们最终将不得不向人们展示我们实际交谈的视频，而不仅仅是音频。我还不太确定我是否愿意这样做。

让我们开始吧。你知道，上次我们不得不结束，因为时间到了。当时你正在内部谈论很多关于我们在讨论公司时应该停止谈论模型的事情。我认为这是一个有趣的对话，我们应该在这里继续。这是什么意思？你为什么这么说？是的，我的意思是，我在内部说的具有煽动性的话是，如果我们永远不再谈论模型会怎么样？是的。是的。

并且有一点提示。是的，这来自于一种感觉，我们个人、内部，坦率地说，我认为我在与创始人洽谈时也注意到了这一点。我们可能关注的是错误的事情。我的意思是，模型的核心在于它是一种支持技术。这就是我们谈论的。这个生成式人工智能的世界是一种支持技术。这让我想起了……

过去，曾经有一句格言，你宁愿要来自佐治亚理工学院或滑铁卢大学的工程师，也不愿要来自麻省理工学院的工程师，因为刚毕业的麻省理工学院计算机科学专业的毕业生只学习了一堆理论计算机科学，这有点像整洁、奇妙和学术上的用途，并且可以构建技术以进行技术分割，但根本不在乎这将如何在现实世界中使用。而一个更实用的计算机科学项目，他们将成为建设者和黑客，这就是我们想要的。我们想要建设者和黑客。

它有点像两点。第一点是，我们需要关注最终用户。你知道，模型在所有事情上都不一样好。所以问题不在于你使用了哪个数据库或使用了哪个模型，而在于最终用户是否会对这个产品感到满意并会再次使用它？因此，你获得了继续与他们合作的权利。第二个根本问题是，模型对公司本身是否重要？

也就是说，模型是否适合你的特定用例？如果你没有一个非常清晰的用例，你就无法评估模型是否适合该用例。我们可以天花乱坠地谈论，哦，这是一个用于音乐、文本、声音或图像的模型。但是，

我们已经看到，这不是答案。答案是，它在渲染用于深度伪造的面孔方面真的好吗？或者它在语音语调的变音方面真的好吗？因为这就是用例。答案在于你使用和评估产品的方式的细微之处。而不是因为它擅长某种大型的10000英尺的标题。

最后，即使你认为该模型非常棒，并且像苏打水一样，现在处于最先进的水平，你仍然必须问自己这个问题，它是否会随着时间的推移成为最好的东西？对。对。就像，是它吗？我不在乎。这是一家处于早期阶段的初创公司，有15种方法可以打破它。问题是，三四年后，它能否保持竞争壁垒？你知道，答案是一个谜题还是一个谜？

因为我认为我们都试图变得非常聪明并解决一切问题。而谜题是可以通过蛮力思考解决的，智力马力就能解决。而谜团是只有通过旅程才能发现的东西。我认为，模型是否会随着时间的推移而保持最佳性能？我认为，如果我们认为这是一个谜题，我们就是在自欺欺人。

这是一个谜。这是一个不可知的事物，因为我们已经多次看到，你和我都与我们合作的几个投资组合公司一起工作，这些公司最初使用模型，现在正在采取……现在正在采取这样的情况，开源正在赶上来……

他们完全可以接受，好吧，我们将把模型冲进厕所。让我们使用开源模型吧。当另一个模型实际上更便宜、更好，而且我可以与外部合作伙伴合作使其变得更好时，我没有理由花费时间、金钱和精力在内部构建模型。因为最终，我的客户仍然很满意，我仍然与他们合作。坦率地说，通过与他们合作，我现在已经获得了一些有用的见解，这将帮助我在明年构建更好的产品，而那些不在市场上与这个客户合作的人将不会拥有这些见解。这些才是……

这些才是重要的东西。每个人都很聪明。每个人都在试图回答很多问题。我只是认为，我们不问错误的问题非常重要。因为如果你向创始人或彼此提出错误的问题，你仍然会得到答案。因此，最好追溯到，这个问题是否值得回答？我们承担的风险是什么？我们承担的风险是，无论你使用什么支持技术，它能否在短期内满足客户需求？

然后，从那里开始，战争迷雾太多了，无法知道之后会发生什么。我同意所有这些，但肯定也有例外。像基础模型公司就是模型公司。比如你应该……

我们是Anthropic的投资者。我觉得我们对这项投资感觉很好。是的，是的。那么，有什么不同呢？为什么在某个市场上，谈论模型曾经是正确的事情？为什么你认为在我们看到人们谈论模型的许多其他市场中，谈论模型没有多大意义？

因为这就是它的来源，对吧？就像我们现在花了几周时间，但我们在短短几周内遇到了很多人，他们来找我们谈论模型。是的。我们就像你之前说的那样，我们问错了问题，因为最终你就像，我们甚至不应该谈论这些模型。问题是，这些客户会发生什么？是的。

是的。并且产品市场是否合适？是否有满意的客户？他们能否随着时间的推移为这些客户提供服务？他们是否有产品思维和品味来跟随他们在旅程中？他们是否通过与客户的接触获得了见解？这些是最重要的事情。你必须确保技术能够胜任构建事物。他们必须能够交付代码，速度很重要，所有这些事情。对。

那么基础模型有什么不同呢？很简单。它们是基础模型。这听起来很简单。不，不，我们，这听起来很迂腐。不是的。几十年来我们一直有AI，几十年来我们一直有模型。有些小，有些大。

关于这一点没有任何改变。我们评估人工智能公司的方式，我的意思是，你知道，我们投资了Cruise，它有很多人工智能和很多模型。我们早在前些年就投资了Grammarly，它有很多人工智能和很多模型。五年前或十年前，当我们投资这些公司时，你并没有问任何这些基础模型问题。你是在询问它将如何改变世界，以及你是否认为它真的会改变世界，然后……

然后做出决定。这不是本末倒置。我认为确实存在一种叫做基础模型的东西。我认为，每个正在构建任何类型人工智能模型的其他创始人现在都会将他们的东西重新命名为基础模型，这并不奇怪。对。这就是问题所在，对吧？我们没有看到人们推销精确模型或特定模型。它们是X的基础模型，Y的基础模型。对。但是，制作纸杯蛋糕的基础模型并不是基础模型。

我上周看到一篇帖子，我认为它进入了Slack，其中一些很酷的一次性提示即使在所有基础模型中也具有截然不同的有效性水平。因此，我们盯着这些松散的评估，这些评估给了我们一些随机数字。但即使是单个提示也是，你知道，你会给ChatGPT一个C-，给Cloud一个A-，然后对于其他一些提示则相反。

因此，不，你会看到，如果一个模型经过更多训练和调整以用于编码数据，它在编码方面就会更好。我们知道，这些大型基础模型公司正在关注不同的领域，他们正在对数据进行分段和正确地构建数据，以便在这些领域获得更高的效率。这并不意味着一个基础模型不会成为一家非常非常大的公司，你知道……

我们显然对Anthropic非常看好。但是，不，伙计，我认为即使是基础模型，也值得问这个问题，它是否擅长我想让它做的事情？它仍然归结于客户试图做某事。说得通。我们正在听取许多创始人的意见。还记得那位告诉我们她使用……我不记得哪个了，但Anthropic用于一项任务，然后……

GPT-4用于不同的时间。我们在许多初创公司中都看到了这种情况。是的，一直如此。对于愿意测试模型的人来说，他们绝对会看到，我喜欢Claude的语气和基调用于X，然后我使用……如果他们给我访问权限，我会使用Gemini Pro用于Y。是的，我认为有趣的是，他们非常清楚地看到了……

在他们产品的不同部分体现出来的不同质的方面。如果你认为这些都是广泛概括所有内容的基础模型，那么这不是你所期望的。实际上只有大型语言模型。多模态，最终是多模态的大型语言模型。这是一个……

基础模型中特定情况的N，这在计算中几乎从未存在过。看起来我们将有一场三到四匹马之间的比赛，可能是Meta，我不知道你对此有何看法，ChatGPT，Quad，谷歌。我们将看看是否还有其他人可能会出现。其他所有都是人工智能公司。这是一家支持人工智能的公司。也许他们正在使用基础模型……

我们越来越看到的是，他们正在混合使用。他们正在为某些事情使用基础模型，为其他事情使用一些较小的专有模型，为其他事情使用开源模型。哦，太好了。这不是你正在承担的风险。我认为这样评估更容易。我们还进行了一些其他大型模型投资。嗯哼。

你知道，一个在生物领域，Perfluent，对吧？一个在Adept，动作转换器模型。但我们也在这些特定情况下非常喜欢这个用例。所以我们当时确实谈论了很多模型，但我认为你可以反过来做，我们可能会做出更快、更好的决定，坦率地说。你可以从用例和能力入手，仍然可以做到。

是的，你知道吗？我现在正在反思。Ali Madani是ProFluent的创始人，他正在将转换器扩展到生物学领域，只是为了提供一些背景信息。我现在正在重放过去几个月与他的谈话。他定位它，他不称之为生物学的基础模型。他将其定位为他们拥有一个底盘，然后他们将将其拉入特定行业。我们看到第一个是基因编辑。

这太棒了，对吧？但这首先是一个用例框架的问题，它具有可能跨越多个垂直领域的某种……你知道……能力的支持技术。所以如果我给他……赞扬一下，他从一开始就以这种方式谈论它。我的意思是，要……

在那里并给予我们的人员广泛的赞扬。这正是让我们对Ali感到兴奋的原因，以及他正在做的事情，对吧？他不仅仅是一个科学项目，他不会只是将数据扔到问题上。他就像，不，这些是我想要在世界上使用的用例。这些是我认为我们可以构建蛋白质的地方，这样你就可以帮助世界。就像，我要去做这件事。我使用Transformer架构。是的，是的，是的，是的。顺便说一句，让我兴奋一下，大约20秒钟。自从我们最近一次交谈以来，他们的版本已经发布。这个想法……

五年前，我们曾经对使用深度学习进行自然语言处理技术感到兴奋。它可以找出句子中的双重否定。我记得坐在我的公司里，心想，哦，我的天哪，我找到了“非非”问题。现在，转换器不仅可以撰写完整的文章，而且你知道，所有这些公司都使用了转换器……

转换器设计了一种自然界中不存在的全新蛋白质，它正在哺乳动物细胞中进行基因编辑。太疯狂了。我认为我们忘记了过去五年世界变化的速度有多快。我同意。我同意。需要明确的是，这并不意味着我突然变成了反AI的人。就像，我认为你知道这一点，对吧？就像，我认为……

我认为GAIA将在未来20年内通过整个美国的GDP，以及全世界。我认为我们最终会达到AGI。我们不必争论何时达到。这只是一个如何评估现在与以后的问题？在初创公司领域，相差两年就意味着公司倒闭。而时间上的偏差就是错误的。

这不仅仅是时间上的偏差。因此，如果我们试图评估你现在正在进入的内容，你仍然只需要问一下用户是否会满意的问题。你可以从那里开始。是的，听着，我从未想过你是一个技术落后的人。对吧？就像……

我认为你的实用主义受到赞赏。你所说的这些其他模型，该行业问错了问题，许多人现在仍然如此。当你问错了问题时，听着，我们很乐意花很多时间来争论，你知道，这个模型的可防御性，这个，那个，以及其他事情。但是，如果你将其视为最终用户的支持技术，

我认为你会问不同类型的问题。我的意思是，这不仅对我们来说是一种鼓励，显然，但就像，我们只是在公开谈论我们在内部谈论的内容。但我发现同样的循环也发生在创始人身上。

是的。而且可能没有成效。是的，是的，是的，是的。几分钟前，你问我我对Meta及其交付大型模型的地位有何看法。我将利用这个机会过渡到今天我想和你谈论的内容。但在开始之前，我要给自己一个奇怪的赞扬。我认为就构建者可以访问……

你知道，最强大的模型的API世界而言。我认为一年前，我在帖子中的观察是，将会有两到三家少数参与者这样做。我说，OpenAI和Anthropic。我说，也许DeepMind。我认为开源在能力上将落后一到两年。

我现在对这一点的感受甚至更好，就原始能力而言。我认为有很多证据表明这一点，这很好。我认为如果开源社区落后12到18个月，这将成为……

不是商品，而是对产品构建者来说更容易获得的层。我们将看到很多美好的事情发生，然后当他们想要使用少数几家参与者提供的最强大的模型时，他们将在各个方面付出代价。今天我想和你进行的对话是，把API和原始模型能力的讨论放在一边。把人工智能用于工作效率的市场放在一边，因为我也认为这是一个非常重要的市场，但它与我想谈论的市场不同……

过去几周，Meta和其他公司在面向消费者的AI方面有很多新闻。这是一个非常重要的市场。我一直在试图思考我们朋友Anthropic的Diane最近在晚餐上发表的一条评论，即该市场中发生的事情取决于我们在S曲线上的位置。我认为这是一个非常好的框架，并且……

我不知道。我有一些想法想和你分享。我不是Mitch Wood。我认为我在曲线的左侧或右侧。我认为如果模型是消费者的产品，如果消费者正在互动，而模型是……你的母亲在四年后使用人工智能时会使用什么，使用类似ChatGPT的产品？没错。如果模型是产品，并且……

最终用户对前沿能力有差异化的价值，我认为这将归于像OpenAI这样的群体。他说……

是推出Jats GPT的人，或者……不，不，不，不，不，不。他说担任产品主管……不，不，不，不，不。不，不，不，不。我对这一点的强烈信念是，我记得去白板前为Brad画矩阵图。我认为真正的潜力在于……

白领工人的AI工作效率。我认为他们围绕Moderna等发布的许多用例确实强化了这一点。我认为肯定存在构建者使用的API中的AI。将有一套AI工作产品，这将是一个完全不同的市场。然后是，当消费者想到使用广泛的AI产品时，他们会使用什么？什么……

过去一年多以来，对许多人来说都是ChatGPT。我认为我们正处于该市场S曲线的早期阶段。我认为在未来几年中，事情将如何发展存在很大的不确定性。我一直在试图思考哪些动态会导致什么结果。我在这里插入一下。你是否仍然认为四年后，这个市场的赢家将是一个聊天界面？所以你假设四年后，这个市场会有一个赢家。

他们就是AI领域的谷歌。我正在与你的母亲将要使用的LLM交谈。对。你认为那仍然是一个聊天框吗？听着……

让我直接回避这个问题，通过建立对话，对吧？未来需要进行真正的产品探索。这是一个谜，你将通过它来弄清楚能够为最终用户提供巨大价值的正确产品体验。在这个世界里，我认为是新进入者获胜。

所以，如果它不是一个聊天机器人，而你必须提供某种今天不存在的、我们从未预料到或从未见过的疯狂的产品体验，我认为这是一个全新的东西。我认为，如果它是一种类似聊天的体验，而聊天可以发展成许多不同的东西。如果你有工具使用以及所有进入基本类似聊天体验的其他功能，如果差异化发生在模型层，

但用户界面与我们现在的情况或简单的界面保持一致。最终用户关心的是能力的前沿。我认为这将是OpenAI或类似的公司。然后我认为其他所有情况，它都会落入现有公司手中。我认为我们将看到Meta、谷歌和苹果都在各自的平台上占据很大一部分市场。

好吧，我将与你之前的观点争论。我认为你列出了几个人，他们可能会赢得类似谷歌、OpenAI、Meta，也许还有Anthropic，也许没有其他人，你的观点是，这将是现有公司和这少数几个人。我只是认为Meta……Meta不是Google Wave吗？

就像，我喜欢扎克正在做的事情。我喜欢，你可以从他在播客中谈话时看出，他感觉自己……他拥有如此美妙的创始人能量，你知道，这个人不会放弃。他正在其中。在未来几年，我们将从Llama获得一些不错的模型。这太棒了。我喜欢所有这些。但是，当涉及到消费者表面时，他只是……

他把它塞进了Instagram和所有其他东西。这就像Google Wave。我认为他们没有能力与客户进行这种对话，让客户带着以正确的方式与Facebook平台互动这种期望来到他们这里。也许有一种情况是，像WhatsApp这样的消息传递也许……也许在那里，但这感觉非常附加。

它非常附加。当然是的。但这非常激进。这就像扎克的奇妙能量。但以下是我们可以假设为真的内容，对吧？是他们分享的，OpenAI，Sam分享说他们在某个时候拥有1亿周活跃用户。当然。让我们假设这是一个巨大的数字。这是一个巨大的数字。

你知道，绝大多数用户，绝大多数用户都在免费层，即3.5。是的？是的？这意味着绝大多数用户现在正在获得与WhatsApp、Instagram以及扎克刚刚塞进的每个其他地方的顶级功能中获得的完全相同的体验。我看到Chrome……

谷歌现在在Chrome的搜索栏中，如果你以“at”开头搜索，你实际上会被带到Gemini。因此，我们将看到他们越来越积极地将其塞入他们的分销渠道。我相信我们将在WWDC上看到同样的情况。因此，对你来说，问题是，它肯定不像我们一年半以来看到的Wave那样。

绝大多数转向这些产品的人，无论是Claude还是ChatGPT，都是为了获得基本的聊天体验，而这种体验现在掌握在谷歌和Meta手中。因此，要认为他们会失败，你必须认为需要提供一种全新的产品体验才能赢得这场胜利。

我认为有一些事情值得讨论。一个是，我总是会寻找初创公司击败大公司的途径，因为我的一生都致力于此。因此，找到他们搞砸和遇到问题的地方，因此这就是路径，这正是我醒来要做的事情。

所以，这是第一点，因为它一次又一次地发生。大型公司意识到新的创新事物，然后迅速推出一个解决方案的模式，这个解决方案并没有经过充分的考虑，试图利用他们的权力、能量，但最终还是失败了。部分原因是，正如你几周前非常恰当地指出的那样，他们交付的是他们的组织结构图，而不是客户想要的东西。

这只是个，这种情况一直都在发生。就像，每一次战争的胜利，你知道，微软与网景竞争，并发布了 Internet Explorer，因为他们确实适当地推向了市场，并且利用了他们作为操作系统的既有捆绑优势。还有数百个其他例子表明它根本行不通。所以，

关于 Google Wave 的评论是，你知道，谷歌决定，哦，我的天哪，Facebook 真的很大。我们也必须拥有社交功能。然后只是把社交功能塞进他们可能在谷歌中找到的每一个小孔里，摆在你面前，而不是在你想要思考这些问题并与这些事物互动的地方。而语境对消费者来说很重要。这就是我对 Meta 的看法。他们只是蛮力地把它塞到各处。大多数地方都没有

经过深思熟虑，也没有实际的上下文相关性。然后在谷歌的情况下，它被内置到搜索中。很好。它出现在我的 Gemini 的顶部。我认为对很多人来说，这可能是他们第一次体验真正的 AI，仅仅是因为谷歌的规模有多大。说得通。但正如我们四集前讨论的那样，搜索大致可以分为三种类型。

对，对。所以问题是，我认为对于第三种类型的搜索，研究性搜索，深入的来回搜索，聊天，就像，我试图深入挖掘某件事。我认为这是一个新的用户界面。我不认为谷歌或 Meta 有任何机会赢得这场胜利。他们永远不会有足够的周到性来构建合适的界面。每个组织内部可能都有一些优秀的人知道这一点，并且喜欢发布它，他们会想让他们。所以他们必须离开去创办一家新公司，在那里他们可以加入云，然后在那里做这件事。

但会有新的公司来满足这些新的需求。这是我的赌注。是的，我个人并不相信我接下来要说的话。但是反对你论点的论点是，到目前为止，我们看到的是，大众消费者并不重视能力的前沿。

他们不在乎差异化的产品。他们想要一个足够好的模型。他们想要一个快速有效的答案。没错，他们想要一个现在基本上对任何人都可以通过类似聊天的界面广泛使用的足够好的模型。而这是一个案例，这将是扎克伯格所做的大部分案例。我认为这是正确的，只要你理解你为什么要这样做。当我点击 Instagram 上的小消息栏时，我不知道我为什么在那里。

我不知道我像。同样的，如果你把音乐播放器塞进去，我会想，什么？你为什么不把它作为一个应用程序发布？你在说什么？在 Instagram 的“探索”标签上，当他们甚至给你一个令人费解的俏皮话时，他们只是抄袭了令人费解的 UI。这很刺耳。你会想，等等。我想要我喜欢的照片中的短视频。我不想……

给我写一个这个的食谱。我可以在这里最后再抱怨一下，然后我们继续。

你知道，每个人都在使用 3.5，因为他们都在使用免费计划，这实际上是一个非常有趣的观点。这是一个不幸的观点，因为我无法告诉你我尝试与多少人交谈过，甚至是其他创始人、风投和业内人士。我说，等等，你在使用免费计划。你在做什么？你甚至没有，然后他们抱怨它，出现幻觉，没有给出好的输出。我说，哦，我的留存率下降了。我说，好吧，你甚至没有使用好的技术。我不知道你在说什么。我认为，

我们在试图与消费者沟通的行业中确实遭受了一些损失。对于企业来说，这很好，因为他们可以测试所有模型并找出哪些模型有效。但是我们做得非常糟糕。我会责怪你。你应该在离开 OpenAI 之前就应该这样做。关于为什么你会升级并从这个计划转向这个计划，为什么你应该为 Claude 的 Opus 付费的产品营销。

就像为什么你应该使用 Gemini Pro 一样。我们还没有找到一套好的语言来让人们理解这是一种完全不同的体验。当你使用最先进的模型做很多事情时，它会好得多。不是所有的事情，对吧？对于大约 40% 的事情来说，使用 3.5 就足够了，这就是为什么我让每个人都感到惊讶的是 Chachapiti 增长如此之快。但是，

我们作为行业并没有很好地向人们解释这种真实的体验将会是什么样的。这有点不幸。我认为他们不在乎。我认为我们很乐意这样做，因为这是你我以及这个行业的其他人，我们必须关心趋势以及事情将如何发展。但对大多数人来说，这是他们偶尔会互动几次的事情。它让他们的生活轻松一点。然后他们下班后想去打垒球。

我明白了。我明白了。但这就是为什么产品营销如此重要的原因，因为他们分心了，他们只想要解决方案。如果他们因为解决方案不存在而感到沮丧，那是我们没有向他们解释解决方案就在拐角处的原因。它只是不在免费计划中。是的，但他们并不关心更优雅地解决这个问题而花费每月 20 美元。

关于事情将如何发展的讨论的核心是，我们是否总是会看到用户不重视面向消费者的应用程序中的能力前沿，因此不愿意付费？在这种情况下，我认为大型实验室不会这样做，除非他们改变他们的商业模式。我认为我之前听到你说过，这正是我同意的，我认为将会有一个全新的产品体验被交付

我们交付的东西因为 Noah 与 Tina 迭代了一个 UI 而成为正确的 UI 的可能性，在我看来是如此荒谬，以至于有人会向我们展示一种美丽的新颖的塑造产品体验的方式。我认为在那时，我们会看到用户会关心它。

我们仍然处于游戏结束之前。我喜欢这个，弗雷泽。我喜欢这个。是的。在这种情况下，我认为实际上是新进入者赢得了这场胜利。或者有一个小型团队，其中一个人确实把它推出了门，并且可以从那里来，但它仍然不是新的。我期待着。如果你看到它，你会给我发短信。好的。太棒了。我们结束了。是的，我们做吧。

谢谢大家。我们几周后再见。再见。我不知道。我们见面的时候再见。是的。我们会用几条推文摘要来见你。让我们知道你实际上想要哪种格式。这将会有所帮助。我们可以做到。我们可以转换。再见。

Should we stop talking about models? 32:45 Share

Hallway Chat

Deep Dive

Shownotes Transcript

Should we stop talking about models?