We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode ZeroSearch: Alibaba’s Bid to Replace Google with Disruptive Innovation

ZeroSearch: Alibaba’s Bid to Replace Google with Disruptive Innovation

2025/6/11
logo of podcast Artificial Intelligence: AI News, ChatGPT, OpenAI, LLM, Anthropic, Claude, Google AI

Artificial Intelligence: AI News, ChatGPT, OpenAI, LLM, Anthropic, Claude, Google AI

AI Deep Dive AI Chapters Transcript
People
Topics
我认为阿里巴巴的Zero Search是一种全新的AI模型响应生成方法,它允许AI模型自行模拟Google搜索,无需使用任何AI模型,并将训练成本显著降低。这项技术通过生成模拟的搜索结果页面,并使用算法筛选高质量结果,从而提供更好的答案。由于AI模型已经拥有大量互联网数据,因此可以使用旧模型中的合成数据来训练新模型,从而替代昂贵的Google Search API。实验表明,Zero Search的性能甚至优于Google搜索,成本节省高达88%。我相信,随着LLM的不断发展,Zero Search有潜力完全取代传统的搜索引擎。 我相信Zero Search通过模拟搜索结果数据,以开发先进的搜索能力。它通过生成模拟的Google搜索结果页面来工作,通过算法筛选高质量和低质量的模拟搜索结果,以提供更好的答案。Zero Search 通过生成多个结果并评估,从而获得更高质量的答案。Zero Search 旨在通过使用合成数据来替代昂贵的Google Search API,从而降低训练成本。强化学习训练需要频繁的推出,这可能涉及数十万次搜索请求,从而产生巨大的API费用并严重限制能力。Zero Search是一个强化学习框架,它激励LLM的搜索能力,而无需与真正的搜索引擎交互。Zero Search 的性能实际上优于 Google。LLM在大型预训练期间获得了广泛的世界知识,并且能够生成与给定搜索查询相关的文档。Zero Search 的新方法不仅与使用真实搜索引擎数据的模型相匹配,而且通常比它更好。一个70亿参数的检索模型达到了与Google搜索相同的性能。一个140亿参数的模型实际上优于Google搜索。使用Zero Search进行训练的成本比使用Google Search API​​ 降低了88%。训练有素的LLM可以替代强化学习设置中的真实搜索引擎。我相信Google的需求将会消失,因为Google上的所有数据现在都被吸收到这些数据中。Twitter的数据集非常有价值,Grok在这个新世界中会做得非常好。Twitter和新闻的组合与LLM相结合,基本上不再需要Google。这种方式正在完全改变我们看待信息的方式。Zero Search 的成本节省令人震惊,并且它能够胜过 Google。

Deep Dive

Chapters
Alibaba's Zero Search is a new AI model training method that significantly reduces costs and improves quality. It simulates search results instead of using a real search engine API, leading to an 88% reduction in training costs and comparable or better results than models trained with real search data.
  • Zero Search cuts training costs by 88%
  • It simulates search results instead of using a real search engine API
  • It achieves comparable or better results than models trained with real search data

Shownotes Transcript

在我看来,阿里巴巴在人工智能领域取得了令人震惊的进展,他们提出了一种生成高质量人工智能模型响应的全新方法。这与你以前听说过的任何方法都不一样。他们刚刚发表了一篇研究论文,介绍了这项技术,名为“零搜索”(Zero Search)。其本质是:

允许人工智能模型 essentially Google itself,但它不使用任何人工智能模型。它将训练成本降低了约 88%。所以,最大的亮点是它大幅降低了训练成本。我预计许多人工智能模型都会复制这种模板。但这绝对令人着迷。所以

阿里巴巴的研究人员提出了这个方法。在我们深入探讨之前,我想提一下,我的初创公司 AI Box 正式上线了。我们在 AIbox.ai 提供了我们的测试版平台,它允许你以每月 20 美元的价格使用所有顶级 AI 模型(文本、图像、音频)进行聊天。所以,你无需为每个模型单独订阅,只需每月 20 美元,即可访问所有顶级 AI 模型,例如 Anthropic、OpenAI、Meta DeepSeek、

11 Labs(用于音频)、Ideogram 等(用于图像),你可以在同一个聊天中与它们进行交互。

我最喜欢的功能之一是能够向特定模型提问,然后用另一个模型重新运行聊天。很多时候,我会让 ChatGPT 为我写文档或帮我写电子邮件或修改措辞,如果我不喜欢它的语气,我会用 Claude 重新运行它,我发现效果更好;或者有时我想让它更尖锐一些,我会用 Grok 运行它。所以你有很多不同的选择。

然后你会有一个小标签,可以并排打开所有回复进行比较,看看哪个最符合你的心意。如果你感兴趣,请查看 AIbox.ai。链接在描述中。好了,让我们回到阿里巴巴正在做的事情。正如我提到的,他们推出这项新技术,名为“零搜索”(Zero Search)。它允许他们开发所谓的先进搜索功能。但实际上,他们所做的是模拟搜索。

搜索结果数据。例如,你问它一个问题,它会创建一个模拟的 Google 响应页面,它实际上会生成,例如,当你使用 Google 搜索时,你会得到 20 个网站链接,你可以查看这些链接,它就像生成 20 个虚假的网站或 AI 生成的网站,它认为这些网站通常会

显示在该问题中。起初我以为,然后它本质上让 AI 模型运行,它有一个算法,它会选择哪些是高质量的,哪些是低质量的,选择哪些是最好的响应。这本质上帮助它给你一个好的,嗯,

答案。这让我觉得非常着迷。起初我想,为什么,为什么他们要这样做?这看起来太奇怪了。你为什么要生成多个结果?你为什么要生成像 AM 模型这样的东西?这本质上只是最新的一种方法,嗯,他们实现了几件事。首先,更高质量的结果,对吧?这有点像我们提出“思维链”(chain of thought)或告诉它逐步思考的过程时,它突然开始得到更高质量的结果。这真的很酷,因为它就像,

它会生成 20 个页面,然后它会浏览并查看 20 个不同结果的内容,并确定最佳答案。所以它就像,它会生成相同的东西大约 20 次。所以你会得到更好的回应。但另一个有趣的事情是,他们说,

这取代了使用昂贵的 Google 搜索 API。Google 搜索会提供一个 API。如果你想根据互联网上的所有数据训练 AI 模型,你只需获取 Google API,运行它,就可以根据互联网上的所有内容训练你的模型。但这非常昂贵,你需要向 Google 付出巨额费用。所以他们基本上用合成数据取代了 Google API。这听起来很疯狂,听起来不可能,但实际上并非如此。

遥不可及。有趣的是,因为,对不起,因为这些 AI 模型已经拥有所有数据,你知道的,在,在整个互联网上,它们几乎已经吸收了维基百科的所有数据以及它们可以获取的所有数据集。它们实际上已经拥有所有答案了。所以,如果它们已经从 Google 抓取了所有内容,它们就不需要再次抓取,仅仅因为它们正在进行新的模型训练。它们可以使用旧模型的合成数据来 essentially

创建新的训练数据。这听起来有点疯狂,但这就是他们对它的具体说法。他们说,强化学习训练需要频繁的 rollout,可能涉及数十万次搜索请求,这会产生大量的 API 成本并严重限制能力。

为了应对这些挑战,我们引入了 Zero Search,这是一个强化学习框架,它可以在不与真实搜索引擎交互的情况下激励大型语言模型的搜索能力。这对我来说太迷人了,这是一个非常有趣的概念。他们在做这件事时发现,这实际上优于 Google。所以

他们还提到的一件事是:“我们的关键见解是,大型语言模型在大型预训练过程中已经获得了广泛的世界知识,并且能够根据给定的搜索查询生成相关的文档。真实搜索引擎和模拟大型语言模型的主要区别在于返回内容的上下文风格。所以,就像他们提到的那样,他们已经从预训练中获得了所有数据。当他们实际要训练它时,他们不想再次查询 Google 并再次向它支付所有费用。所以,输出质量如何?这是我最大的疑问,我被震惊了。

所以他们做了一堆实验。他们做了七个不同的问答数据集,他们的新方法“零搜索”(Zero Search)不仅匹配,而且通常实际上优于使用真实搜索引擎数据的模型的性能。所以他们有一个 70 亿参数的检索模型,这并不是很大。

嗯,它实际上达到了与 Google 搜索相同的性能。所以,当你使用 Google 搜索时,他们只是说你获得的响应或你获得的前 20 个链接的质量,这些信息组合在一起的质量与 70 亿参数模型所能达到的质量相同。所以这是一个比较小的模型。

然后他们稍微提升了一下,他们有一个 140 亿参数的模型,这仍然不是最大的模型。我认为 Meta 有一个 5000 亿参数或 4000 亿参数的模型,嗯,它可能是他们最好的。所以有很多更大的模型,对吧?但他们的 140 亿参数模型,嗯,

实际上优于 Google 搜索。所以 70 亿参数的模型与 Google 搜索不相上下,使用大型语言模型与 Google 搜索不相上下,而 140 亿参数的模型则更好。因此,成本节省绝对巨大,使用 Google 搜索 API 进行约 64,000 次搜索查询。

这将花费他们大约 586 美元。当他们使用他们的 140 亿参数模型,并且只是在 A100 GPU 上使用大型语言模型进行模拟时,它大约花费 70 美元。所以,从 580 美元到 70 美元,训练成本降低了 88%。

在他们的论文中,他们引用道:“这证明了在强化学习设置中使用经过良好训练的大型语言模型来替代真实搜索引擎的可行性。”我认为我们将达到它完全取代搜索引擎的地步,就像字面意义上的那样。我们看到 ChatGPT 几乎做到了这一点。人们只是使用 ChatGPT 而不是 Google。但我认为,

对 Google 的需求将会消失,因为 Google 上的所有数据现在都被这些模型吸收了。随着它们在吐出数据方面越来越好,并且不会出现幻觉,并以一种真实的方式提供数据,就像我们看到的 Google 那样,Google 将不再需要存在,也不需要将人们发送到其他地方。现在,

我知道你在想什么。你可能会想,你怎么可能取代 Google 呢?所有这些新信息不断涌现。例如,这篇文章是新发布的信息,它不在他们的模型中,但在 Google 中。所以我认为,总会有一个地方可以容纳所谓的“新闻”,也就是新信息。你可能需要一个 API 来

获取新闻或新信息的来源,例如社交媒体,当然 Facebook 完全被封锁了。所以除了 Meta 可以访问之外,其他地方都不行。但是你还有 Twitter 或 Reddit。所以我认为 Twitter 和 Reddit,也许 Twitter 更重要,因为它有很多第一手的新闻视频之类的东西。所以 Twitter/X,无论你想怎么称呼它,我认为这个数据集非常有价值。所以我认为 Grok 在这个新世界中将会做得非常好。他们可以 essentially 创建自己的搜索引擎,它只是将信息链接到 Grok

上,它将链接到新闻文章和其他内容。所以他们真的拥有你所需要的一切。当然,新闻文章是另一件事。你可能想要新闻,你会看到 OpenAI 显然意识到了这一点,因为他们正在与 Axel Springer 和所有这些不同的,你知道的,所有这些不同的新闻机构达成协议,以获取他们的数据。所以,

记者撰写所有这些新的新闻文章之类的东西是很好的,但他们通常是从 Twitter 上获取的。所以这有点像,我认为,一个与大型语言模型相结合的 Twitter 和新闻组合。你实际上不再需要 Google 了。你不需要那个 API。你可以不用它运行。对于像 Meta 这样的拥有 Facebook 访问权限的公司来说,

Facebook,他们可能只需要自己就可以了,因为用户正在分享新闻。他们可以获取那里的热门内容并将其添加到他们的大型语言模型中。好了,他们就可以使用了。然后,当然还有 Twitter,很多东西都是第一手上传的,他们应该没问题。Reddit 也许甚至可以参与其中,或者他们正在将他们的东西授权给 Google 来做一些事情。所以我认为 Reddit 和 Google 之间的合作关系可能会出现。但这太迷人了。这完全改变了我们看待信息的方式。是的。

无论好坏,因为我相信很多拥有被抓取网站的人,他们的信息不再需要了,因为它已经被抓取,现在它就在那里,他们对此感到不满。所以看看事情会如何发展将会很有趣,但这非常迷人。我被成本节省震惊了。我被他们能够在这方面超越 Google 的方式震惊了。嗯,所以这是,嗯,

阿里巴巴推出的一个非常非常有趣的工具,一个引人入胜的新训练概念。非常感谢您收听今天的播客。如果您喜欢它,请务必留下评分和评论。如果您正在寻找一种方法来减少您 20 种不同的订阅费用,不同的 AI 模型,请查看 AIbox.ai。我们有很多令人兴奋的新功能即将推出。

即将推出。我们可以访问那里所有 30 个顶级 AI 模型,每月 20 美元即可使用。所以非常有趣。非常感谢您的收听,我们下次再见。