We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 🔎 Grok DeepSearch vs ChatGPT DeepSearch vs Gemini DeepSearch

🔎 Grok DeepSearch vs ChatGPT DeepSearch vs Gemini DeepSearch

2025/5/1
logo of podcast AI Unraveled: Latest AI News & Trends, GPT, ChatGPT, Gemini, Generative AI, LLMs, Prompting

AI Unraveled: Latest AI News & Trends, GPT, ChatGPT, Gemini, Generative AI, LLMs, Prompting

AI Deep Dive Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
Grok的Deep Search模式利用来自X(推特)和更广泛网络的实时数据,通过代理过程咨询数十个来源生成详细报告。它擅长处理非技术性话题,例如理解大众观点或趋势,而非复杂的科学论文。其速度较慢,在需要学术严谨性或详细分析的任务中,其输出可能不够全面。Grok的Deep Search模式相对不受限制,用户欣赏其较少的内置限制,但这也增加了遇到错误信息或不可靠来源的风险。 ChatGPT的搜索功能使用必应索引和OpenAI网络爬虫,并具有改进的引用功能(多个来源,突出显示)。它被认为是深度研究任务的优秀工具,因为它允许用户上传大量材料并进行分析和综合。然而,其上传和分析功能消耗积分,并且积分数量有限。一些用户最近发现ChatGPT的研究结果质量下降。ChatGPT在深度研究方面的表现处于中等水平,避免了Gemini的冗长输出。 Gemini通过与Google搜索和GoogleAI概述功能的紧密集成,可以快速访问大量实时更新的信息。它在编程相关问题上表现出色。Gemini的深度研究能力在Google推出更新的模型后得到了显著改善。Gemini的输出可能过于冗长,用户希望Gemini具有像ChatGPT一样的上传文档的功能。Gemini没有明显的深度研究查询次数限制,但无法轻松搜索其过去的对话历史。

Deep Dive

Shownotes Transcript

欢迎大家来到AI Unraveled的新特别深度探讨节目。本节目照例由Etienne Newman创作和制作。他是一位居住在加拿大的高级工程师,也是一位非常热情的足球爸爸。嘿,如果您从这些对AI的探索中获得价值,我们真的希望您能花一秒钟的时间在Apple Podcasts上点赞和订阅AI Unraveled。这确实有助于其他人找到这个节目。

好的,今天我们要解决我认为你们许多人都在努力解决的问题。当您需要使用AI深入研究某个主题时,不同的工具如何比较?我们将重点关注Grok、ChatGPT和Gemini的深度搜索功能(或缺乏此功能)。

我们根据我们在artificial subreddit上发现的一场非常有趣的讨论来进行分析,真实的使用者谈论他们的经验。是的,现在这是一个如此相关的问题,不是吗?我的意思是,我们都被信息淹没。而AI的重大承诺是帮助我们

消除噪音,有效地提取重要信息。因此,无论您是为工作进行研究,也许是一个大型演示文稿,还是仅仅追求个人兴趣,甚至只是试图理解某些复杂的事情,了解这些AI搜索工具的优势和坦率地说,缺点都非常有用。这实际上是关于获得您需要的知识,而不会感到完全不知所措。没错,获得那些关键信息,就像你说的那样。这很有趣,因为Grok特别将其功能称为深度搜索。

但是,你知道,ChatGPT和Gemini,它们提供了相当可比的方法来进行这种深入的网络研究,即使它们没有使用完全相同的名称。对。不同的路径,希望能达到相同的目标。是的。彻底的AI驱动研究。是的。

所以,是的,我们今天的任务是真正地解开真实用户在将这些工具付诸实践时实际发现的内容。让我们从Grok开始。它具有明确的深度搜索模式。Reddit用户注意到它的方法是什么?好吧,Grok非常依赖实时数据。它大量地从X(以前称为Twitter)以及更广泛的网络中提取数据。其深度搜索背后的理念是他们所说的代理过程。

基本上,它试图像一个小型研究代理一样,外出检查多个来源,然后尝试为您编译一份详细的报告。好的,一个代理过程。是的,听起来很复杂。确实如此。Reddit帖子中真正突出的一点是,用户发现Grot特别适合那些不是非常技术性或不涉及密集的法律术语或不是的主题。

正如一位用户所说,过于学术性。所以也许更适合理解一般的观点或趋势,而不是复杂的科学论文?这似乎是暗示,是的。这表明Grok可能非常擅长捕捉更非正式的讨论或像X这样的平台上发生的当前事件的脉搏。这与X集成很相符。实时角度可能是其在突发新闻或公众情绪方面的优势。也许更快,即使并非总是像其他来源那样经过深入审查。

说到Grok的独特之处,这位用户强调了一些他们真正喜欢或可能喜欢缺乏的东西。啊,是的。他们所说的千篇一律的护栏。没错。他们提到,除了明显露骨的内容外,Grok似乎限制较少。他们实际上使用了“真正不受约束”这个词语。

甚至表示他们愿意为这种过滤较少的方式付费。是的,这是一个强烈的声明。它指出了某些用户对感觉不那么精心策划、不那么消毒的AI工具的渴望。他们欣赏内置的限制较少,这限制了他们可以询问的内容或Grok可能会出现的内容。但这是一种有趣的权衡,不是吗?这种不受约束的访问。绝对的。它确实引发了关于可靠性的问题。如果过滤较少,您可能会获得独特的见解,但您也面临遇到更高风险的风险

嗯,错误信息或只是不太可靠的来源。驾驭这一点是关键。说得对。是的。用户也提到了Grok方法的一个潜在缺点,甚至超出了内容本身。对。速度出现了。Grok的深度搜索被认为可能比其他搜索慢。好的。所以也许代理过程需要更多时间来运行?可能。是的。另一点是深度。

对于某些任务,特别是那些需要严肃的学术严谨性或非常详细的分析的任务,一些用户觉得Grok的输出不够全面。所以也许在实时广度方面很强,

但在专门研究方面可能深度不足。这似乎是这些评论的要点。是的。这实际上很好地引出了ChatGPT。对。现在,ChatGPT没有在其上贴着一个大型深度搜索按钮。那么它如何处理这种更深入的研究任务呢?好问题。是的,没有专门的按钮,但它肯定内置了强大的网络搜索功能。它使用Bing索引,此外OpenAI还有自己的网络爬虫收集数据。

我认为最近一个非常重要的改进是它的引用功能。哦,是的。怎么样?好吧,它现在可以为其做出的声明引用多个来源,而且它通常还会突出显示它从中提取信息的特定文本片段。这是透明度和让您自己验证事物的一大步。这太棒了,能够轻松追溯来源。

那么Reddit用户对使用ChatGPT进行这种深入研究有什么看法呢?好吧,有趣的是,一位关键用户最初认为ChatGPT是黄金标准,是进行深入研究任务的最佳工具。黄金标准。好的,高度赞扬。为什么是这样?根据他们所说,杀手级功能是它能够让您上传相当数量的自己的材料、自己的文档,然后您可以指示ChatGPT

使用该材料,分析它,根据您的具体说明进行综合。他们将其描述为几乎像一个增强版的普通提示,具有真正的后续跟进。- 哇,好的,所以您可以向它提供您自己的上下文、您自己的数据,并让它根据该数据与网络相结合进行研究。这对于特定项目来说听起来非常强大。

没错。它为真正定制的、具体的分析打开了可能性,而一般的网络搜索实际上无法做到这一点。您将自己的知识库与互联网的广阔性相结合。但总有陷阱,对吧?他们有没有提到任何限制?有一个,是的。积分?

显然,此上传和分析功能会使用积分,用户提到数量有些有限。啊,好的。所以也许不是您可以依赖于持续大量使用而无需关注使用限制的东西。正是如此。还有一个有趣的摩擦点被提及。哦。是的。最近关于ChatGPT研究结果质量下降的一些挫败感。这似乎与用户所说的犹豫不决相吻合。

相当轻蔑地,一些两类研究自动选择废话。嗯。两类研究自动选择废话。

听起来他们不是粉丝。你知道那实际上是什么意思吗?老实说,从评论中并不完全清楚,但这表明ChatGPT选择其搜索策略的方式可能在幕后发生了一些变化。至少对于这位用户而言,这感觉像是质量或控制方面的一步倒退。有趣。这表明这些工具不断被调整,而且并非总是以用户喜欢的方式进行调整。总的来说,ChatGPT在比较中处于什么位置?它似乎处于中间位置,你知道,被视为点击诱饵。

在某些方面可能更接近Gemini,但至关重要的是没有被描述为Gemini的,让我们说,倾向于无限的并且不可否认有点烦人的冗长。好的,这是一个完美的过渡。让我们谈谈Gemini,谷歌的产品。它如何处理深度搜索?

Gemini的巨大优势在于它与Google搜索本身以及Google的AI概述功能紧密集成。这使其可以说是能够非常快速地访问庞大且不断更新的信息池,实时索引的网络数据。

说得通。利用他们的核心优势。显然,它可能在整个Google生态系统工作区等方面运行良好。没错。那么,我们一直在关注的Reddit用户对Gemini的深度研究体验如何呢?好吧,这就是它变得真正有趣的地方。对于与编程相关的问题,Gemini显然是这位用户压倒性的赢家。是的,他们说,我引用:“Bi-R对我的所有问题都有最好的答案,从设计到库搜索到其他任何东西。”

这是一个非常强烈的认可,尤其是在技术领域。哇。好的。因此,对于编码、开发、技术文档,Gemini对他们来说确实很出色。这表明它可能非常擅长利用Google索引的大量技术信息。似乎如此。但有趣的是,他们还提到他们最初使用Gemini的深度研究功能的体验实际上并不是很好。哦,它变得更好。显然,是的。

他们觉得在Google推出更新、更强大的底层模型后,有了非常显著的改进。他们特别提到了1.5模型。这只是突出了事情发展得多么快,不是吗?一个工具在一个月内可能很平庸,而下一个月由于底层模型的更新而变得更好,不断发展。绝对的。现在,Gemini有没有提到任何缺点?我们听说过潜在的冗长。是的,这是主要的一个。输出可能很糟糕。

过于冗长,使用比严格必要的更多的语言,这可能意味着需要花费更多时间来挖掘关键点。

好的,所以可能很彻底,尤其是在技术方面,但您可能需要阅读更多文本。似乎如此。另一个与我们听到的关于ChatGPT的观点相呼应的观点是希望上传他们自己的文档。啊,那个功能又来了。似乎是一个常见的请求。非常如此。能够将AI的研究建立在您自己特定的数据或上下文中似乎非常有价值。他们希望Gemini具有像ChatGPT那样的功能。说得通。

关于Gemini还有什么?是的,还有几个有趣的要点。用户实际上很惊讶Gemini似乎对他们可以运行的深度研究查询数量没有任何明显的限制。哦,不像ChatGPT的上传功能提到的信用系统。没错。这对于进行大量研究的人来说可能是一个很大的优势。但另一方面,他们指出一个相当令人费解的遗漏。哪个是?您显然无法轻松搜索Gemini中的过去对话历史记录。等等,真的吗?来自谷歌?

搜索公司。我知道,对吧?这似乎很奇怪。您会期望强大的历史搜索成为标准,尤其是来自他们。对于该用户来说,这是一个明确的摩擦点。好的,我们已经根据这些用户的经验详细介绍了三大巨头Grok、ChatGPT和Gemini。

现在,在我们进行综合之前,我知道您提到想谈论一些对希望加深自己技术技能的听众来说很重要的事情。啊,是的。时间安排完美。因为了解这些工具是一回事,但实际上掌握底层技术、AI和相关技术领域所需的技能,这至关重要。对于任何想要真正迈出下一步的听众,也许是在高需求领域获得认证,我们的制作人Etienne Newman实际上已经创建了一个令人难以置信的资源。没错。

我们想提到GM Cat Tech应用程序。

它是AI驱动的,专门设计用于帮助您掌握并重要的是通过50多个不同的高需求技术认证考试。它非常全面。Etienne已将他的工程专业知识用于使其有效。这不仅仅是阅读材料。Jenga Tech包括PBQ(基于性能的问题)。模拟现实世界中的任务,对吧?没错。加上测验、抽认卡以进行快速复习、动手实验室以进行练习,甚至还有完整的模拟以真正测试您的准备情况。它涵盖了很多方面。

因此,如果您正在考虑提升自己的技能,获得认证,请务必查看Jenga Tech应用程序。我们稍后会再次提到它,但它是Metzian的一个很棒的工具。好的,回到我们的AI比较。Reddit帖子也简要地提到了其他一些工具,不是吗?是的。主要是简短的提及。一位用户提到了一个名为O3的工具,说他们发现它比前三名更好、更快,而且值得注意的是,它不会过于冗长。所以也许值得关注。好的,O3。知道了。还有什么?

提到了Perplexity和You.com,但最初的帖子似乎对他们的深度搜索功能总体上印象不佳。因此,至少从该用户那里获得的积极反馈较少。对。Claude也出现了。一位用户报告说从Claude那里始终如一地获得很好的答案,特别提到了Sonnet 3.7模型用于深度研究和网络搜索。听起来很有希望。但另一位用户则对Claude的体验评价不高。

提到了一些不一致之处,也许是关于商业行为或价格变化的担忧。所以那里有点褒贬不一。好的,所以Claude也在其中,但也许经验各不相同。还有其他人吗?Deep Seek也被提及,主要是在subreddit上比较它与ChatGPT和Grok的相关讨论的标题中。

有时侧重于开发人员的成本效益,所以它绝对是这个领域中的另一个参与者,它确实表明了这个领域的动态性,有很多选择不断变化,绝对不仅仅是前三名,所以如果我们尝试将所有这些整合在一起,是的,综合一下来自这个Reddit领域探索的关键差异和要点,什么很突出,好的,根据这些用户的账户,Grok似乎正在通过其实时X洞察力和

过滤较少的方法来找到自己的利基市场,也许最适合当前事件或一般情绪。

但对于严谨的事情来说,可能速度较慢且深度不足。对。还有ChatGPT。它似乎仍然是一个非常强大的多面手。能够上传您自己的文档对于定制研究来说是一个主要的优势,但您有这些信用限制,并且人们注意到最近在质量或用户控制方面可能出现了一些波动。明白了。还有Gemini。Gemini似乎在技术方面非常出色,特别是编程问题,利用了Google搜索功能。快速访问信息。

主要缺点似乎是潜在的冗长和缺乏文档上传。所以听起来最好的工具是,好吧,这取决于。没错。这完全取决于您,用户,实际需要什么。您在寻找什么样的信息?分析需要多深?速度是绝对优先事项吗?将您自己的文档集成进来是否必须具备的功能?是的。所有这些因素都会发挥作用。正是如此。

然而,大图景是,所有这些主要的AI参与者都超越了仅仅输出静态知识。他们都在集成实时搜索,试图从实时网络中综合信息。而且他们这样做的方式不同,对吧?使用不同的数据源、不同的方法。是的,这导致了我们一直在讨论的这些独特的优势和劣势。看着每个平台如何发展,这是一个引人入胜的分歧。确实如此。它强调了不仅要使用这些工具,还要理解其背后的技术的必要性。

这让我们回到了。是的,我们提到的Jamga Tech应用程序。如果这次讨论让您考虑提升自己的技术技能,也许是在AI、云、网络安全或网络方面,请认真考虑查看Jamga Tech。它专注于通过PBQ、实验室、模拟、测验、抽认卡进行实践学习,

它旨在帮助您真正掌握50多个认证的材料。这是一种超越仅仅理解AI概念,而实际上获得可认证的高需求技能的方法。Etienne Newman创建的一个非常有价值的资源,所以请查看Jamka Tech应用程序。好吧,这是一个很棒的深度探讨,根据用户的经验,解开了这些AI搜索工具在现实世界中的表现。随着这些工具变得越来越好、越来越快,也许越来越奇怪,它确实让你思考,不是吗?

在未来几年,研究的整体性质,我们如何发现和吸收知识的方式将如何改变?这是个大问题,不是吗?这如何改变学习、发现、保持知情?以及这些AI助手中的哪一个,或者我们甚至还没有看到的助手,随着事物的演变,最终会最适合您的需求?值得思考的事情。

绝对值得思考。好吧,非常感谢您加入我们对AI Unraveled的这次深度探讨。如果您发现这很有价值,请最后提醒一下,在Apple Podcasts上点赞和订阅。这有助于我们继续进行这些对话。我们很快就会回来,进一步探索这个不断变化的AI世界。感谢收听。