We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

EP 510: OpenAI's o3 Use Cases - How to use the world’s new most powerful LLM at your company

2025/4/23

Everyday AI Podcast – An AI and ChatGPT Podcast

AI Deep Dive AI Chapters Transcript

People

Jordan Wilson

一位经验丰富的数字策略专家和《Everyday AI》播客的主持人，专注于帮助普通人通过 AI 提升职业生涯。

Topics

我今天要讨论 OpenAI 新发布的 O3 模型，以及如何在公司中使用这个我认为是目前世界上最强大大型语言模型。O3 模型与传统的大型语言模型不同，它具有代理能力，能够独立思考并按顺序使用多种工具，这使得它的应用潜力巨大。在之前的 AI 应用中，我们常常受限于技术本身。而 O3 模型则突破了这一限制，它的应用仅受限于我们的想象力。我们可以用它来重新定义工作方式，这绝非夸大其词。 O3 模型能够处理多种任务，例如 PDF 转录、数据分析、市场研究、情感分析等。它能够访问网络信息，使用 Python 代码，并创建交互式仪表板。这些功能使得 O3 模型能够高效地完成许多以前需要耗费大量时间和人力才能完成的任务。我通过几个实际案例演示了 O3 模型的强大功能。例如，它能够准确地转录复杂的 PDF 文档，即使文档包含图像和非文本内容；它能够从网络上检索最新的信息，并对信息进行总结和趋势分析；它能够处理多个 CSV 文件，并使用 Python 代码进行数据分析，并根据数据分析结果，提供商业增长建议和新的播客主题创意；它能够使用画布模式创建交互式仪表板；它能够根据提供的示例，自动生成 AI 新闻和新鲜发现内容；它能够根据图片信息识别餐厅并提供相关信息；它甚至能够尝试创建视频，虽然最后一次演示因为一些技术问题没有成功。总而言之，O3 模型的出现标志着大型语言模型发展的一个重要里程碑。它能够独立思考、规划和执行任务，这将极大地改变我们工作的方式。

Deep Dive

Shownotes Transcript

这是 Everyday AI Show，一个日常播客，我们简化 AI 并将其力量带到您的指尖。每天收听，获取提升您的职业、业务和日常生活的实用建议。世界上最强大的大型语言模型不仅已经出现，而且就在那里，等待您进入并发展您的业务和职业。

而且它是自主的。是的。大型语言模型是自主的。我将讨论

这意味着什么。我们将回顾 OpenAI 令人惊讶的令人印象深刻的新 O3 模型，并讨论如何在我的公司中使用我认为现在是世界上最强大的大型语言模型，并讨论一些不同的业务用例。我认为今天的剧集实际上非常重要，因为我们将看到，希望是现场的，在我们可以使用大型语言模型方面取得了巨大的进步。因为我认为以前，当涉及到 AI 特别是使用前端大型语言模型时，对吧？您登录 chatgpt.com，登录，您知道，gemini.google.com，claw.ai，对吧？使用这些前端大型语言模型。我认为我们一直受到技术的限制。

但这是我第一次使用大型语言模型，我觉得自己不是受到技术的限制，而是只受到自己想象力的限制。当我谈论想象力时，我并不是说，哦，让我去创作一些可爱的照片在社交媒体上疯传。不，我说的是重新定义我们所有人如何工作。这不是夸张。

我们今天将在 Everyday AI 上讨论它。大家好！我的名字是 Jordan Wilson。我是 Everyday AI 的主持人。这件事是给你的。这是您的每日直播播客和免费每日通讯，帮助我们所有人不仅学习 AI，而且学习如何利用它来发展我们的公司和职业。所以

如果这听起来像是您想做的事情，您需要访问我们的网站。因此，它从这个播客和直播开始，在那里您学习，但您实际利用它的地方，就在我们的网站 youreverydayai.com 上。因此，您可以在那里注册我们的免费每日通讯。我们将回顾今天的谈话，并让您了解您需要了解的所有其他信息，不仅要跟上，

而且如何领先，以及您如何在公司成为 AI 方面最聪明的人。好的。通常情况下，我们每天都会从回顾 AI 新闻开始。如果您想要这个，它将在通讯中。我们真的有很多事情要做。我不希望这意外地成为一个 90 分钟的播客。我将尝试快速进行，在非常短的时间内提供尽可能多的价值。好的。

所以让我们直接进入正题。直播观众，喜欢这个。伙计，我喜欢在上午 7:30 中部标准时间直播之前。我喜欢人们已经进入等候室发表评论。所以向 Sandra、Arvin 和 Michael、Big Bogey Face、Kyle、今天早上加入 YouTube 机器的所有人致敬和问候。Brian、Aiden、Nathan、Michelle，

Michelle Hector，太多人无法一一列举。感谢您的收听。是的，如果您收听播客，通常我们会现场进行此操作。很有趣。你知道，所以如果你有想法或评论，一些你可能想在今天现场回顾 03 时看到的东西，现在就发表评论，现在就发表评论。首先，到底有什么新东西？什么是 OpenAI 的 03 模型？好吧，OpenAI 上周实际上发布了

下降，让我数一数，六个不同的模型，对吧？其中三个只是用于 API。因此，如果您登录 chatgpt.com，您将看不到 GPT 4.1、4.1 mini 和另一个是什么？4.1 微型。但您会看到 OpenAI 几天前发布的三个新的思维模型。现在大约已经一周了。所以这些是 03-01，

04 Mini 和 04 Mini High。是的，我知道命名很混乱。是的，从技术上讲，这些思维模型有三个不同的层级，对吧？所以，不详细说明，

您可能习惯使用的模型被称为 GPT-4-0。所以这是一种所谓的旧式转换器模型。所以现在您有了 OpenAI 的这个新系列，称为 O 系列模型。是的，不幸的是，现在非常混乱，因为您有一个 O1，这取决于您的付费计划，对吧？所以是的，如果您有 ChatGPT Plus 计划，如果您进入您的模型选择器，您可能会看到 O1。如果您在……

每月 200 美元的计划，就像我一样，您将看到 O1 Pro。但是现在您也有 O3，有些人称之为 O3 Full 或 O3 High，但它只会显示 O3。好的。然后您还有 O4 Mini 和 O4 Mini High。所以这些基本上是 O 系列。这些是某种程度上使用这种思维链或推理的模型。所以您有像您的 GBT4O 这样的旧式转换器模型，它们更像是，我们说超级高级模型

你知道，自动完成，对吧？为了过度简化事情。O 系列模型，它们会思考，对吧？它们像人类一样推理，您可以查看思维链或至少是思维链的总结，当您向这些 O 系列模型提供提示时。

好的。呃，这很重要，因为通常它们会花费更长的时间。呃，所以，你知道，你也要考虑，我应该什么时候使用 GPT-4-0 模型，什么时候应该使用这些 O 系列模型？所以这是新的。好的。最重要的事情，我们今天主要讨论 O-3，因为我认为这是，呃，

说具有开创性可能无法做到公正。我会说这是改变类别的模型，呃，对。我们已经有了推理模型。呃，我们有，你知道，所谓的旧式转换器模型，我们也有很棒的混合模型。例如，来自 Google 的 Gemini 2.5 pro，呃，来自 Anthropic 的 Claude 3.7，呃，十四行诗。所以您有这些好的，呃，

混合模型，既是旧式转换器，又是所谓的新的推理器、思想家，对吧？

但这个完全疯狂了 03 好的，有什么不同？有什么新东西？所以它能够使用所有工具，这意味着 03 可以使用网络搜索 Python，您可以上传您的文件，它可以使用视觉输入推理，它可以生成图像，它可以使用这个画布功能，它只是

工具的使用非常疯狂，对吧？因为之前的 O 系列模型，我昨天简要地谈到了这一点。是的，这是我们节目的第二部分。我们昨天做了第一部分。因此，如果您想了解有关该模型的更多规格，您可以查看一下。

但是之前的 O 系列模型并非都能够访问所有这些工具。一些不同的 O 系列模型甚至无法上网。因此，O3 是第一个具有 ChatGPT 工具带下所有单个工具的全功能模型，当我们谈论自主 AI 时，这最终是重要的一步，对吧？

大型语言模型或 AI 工具需要真正自主，对吧？为了让它拥有代理权，为了让它代表您执行任务，对吧？所以它不是一个完全的，你知道，代理，对吧？但我会说这是第一个自主模型

我用过，这是一个巨大的进步。所以它经过训练可以自主决定何时以及如何使用这些工具，通常在一分钟内给出丰富的答案。呃，如果您有付费计划，呃，到 chat to BT plus，呃，现在可以使用了。所以，嗯，

它也可以立即在 API 上使用。所以用法有点不同。就像我说的，如果您使用的是价格，每月 200 美元的专业计划，您可以几乎无限地使用。这是一件好事。我不必担心，你知道，在演示这些东西时用完，因为我有，你知道，几乎无限的使用。如果您使用的是正常的每月 20 美元的 chat TFT plus 或

或专业版或抱歉 chat gpt plus 团队企业版等，您每周可以获得 50 条 03 消息。对于 04 mini high，这是这些系列中下一个最好的模型，您每天可以获得 50 条消息，对吧？所以，呃，我做了一些测试，我们只在进行这些现场演示时才使用 03，04 mini high，就像我说的那样，这是下一个最好的和最令人印象深刻的模型，而且它仍然

真的很好。所以至少，你知道，即使你只使用每月 20 美元的计划，你可能也想考虑一下，在，你知道，节省那些 Oh 三个查询，每周 50 个。呃，但是 Oh 四个 mini high，呃，应该足以满足您的许多用例。呃，让我这样说，因为人们会问，嘿，Jordan，你不是两周前才告诉我们 Google Gemini 2.5 是世界上最好的模型吗？是的。两周前是，呃，今天是

我认为不是。昨天谈到了这个。最好取决于您的需求。我会说 Google Gemini 2.5 Pro 可能是最灵活的模型，可能具有最大的实用性。但是当谈到最强大的模型时，至少对我来说，那就是最好的模型。

最好，是这个新的 O3。因此，如果您查看第三方基准测试，我们昨天讨论过，例如 live bench。所以，你知道，那些公正的第三方基准测试，他们会考虑 live bench 上的许多不同因素，一个好的第三方基准测试软件或基准测试方法。O3 high 远远领先于 Gemini 2.5 Pro。

同样，在人工智能分析指数上，所以他们还没有做 03，但即使是 04 Mini High 的得分也高于 Gemini 2.5 Pro。

所以，你知道，这涵盖了七个不同的评估，进行了一些，你知道，非常著名和常见的基准测试，如 MMLU Pro、GPQA Diamond、人文 Lax 考试、Live Code Bench、Sci Code、AIM、Math 500，对吧？所以当谈到您的标准 AI 基准测试时，O3 Mini High 和 AI，

或者抱歉，03，03 full，03 full，不是 03 mini high。现在已经没有了。所以 03 full 是迄今为止基准测试中最好的模型，即使是人工智能分析指数上的 04 mini high。好的。所以在我们开始之前，我们将现场进行这些操作。请记住，如果您正在收听播客，请观看视频。我认为这会更令人印象深刻。我将尽力描述屏幕上发生的事情。

屏幕上发生的事情。是的，那是正确的。有时一大早，当我睡眠不足并且在第二杯雀巢咖啡打在我脸上之前，我的话会脱口而出。这将是最好观看的节目之一。所以如果你正在收听播客，请务必查看您的节目说明。我们留下链接。所以在我们的网站上，对吧？Your everyday AI dot com。您可以访问剧集页面。点击今天的剧集应该会在我们完成直播后 30 分钟内上传。您可以在那里观看视频。您也可以在播客上收听，但您可以观看视频。现场演示非常卡顿。请记住这一点，对吧？即使我们两周前进行了 Gemini 2.5 Pro 演示，我们也遇到了一些奇怪的幻觉。我问了一些关于芝加哥的问题。而且，你知道，当你查看 Gemini 2.5 Pro 的推理时，它就像，哦，你问的是复活节周末。它就像，不，不，我没有。所以，

请记住，现场演示，永远不好做，尤其是在生成式 AI 方面，考虑到生成式 AI 是生成的。所以即使您要使用与我相同的精确提示和相同的精确信息，您每次都可能会得到略微不同的结果。这是因为生成式 AI 是生成的。它不是确定性的。就像我说的那样，到目前为止，这是我用过的最令人印象深刻的技术之一，对吧？我实际上使用过数千件软件，呃，

我会说甚至数千件 AI 软件，但至少，你知道，一千件，超过一千件 AI 软件。在过去的 10 到 20 年里，我使用过数千件软件。到目前为止，这可能是最令人印象深刻的，也许是最令人印象深刻的。好的。所以让我们现场看看。

呃，所以让我们开始吧。呃，直播观众。如果您有，呃，想法、建议，呃，请现在就提出。好的。希望我能做到这一点，呃，正确地做到这一点。让我，呃，分享我的窗口。如果您能直播观众，请务必告诉我，是的，Jordan，我们可以看到您的屏幕上显示的内容。呃，好的。所以

您还在四处奔波，试图弄清楚如何利用 AI 发展您的业务吗？也许您的公司已经使用大型语言模型一年或更长时间了，但无法真正获得牵引力以找到 Gen AI 的投资回报率。嘿，我是 Jordan Wilson，这个播客的主持人。

像 Adobe、Microsoft 和 NVIDIA 这样的公司与我们合作，因为他们信任我们在生成式 AI 方面的专业知识，以帮助大众领先。一些美国最具创新性的公司聘请我们来帮助他们制定 AI 战略，并培训他们数百名员工如何使用 Gen AI。因此，无论您是为数千人寻找 chat GPT 培训，

或者只需要帮助构建您的前端 AI 战略，您也可以与我们合作，就像世界上一些最大的公司一样。访问 youreverydayai.com/partner 与我们的团队联系，或者您可以点击我们网站的合作伙伴部分。我们将帮助您停止在那些 AI 圈子里奔波，并帮助您的团队领先，并为 Gen AI 建立一条通往投资回报率的直线路径。好的，希望已经上传了。让我看看我是否可以把我的大脑袋移开。

不。好的。就这样。足够了。好的。

好的，酷。谢谢。谢谢，YouTube 团队。你们说你们可以看到屏幕。好的，所以我们将要这样做。我们将现场进行，我们将快速进行，因为我想尽可能多地完成。其中一些是我在进行 Gemini 2.5 节目时运行的类似提示。我希望您也考虑一下我在这里做的一切都是一个例子，但想想您如何在您的业务中使用它。这些是真实的业务用例。好的，一些简单的事情。

我一直喜欢做的事情，因为这是一项以前在所有大型语言模型中都不太好的技术，而且它越来越好。好的，所以我现在要上传一个 PDF。好的，这是，让我们看看，让我找到正确的那个。这不是正确的那个。好的，这是正确的那个。好的，我正在上传一个 PDF，好的？我使用的是 03，我说的只是逐字转录。

好的。我将放大我的屏幕。所以基本上这是，呃，一个广告宣传册。很多人联系我，他们想在 Everyday AI 上做广告，呃，大多数情况下我不喜欢邀请广告商，呃，但有时，你知道，当我感觉他们适合我们的观众时，我会把这个发给他们。所以我可以，呃，

看，对吧？所以总是查看这种思维链，这样您就可以扩展它并查看，所以我可以看到它在做什么。所以请记住，请记住，我将继续前进，并希望在我的屏幕上分享这个，以便您可以看到。这个 PDF，它不像纯文本，好吗？它是多模式的

到极致，对吧？很多东西都是用 Canva 创建的，对吧？所以它是平面图像。这是大型语言模型不应该能够看到的东西。六个月前，没有大型语言模型可以做到这一点。所以例如，我这里有一页包含所有这些统计数据，但有图像，底部有所有这些徽标，你知道，它说像来自领导者的信任。所以这些都是收听我们的播客、阅读我们的通讯等等的人。所以这是一堆这些徽标。所以这是，

我的意思是，当您谈论可以所谓的读取 PDF 的传统 OCR 技术时，当您谈论计算机视觉时，六个月前的技术将难以处理并转录它，因为很多内容甚至不是文本框。有屏幕截图。有，你知道，像……

像 jpeg，有 png，这就像混合媒体，这不是任何工具都应该能够读取的东西，好的，所以它运行得有点慢，所以我会立即说一件事，当我使用 Gemini 2.5 pro 进行此操作时，它非常快，好的，所以看起来它完成了，呃，所以让我们看看它做得如何，但想想有多少次，像，我有很多这些都是我自己的，像，呃，

多年来的个人用例。就像，哦，我，你知道，为某事创建了一个演示文稿，或者这是一个旧的 PDF。我不知道它来自哪里。我不知道原始文件在哪里，我需要更新它。所以你可能会，你知道，尝试复制和粘贴所有内容，重新格式化，不是所有内容都复制粘贴，对吧？这是很多你

你知道，正在做的事情，比如，你知道，查看旧的 pdf 或只是尝试更快地阅读它们，尝试与您所在行业的重要的文件进行对话，所以我浏览这里，呃，它做得很好，所以我可以在此处浏览，您也可以点击思维链，如果您想更好地使用大型语言模型，请点击思维链，所以它说提取详细信息以给出用户请求的 PDF 文档的逐字转录的最佳答案，但

该文档包含图像而不是可访问的文本。这意味着我不能简单地直接读取文本，因为文件搜索。所以我可以看到 O3 正在尝试使用的不同工具来完成此任务。它说文件搜索没有在图像中检测到任何文本。我的下一个最佳选择是使用图像读取或可能是 OCR 手动转录。尽管如此，这可能很费时，特别是考虑到有八页内容。

对吧？所以你可以真正看到它是如何做到这一点的。所以我浏览第一页，一切都正确。第二页，在那里，我们有，你知道，180,000，呃，你知道，呃，每月播客听众。在那里，这是一个非常令人印象深刻的东西。呃，来自领导者的信任，Gemini 也正确地做到了这一点。这些只是徽标，对吧？这些只是

随机外观，不是随机徽标。我的意思是，它们是大多数人都知道的徽标，但 oh three 做对了。对。它说，好的，Google、Amazon、Nvidia、Microsoft，它甚至得到了徽标，对吧？所以非常，非常令人印象深刻的工作。所以让我们看看它是否得到了所有东西。

真正地，第三页我们有一些推荐，它也正确地得到了这些，甚至像，对吧，那里有像五星级一样的东西，对吧？这些实际上来自我们的呃网站，人们去那里留下星级评分，他们可以留下评论呃，做得很好，非常非常令人印象深刻，呃，这是我们的第四页，一切都正确，每日通讯，这有点像我们不同的呃，在不同平台上的统计数据

赞助选项，在那里，它做得很好。所以即使像，对吧，所以在我们的每日赞助选项中，并非所有内容都包含在内，对吧？这里有一个小 X。它甚至遍历并为这些小设计元素分配了

复制粘贴表情符号。所以是一个复选标记或一个 X，而所有这些都是纯文本。我可以复制粘贴这个非常令人印象深刻。好的，这很棒。我认为 Gemini 2.5 也做到了这一点。我在最后这里有一个小图表，只是比较 Everyday AI 播客与其他一些播客和一些其他通讯。它实际上重新创建了一个我可以复制粘贴的图表。

直播观众，您对这个第一个用例有什么看法？非常令人印象深刻。所以比 Gemini 2.5 Pro 慢一点，但最终，我关心的是这件事，我关心的是准确性，这是一个相当复杂的任务。好的，让我们继续下一个。只是为了我们的播客观众，每次我打开一个新的聊天，所以我不会无意中使用相同的上下文窗口。

好的。这是一个可能很困难的。呃，Google Gemini 2.5 对此有点挣扎。好的。所以我要做的是，呃，直播观众。就像我说的，如果你有任何想法，如果你有任何提示你想让我运行，呃，你知道，谢谢。例如，Joe，他写了 Oh 三个测试提示。呃，对。呃，去

继续，说些什么，这样我就知道了，我可以最后运行它。或者如果没有，如果我们时间不够，我会在我们的通讯中进行。好的，所以我们开始吧。下一个，我说，找到 Jordan Wilson 的 Everyday AI 播客的 20 个最新剧集，并简要总结每个剧集。然后找出剧集之间的五个趋势。

相当困难的任务，好吗？想想您可能需要做的所有不同类型的研究。从理论上讲，这是最新的研究。而这正是我，比如，你总是需要对不同的大型语言模型进行压力测试，特别是它们如何连接到互联网，对吧？因为有时它们使用缓存的平台。

页面。所以，你知道，我们的网站显然是最新的，对吧？我们每天都会更新它。所以即使，你知道，六到九个月前，我们在五个主要的互联网连接 AI 大型语言模型上进行了类似的提示。没有一个完全正确。有些比其他好，但我们开始吧。我可以看到，这就是我们进入这个自主性的原因，因为一步一步地它正在进行，

这非常令人印象深刻。所以首先它在内部分解它，并说，我需要收集 Everyday AI 播客的最新剧集标题。然后它在网上进行了一些搜索。看起来它进行了三个不同的，或者抱歉，两个不同的广泛搜索。然后它访问了大约七个不同的网站。然后在查看所有这些网站后，它确定了我的实际网站在哪里，然后

它导航到剧集页面，并试图找到最新的剧集。然后它休息了一下，它开始推理和逻辑。它说，好的，看起来之前的剧集都相对容易检索，但我需要针对剧集 503 及更高版本以获得更完整的列表。我将首先关注最新的剧集，嗯，

对吧？503、502，向后搜索这些特定的数字。然后它返回到搜索网络。然后它返回到再次思考。它又返回并搜索了网络三次，对吧？所以通常情况下，即使您使用 Gemini 2.5 Pro，它通常也会批量访问网络。所以它认为它就像，好的，我需要访问网络。它访问网络。

完成了。它返回并总结了它的想法。它在思考和网络之间来回切换，这可能看起来并不令人印象深刻。但是当我们谈论到，我们将有一些例子，当我们谈论使用多个工具时，那时你会看到这个，这个工具的使用，你会说，哦，是的，这太大了。这太疯狂了。好的。所以这个，让我们向下滚动到底部。

粉碎了它。非常令人印象深刻。非常令人印象深刻。好的。所以它做对了。所以这里实际上是昨天的剧集。所以很好。它没有使用，你知道，旧的缓存网站。所以无论您正在处理什么，O3 都可以找到字面上的最新正确信息，因为它有昨天的剧集，即 509，即第一部分。所以今天的剧集是 510。所以第一部分，我们开始吧。它说它有标题和播出日期。

这非常令人印象深刻，因为我在想，各位，我甚至不知道播出日期。好的。我知道了。它不容易找到，对吧？文字非常小。所以它在查找剧集编号、播出日期和完整标题方面做得非常好。然后它有一个单句摘要，其中包含一个链接，就在那里。非常令人印象深刻。对。让我们看看，我将向下滚动到其他剧集之一，确保它没有编造任何东西。我没有把它弄对。

好的。让我们看看第 499 集，ChatGPT 是用于图像生成的新的 GPT，五个最佳商业用例。它说演示，GPT for O 的像素完美生成如何提升产品原型设计、广告和培训资产。这三件事我都涵盖了。没有幻觉。非常令人印象深刻。现在让我们看看，它是否确定了五个跨剧集趋势？好的。所以趋势一，模型发布深度潜水占据主导地位。是的。

过去 10 集做了很多这样的事情。周二到周一的 AI 新闻很重要。是的。它去了，对不起。哦，不。我是否要求你提供过去 20 集的信息？我问它什么了？好的。我确实说了 20 集，这可能更好。对吧？所以很好。它确定了在周一你会发布一篇关于 AI 新闻的重要文章，对吧？它捆绑了多标题摘要，创造了一个可靠的每周新闻开始。

新闻节奏。所以它确定了这个趋势，呃，商业优先框架。所以它说在过去 20 集中有一些商业优先框架，呃，嘉宾驱动的权威。所以它说有一些经常出现的嘉宾时段。我们有来自 Scrunch AI 和视频创业公司创始人的嘉宾，呃，谷歌，等等。然后它还说基础设施和成本关注度越来越高，非常令人印象深刻。

对于一个总共花费，我认为它说一分钟，不，两分零八秒的提示来说，这非常令人印象深刻。这将花费一个人数小时才能做到。

而且我不知道他们是否会做得那么好。你会用它做什么？任何事情，对吧？所以你显然可以将它用于你自己的信息，但谈谈竞争见解。谈谈市场研究，对吧？去寻找最新的信息，了解这些信息中的具体内容，然后确定关键趋势。这就是大型语言模型擅长的事情。然而，这就是我们许多知识工作者持续进行的工作。好的。

我认为这个会破坏 ChatGPT。好的。我没有在 Gemini 2.5 上这样做，因为我知道它可能无法处理它。尽管也许，嘿，直播观众，如果你想看到一个面对面的比较

也许下周，只需在评论中说“面对面”。如果我需要做一个 O3 与 Gemini 2.5 Pro 的比较，如果这会有帮助，只需说“面对面”。如果你不关心，没关系。我知道有些人喜欢面对面的比较，有些人不喜欢。没关系。好的。所以我将在这里上传一些文档。请稍等。然后我们将继续。我将解释这里发生的事情。我认为……好的。太快了。嗯……

好的，我认为 Chet Chiviti 无法处理这个。我认为大型语言模型无法处理这个。让我们拭目以待。

所以我所做的是，我只是说，这些是我的播客统计数据。好的。我有两个不同的 CSV 文件上传。是的，O3 可以接受文件、浏览网页和使用 Python。我们可能会看到其中一些事情发生。所以你已经可以看到它正在使用大量的 Python。我将在这里阅读脚本或我使用的提示，但你会看到它已经，呃，

分析了我上传的图像。它已经运行它自己的 Python 代码来开始制作，对吧？你知道作为人类，如果你有这些巨大的电子表格，你将不得不进入并可能运行所有这些公式，真正尝试操作电子表格，花费大量时间尝试处理数据，对吧？所以它立即运行 Python，好的？你会看到，对于我们的直播观众来说，它在思考之间切换

使用互联网和 Python 代码异步。这一切都实时发生，来回进行。好的。所以在加载的同时，好的，我实际上要阅读提示。但是对于我们的直播观众，我会让你们观看这个。

观看一下思维链，好的，这是我的提示，我说这些是我的统计数据，这些是我的播客统计数据，我刚刚导出了一切，好的，我说给你，你知道什么，在我告诉 ChatGPT 我要求什么之前，让我告诉你这两个不同的文件中有什么，这两个不同的 CSV 文件，所以一个是呃，它是每一个

播客剧集。所以 509，有一个剧集 ID、一个发布日期，然后是下载量，所有时间的下载量、过去 90 天、过去 30 天、过去 7 天等等。好的。所以它有 509 列或 509 行，8 列，诸如此类。所以这是

一大块，你知道，这里有 4000 条数据。这个令人印象深刻。统计位置报告。好的。所以这是我们的，你知道，按下载量划分的最大城市。呃，这是一个巨大的电子表格。世界上有这么多城市。好的。显然，Everyday AI 节目，嗯，我们有来自 22898 个独特城市的收听或下载。说实话，我不知道有那么多城市。嗯，

我还不知道这一点，而且我不知道为什么。所以世界上的国家，

嗯，世界上有 195 个得到承认的国家。然而，我们的播客统计数据显示，我们有来自大约 202 个国家的听众，我心想，这怎么可能？对。所以我不知道。也许有一些，呃，一些，一些国家没有，呃，联合国全球承认的国家。我不确定，但是我上传的另一个 CSV 文件有近 23000 个不同的城市。好的。然后还有一些，呃，

你知道，这里有几行。所以它是城市、州、国家，然后是每个这些东西的不连续性和下载次数。好的。它还在工作。好的。我把它弄坏了。所以它说发生了网络错误。

所以我将点击重试。我们将看看它是否可以完成。这可能是我稍后检查的事情。但是我要求的是五个明显的趋势、五个不太明显的趋势、五个基于我的统计数据的增长想法、10 个基于表现良好和 2025 年 4 月趋势的新播客的相关剧集主题想法。各位，让我只指出那里的一件事。

那是更大的播客的事情，对吧？人们总是说，“乔丹，你的团队有多大？”我说很小，对吧？那是预算更大的播客的事情，对吧？那些来自 Verge、纽约时报的播客，他们可能每月支付六位数的咨询费来做第四件事，对吧？不是每个月，对吧？但是

他们可能会付钱给顾问去分析所有数据，找到趋势，找到，你知道，所以你不仅必须在电子表格中运行一些复杂的

查询以找出实际的趋势，因为它不像按下载量排序那么容易。没那么容易，对吧？因为有时如果一个，呃，如果一个剧集，你知道，不到 90 天，这些数字就会出现偏差。所以我以前做过这个。它会创建它自己的算法来查看，呃，你知道，某些不到 30 天的剧集的病毒式传播性，呃，

按类别匹配不同的剧集等等。所以虽然它坏了，但我确实认为，如果我点击重试足够多次，或者如果我没有要求五件事，而只是要求那件事，10 个相关的剧集主题，我认为它可能会做到。所以在这个过程中，我将跳到一个新窗口。

你知道，我们在这里真的在压力测试它。好的。我不确定这是否有效。下一个将是一个有趣的事情。好的。所以我们要做的是。这是一个非常长的。复制并粘贴到这个中。我会告诉你，我会告诉你这里发生了什么。好的。对于这个，我将使用画布模式。好的。有很多事情要做。所以我从说“为此使用画布”开始。好的。

我要看看 O3 是否能比我做得更好，好的，对于演示来说，运行两个非常复杂的、极其复杂的查询可能不是最好的，是的，因为我将得到请求超时，所以我可能必须等待

或者，呃，或者暂停第二个。这就是为什么，各位，哦，我的天，有时，有时现场做这些事情不好。呃，因为你知道，如果你从同一个帐户运行太多查询，你可能会遇到超时，但我想要真正突破界限，并思考，你知道，什么，呃，什么是可能的，呃，什么是不可能的。所以，好的。是的。有趣。所以它仍然卡在那里。

我希望有一个暂停选项，因为第一个，非常复杂的那个快完成了。好的。坚持住。我将开始描述我希望在这个下一个演示中发生的事情。然后我们将这样做。然后我们将现场做那个。好的，我们遇到了一些问题。

很好。所以接下来我要做的，对播客统计数据的非常深入的分析，要么成功要么失败，我将给 ChatGPT 三个我每日 AI 简报 Everyday AI 的例子。我要看看它是否能比我做得更好。好的。然后我说，看看 AI 新闻部分和最新发现部分。所以如果你阅读我们的简报，好的，让我继续展示一个例子。所以我们有我们自己的简报。

我们在这里有新的部分，通常，你知道，五到七个最重要的 AI 新闻故事。你会看到它们以一种特定的方式编写，大约两到三句话，你知道，一个希望有帮助的标题。然后我们还在我们的简报中有了这些最新发现，它们通常只是更快，更快，

呃，小道消息，你知道，有时如果这是一个重要的 AI 新闻日，其中一些最新发现可能是通常，呃，你知道，非常，呃，非常值得报道的事情，但在一个繁忙的新闻日，你知道，它只是得到了，呃，你知道，一些最新发现

所以基本上，我粘贴了我的 AI 简报的三个例子。所以 O3，O3 模型可以阅读、分析和理解它。以下是最新发现的编写方式。以下是 AI 新闻的编写方式。然后我给它一个布尔 URL，我会向你们展示什么是布尔 URL。

我在 Gemini 2.5 Pro 剧集中谈到了这个。所有这些都是，这就是我开始我早晨的方式，对吧？所以当我阅读 AI 新闻时，我实际上在 Google 中有一个专门的搜索字符串，它只显示过去一小时内关于我关心的大约十几个公司新闻，但它也必须包含“AI”这个词。所以，你知道，OpenAI、Apple、Nvidia、Microsoft、Amazon 等等，过去一小时内的任何内容，但也包括“AI”这个词

AI 和那些。所以，你知道，这是我关心的事情，对吧？但是想想你能做什么。各位，简单的布尔搜索与大型语言模型（如 O3）相结合，尤其是那些能够推理和使用工具的模型。巨大的，巨大的技巧。所以基本上我说，伙计，这里是我的简报的所有例子。这是我希望你做的事情。这是这个布尔 URL。去写一个

去写今天的 AI 新闻和最新发现，对吧？去做我的工作，比我做得更好。好的，让我们看看。好的。

感谢你们的坚持，各位。我们正在倒带。我认为行不通的非常复杂的查询成功了。好的。现在我们将阅读它，我将启动另一个，嘿，做我的工作，O3，去创建一个简报。好的。现在那个正在工作，我将跳回去，看看花了多长时间。我确实不得不重新启动这个。再说一次，这非常令人印象深刻，因为我们正在谈论

呃，我必须在这里计算一下，但它超过了十万行数据，好的，它只思考了一分四十四秒，我确实不得不点击了几次重试按钮

好的，让我们向下滚动。它说五个明显的趋势，对吧？所以这是我首先要求的。所以它说月下载量持续攀升。太好了，对吧？所以它说我们的月下载量环比增长了 37%，看起来是 37%。太好了。它说“AI 新闻很重要”剧集占据主导地位。它说 20 个下载量最高的节目中有 8 个是我们的周一节目。

它说常青的“如何”内容大获成功。很酷。我有点知道，但知道这一点很好。它说以 OpenAI 为中心的标题比平均水平高出 18%。就在那里，那需要

需要很多，你知道，要么知道如何处理数据，要么知道如何在 Google Sheets 中运行不同的公式等等。然后它说，美国占所有播放量的 66%，芝加哥是单一顶级城市。是的，芝加哥坚持住了。谢谢大家。好的，五个不太明显的趋势。第一，周五的发布比其他工作日多播放 9%。真的吗？哈。

有趣。我一直认为周五是糟糕的一天。有趣。好的。这些是我们的隐藏信号。第二，澳大利亚是令人惊讶的第二大市场。我实际上知道这一点，因为我经常查看我的统计数据。对。但是是的。嘿，向悉尼和墨尔本致敬。是的，就像 Everyday AI 播客有时是

澳大利亚排名前五的技术播客，对吧？在美国，我们通常是排名前十、排名前十五。在澳大利亚一直是第五名。所以，你知道，感谢澳大利亚的各位收听。所以它说 AI 代理关键词提升了 50%。

我完全不知道，对吧？所以再一次，这是我必须在 Google Sheets 或 Excel 中运行一些复杂的公式才能找到的东西。这很有趣。我不知道。我应该做更多关于 AI 代理的节目，对吧？以及跨不同媒介的 AI 代理，对吧？所以这里还有另一个。不到七天大的剧集已经达到了 90 天平均速度的 80%。这令人印象深刻。所以我不知道。所以基本上，

80% 的播客下载量将在前七天发生，对吧？所以如果我想，我会回去进行对话，我会说，嘿，这些更常青的呢？将这些常青剧集与 80% 的速度、80%、90 天的速度进行比较，因为，好的，如果我应该关注更多常青剧集，但 80% 的下载量发生在前七天，我应该吗？但也许常青内容中存在异常值。好的。

它还说，尽管没有针对特定地区的內容，但欧洲的份额连续三个月上升。好的，这很有帮助。酷。好的。五个增长想法……

有一个官方的周五见解时段。所以它说在周五安排风险最高的剧集以利用 9% 的提升。呃，它说做一个澳大利亚迷你系列。好的。我可以这样做。有一些澳大利亚友好的，呃，当地的，呃，当地的故事。呃，它说做一个代理协调器月度专栏的衍生节目，刷新和重新推广复古常青剧集地理个性化，电子邮件预告片。好的。呃，我们开始吧。10 集。

剧集主题想法。好的。呃，我在我的屏幕上，直播观众。呃，我不会全部读出来。请告诉我你们想看哪个，直播观众。呃，只需说，呃，你知道，第二集，第七集。呃，好的。所以一些，一些好东西。所以它实际上继续了。这太疯狂了。嗯，

它有一些事情弄错了。所以它说 WinServe 而不是 WinSurf，但它说我应该做一个 OpenAI 和 WinSurf 的剧集。嘿，它已经说过我应该做一个 Gemini 2.5 Pro 与 GPT-4 的比较，小型语言模型在设备上，NVIDIA Blackwell 发布回顾，最高法院 2025 年的版权决定。所以它做得很好。好的，足够了。我们将跳到其他内容，但是查看这些信息，

你真的必须仔细查看思维链才能看到它是如何做到这一点的，因为这非常令人印象深刻。它在内部思考，它分析了一些数据，再次思考，开始在那里使用网络来查看趋势。所以它去了饼图，对吧？所以

非常令人印象深刻。哦，是的，它还创建了一个仪表板。让我们看看这个仪表板是否有效。呃，我，我使用了 ChatGPT 中的画布功能。哦，这很酷。这很酷。嗯，

好的。所以这里是我的所有不同剧集。这是一个奇怪的报告错误，呃，来自，呃，Buzzsprout。它说它获得了 38000 次下载。它没有。呃，但我可以在这里浏览，呃，我，我有一个交互式条形图，这超级酷，对吧？呃，只是查看所有数据的一种更好的方式。这是我的顶级国家，它会给我带来一个交互式条形图，我可以悬停。这超级棒，超级流畅，对吧？所以有一些，有一些

呃，英国加拿大澳大利亚，这里是我的所有不同的嗯，我的所有不同的下载量，这里是我的月度趋势，这超级棒嗯

同样令人印象深刻的是，它浏览并构建了月度趋势。再说一次，所以我将鼠标悬停在这里，它会显示月份，然后是该月的下载量。它相当，相当准确。呃，看起来不是百分之百准确。嗯，

因为一些下载的报告方式，对吧？七天，30 天等等。但我认为这些只是那些在那些周发布的剧集。然后是主题性能。这很酷。所以这给了我平均下载量。所以例如，OpenAI 剧集的平均下载量看起来大约是 4800，而微型剧集则……好的，它们实际上都非常相似。

而 AI 新闻实际上少一些。所以，好的。超级，超级令人印象深刻。好的。现在让我们回到我的另一个，让我们看看 O3 是否做得更好。再次，对于这个，我给了它我的简报的例子。我给它一个布尔 URL，我说，去写今天的简报。然后我还告诉它制作一个交互式仪表板。所以让我们看看它做得如何。

再次，你在这里看到这种代理性质吗？所以再次，看起来这里是我的画布。我将稍后预览它。我想向下滚动看看它在这里做了什么。好的。嘿，对于那些阅读我们简报的人来说，这看起来和读起来像吗？这非常令人印象深刻。它做了一切。哇。

好的，我还想确保所有这些都是最新的，因为我说它必须来自过去 24 小时。如果它很旧，不要把它放进去。所以，你知道，让我们看看，让我们看看，第二点。所以它说，X OpenAI 员工呼吁监管机构阻止营利性翻转。

非常好的标题。它最后有一个拖尾表情符号，我甚至没有告诉它这样做。对。所以它注意到了简报的写作趋势。它做得很好。看起来大多数这些摘要都是两到三句话，这就是我们一直努力做的。所以让我读一下这个。它说前雇员。

向加利福尼亚州和特拉华州的总检察长请愿，要求阻止 OpenAI 将其研究非营利组织合并为 C 公司的计划，理由是这背叛了最初的公共利益章程，并将权力集中在投资者手中。该文件加剧了治理审查，就在 OpenAI 竞相将其 O 系列模型货币化之际，对吧？然后它也有来源，所以我可以检查。所以如果我点击这个，

这是正确的。你知道，我会浏览并阅读这个，但它确实是今天的一个新故事，看起来它是正确的。所以它实际上做得非常出色。这是我们的 AI 新闻摘要。让我们看看它是否得到了最新发现，最新发现。

太棒了，对吧？所以这里有这些较短的小片段，对吧？它给出了标题，这很酷。所以例如，它说时间加所有业务启动和 OpenAI 词典和每日 Gen AI 简报。在那里我可以悬停。这是来自雅虎财经的。这是今天的。做得非常好。

好的。让我们看看它是否实际上创建了这个简报的交互式版本。好的。现在再次，我使用了画布模式。我点击预览。好的。所以非常令人印象深刻。所以我的，我的，我的唯一不满。所以我现在看到的是，看起来像一个，让我们看看。好的。它实际上是交互式的，这真的很酷。有一个用于 AI 新闻的切换开关和一个用于最新发现的切换开关。看起来我们所有的故事都在那里。唯一的事情，我可以浏览并，嗯，

你知道，迭代地使用它，因为它看起来像，你知道，我会改变一些颜色。例如，标题颜色有点难以阅读，但有一些不错的悬停动画，这很酷。同样在“最新发现”方面，同样的，一些悬停动画。它说有一个过滤器，我不知道它如何工作。

但是让我们看看，我怀疑这个过滤器是否有效。有一个搜索栏。让我们看看它是否有效。所以我将输入 Nvidia，因为我知道这里至少有一个关于 Nvidia 的故事。等等，这太疯狂了。它实际上有效。好的。所以我输入了 Nvidia，只有一件事出现了，只有 Nvidia 的那件事。哦，哇。好的。有趣。所以我删除了它。一切都消失了。让我输入 OpenAI。

同样的事情，只有一个 OpenAI 故事。让我输入“AI”这个词。好的。几乎所有东西，因为所有东西都包含“AI”这个词。我的天哪，播客观众，我抓耳挠腮，因为非常，非常令人印象深刻。这实际上只是在几秒钟内创建了今天 AI 新闻和今天最新发现的交互式网站。如果这不能让你重新思考工作。

我不知道还有什么能做到。我一直在，你知道，我和我的团队每天花费数小时来做这件事，我们仍然会继续以旧的人类方式去做，对吧？因为就像我在我的第 500 集中所说的那样，我认为我们作为人类工作者需要关注的最大事情之一，对吧？因为当我们看到这些 O3 模型非常出色时，就像你必须思考你的代理现在意味着什么。我认为，至少对我来说，我的代理是，你知道，这听起来可能很奇怪或自大，就像，

我认为自己是品味塑造者，对吧？现在，我希望我可能会有更好的品味，你知道，浏览数十个 AI 新闻故事，然后根据我们的观众想要的内容挑选出五到七个。但我可以与 ChatGPT 分享更多数据，它可以知道，哦，嘿，你的观众关心这 46 个主题。所以，哇。

哇。是的。来自 YouTube 的 Giordi 只是说点头表示赞同。Michael 说仪表板令人难以置信。Giordi 说它与简报完全一样。天哪，伙计。Joe 说看起来你雇用了一位新的 Everyday AI 播客研究助理。Denny 说旧的人类方式。是的，很奇怪地说，但是是的。好的。

哦，我的天哪，各位。好的。我不知道。还有其他人印象深刻吗？还是只有我？你知道，我对 Gemini 2.5 Pro 没有这种印象深刻的程度。再次，极其强大。它真的，真的很好。对我来说，这，天哪，非常好。好的。让我们做一些我们在 Gemini 剧集中也做过的其他事情。好的。所以这里，一个超级简单的。

我要看看我是否可以同时运行其中几个。再次，我可能会破坏一些东西，但我们已经接近 50 分钟了，我有很多想做的事情，我们可能没有时间做。好的。让我做几个。

所以第一个我说，呃，使用画布并创建一个维基百科的 HTML 克隆，但赋予它浓厚的芝加哥氛围，使其功能齐全，包括可点击的链接和多个有效的页面，包括最重要的芝加哥事物。好的。呃，我们开始吧。它正在幕后思考，呃，除了编写一些代码之外，它还将，呃，它正在，它也在使用网络。我看到它，呃，实际上。

这里访问某些网址。好的，速度很快。15秒钟内就完成了。让我们看看它好不好。我点击预览。好的，它没用。没关系。有趣的是，我昨天做了这个。一次就成功了。所以我只想说有个错误。请修复。所以我实际上可以使用内置功能

来修复此代码。也许我会这样做。所以我只想说修复错误，对吧？所以在画布中，有一个错误。我刚刚点击了修复错误。我会尝试一次。同样，生成式AI是生成的。显然，当我进行现场演示时，事情并没有那么顺利。但是我确实做了，我昨晚做了一个芝加哥的，效果非常好。让我们看看我是否可以调出来，以防万一。因为我喜欢它。很有趣。让我们看看。是的。

芝加哥，维基百科。就是这样。好的。如果这个在30秒内不起作用，我会分享另一个我认为效果相当好的。让我们看看这个，“修复代码”选项是否修复了它。好的。看起来它添加了一些不起作用的图标。好的。让我们看看。有时重新启动

在聊天中重新启动画布。GPT有点bug，至少对于03来说是这样。是的。没关系。让我继续调出昨天一次就完成的那个。非常令人印象深刻。这个，对吧？所以这里有我们的芝加哥PDA。让我们展开这个。是的。哦，别担心。它完全支持移动端响应式设计。我可以点击主页。让我们看看。

看看这个。它也引入了一些图像。所以有些图像没有完全加载。我想我需要点击允许全部，但是就是这样。我的意思是，我们有一个可用的芝加哥维基百科，对吧？食物、体育、地标等。还有，让我们看看它是否可以互联。所以我可以点击这个。我在主页上。我可以点击这个地标，然后它把我带到地标页面。

非常令人印象深刻。非常令人印象深刻，各位。好的，让我们继续。我没有时间做所有这些。所以我做的另一个，让我们看看它是否有效。好的，它有效，但我将进行一个后续提示，使其更好。这个，我说……

分析过去30天苹果在线提及的情绪，根据情绪分析确定五个反复出现的主题。为苹果的公关团队提供可行的建议，并创建一个交互式仪表板来显示您的发现。对。所以它真的出去了。它找到了过去30天所有关于苹果的新闻报道。然后它在这里浏览。我都有一个图表。对。

所以让我退出这个。所以我有一个它创建的图表，它包含所有这些故事的链接。所以它说主题。例如，

让我们看看三个AI目标和营销声明。所以它说这是42%的负面，30%的正面和28%的中性。所以它对这个特定主题进行了情绪分析。然后它说监督机构。所以它说人们在说什么，然后是公关风险机会。所以它说监督机构说苹果夸大了苹果智能100%。

100%是真的，时间表和延迟加剧了人们对AI新闻的怀疑。然后它说中等风险，与OpenAI Gemini炒作周期相比，势头正在下降。好的。然后我只是跟进了一个提示，我说，让它更好。好的。即使第一个看起来非常令人印象深刻。

所以让我打开这个苹果情绪分析仪表板。我的天哪，这个东西看起来太棒了。我不知道。直播观众。有人对这个印象深刻吗？如果你参加了谷歌Gemini的节目，我也做了这个。我认为这个仪表板更好一些，对吧？所以我有了这个，它显示了整体的正面、负面、

过去30天中性的情绪基调。它按类别细分，而且，哦，我的天哪，它是交互式的。所以我可以悬停在更正面或更负面的内容上。例如，最积极的情绪

过去30天苹果新闻报道是iPhone 17泄露的嗡嗡声，正面评价为49%，负面评价为13%。相反，最负面的事情是在欧盟和DMA中的一些监管审查。所以它只有5%的正面评价和80%的负面评价。所以这很棒。

谈谈重新定义你的工作方式，对吧？你们中的一些企业主可能每月支付五到六位数的费用给一些公关或品牌管理公司来做这件事。

而且他们可能做得没这么好，对吧？这是一个提示。想象一下，如果你真的输入你自己的数据，稍微改进一下，告诉它实际要创建什么。我只是开放式地说，伙计，出去，抓取30天的苹果新闻。然后我有一个后续提示说，让它更好。哦，我的天，这太好了。我可以看到过去30天积极和消极的结果。

情绪。如果我想的话，我也可以在这个上面绘制苹果的股价，看看这些负面和正面情绪对股价的影响有多大。

然后在这里，有一个交互式的，天哪，这太好了。有一个交互式的，基本上是卡片，对吧？在监管审查下，你知道，它说正面5%，中性15%，负面80%。然后它说公关策略，加倍透明度，出版商，一个部门，

在7月1日DMA执行日期之前，发布以开发人员为中心的合规性演练，将隐私定位为竞争优势，并主动向技术记者简报。我的天哪，各位，如果你不认为这是像大型语言模型一样有代理性，这太令人印象深刻了，太令人印象深刻了……好的，你知道吗，我，我有几个……

但是我，好的。我想做另外两件事。我想做另外两件事。好的。对不起，这是一集较长的节目。如果你还在，我不知道。告诉我，告诉我你最喜欢的煎饼配料。你在煎饼上放什么？最近我一直在自己做煎饼，我告诉我的妻子，为什么，为什么我曾经，你知道，用盒装煎饼？有点臭。所以最近一直很喜欢蓝莓煎饼。好的。好的。所以

让我们看看一些令人印象深刻的事情。我正在截取某物的屏幕截图，我找到的一个随机菜单的屏幕截图，因为我想让你看看这有多令人印象深刻。所以我只是有，嗯，我会说，找到餐厅和它的位置。好的。同样，我只有一个随机的，呃，这张菜单的照片。没有识别特征。好的。而且不仅没有，没有地理位置数据，也没有退出数据可以告诉大型语言模型这是在哪里。好的。因为我截取了我发给自己的一张照片的屏幕截图。

所以我检查了，没有识别数据。我们只有法吉塔拼盘，你知道，1549牛肉玉米片，1149蔬菜米饭碗，1049混合绿色沙拉，1079，对吧？没有其他信息。让我们看看。这是，没错。我甚至不知道它在哪里。因为我想，这是什么菜单？我完全不知道。它在39秒内找到了它。

如何？我完全不知道。对吧。你可以浏览并阅读。所以看起来它正在分解。它首先使用计算机视觉。它正在识别不同的项目，不同的价格。然后它查看许多不同的网站，以查看哪个单一餐厅可能拥有这种组合。对。

哦，我的天哪，这太有趣了。它还发现，你知道，哦，所以正确的答案是这是来自迪士尼世界魔幻王国边疆乐园的。它还说，哦，你知道，这些价格并不完全准确，因为这些价格只在2019年到2022年。各位，这有多么令人印象深刻？我的意思是，首先，这有点令人毛骨悚然，但想想所有商业用例，对吧？

我不知道。假设你有一个外勤人员在拍照，你知道，我不知道，也许你修理你的企业主，你有一家家装公司，对吧？你有，你知道，你的人在外勤，他们正在拍照，你有几十年的这些数据和所有这些随机的照片。你会想，嘿，这是从哪里来的？

或者假设你在商业方面，商业房地产建设，对吧？你有一张建筑物的外部照片，你会想，这是从哪里来的？使用了什么材料？这个项目是什么时候完成的？对吧？你不知道，你可能会花几个小时，因为这可能对你正在进行的投标非常重要。你可能在几分钟内就能找到它，特别是如果你有EXIF或地理数据。

照片，默认情况下，大多数照片都有这些数据。它可以立即找到它，但这令人毛骨悚然，令人印象深刻，令人毛骨悚然，令人印象深刻。好的。最后但并非最不重要的一点，让我们看看。我有一个例子。它在哪里？就是这样。所以像我看到的一些例子，我看到人们在推特上尝试的事情。所以我认为有人尝试了这个。所以

我所说的只是利用你掌握的每一个工具，并找出如何制作一个在海滩上可爱的小狗的电影。好的。这不是Sora。好的。GPT-4-0或对不起，Chad GPT-03没有创建电影的能力，对吧？当你谈论改变你脑海中对你业务来说可能的事情时，

我只是字面意思地说，利用你掌握的每一个工具，并找出如何制作一个在海滩上可爱的小狗的电影。它没有这些能力。它不能创建电影。它不能。对吧。它不是Sora。对吧。它真的做不到。我做了一个测试。我讨厌泄露。对吧。所以让我告诉你这里引擎盖下发生了什么。所以它说，

首先，我将创建一系列画面，展示一只可爱的小狗在海滩上奔跑并玩球。画面将略有不同，以显示运动。每个画面都会有略微不同的姿势。我将制作至少10个画面，然后使用Python工具将其转换为GIF。最后，我将向您提供观看GIF的说明并提供下载链接。所以这里实际上发生的事情，这就是为什么这是相当有代理性的。

03意识到，嘿，我不能真的这样做。我没有可以做到这一点的功能。我没有可以做到这一点的工具。但是让我思考一下，对吧？让我做一些研究。让我在内部思考。它需要一点时间，但看起来它要把它放在一起了。它要把它放在一起了。好的。所以。

好的。看起来不错。就是这样。直播观众。这是，这是伟大的揭示，对吧？这就像在1993年使用互联网一样，当某些东西加载非常慢时。好的。所以它说完成了。它去哪里了？它在那里加载。好的。我正在刷新。看起来它还在进行中。有时它会这样做，对吧？嗯，我要缩小，尝试刷新。我相信它稍后会弹出。显然，显然它会用，呃，

用我试图在这里做的最后一个，各位。对不起。这是一集漫长的闲聊节目。让我看看。让我看看我是否可以找到我做的测试，如果这个在接下来的几分钟内没有快速完成。让我们看看。

好的。显然现在，现在我找不到它了。你是，你是认真的吗？你是认真的吗？我，我，我正在另一个窗口中查看。各位，如果我不每天使用聊天GPT一百次，这会容易得多，嗯，这使得这里有点困难。好的，等等，就是这样。好的。我找到了我的另一个。让我们看看。

就是这样。我们要结束这个。我们要结束这个，各位。好的。这是另一个。让我们看看。所以我说了，给我制作一部我可以下载的电影，其中包括一只在海滩上的小狗。对。所以同样的事情。是的。不幸的是，看起来这个要么超时了，要么。好的。哦，有趣。所以它做到了。它以不同的方式做到了。

我甚至不知道在这个上面发生了什么。它实际上引入了，呃，看起来是从Pinterest上在海滩上的真实小狗。嗯，它之前给了我指示，当我这样做时，它实际上创建了它。所以生成式AI有点不同。呃，所以我可以点击下载。哦，你一定是在开玩笑吧。哦，它说，它说会话过期了。让我告诉你之前。它做到了。它成功了。它创建了一个小狗的视频。

为什么我做的最后一个演示是那个不起作用的？我的天哪。好的，各位。我希望以一声巨响结束那个，但让我们在这里结束吧。

好的。当我拼命地尝试在后台重新运行它时，我看到可能有一些问题。所以很快，有一个测试提示。好的，玛丽说，在药房雇佣创意人员的决策者是谁？好的，这是一个提示的例子。我稍后可以在这里运行它。你们很多人想看到正面交锋。好的。你们很多人想看到03之间的正面交锋。

03和，呃，Gemini 2.5 pro Denny问道，在AI上上传CSV还是Excel表格更好？这取决于你指的是哪个，呃，哪个AI。根据我的经验，呃，你知道，如果你正在使用03，呃，CSV和像XLS或XLSX，呃，工作同样，呃，同样好。

让我们看看。我只是想确保在我们结束这个节目时没有其他问题。马克在这里发表了一个很好的评论，说两者都可爱，网站做得更好。是的，绝对的。是的，还有其他AI工具，对吧？我真正想向你们展示的是O3如何

使用这些像五个不同的工具同时进行代理操作，来回切换，在它们之间来回切换，我认为这是真正将它与Gemini 2.5 pro区分开来的东西之一，也是为什么我真正认为O3在一个，呃，在一个单独的剧集或系列中。好的。我运行了这个。让我们看看。它，它仍然没有做到吗？各位，我非常努力地想结束这一集。

用一只在海滩上的小狗。我非常努力。上次成功了。好的。我破坏了0-4或0-3。好的。好的。我希望这对你们有帮助，各位。我知道这是一个漫长而冗长的剧集，但是让我告诉你，如果你在这些例子中没有看到这个模型如何彻底改变工作方式，

那么我可能会为你们感到有点难过。是的，这个很长。这个很冗长。我们不做编辑，不做脚本。这就是为什么我说，你知道，试图带给你人工智能中最真实的东西。有时东西会坏。有时东西第一次就能很好地工作。但事实上，我们现在有一个字面上的、有代理性的、大型语言模型，它现在可以使用，好的？它可以思考、推理和提前计划。

它可以浏览互联网。它可以找到趋势。它可以总结信息。它可以字面意思上为你构建仪表板。它可以在一两分钟内处理数十万行数据。它可以自行代理地决定

如何完成这些任务，对吧？这些都是非常简单的用例。我没有，你知道，微调提示，你知道，向你展示一些令人印象深刻的东西。这是基本的

人类语言，对吧？如果我投入大量工作，我可以创造更令人印象深刻的东西。我相当擅长提示，对吧？我想向你们展示任何人都如何，日常AI人员如何，对不起，普通人如何只需使用自然语言提示，输入大量数据，输入你正在处理的需要网络的东西。它需要思考。它需要推理。它需要思考。

你知道，使用，你知道，电子表格。它需要创建可视化仪表板。所有这些过去需要做的，即使使用像，你知道，O1 Pro，O3 Mini High，之前的版本，Gemini 2.5，对吧？通常来说，要完成所有这些事情，现在O3可以自行代理地完成，因为它可以来回切换并在所有这些工具之间自行切换，而你不需要重新提示它

从字面上改变了我们工作中可能发生的事情。好的。我没有做到所有的事情。如果这对你有帮助，我有10个更多的商业用例。

我们没有时间。好的。请点击转发。所以如果你还在播客上收听，我的天哪，这我应该在45分钟时就停止了。如果你想，等等，这改变了事情。点击LinkedIn上的转发。

我有10个关于03的商业用例，我甚至没有提到。它们可能有点太复杂了，但非常像技术。

今天的剧集，但你知道，更好的是。我想向大家展示一个广泛的范围。所以如果这对你有帮助，如果你想要10个额外的O3用例，包括提示，你知道，你可以填写空白并用你自己的数据尝试一下，只需点击这个的转发。如果你在播客上，你知道，我们总是在我们的节目说明中留下链接，来

你知道，在LinkedIn上观看它。所以如果我没有发给你，就回复我，对吧？给我几天时间。你知道，如果我没有立即回复你，只需点击转发。我会发给你的。我希望这对你有帮助。如果是这样，请访问youreverydayai.com。注册免费的每日新闻通讯。记住，这是第二部分。所以如果你仍然有点困惑，请收听第一部分，或者在评论中留下你的问题。希望这对你有帮助。明天见，每天都有更多关于Everyday AI的内容。谢谢各位。今天的Everyday AI就到这里了。感谢您的收听。如果您喜欢本期节目，请订阅并给我们评分。这有助于我们继续前进。更多AI魔法，请访问youreverydayai.com并注册我们的每日新闻通讯，这样你就不会被落下。去打破一些障碍，我们下次再见。

EP 510: OpenAI's o3 Use Cases - How to use the world’s new most powerful LLM at your company 01:14:11 Share

Everyday AI Podcast – An AI and ChatGPT Podcast

Deep Dive

Shownotes Transcript

EP 510: OpenAI's o3 Use Cases - How to use the world’s new most powerful LLM at your company