OpenAI 在 ChatGPT 中添加了一个新模型,那就是 GPT 4.1 模型。这是一个全新的模型,他们刚刚发布或推出。它实际上是在 4 月发布的,但他们从未将其添加到 ChatGPT 平台。所以在今天的播客中,我将分解这个新模型的功能、他们之前没有发布的原因、围绕此次发布的一些争议,一些人推测这是由于安全原因和其他原因造成的。它现在正式上线了,我们将深入探讨所有这些。
在我们开始之前,我想说的是,我的初创公司 AI Box 正式推出了我们的第一个产品,那就是 AI Box Playground。这本质上是一个您可以在一个平台上访问所有顶级 AI 模型的地方,您可以每月支付 20 美元来测试所有这些模型。因此,您不再需要订阅 20 到 40 家不同的顶级 AI 公司。您可以每月支付 20 美元,访问所有内容,并根据需要使用它们。您每个月基本上都会获得代币,您可以将这些代币用于任何您想要的东西。
我们可以访问像 11 Labs 这样的音频模型,访问一些顶级图像模型,例如 OpenAI,当然还有许多您可能没有使用过或听说过的,实际上非常令人印象深刻的模型。我们还有一个名为媒体存储的功能。这是一个存储您创建的每个文件的地方。您可以轻松地回顾您过去进行的所有对话。
您进行的对话以及您用来生成不同内容(如图像或音频)的提示,您可以点击媒体存储中您创建的任何媒体上的一个小按钮,然后查看用于生成它的实际聊天记录。这里有很多很酷的功能,例如在不同的 AI 模型之间进行比较,
例如,让多个 AI 模型运行相同的提示,并进行并排比较。因此,我们在这里添加了许多非常酷的功能。如果您有更多想法,我们正在快速开发和添加新功能。因此,我们很乐意听取您对想要看到的内容的意见。您可以在说明中查看它。它是 AIbox.ai。好了,让我们进入 OpenAI 的这个新模型。
我发现这里真正有趣的事情是,我将直接公布消息,本质上,这个 GPT 4.1 是专门为数学和编码设计的。这似乎是 OpenAI 正在努力解决的问题,但这实际上是他们正在逃避的一个领域。他们的主要竞争对手 Claude 凭借 Claude Code 正在超越他们。每个人都在使用它。甚至 Google Gemini 也取得了一些重大进展,他们最近刚刚推出。
宣布新的 Google Gemini 聊天机器人现在可以更轻松地集成和分析 GitHub 项目。因此,它正在直接构建到 GitHub 中,GitHub 为微软所有,微软大量投资于 OpenAI,但 Gemini 正在该领域取得一些重大进展。因此,这个代码领域非常非常有价值。许多公司都在关注它。以至于 OpenAI 实际上即将以 30 亿美元的价格收购一家顶级
AI 编码公司,名为 Windsurf。它几乎是最受欢迎的一家。Cursor 可能是第二受欢迎的,根据其最后一轮融资,其估值约为 10 亿美元。但 Windsurf 以 30 亿美元的价格寻求被 OpenAI 收购。他们在这里采取了一系列行动。现在,
我认为 Windsurf 的收购及其时间表可能是促使他们在 ChatGPT 上上线这个新的 GPT 4.1 模型的原因。因此,如果您转到 ChatGPT,您可以点击下拉菜单。有趣的是,它实际上并没有显示在其
优先 AI 模型中,您必须点击他们的更多模型部分。在那里,您将看到 GPT 4.5,这是一个所谓的“研究预览”。然后您会看到 GPT 4.1 和 4.1 mini。现在,许多人问的问题是,好吧,当我可以使用 GPT 4.5 时,为什么我要使用 GPT 4.1?4.5 不比 4.1 或 4.1 mini 好吗?这实际上很有趣。OpenAI 特别指出,对于编码任务,GPT 4.1 将比
GPT 4.5 更好。这正在进入一个奇怪的地方,我们正在推出所谓的新模型,或者据说是更先进的模型,它们在某些任务上的表现不如旧模型。所以就像他们一样,你知道,这个旧模型可以很好地完成 X、Y 和 Z,但新模型可以做得更好,但不是这个特定的事情。因此,对于 OpenAI 来说,这有点奇怪,您需要混合搭配您拥有的模型。这就是为什么他们的下拉菜单中有四个不同的模型可供选择。然后在他们的更多模型部分,您还有三个。因此,如果您在聊天中,您可以从七个选项中选择要与之交谈的对象。我已经详细讨论过这是一种糟糕的营销方式,以及其他模型、其他公司做得如何出色。例如,XAI 的 Grok 只是,你知道,你可以使用旧版本的 Grok,或者你可以使用 Grok 3。现在他们在 Grok 中有了新功能
uh 3,就像你知道我进行深入研究一样,或者像他们有一个思考按钮,它会提供更多计算能力,并且它会真正思考,我发现这方面取得了很好的结果,这更是我想从 OpenAI 那里看到的,即使它完全切换了模型,我只想要一个简单的用户界面,现在他们在搜索框内创建了一些用户界面,但我认为他们有一个用于互联网的搜索按钮,这很好,他们有一个深度研究,这有点荒谬
如果您想要一份非常详尽的文档。我理解这一点,我认为应该保留它。然后他们有一个创建图像的功能。在我看来,如果您来这里创建图像,并且您知道您可以创建图像,
您应该只说您想要它创建什么图像,它应该知道并自动生成。它实际上确实做到了,但也许他们只是试图提示新人告诉他们他们可以创建图像,他们可以在这里输入。所以也许这是一种营销手段。但无论如何,它并不是非常有用。我的意思是,它是多余的。您可以直接与模型交谈并告诉它创建图像,您不需要一个专门执行此操作的按钮。但无论如何,如果您点击创建图像按钮,它只会自动添加文本。
到聊天中,内容为“创建图像”。现在您可以开始了。实际上,也许告诉人们您可以创建图像并不是一个坏主意。我实际上可能会把它偷到 AI Box 中。所以,呃,你知道,对于我所有的火焰甜甜圈,不要生我的气。如果您转到 AI Box 并看到我将其添加到我的用户界面中。好了。这就是嵌入的内容以及这个新的 GPT 4.1 模型的有趣之处。所以这个
这个模型是在 4 月发布的,但它只向 API 平台上的开发人员发布,这意味着 chatgpt.com 上的普通用户无法使用它。只有当您拥有具有 OpenAI API 访问令牌的开发者帐户时,才能将其嵌入到您正在构建的软件或项目中。这仅适用于开发人员。您可以说,好吧,没关系,这是一个代码工具。只有开发人员需要代码工具。开发人员知道如何访问。但实际上,我认为许多人,甚至开发人员都在使用……
可能直接使用 clot 或其他平台,他们可能不想为了在他们可能创建的特殊门户上使用它而经历这种麻烦。它只是被嵌入到软件中。现在,他们为什么要这样做?为什么他们不把它像其他人一样直接部署到 ChatGPT.com 上?这就是争议的来源。因此,一些人说,
这是由于安全问题,他们没有发布适当的安全报告。因此,他们基本上为此受到了很多批评,他们声称开放了一批正在讨论这个问题的研究人员,声称开放 I 正在降低其 AI 模型开放方面的透明度标准。我争辩说,尽管如此。
GPT 4.1 比 GPT 4.0 更快。该模型不是前沿模型,因此它不需要与一些更强大的模型相同的安全报告。因此,OpenAI 的回应是:“是的,我们没有像您批评我们那样发布安全报告,但这仅仅是因为这并不是我们的前沿模型。它就像我们的辅助模型一样。我们只是让开发人员使用它。它不需要那么多审查。”现在,
如果我完全说实话,我实际上并不主张对这些代码生成模型进行更多安全审查。我不太担心这个问题。那不是我的专业领域。我宁愿更快地获得模型,而不是过多地关注安全性。那只是我个人的想法。
但归根结底,这很有趣,那是开放的眼睛的回应。那么这到底能做什么呢?根据 Sheki Amdo 的说法,这个新模型将帮助使用 ChatGPT 编写或调试代码的软件开发人员。这两种是具体的
事情。它在指令遵循方面实际上比 GPT-4.0 更好。它也比 O 系列推理模型更快。它不一定是推理模型。它快得多。它在代码方面更好。这很有趣,因为有些人喜欢用于代码的推理模型,显然他们在这次特定更新中已经放弃了它。我认为这绝对是一个有趣的事实。所以
这就是他们特别所说的。他们说 GPT 4.1 没有引入新的模式或与模型交互的方式,并且在智能方面也没有超过 O3。这意味着安全考虑虽然很重要,但与前沿模型不同。这是他们的安全主管解释为什么他们没有对这个进行大量安全测试的原因。
正如我提到的,这个模型的发布时机非常有趣,因为我们有很多竞争对手。当然,我们有 OpenAI 现在试图推动其 30 亿美元收购 Windsurf 的交易。但是我们也有
许多其他参与者正在推出编码工具。我们有 Cursor,据称我认为 OpenAI 也可能出价收购了它们。没有成功。然后它选择了 Windsurf。有传闻,但我们当然也有 Gemini 与 GitHub 更深入地连接。我们有 Claude code,它
已经超越了大多数开发人员,并且越来越受欢迎。因此,我认为竞争非常激烈,看看谁将成为这个领域的最终赢家将会非常有趣。好的。非常感谢您的收听。如果您有兴趣,请务必查看 AI Box 平台。
获得一个平台,可以在一个聊天中与所有文本、图像和音频模型进行聊天,在同一个聊天中切换所有模型,使用擅长不同事物的不同模型。就像我们今天在播客中讨论的那样,有些模型擅长代码。甚至一些较旧的 OpenAI 模型也擅长代码,而有些则不擅长代码。在 AI Box 平台上,您可以启动新的聊天。我们特别有
我们在本集中讨论过的 GPT 4.1 和 4.1 mini 和 4.1 nano。我们这里都有这些。如果您对编码感兴趣,您可以测试所有这些,或者您可以使用所有其他 Chatship 团队模型、Anthropic 和 DeepSeek 以及 Google、Meta、Microsoft、Mistral 和 NVIDIA,所有这些。好的。所以去看看吧。AIbox.ai。非常感谢您收听今天的播客。我们将在下一集中再见。