We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Build Your Own Models with ChatGPT on OpenAI

Build Your Own Models with ChatGPT on OpenAI

2024/4/6
logo of podcast No Priors AI

No Priors AI

AI Deep Dive AI Chapters Transcript
People
主播
以丰富的内容和互动方式帮助学习者提高中文能力的播客主播。
Topics
主播:OpenAI 扩展了其自定义模型训练计划,允许公司创建针对特定用例的生成式 AI 模型。这对于医疗保健、法律等行业具有重要意义,可以提高模型的准确性和适用性。最初,该计划需要与 OpenAI 研究人员合作且成本高昂,但现在已经扩展到更多客户,并提供了自助微调选项,降低了门槛。OpenAI 的这一举措不仅可以增加收入,还可以缓解其模型服务基础设施的压力。 许多公司已经开始使用微调的模型,例如 SK Telecom 利用微调的 GPT-4 处理与电信相关的韩国语对话。Harvey AI 则利用微调的 GPT-4 帮助律师处理法律案件,有效避免了 ChatGPT 出现幻觉和虚构案例的问题,显著提高了准确性和实用性。 主播预测未来会有数千个针对不同行业和特定任务的 AI 模型出现,这将改变 AI 行业的格局。为了方便用户使用这些模型,主播正在开发 AI Box 平台,整合各种 AI 模型,并允许用户混合匹配和链接提示。

Deep Dive

Shownotes Transcript

OpenAI正在扩展其定制模型训练计划。所以在今天的播客中,我想深入探讨这意味着什么,为什么这很重要,并讨论我们从这个微调模型中看到的一些有趣的用例。有很多公司实际上正在使用这些你可能不知道的微调模型。我个人也不知道。有一些非常有趣的用例。我会谈谈这些功能,以及正在发生的事情。让我们进入播客。

所以我想首先谈谈的是,这显然是一个很多人都在使用的用例。这本质上是定制模型程序,它基本上是为了帮助公司获得

创建针对特定用例量身定制的生成式AI模型。所以你可以想象,如果一家律师事务所或医疗保健提供商想要使用ChatGPT,但他们会说,“嘿,它并不了解医疗保健行业的所有这些非常具体的东西”,他们就可以提供额外的数据,并对模型进行微调。它本质上是ChatGPT或GPT-4,但拥有所有这些额外的行业特定

知识。这就是他们帮助人们做的事情。所以定制模型和所有这些实际上是在OpenAI的第一次开发者大会上推出的。如果你记得的话,他们举办了大型开发者日。这实际上允许企业与OpenAI的研究人员合作。所以这不像你可以自己做。你几乎必须去合作。我实际上看到了一些,我看到了一些报告说,你必须花费一百万美元或其他什么疯狂的数字才能做到这一点。所以它绝对不是人人适用,但很多人都在这么做。所以

自从他们推出这个以来,他们发布了一篇大型博客文章,并引用了“数十家”。所以我假设,我不知道,像“数十家”,比如一小撮数十家。我不知道。可能大约在12到100家客户或公司之间,他们专门与OpenAI合作,并参与了这个定制模型项目。是的。

但OpenAI表示,他们需要扩展该计划以“最大化性能”。我不确定在这种情况下“最大化性能”是什么意思。但我可以假设这可能是他们赚钱的好方法。如果性能指的是财务回报,那么这是一件好事。当然,对于公司来说,我并不是说他们在销售不好的东西。我只是说那可能是他们的主要动机。所以

一件有趣的事情是,这里有一个新功能,叫做辅助微调。这被添加到定制模型程序中。但本质上,辅助微调是,当然你可以去

他们有两种选择。旧的选择是OpenAI将帮助你做到这一点,他们有一个新的选择,你实际上可以自己做到这一点。所以这有点像自助式。你可以自己引入数据。你可以在不需要使用OpenAI的情况下自己进行训练,这将更便宜,我认为这对许多公司来说将是一个非常有趣的选择。所以

现在正在开发许多不同的定制训练模型,它们基于OpenAI的GPT-4基础模型。我认为这是一个很好的例子。他们在他们的博客文章中谈到了几个例子,当OpenAI宣布这些新功能时,他们谈到了这些例子。我的意思是,这里最大的功能实际上是,这个程序已经存在了,但现在你可以自己去做,而不需要花费一百万美元来获得研究人员之一的访问权限。在我看来,这是一个巨大的新闻。

他们谈到了几家一直在使用它们的企业。其中一个是SK电信。这是一家我喜欢的大型韩国电信公司。我喜欢听到他们进行大量投资和在人工智能领域采取许多行动。所以这对我来说并不令人震惊,但他们对GPT-4进行了微调,以帮助进行大量与电信相关的韩国对话以及他们正在做的其他一些事情。

另一个我没想到与OpenAI在这方面有合作的著名公司是Harvey AI。这是一家在去年早些时候筹集了数百万美元资金的公司。我记得当时Harvey AI非常火爆,因为它可以帮助律师处理法律案件等。我记得当时有很多炒作,我确定现在更多了,但当时有大约15,000家律师事务所正在等待使用Harvey AI。

所以我认为这非常有趣。我实际上观看了一个演示,它展示了Harvey AI的实际应用,它能够输入大量与法律领域相关的特定数据。我认为他们实际上提供了一些案例。所以如果你认识律师,他们做的本质上是,当有诉讼时,他们会查看许多旧案例,如何解决这些案例,并试图找到某个问题的先例。

而这是ChatGPT众所周知难以处理的事情。有一个律师向它询问了某种法律先例,

某种关于某个问题的法律先例,它完全编造了一个从未存在过的案例,关于某个航空公司诉讼的案例。他提交了这个案例。他遇到了大麻烦,因为他完全提交了一个从未发生过的虚构案例。这是一个幻觉。这是一个关于这些AI工具可能出现的一些问题的很好的例子。话虽如此,律师们对此有很多怀疑。我认为,这就是Harvey AI诞生的原因,也是它重要的原因,因为为了避免此类问题,嗯,

对不起,我只是在想,这将是Harvey AI的一个天才营销策略,本质上是雇佣这位律师去做这件事。然后,无论他的后果是什么,都为他支付费用,以便证明为什么你需要他们。你不能只使用开箱即用的ChatGPT。无论如何,这可能不是发生的事情。这是一个很好的阴谋论。无论如何,它做得非常好。

呃,如果你将它与ChatGPT并排比较,以及他们能够对Harvey进行微调的内容,它会产生非常好的结果。我看到一个演示,他们询问某个特定问题的先例。ChatGPT给出了关于你所期望内容的三段简短描述,对吧?就像它只是从它拥有的任何内容中提取一样。然后当询问Harvey时,它能够使用自然语言处理,就像LLM的

GPT-4,但拥有所有数据和上下文,它能够实际概述四个真实的案例。它可以添加指向这些案例的链接,然后它能够,是的,基本上概述实际的有用数据以及与案例法相关的许多不同的问题和事情。非常非常有用。当然,这不可能仅仅通过GPT-4开箱即用地实现。我

我认为这里有趣的是,OpenAI表示他们认为大多数组织将为其特定行业创建自己的定制模型。这实际上与我在构建AI Box(一个无代码AI应用程序构建器市场)时的论点相同。我们相信,未来不会只有我们今天看到的少数几家大型企业,而是最终将有

成千上万的AI模型存在于各个行业中,这些模型擅长做不同的事情。这就是为什么我们正在构建AI Box,以便我们拥有一个平台,人们可以在一个帐户上访问所有这些不同的模型,对吧?你不需要创建20个不同的帐户来使用所有最佳的AI模型。你可以在一个帐户上获得所有这些模型,你还可以将它们混合搭配,将它们链接在一起,将你的提示链接在一起。所以

这就是我正在构建的东西。我很高兴看到OpenAI也看到了我正在构建的相同未来。对我来说,这里有趣的是,OpenAI现在似乎即将达到约20亿美元的年收入。

他们正计划与微软合作建设一个价值1000亿美元的数据中心。所以现在,我认为他们目前正在进行的这种定制模型训练被视为维持其收入增长的一种方式,同时他们也在试图减少,就像他们的模型服务基础设施面临着巨大的压力一样,这

需要很大的代价。所以这些微调和定制模型我认为效率要高得多。我认为正因为如此,这可以帮助减轻OpenAI的负担。就像,显然这是历史性的,你知道,他们现在面临的这种计算能力挑战。我认为这实际上可以帮助减轻这种负担。

所以有趣的是,OpenAI实际上为GPT 3.5(任何人都可以访问的免费版本)引入了新的模型微调功能。这包括用于模型质量比较的仪表板、第三方集成支持,并且他们正在使用权重和偏差以及一些工具增强功能。

但我认为有趣的是,关于GPT-4的微调细节(在开发者日早些时候以抢先体验的形式提供),他们实际上没有说任何关于这方面的内容,所以我不知道这什么时候会发布,但我一定会让你随时了解。我认为这是我们从OpenAI看到的令人着迷的新发展。它解决了一些问题。我认为它有助于产生额外的收入,但总的来说,我认为这对社区来说是惊人的,因为公司将能够取得令人难以置信的进步。

基于OpenAI所拥有的内容进行微调模型。我很期待这一点,我会让你随时了解我们在那里看到的任何令人惊叹的创新。如果你在这集中学到了任何东西,如果你觉得这有任何有趣之处,如果你能给我们留下播客评论,那真的会让我非常高兴。我很乐意听到你的反馈。如果你在Spotify上,请给我们一些星级;如果你在Apple播客上,请留下评论。非常感谢。但我希望你度过愉快的一天。