We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Inside OpenAI's Checkbook: The $540M Investment in ChatGPT

Inside OpenAI's Checkbook: The $540M Investment in ChatGPT

2024/4/2
logo of podcast No Priors AI

No Priors AI

AI Chapters Transcript
Chapters
This chapter explores the significant financial investment in ChatGPT's development, highlighting the substantial expenses associated with talent acquisition, model training, and the overall cost of bringing the product to market. The previously unreported figure of $540 million is discussed.
  • $540 million spent on ChatGPT development
  • Hiring key employees at high salaries (up to $5 million annually)
  • Significant costs associated with training machine learning models

Shownotes Transcript

深入了解OpenAI的财务决策,探索每年分配给ChatGPT的5.4亿美元,揭示推动这一重大投资的动机和优先事项。加入讨论,我们将剖析人工智能开发的经济学。

AI Facebook社区: ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://www.facebook.com/groups/739308654562189⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Podcast Studio AZ: ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://podcaststudio.com/mesa-studio/⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 播客工作室网络: ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://PodcastStudio.com/⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠

<raw_text>0 今天的播客中,我们将讨论训练ChatGPT的成本,OpenAI在整个公司上花费了多少,历史上他们花费了多少,以及未来会发生什么。我们将讨论一些财务成本和时间,以及你可能没有想到的水的成本。

我们还将讨论其他公司正在做些什么来帮助减轻这些成本,谁是花费最多资金的人,以及为什么微软和OpenAI将在不久的将来开始制定一些新的财务模型和新产品,以帮助抵消这些成本。因此,不再多说,让我们跳入播客。我认为今天我们想讨论的最大问题是,嗯,有一个来自《信息》的大标题说,OpenAI的损失翻倍至5.4亿美元,因为IT开发了ChatGPT。

所以这真的很疯狂,因为他们在构建ChatGPT时,显然不得不从谷歌招聘一大批关键员工。这些员工的薪水可能非常高,其中一些每年薪水高达500万美元。当你的公司是OpenAI,而你的产品绝对是关键的,并且基于这些AI专家,你只会支付任何成本,尤其是当你已经从微软和其他投资者那里获得了十亿美元时,你只会花费任何必要的费用来加速将产品推向市场。

所以显然,他们去年花费超过5.4亿美元来准备、开发和推出ChatGPT,值得注意的是,这是一个之前未报道的数字,来自公司内部的一些人泄露的,实际上很多费用都用于训练这些机器学习模型的高昂成本。在你知道ChatGPT推出之前,这是一笔巨大的费用,因为很多工作必须从头开始进行,这是一项庞大的工程。

因此,即使在他们推出之后,收入也有所增加,达到了每年数亿的速度,这是他们在2月份推出付费版本的ChatGPT后仅几周内所取得的成果。我认为整个公司的运营成本不会减缓。我认为随着他们获得更多客户,并继续训练越来越先进的人工智能模型,成本只会继续上升。

显然,这项技术正在迅速发展,他们必须保持对IT的高度关注。因此,首席执行官山姆·阿尔特曼私下表示,OpenAI可能在未来几年内尝试筹集多达1000亿美元。这绝对是疯狂的。

到目前为止,写给他们的最大支票,埃隆·马斯克在一开始就写了一些相当大的数百万美元的支票,某些情况下高达数亿美元,微软给了他们10亿美元,然后最近,微软又给了他们100亿美元,这使得微软成为该公司的约50%的股东。因此,他们计划在未来几年内筹集多达1000亿美元,我认为这确实表明他们认为继续开发这些能力将花费更多的资金。如你所见,他们需要在图像上花费大量资金。

他们有DALL·E 2,但目前被其他竞争对手打得很惨。嗯,人们只能假设他们将来会更多地进入音频和视频领域。因此,随着他们开始考虑所有想做的事情,这将变得非常昂贵。

非常有趣的是,他们可能正在考虑筹集1000亿美元。我认为这非常重要,因为现在有很多其他公司正在创建这些类型的AI模型。我们有谷歌在努力。

我们有彭博社,最近彭博社表示,他们使用了130万小时的GPU时间来帮助构建彭博GPT大型语言模型。因此,所有这些目前都是非常昂贵的,大家都在竞争。

现在几乎就像是这场大型AI竞争或军备竞赛,支持来自NVIDIA和其他平台的GPU服务器能力。嗯,因为每个人都在努力训练这些庞大的模型,因为这是一个热门话题。因此,随着他们争夺这些资源,成本也在不断上升。

我认为,除了训练和ChatGPT历史上OpenAI的历史支出外,另一个我们真正需要考虑的成本是,试图训练新模型的人将不得不开始在数据上花费更多。ChatGPT在某种程度上是低调的,因为他们将成为一个开源平台。他们拥有进入王国的钥匙,当涉及到Twitter和应用程序时,许多不同的资源允许他们免费使用数据。

而现在,随着每个人开始将这些平台货币化,像Stack Overflow和Reddit这样的公司都表示,如果你想使用他们的数据,你现在必须支付他们,因此ChatGPT可能是在一个他们以较低成本获取这些内容的时机进入的。至于公司是否会追溯性地让OpenAI为他们之前训练过的数据付费,这还有待观察。另一个很多人没有想到的训练这些模型的成本是所需的水。因此,最近一轮研究刚刚发布,称训练ChatGPT所需的水足以填满一个核反应堆的冷却塔。

嗯,我认为了解这一点非常重要,在这项新研究中,他们表示,仅GPT-3(也就是在GPT-4和GPT-5之前)就消耗了大约185,000加仑或700,000升水,因此这相当于每次与ChatGPT的对话,等于他们将一大瓶新鲜水倒在地上。因此,研究中的人们显然强调了与此相关的环境问题,谈论美国目前面临的历史性干旱。

美国目前面临的干旱,以及像谷歌这样的公司训练,谷歌的服务器和云设施都位于德克萨斯州等更容易干旱的州,实际上需要更多的水,因为蒸发更多。我认为在研究中,他们特别关注的是没有回收的水,因为这些服务器通过回收水来帮助冷却它们,而是专门关注蒸发或损失的水。

我认为,考虑到干旱和水循环的问题,使用当地河流和溪流的水是非常重要的。我认为这可能比我不知道的核废料问题要小,正如这篇文章标题所暗示的那样,他们提到核反应堆,试图让其看起来非常放射性和可怕。我的意思是,这只是水,它会蒸发。

嗯,我不知道还有什么好说的。我认为我们都会生存下来,尽管这是一个有趣的事情,需要关注。随着越来越多的AI模型的出现,它们都需要更多的水,以确保我们以负责任的方式使用和扩展这些资源。

现在说了这么多,成本确实很多,对吧?我们有员工的成本,训练的成本,数据的成本,以及水的成本,我想。最后,我想谈谈OpenAI和微软现在正在实施的新方法,以收回部分成本,推出新产品线。

而目前发生的最大一件事是,微软可能开始向企业提供私人ChatGPT,正如你所知,许多不同的企业已经禁止员工使用ChatGPT。最近,三星有一批员工向ChatGPT泄露了机密公司信息和源代码。我说泄露。

我假设他们是开发人员,他们在说他们粘贴代码,疯狂地问:“嘿,根据这段代码,我能做什么?”我有来自我公司的开发人员这样做,还有很多其他人从ChatGPT那里获得开发建议和代码建议。

因此,这种情况发生在三星。他们禁止所有员工使用这些AI模型,并表示他们将致力于开发一些内部工具,我不知道它们会有多好,但这就是他们的计划。因此,由于这个原因,微软特别是因为他们向OpenAI投资了100亿美元,他们获得了一个特殊的协议,允许他们转售OpenAI的产品。

因此,你可以看到这一点,许多其他产品也在整合,但特别是,他们被允许将ChatGPT私下转售给公司。因此,私人公司将能够购买一个特殊版本,完全在独立的服务器上运行,所有进入该服务器的数据将永远不会用于公司的任何账户,也不会被纳入未来的训练数据。

现在,他们这样做也让你思考,如果你不在这个计划中,你当前告诉ChatGPT的内容是否被用于训练数据。但这是另一个话题,ChatGPT和OpenAI也暗示他们将在不久的将来推出类似的产品。