We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode DeepSeek vs. OpenAI: is a new AI Cold War brewing?

DeepSeek vs. OpenAI: is a new AI Cold War brewing?

2025/2/27
logo of podcast Lexicon by Interesting Engineering

Lexicon by Interesting Engineering

AI Deep Dive AI Chapters Transcript
People
A
Alfredo Esposito
C
Christophe McFadden
Topics
Christophe McFadden: 本期节目探讨DeepSeek的崛起及其对AI未来的影响,包括AI的开源革命、版权争议以及DeepSeek对创新、市场和数字主权的意义。 Alfredo Esposito: 我是一名律师,专注于新技术,特别是生成式AI及其与版权和内容创作相关的问题。DeepSeek是中国开发的生成式AI模型,与ChatGPT类似,但它是开源的。OpenAI的CEO Sam Altman承认公司在开源策略上犯了错误,这凸显了OpenAI与DeepSeek的区别。Elon Musk起诉OpenAI,认为其非营利理念已被完全抛弃。DeepSeek的崛起展示了开源AI模型的潜力,尤其是在协作开发方面。DeepSeek的R1和B3模型采用了“专家混合”(MOE)技术,使其更具成本效益。DeepSeek在中文语言处理上进行了优化,但不会牺牲其他语言的表现。DeepSeek的训练成本被夸大,实际成本可能远高于宣传的数字。在AI训练领域,版权已经失效,传统版权法无法适应生成式AI的规模和学习方式。OpenAI指责DeepSeek使用其模型进行训练,但OpenAI自身也是通过大量受版权保护的内容训练的。无论DeepSeek服务器位于中国还是美国的AI系统,AI技术都具有双重用途,可用于战略国家利益。DeepSeek的发布对股市产生了巨大影响,但这并不意味着AI泡沫即将破裂。我们正处于一场数字冷战,涉及美国、中国、俄罗斯和欧盟,AI技术已成为大国竞争的新战场。DeepSeek并未证明AI可以在小预算下开发,未来可能会出现更多专注于特定应用的AI模型。未来可能会采用类似Spotify的收益模式,为生成式AI训练数据提供补偿。 Alfredo Esposito: 我专注于生成式AI及其法律和伦理问题。DeepSeek作为中国开发的开源AI模型,与OpenAI的ChatGPT形成对比,其开源特性允许开发者查看、修改和运行模型。OpenAI的策略转变以及Elon Musk的诉讼,都突显了OpenAI自身在开源方面的矛盾。DeepSeek的R1和B3模型采用混合专家技术(MOE),降低了训练成本,但实际成本可能被低估。DeepSeek的训练数据可能包含OpenAI的模型,这引发了版权争议,但更深层次的问题是,现有的版权法难以适用于AI大规模数据抓取的训练模式。DeepSeek的服务器位置在中国,引发了数据安全和地缘政治风险的担忧,但这种担忧并非DeepSeek独有,而是AI技术在国际竞争中的普遍问题。DeepSeek的发布对股市产生了冲击,但我不认为这代表AI市场泡沫即将破裂。我认为我们正处于一场AI冷战,各国利用AI技术进行战略竞争,这将影响AI的监管和发展。未来,AI发展可能转向更专业化的应用,而不会直接挑战OpenAI等巨头。关于数据补偿问题,未来可能出现类似Spotify的模式,对训练数据提供者进行补偿。

Deep Dive

Chapters
DeepSeek, an open-source generative AI model developed by a Chinese startup, is compared to OpenAI's ChatGPT. Key differences include DeepSeek's open-source nature, cost-effectiveness, and potential language optimization for Mandarin while maintaining multilingual capabilities. The discussion also touches upon the varying translation capabilities of different AI models.
  • DeepSeek is an open-source generative AI model.
  • It's developed by a Chinese startup.
  • Key differences from ChatGPT include open-source nature and cost-effectiveness.
  • DeepSeek uses a 'mixture of experts' system.
  • Mandarin optimization is discussed, but it's noted that other languages are not necessarily compromised.

Shownotes Transcript

欢迎收听本期Lexicon节目。我是克里斯托弗·麦克法登,Interesting Engineering的撰稿人。今天我们邀请到了阿尔弗雷多·埃斯波西托,一位数字权利倡导者、版权专家和人工智能法律专家,来探讨DeepSeek的兴起,这是中国对OpenAI的开源回应。

从人工智能监管到全球科技军备竞赛,阿尔弗雷多将分析塑造人工智能未来的法律、伦理和地缘政治挑战。所以,让我们一起深入探讨人工智能的开源革命、版权之争,以及DeepSeek的兴起对未来创新、市场和数字主权意味着什么。

赠予自己知识。IU Plus是一个高级订阅服务,可以解锁对尖端故事、专家见解和科学、技术和创新突破的独家访问权限。掌握塑造未来的知识,走在时代前沿。阿尔弗雷多,感谢您的加入。您今天好吗?哦,感谢邀请。我今天真的,真的很好。谢谢。太棒了。荣幸之至。为了我们观众的利益,您能简单介绍一下自己吗?

我是一名律师。有些人会叫我书呆子律师或极客律师,因为我对新技术很感兴趣。在我开始做这些低端工作之前,我先创办了自己的第一家唱片公司。

大约在2010年左右。我开始接触与知识共享许可和开源相关的版权问题。然后我的职业生涯发展得更低端了一些。所以现在我真的很热衷于研究生成式AI和所有与内容创作、版权以及所有生成式AI模型相关的东西。太棒了。我们已经有点跑题了。

这是一个有趣的开端和结尾。好的。您能解释一下DeepSeek是什么,以及它与OpenAI的ChatGPT等其他知名AI产品有何不同吗?DeepSeek起初是一个生成式AI模型,它是由一家中国初创公司在过去几年中开发的。

基本上,乍一看,它可能看起来与ChatGPT非常相似。这可能是最著名的生成式AI模型。但我可以说这只是一个表面上的观察,因为首先要说明的是DeepSeq是一个开源模型。这意味着任何开发者都可以查看、修改和运行这个模型。

举个例子,OpenAI的首席执行官山姆·奥特曼几周前在Reddit的AMA环节中说,我个人认为我们在这件事上站错了历史的立场,我们需要制定不同的开源战略。这就让我们看到了OpenAI与DeepSeek之间的区别。所以,在这段历史中存在一些不同的方面。我希望这对我们的听众来说会很有趣,因为第一部分

可以从OpenAI根本不开源的偏见开始。埃隆·马斯克,OpenAI的创始人之一,也对OpenAI提起诉讼,称该公司的非营利理念已被彻底抛弃。

另一个原因是,像DeepSeq这样的强大的开源AI模型的兴起,它拥有R1和B3模型,这是一种解码方式,展示了协作式AI开发的潜力。这可能是OpenAI模型之间最大的区别

ChatGPT和DeepSeq。然后这两个模型之间也存在差异,我们稍后可能会深入探讨一下,一个模型如何便宜,另一个模型如何昂贵。这是在我们的生成式AI模型中也引发了很多讨论的事情。好的,很棒。那么

您刚才提到的DeepSeq的R1和B3版本之间有什么区别?基本上,这些模型之间存在一些差异。

可能使这些模型之间的差异变得有趣的一件事是,DeepSeq只使用了经过训练的整个模型的一小部分。从技术上讲,这被称为专家混合,即MOE,它只是在查询的参数以及所使用的标记中激活一些差异化。

在查询过程中,以及我们通常通过提示进行的提问。因此,也有一些中性语言处理、NLP、机器学习以及大型语言模型,但发生的情况是,据称使用DeepSeq应该更具成本效益

比其他模型。好的,足够了。所以很明显它是在中国开发的,但它大概也是多语言的。我们知道它在母语普通话中是否更好,或者它使用的语言实际上并不重要吗?这真的很有趣,因为……我甚至无法回答这个问题。

是的,谢谢。就像,是的,普通话和汉语对于这类模型来说真的很难理解。还有很多图画符号。所以我们可以说,当然,它针对的是母语为中文的人进行了优化。

这是一种区域性优化。但另一方面,我认为这不会以牺牲所有其他语言为代价。我们必须说,这种专家混合系统据称拥有6710亿个参数。这说明

它也可以用其他语言提供非常好的性能。如果我们也考虑一下其他正在开发的模型,例如

DeepL,这是全球使用最广泛的模型之一。它们可能都相当不错。而且我可以说,同样的ChatGPT在翻译方面我也不是很满意。所以我可以说,用普通话工作可能真的很难,但我认为

这不会像我之前说的那样,以牺牲其他语言为代价。我们可能没有与汉语相同的复杂程度,但我认为这对DeepSeq根本不构成问题。这也不是一个公平的衡量标准。OpenAI或ChatGPT大概主要用英语进行训练。

是的,绝对的。就像反过来问这个问题一样,不是吗?所以这很公平。我是意大利人。我可以说,你知道,如果你直接翻译成意大利语,当然会失去很多细微之处。所以,你知道,模型构建的地方在那门语言中可能会更好。但我可以说,我认为它们足够强大,可以进行翻译,而且在进行良好的翻译时,它们可能也存在同样的

差异。可能不是最好的,但我认为这些模型在这方面并没有那么大的区别。足够了。我想你是一位意大利语母语人士。是的。所以如果你用ChatGPT翻译成或从意大利语翻译,你觉得怎么样?它太机械了吗?是的,我必须说我不太用ChatGPT进行翻译。

至少我主要使用英语和西班牙语,我可以说,我可能比ChatGPT更擅长翻译,但这并不是因为我是一个非常优秀的翻译。只是因为,正如我告诉你的,有很多细微之处是你从语言中省略掉的。所以可能有一些模型。我认为它们比ChatGPT好得多。这很公平。只是出于兴趣。我不知道有什么区别。是的。

据报道,DeepSeq的训练成本远低于GPT-4等其他模型。我们知道这是如何实现的吗?这些说法可靠吗?我认为说它训练成本很低有点误导性。首先,因为当然,你知道,可能……

他们宣传的成本只是最终预训练运行的成本。因此,围绕基础设施、人员、数据采集和能源消耗等方面还有很多开支。而且,你知道,还有他们应该用来开发所有东西的芯片。我认为这个数字真的……

我必须说,我不太相信这个数字。然后,你知道,你也可以说,可能有一些更便宜的AI开发方式,但我真的不相信这一点,我必须说。这只是数字。这只是数字。我认为,你知道,我们不应该相信这些数字。

根据我的经验,以及构建模型的成本,以及与所有其他模型相比。所以,是的,这就是我的答案。当然,如你所知,我们没有官方数据,尽管我们可以查看官方数据,但我对此持相当怀疑的态度。足够了。同样,对于ChatGPT来说,这可能也是正确的。你怎么能检查、验证他们提供的任何成本呢?同样在中国,

一些成本要低得多,不是吗?我不知道中国程序员的工资是多少,但我猜想它肯定比美国低得多。所以这大概是一个因素。大概是的。关于同样的主题,鉴于据称训练它更便宜,像美国对中国实施的制裁,例如对英伟达芯片的制裁……

对于模型来说,这是一种适得其反的方式。如果说法属实,训练AI的成本更低。我不知道它是否适得其反。这是一件正确的事情。通常也要看看市场发生了什么,也许我们稍后可以深入探讨一下。这种制裁可能会

让中国公司获得先进数据变得更加困难和昂贵。这就是为什么我认为DeepSeq最初的廉价说法不属实的原因,但我认为这将对这种网络冷战产生长期战略影响。

这很公平,很公平,安森。所以稍微换个话题,关于模型的训练,有人声称DeepSeek窃取了OpenAI的模型来加快其训练速度。我们知道这其中是否有任何真相吗?这是一个虚伪的情况吗?OpenAI基本上……

怎么说呢,基本上是抓取互联网来训练它的模型。这是我的看法。版权或数字版权已经死了。

至少在AI训练领域,已经死了。这不仅仅是我的观点。如果你看看最近关于Meta和Facebook以及OpenAI训练实践的核心判决,基本上他们已经对大规模数据抓取用于AI训练进行了有效验证。现实情况是,鉴于规模

以及这个模型学习的方式,在人工智能和生成式人工智能时代执行传统的版权几乎是不可能的。山姆·奥特曼、米拉·穆拉蒂和OpenAI的每个人。如果没有,或者说尊重版权规则,就不可能拥有生成式AI模型。这就是为什么我的观点是版权是,或者我们不会有生成式AI,或者至少我们必须重新思考版权。

就像今天一样。那么,关于OpenAI,当OpenAI指责DeepSeq在其模型上进行训练时,是的,他们可能是对的。就像,我什么也说不出来,他们可能是对的,但这就是讽刺之处。OpenAI本身构建了GPT和所有其他模型,这些模型都使用了大量惊人的脚本内容。

所以包括,正如我之前所说,各种受版权保护的材料。你可以看到《纽约时报》和其他报社的诉讼。这是很清楚的,而且这种情况会发生。最终,我们将看看,至少根据美国法律,这是否会被视为合理使用。我认为不会。或者简单地说,我们将拥有其他类型的模型

我们可能应该转向另一种范式,在这种范式中,我们现在看到的传统的知识产权概念正在瓦解,而且这可能会发生变化。我们必须重新思考我们在世界各地思考版权的方式。我可以理解……

有些人可能会说,他们没有抄袭,所以你不能说你在侵犯版权,但你在抓取数据,所以你并没有受到某事物的启发。你只是从网络上获取东西,并从中赚钱。所以可能,你知道,这是我的领域,所以这是我在过去三年里一直在努力尽可能多地研究的事情。关于这个问题的适当对话应该是……

你知道,不应该是谁抄袭了谁,而是如何建立,这将是一个非常非常非常困难的挑战,我们将需要新的公平补偿框架

和归属。这是另一件事,可能每个人都忘记了。在这个信息遍布网络的时代,阻止它将非常困难。最后,我还发表了一篇文章,内容是关于印度针对

针对OpenAI的诉讼,以及如何执行这项诉讼。此外,你知道,让我们说,DeepSeq复制并抓取了ChatGPT和OpenAI,OpenAI抓取了网络,但它将执行法律。

你没有一个全球性的想法。我们只是,一切都是,你知道,真的,非常理论化。这就是为什么一切都在转向地缘政治战争,或者让我们说,你知道,网络战争。

这很公平。我认为谷歌开始对你的搜索词进行AI摘要,不是吗,例如谷歌。但它会注明信息来源,不是吗?你可以在右边看到来源。我的意思是,也许这就是未来。像OpenAI这样的公司被迫提供其来源并将其归属给你。

是的,有。你在说谷歌搜索吗?是的,谷歌搜索,是的。是的,但对于谷歌搜索,基本上,你只是添加了事物的列表,然后你点击链接,链接直接跳转到链接。在这种情况下,你只是自己获取所有内容,将其放入你的模型中,并通过订阅赚钱

从法律角度来看,这是完全不同的。你可以根据美国法律进行合理使用,另一方面,你没有合理使用。利润是一个,直接利润是可能改变这两种法律观点的轴线之一。好的。是的,这很公平。好的。

好的,下一个问题。由于DeepSeek服务器主要位于中国,这引发了人们的担忧,即这项技术可能被用于外国影响活动、数据孤岛或潜在的网络行动。您将如何回应这些担忧?或者我们该如何回应?

是的,我们当然是从西方的角度来看待这个问题。我可以说,从另一方面来说,他们也可以这么说。现实情况是,先进的AI系统总是会变成,我可以说,一种两用技术。无论我们谈论的是在中国部署的DeepSeq服务器,还是在美国、俄罗斯或其他任何地方托管的系统,

这些基本上都是可以用于国家战略利益的工具,正如我之前所说的,这场正在进行的数字冷战。所以我想想,我们可以说语言模型可以用于从分析情报到生成宣传,从防御性网络安全到进攻性行动,

我认为这并非中国公司或西方公司的独有现象。这可能是技术本身的性质,当它被人类用于地缘政治战略时。如果我们想回到一些非生成式AI的东西,我们可以看到这种历史模式存在于各种变革性技术中。

从核能到太空能力。现在它又回到了太空,有了SpaceX和埃隆·马斯克。我们也可以说互联网本身也是如此。

所以,这些工具总是被用来试图获得这种领域,以进行这些国家之间的竞争和战略竞争。所以,当然,谈论服务器位置和数据治理是非常有道理的。但我认为我们应该认识到,这不仅仅是与DeepSeq相关的核心问题。

这可能是人工智能已经成为这种现代大国竞争的另一个战场。我认为这只是与任何技术进步相关的国际关系的性质。所以我们不应该责怪……

任何人,因为每个人都应该受到责备,或者没有人应该受到责备。是的,这很公平。我认为我想要表达的是,显然,美国的法律体系、宪法、保护措施等与中国的法律体系、宪法、保护措施等非常不同。他们的意识形态和哲学在这些事情上也是如此。只是想知道这是否会在某种程度上影响

用户数据安全,你知道,他们正在谈论,特别是他们将敏感信息带入DeepSeek,你应该这样做。这是真的。这是真的。但另一方面,你会看到,在这个时刻,关于欧盟如何处理数据、

美国如何处理数据或将如何处理数据,以及中国如何处理数据之间存在这种巨大的讨论。但在过去几天里,我认为我们正在关注,我不知道这是否是一个好词,比如美国的欧洲化,因为欧洲的监管,如我们所知,但现在他们正在

他们试图软化这种监管,所以我不能100%确定哪种模式是理想的模式。我一直认为欧洲模式是好的,但现在由于来自美国以及新政府的压力,我们可能不会

实现我们所追求的数据民主化,我认为是这样。好的,好吧。我的意思是,关于欧盟,显然有权忘记你的个人数据,不是吗?我不知道他们将如何用像AI模型这样的东西来执行这项权利,但理论上他们可以使用一些机制,对吧?理论上。理论上,好吧。那么足够了。是的。

DeepSeq的R1模型的发布确实让股市震荡了一番,尤其影响了英伟达和纳斯达克。一些人说,这是AI所谓的泡沫即将破裂或即将市场调整的迹象。您对此有何看法?是的,市场的反应非常强烈。我不记得了。我认为这可能是英伟达损失的钱

我认为大约是5000-6000亿美元的股市,股价下跌了大约20-25%,我不确定,但那是数字。

而且不仅仅是英伟达,所有与美国科技相关的公司都受到了影响。但问题是,这影响了加密货币市场。它的运作方式与埃隆·马斯克的狗狗币和所有迷因币的运作方式相同。一切都是相关的

公告。所以,好的,现在我们将开发这个系统,这个系统将非常便宜。没有人检查这是否属实,正如我们所看到的,DeepSeq的成本可能并不像他们宣传的那样便宜。但仅仅是这种沟通,这种新闻,它以这样一种方式进入了股市,当然所有东西都跌了下来。所以可能

我认为要开发所有这些AI模型,我们必须关注大量的计算资源和投资。转向开源模型的想法可能会显示出比我们想象的更低的资源,但另一方面,我认为这并不是

这种股市崩盘会揭示法律科技AI市场中的泡沫。当然,我不是财务顾问,但简单地说,你知道,这是……我认为它没有被高估。我认为现在市场就是这样。这是……我们知道这种模型需要大量的资源,如果我们想构建一个模型,也……

符合我们在欧盟认为良好的法规。然后,当然,你可以拥有一个不使用整个模型的DeepSeq模型,所以在令牌方面,在每天或每次提示或查询消耗多少资源方面,它可能会更便宜。但我认为这不会……

市场在那段时间被高估了。或者至少这是我根据这种有影响力的新闻得出的想法,这些新闻可能已经,已经,已经,你知道,

让市场下跌。我认为英伟达将会复苏,因为现在它可能是唯一一家能够做到这一点的大公司。也许其他公司会涌现出来。所以我们不会再有垄断了。我们将有更多的公司。但现在,所有其他竞争对手,现在可能没有人能生产出像英伟达这样的产品。股市,出了名的反复无常。

如果你在东方有一个职位,并且每天都在关注你的股票仓位,你会疯掉的。是的,绝对的。此外,你知道,这就是市场的观点。它会变得情绪化。当你看到英伟达上涨时,我认为它在几年内上涨了200%到300%,突然间你看到它下跌了20%。

你会说,好吧,这会发生,你知道,我将再次直接降到零。所以所有投资者,他们可能会开始抛售,因为每个人都在抛售。但这并不是迷因币。你知道,我们谈论的是一家必须建立相当庞大结构的公司。所以我们应该小心这一点。绝对的。好的。

现在考虑一下地缘政治方面的问题,鉴于DeepSeek对OpenAI、微软和外国政府构成的潜在威胁,可以说,我们是否,正如你多次提到的那样,我们是否正走向人工智能超级大国之间的网络冷战,这可能导致这些聊天机器人、这些AI的中断,或者某些产品在某些国家的禁令?

我之前说过,我们已经身处这场网络冷战之中,它不仅涉及美国,也涉及中国,可能还涉及俄罗斯,还涉及欧盟以及监管理念。

我不会像上个世纪那样称之为核军备竞赛,但当然,只是为了使用一个中性词,像Gipsy或OpenAI这样的公司

在其国内和国外,都是这种地缘政治斗争中的代理人。这就是为什么我认为美国针对OpenAI的诉讼也会缓慢进行,而且正如我之前所说,版权将会改变。他们也将改变国内法,因为现在有这种地缘政治战争的工具。

有一句非常有名的话说,美国创新,中国复制,有时还会扩大规模,而欧洲则进行监管。

但是现在,你知道,这变得非常有趣,这就是为什么现在,在今天,一切都变得非常棘手。欧洲严格的监管方法,尤其是在隐私方面,你知道,DeepSeq现在在意大利已经无法使用了,除非你使用VPN。如果你不使用VPN,它在比利时也无法使用。所以这种监管方法是有效的,对吧?

对美国来说,它阻止了DeepSeq进入欧洲市场。美国不希望欧洲进行监管,因为他们说它太严格了,但这种欧洲监管并没有阻止DeepSeq进入生成式AI模型市场。所以

在这种情况下,人工智能法案或GDPR不再被视为官僚障碍,而更像是一种防御性屏障,以对抗中国人工智能在欧洲的扩张。但另一方面,我们不知道这将持续多久,因为另一方面,他们希望欧洲放松管制

所以它处于中间状态,现在一切都变得过于政治化了。这就是为什么我说这是网络冷战。

而且与法律关系不大。它与消费者权利关系不大,与内容创作者的权利关系不大,因此与版权等关系不大。所以现在我们正在见证一种转变,这种转变发生在民主和权利以及上个世纪的权利执行之间,因为我认为赌注太高了……

要维持我们今天所生活的民主制度。这有点令人悲伤,但说实话,我看不到,我无法预见有什么能够真正地执行用户和消费者的权利。现在赌注太高了,而且真的太高了,而且欧洲可能会更接近美国,

而且我们可能会看到更少的监管。所以美国可能会创新,中国也会创新,欧洲会跟进。这让我很不高兴,因为法律和法规可能是使我们大陆成为超级大国的因素,因为我们没有中国的创新,我们没有欧洲的创新,

我们的,但我们有规则来创造一个更好的环境世界,如果我们失去了这一点,我不知道将会发生什么。监管是一个非常迟钝的工具,它往往要么无效,要么像你提到的VPN一样,你可以绕过它,你可以绕过监管,DeepSeek在这里被禁止,但你可以通过VPN绕过它。

它根本不起作用。而且它追赶的速度太慢了。所以诀窍将是创新。我的意思是,从哲学上讲,像欧洲和英国,我们有所不同。正如你所说,欧洲进行监管。例如,在英国,一切都是合法的,直到它变得非法。

但在欧洲,哲学是相反的,你知道。是的,但在英国,许多作者和内容创作者都反对所有允许这种版权的法律,也就是版权的终结。所以这取决于你想优先考虑什么。如果你想优先考虑作者,当然,监管会很好。如果你想不惜一切代价进行创新,那么就会有人为此付出代价。这就是为什么它会变得政治化。这是一个相当充分的答案。好的,最后一个。随着DeepSeek证明AI可以在小预算下开发,如果这是真的,我们是否会在未来几年看到大量具有成本效益的AI初创公司可能会挑战大型科技公司,或者不会?

是的,就像我之前说的,这有点误导性,因为我们需要质疑这里的假设。DeepSeq 并没有完全证明,实际上并没有真正证明人工智能可以在更小的预算下开发出来。也许,我不会说完全相反,但最终,我们现在可能不会看到这个竞争格局发生巨大的变化。也许将来会发生一些变化。是的。

市场可能会在利基理念上得到更大的发展。因此,将会出现某种专门用于应用程序的生成式 AI 模型,而不是像我们现在看到的通用人工智能。比如说 DIP,翻译模型。所以,一些在翻译方面做得非常好的东西,而不是通用目的。

我们将不得不看看将会是什么,拥有更多开源模型,你知道,这种利基市场将会被建立起来。这种模型将如何训练,因为,你知道,如果你必须考虑补偿

所做的抓取。这将产生成本。如果明天,比如说,某个法院将要裁定,你知道,你可以训练,你可以抓取整个互联网,那么版权将永远消失,这将降低成本。所以我们还有几个参数需要考虑。所以我认为不会有……

更多能够直接挑战 OpenAI 或谷歌或微软来构建这些基础模型的初创公司。但我们可能会有一些更利基的模型,所以更专业的应用程序。但我们仍然有太多参数需要考虑,现在它真的不是……我们没有所有……

我认为我们现在还不能说它会是什么。它在世界上总是会更便宜,但你知道,也有这样一种想法,即考虑到 deep-seq 的发展,它不会像我们想象的那么便宜。足够了。我不知道你是否知道答案,我也不知道答案,但是……

一定有办法,比如说你把自己的作品发布到网上。一定有办法阻止训练数据模型访问它,除非支付费用,或者我不知道,类似的解决方法。就像一种,

人工智能付费墙之类的东西。这也是英国正在讨论的问题之一。有多少。如果你的作品的比例是 0.00001%,你可能会像在 Spotify 上作为歌手一样获得收入。所以不多。是的。

足够了。我的问题就这些了。你还想补充什么吗?你认为我们没有涉及到哪些重要的事情?我认为我们已经触及了很多方面。也许,我只是想借用 Spotify 的想法来说,也许现在这种模型,

音乐已经被下载了,我在 15 年前在创意共享音乐标签中找到了它,因为我认为……没有更多的方法让人们付费……你知道,下载音乐,就像音乐随处可见,你可以在 YouTube 上收听,你可以下载它,你可以把它放在你的 iPod 上,你怎么能强迫人们付费音乐呢?所以

这就是为什么我决定简单地使用创意共享许可证发布音乐。没有人会因为拥有版权而变得毫无用处。不是因为我不信任也不相信版权,但如果你有一部法律,而你没有任何办法执行它,当然,这将会……

这将改变一点这种想法。所以我不会说我们可能会把收入模式看作是生成式高数据训练的 Spotify,但我认为类似的事情将会发生。

所以也许,比如说,最大的《纽约时报》或大型作者或大型纸张公司或大型模型或图形或插图公司,他们可能会在法庭外获得一些补偿,这是否足够,我们不知道,以产生更多内容。

但如果我们看看音乐界发生的事情,我们不再有小型唱片公司,我们不再有小型制作公司或公司了。所以

我担心内容创作、编辑和作者也可能会发生同样的事情。所以我们可能会有一个 Spotify 模型,以及对生成式 AI 的补偿。但这不会是在一家私营公司下进行的。这可能会由美国的联邦法律或英国的法律来建立。也许以后,慢慢地,慢慢地,慢慢地,欧洲也会效仿。

好的,非常好。太棒了。就这样,阿尔弗雷多,我们的时间到了。感谢你的时间。另外,别忘了订阅 IE Plus 以获取高级见解和独家内容。