嘿,在节目开始之前,我想快速问一下,如果您喜欢整洁的眼睛节目,请花点时间在您的播客应用程序中评分并留下评论,说明您喜欢哪些剧集以及您想听到哪些主题?您的反馈可以帮助我们塑造节目,以满足您的好奇心,带来令人惊叹的体验,并为您提供最佳体验。
自从互联网调制解调器进入我们的家庭以来,人们就开始登录,有时只是为了看看网络提供的所有疯狂内容。从那时起,这种需求就由在线社区满足,创意人士聚集在一起,互相启发并分享他们的技巧。像 DeviantArt 这样的网站为艺术家提供了展示其多样化数字创作的空间。
Newgrounds 成为古怪 Flash 游戏和动画的中心,而 Vimeo 则始于一个为有抱负的电影制作人提供的简朴社区。近年来,您可能注意到 AI 生成的图像出现在您的社交媒体上,那些通常超现实的肖像或梦幻般的风景看起来几乎完美得不像真的。随着这种新型创作的出现,一个新的平台也应运而生,那就是 Civitai。
这是一个中心,初学者、专业艺术家和工程师都在这里使用 Stable Diffusion 和 Midjourney 等最新模型进行实验,对其进行调整,开发新技术并分享他们的工作流程,随着社区的壮大,工具变得越来越容易获得,并模糊了所有角色之间的界限。只需点击几下,任何人都可以在这个生态系统中玩耍。
任何人都可以从消费者转变为创造者。但这对艺术的价值究竟意味着什么?民主化这项技术,能够创造几乎任何我能想到的东西的风险和回报是什么?
这是 TED AI Show,我们将在这里弄清楚如何在 AI 改变一切的世界中生活和蓬勃发展。
我们曾经对未来的大部分想象现在都实现了。
口袋大小的无线电设备将使个人能够与任何地方的任何人进行交流。
但这种重塑现实也充满了难以驾驭的棘手问题。欢迎来到 Shift,这是 PRX 的一个新的每周播客。
PRX。
我会说。
我的最大技能之一就是我与人互动的能力。
我是您的主持人 Chafer Strong。您可以在 shift.show 上了解更多信息。
为了帮助解答这些问题,我们邀请了联合创始人 Justin Maier 和 Maxfield Hulker。我们将一起探讨内容创作和消费的未来、所谓的“互联网死亡理论”,以及为什么 NSFW 内容仍然存在于他们的平台上?好的,Justin 和 Maxfield,欢迎来到节目。
再次感谢您的邀请。很高兴来到这里。
每个人都有自己的起源故事,我很想知道是什么首先吸引你们进入 AI 和创意技术的世界。
你想先说吗,Justin?Max 在 2022 年 8 月向我介绍了 Midjourney,在此之前我已经关注 AI 图像生成的发展有一段时间了。我对在 Midjourney 中看到的东西感到着迷,我一直是一个有创造力的人。工程对我来说总是更容易一些,但能够利用我的工程技能来修改提示并与 AI 来回互动,这对我来说是改变游戏规则的,也是令人振奋的。
Maxfield,你呢?
是的,我在 Midjourney 出现之前很久就开始玩 DALL-E 了。而且,我喜欢它是一个开放的 Google 产品,你实际上可以修改它。我用它生成的我的第一批图像只是我融化成风景图像,那完全是像素化的,并且被破坏了。看到这种新型艺术形式,它更像是计算机生成的,而不是人造的,这真的很有趣。
很有趣。我认为对我来说也是如此,我认为这是 2022 年 Midjourney v3。我相信当人们真正开始使用它时,能够查询人类创造力的某种提炼并获得反馈非常令人兴奋。
当然,这也是开源 AI 真正起飞的一年,对吧?Stable Diffusion 和 Imagen 出现了。所以我很想知道,你们几年前推出了 Civitai,每月有数百万访问量。你们在 AI 创作领域解决了什么问题?在你们第一次推出这款产品时,你们是在解决什么问题?
我可以回答这个问题吗,Max?
是的,请便。
这是你的愿景。我从 Midjourney 转向开源图像生成,是因为 Midjourney 的无限计划实际上并不无限,它有速度限制。所以我需要为我的爱好找到一个新的出口。
Stable Diffusion 刚刚发布。所以我开始积极参与那个社区。每次有人发布图像时,人们都会问,你的提示是什么?你是怎么做到的?对吧?人们开始创建自定义模型。
他们会添加新的概念,他们会添加新的风格。他们会添加新角色,诸如此类。所以 Civitai 的目标实际上是解决这个问题。我们希望让用户能够在一个地方找到所有模型和所有他们需要的资源来创作东西,并且每次他们发布图像时,我们都会捕获有关其制作方式的所有信息,包括用于制作该图片的模型。许多社交功能也是由此产生的,因为你知道,人们需要能够讨论他们制作的这些很棒的东西。所以这就是目标。
我的意思是,这真的很有趣,因为你是对的。每个人都非常痴迷于使用的提示,但这不仅仅是提示。所以你们的平台有点像拥有完整的责任链,即用于生成该图像的完整工作流程,对于那些不了解的人来说。你能简单地为听众解释一下开源 AI 及其对创建这些微调模型的意义吗?你知道,人们会使用诸如“LoRA”之类的术语,你能简单地解释一下吗?
Max,你会如何解释?我认为你可以比我更简单地解释。
我喜欢复杂性。绝对是。是的,让我考虑一下。所以我认为你有一些由大型公司创建的通用基础模型,这些模型需要花费数百万美元才能创建,因为它们需要大量的训练数据。
LoRA 和嵌入是你可以根据这些基础模型创建的微调,用于与这些基础模型一起使用,以便进一步调整并获得图像生成的最后 10%。你想要在概念上获得什么,而无需拥有深厚的资金来资助它。我们说这可能是对……
允许在其上构建的最高级别部分。谢谢。你想分解一下你们社区正在制作的微调的一些例子吗?也许是一些你最近遇到的杀手级例子?
自一开始以来,对我来说最有趣的大概是这个想法,你知道,如果一切都是华夫饼,或者如果一切都是由电线制成的,或者如果一切都是由咖啡杯制成的,这个世界会是什么样子?是的,完全正确。如果我们都感觉……
然后他们能够使用 Civitai 将其与不同的风格堆叠起来,对吧?所以这里有一张图像,如果一切都是由毛毡制成的。然后,如果它像 Studio Ghibli 动画风格一样制作,那么这就是一切都是由毛毡制成的图像。
能够将这些复杂的概念叠加在一起正是开源的优势所在,因为你无法使用任何这些封闭的工具可靠地做到这一点。能够进行特定方面的人类表达真的很有趣。我认为我通常难以做到的一件事是能够进行特定的面部表情,并且能够对诸如面部表情之类的概念进行训练。这真的非常酷,因为同样,你可以准确地得到你想要的东西。
公平地说,这有点像一种花哨的方式来过滤或聚焦你从这些模型中获得的内容,并获得某种一致的风格,然后其他人可以复制。我喜欢你关于将这些部分堆叠在一起的观点,因为确实感觉在开源方面,所有这些都是乐高积木,你实际上在封闭源代码中看不到。
好吧,他们最终会找到某种方法来做到这一点,Midjourney 有他们的风格参考,它慢慢地出现,但一旦出现,你就会在开源中立即看到它。所以我很想知道,在你们创建 Civitai 之前,生态系统是什么样的?合作发生在哪里?你提到过,你想分解一下 Civitai 之前和之后社区的重心是什么?
是的,我认为问题是当时没有重心,对吧?就像世界各地都有不同的社区。你知道,有些人专注于工具,有些人专注于模型开发。有些人专注于,你知道,最新的研究论文是什么。所有这些都在 Civitai 中汇聚在一起。
我完全理解。社区是重点,因为 Civitai 来自拉丁语中的“社区”一词。但在网上呢?社区对于使开源 AI 能够发挥作用至关重要,这可能与所有其他构建这些 AI 创作工具的方法不同……
与封闭源代码开发等相比。这实际上取决于公司内部的小团队以及他们背后拥有的所有资源来推动某些事情的发展。开源开发真正归结为的是一群人能够在继续开发某些东西方面有多高的生产力。
这有点像一种新型的开源运动,人们推动事物的方式不是通过软件,而是通过训练。所以这创造了一种新型的分布式训练,这种训练在这些……你知道,在这些封闭源代码模型中并不存在。相反,它允许许多人添加他们认为需要添加的内容,然后人们可以从那堆内容中提取他们想要的内容。因此,社区至关重要,因为它基本上使人们能够找到并提供他们最擅长的利基市场。基本上,如果没有社区,开源开发就不会真正发生。
这说得通。或者说,为什么信任少数被任命的产品经理来决定要为绝对所有东西构建什么?让社区参与进来。完全正确。
我本来想说……这与其说是关于开源 AI,不如说是关于开源内容的整体。关于这一点,有趣的是,它正在推动内容方面的新界限,那就是它不再是静态的,而是更具交互性。它更易于定制,并且更适合……你知道,实际查看它的人。
有趣的是,当你脱离工具本身作为问题,它们是开源的、封闭源代码的或其他任何东西时,重要的是内容有多容易复制,以及它看起来有多好。所以艺术本身就像一个完整的垫脚石。我的意思是,它是一个全新的想法。想象一下,如果你有一个 YouTube 视频,它展示了拍摄地点使用的每一件设备、每个角度、每个灯光功能、每个……你喜欢的每一件设备的粗略设置,以及如何制作视频,这样你就可以真正准确地制作出来……这有点像这样,能够完全重新创建,然后能够即时进行混音和更改媒体,这很酷,这是开源内容。
Max,这是一种非常有趣的说法。就像我们可能在 TikTok 的兴起中看到了一丝这种现象,以及基本上能够混音内容或将内容组合在一起的能力。这总是让我想起 Reddit 社区上的 Photoshop 比赛,有人会上传照片,然后其他人会向其中添加内容。
然后,通过这次对话,你可以看到这个……基本上就像……栩栩如生。我们在更静态的意义上看到了这一点,再次使用这些短视频平台。但是,是的,你刚才描述的,能够查看某些内容,然后基本上获取它,然后……是的,对其进行混音,甚至不是完全……重新创建它,然后按照你想要的方向进行处理……非常令人兴奋。是的,在我看来,没有什么东西能与之相比……
完全是新时代的媒体,对吧?我的意思是,即使在这个播客中,如果你想想十年后,你会说,我不喜欢这里出现的嘉宾,让我们替换他们。让我替换概念,或者让我替换出现在这里的人……
是的,Justin……
请便。让我得到 David Bowie 的说法,这是一个非常酷的想法,我非常喜欢。也许这……
是预兆,因为我们肯定会回到现实与想象之间的界限模糊以及其中各种含义的问题,但让我们回到 Civitai,开源似乎是如此基础,并且指出能够看到完整的“配料表”并了解复制和混音某些内容的说明的能力真的很酷……但显然,你们刚刚宣布了 Spine,你们也正在采用封闭源代码工具,如 Eleven Labs 和 CleanAudio。你如何看待开源和封闭源代码运动,以及你如何看待 AI 在这种我们必须同时使用这两种工具的世界中如何发展?
我认为,最终,我们看到的是,最好的内容不仅仅使用一种工具。他们会使用像 Flux 这样的开源模型开始生成他们的图像,该模型有一些 LoRA。然后,在他们制作完图像后,他们会将其导入到像 LumaFusion 这样的视频工具中,然后他们会使用 Soundful 或 Audiocraft 向其中添加音乐。我们看到的是,嘿,人们希望能够使用所有这些工具来制作内容,最终目标是能够支持 Max 谈到的这种新媒体,在那里,我们可以完全重新创建内容并使其可混音。
你将 Spine 描述为 AOL 之于互联网,Spine 之于 AI 艺术。你能详细说明一下吗?请记住,我们的一些听众年龄不到 30 岁,不记得没有 AOL 的世界是什么样的……什么是……好吧,安装风险是什么?是的,是的。
所以,对于那些不熟悉 AOL 的人来说,它基本上使互联网的所有内容都可以在一个地方访问,对吧?你可以进行即时消息、电子邮件,你可以查找股票,所有这些,人们当时在界面上做的事情。
0 从某种意义上说,我们现在做的就是尝试将人们使用AI创作内容的所有工具整合到一个地方,这样一来,人们就不必了解所有不同的工具,而是知道当前最好的工具是什么,并尝试弄清楚如何帮助你找到你认为有趣的东西,让你能够用不同的动画或动画风格替换所使用的视频。诸如此类。现在,不必再费力寻找在哪里做某件事,你就可以来到一个将所有这些整合在一起的地方,并且根据创作的最佳内容,看看什么适合你想要创作的东西。
我喜欢它,很喜欢它。好的。所以这很有趣,对吧,能够了解某物是如何创作出来的本质是一样的。但由于人们使用的是封闭源工具,你如今无法获得这些信息,也无法让这些工作流程为其他创作者所用。我一直在与设计师和大型科技公司交谈,他们一直在 Civitai 上下载模型。他们也表示,我必须非常小心我在屏幕上显示的内容。
有些人认为我实际上是在工作,而这正是开源的有趣之处,对吧?不适合工作场所的内容一直是重要的驱动力。在开源AI的许多方面,它都是 Civitai 的一部分。你能向我们的观众解释一下为什么不适合工作场所的内容在开源AI的发展中如此重要吗?
嗯,几件事,我的意思是,我认为首先,农民是一个老生常谈,对吧,所有新的媒体形式都是由色情内容推动的。这是真的,它之所以成为老生常谈是有原因的,在很多方面,只有那些推动它的人,实际上才有着强烈的愿望想要制作这些东西。而他们也是那些推动技术进步的人。
在我们最初考虑这件事的时候,我们犹豫了很久,我们是否应该为不适合工作场所的内容设置一个单独的部分,或者我们是否不允许不适合工作场所的内容?我认为,就这一点而言,我们必须保持这些资源的多功能性,因为它们可以用于许多不同的用途。例如,当时,最好的用于制作敌人的模型实际上是一个色情模型,因为它接受过大量人体训练,显然如此。所以,它被大量并非在制作任何不适合工作场所内容的人使用,但他们使用这个色情模型是因为他们只是想获得对人体在不同姿势下的最准确的呈现。在这一点上,我认为,你知道,我只是进行了一次谈话,真的,我们可以把这些东西关闭,因为它有很多用途,不仅仅是它被宣传的用途以及它可能被用于的用途。
你还有什么想补充的吗?我基本上同意你的观点,我们看到人们投入到用AI制作成人内容的精力最终推动了模型质量的提高。因此,在这方面对我们来说很重要。我们想确保我们可以支持人们用AI制作的所有东西。
就像你说的,开源技术的吸引力在于,这些封闭源平台对你施加的限制不存在,对吧?你可以制作各种各样的东西,好的坏的,呃,能够拥有一个能够支持它的空间并非没有挑战。我们一直在学习、成长,并尽最大努力至少通过我们的网站来设置一些限制。
但是,绝对是。这是一个艰难的决定,但我对我们做出了这个决定感到高兴,因为我认为这创造了一种独特的体验,并使我们能够成为所有事物的中心,可以说,不仅仅是一半,如果你愿意的话。
有趣的是,早期版本的 Stable Diffusion 非常擅长解剖学。然后,当 Stability AI 从其训练数据中删除色情内容时,突然间,解剖学的准确性大幅下降,你知道的,以及你如何重建解剖学。但我必须想象,你们必须处理一些道德和伦理问题。
例如,我知道你们已经做了很大的努力来减少平台本身不适合工作场所的内容数量,并且有一些人使用这些模型来制作儿童色情内容的例子。这段旅程和经历是什么样的,你知道的,重新设置限制。我很想让你更详细地介绍一下。
是的,对我们来说,这是一个有趣的学习经历,因为显然,在我们把它整合在一起的时候,我们想,哦,不,我想我们并没有真正意识到人们可能会用它做什么。所以,在我们把这个网站整合在一起的时候,甚至在我们脑海里,我们都没有想到这一点。
当我们第一次
所以,创作者现在认为,25% 的所有资金都花在了任何单一代上。但是,是的,现在我们有更多计划,为创作者提供更多方法,以便在未来能够激励他们。但这些是目前主要的两个,而且进展相当顺利。我们已经收到了一些很好的反馈,对于使用它们的人来说。
你完全正确。就像开源人士投入了大量时间到基本上像公共评论社区资源一样,让你看到,你知道,一个你可以赚钱并获得一部分收益的社区,即使你的模型被用来创作一张图片,那也真的很酷。
你们最终看到的用户类型是否有不同的角色?就像我想象一下,一些是常规的模型贡献者,还有一些只是付费下载模型的。嗯,还有一些是在平台上创作内容的。你们如何看待 Civitai 服务的各种利益相关者?
是的,是的,很早就这样了。我们将其大致分为三类,它们各自服务于不同的目的,并且相互建立。第一类用户是我们所谓的“创作者”。
他们是制作模型的人,然后吸引了我们下一类用户,称为“爱好者”,他们会使用这些模型来创作图像、创作内容,这又会吸引下一类用户,称为“消费者”。所以,呃,我们就是这样分层的。我们发现,你知道,消费者数量很多。
基本上,你知道,我们 90% 的用户是消费者,接下来的 9% 是爱好者,而顶尖的 1% 是创作者,我听说这在公众中很常见,是的,是的,完全正确。所以,有趣的一点是,现在比以往任何时候都更容易向上移动。因此,我们一直在努力寻找方法来帮助消费者成为爱好者,并鼓励爱好者成为创作者,因为你不需要成为,你知道,某个超级技术人员才能弄清楚这些东西,因为现在,任何人都可以创作,你只需要一个好主意。然后,我可以指导你,让它变得很棒。
嗨,我是 Grant,播客“重新思考”的主持人,在这个节目中,我和一些当今最伟大的思想家谈论他们看待世界的不寻常方式。在“重新思考”中,你将从科学家、领导者、艺术家等等人那里获得令人惊讶的见解,例如 Race、Weather、Spoon、Welcome、Gladwell 和 Yu,这里有课程可以帮助你在工作中取得成功,建立更好的关系等等。在任何你收听播客的地方都能找到“重新思考”。
说到钱,我必须问一下。所以,你们去年在 Andreessen Horowitz 的带领下筹集了 510 万美元的种子轮融资。过去一年,人工智能领域发生了很大的变化。
投资者现在如何看待你们改进后的使命?你们是否面临着必须盈利,而不是你们最初专注于艺术和社区的使命的压力?这些激励措施是否完美地协调一致?或者你们是否面临着一些需要应对的紧张关系?
这很有趣。是的,我的意思是,确实有盈利压力,也有成为一家企业的压力。不过,这种媒介的酷之处在于,与传统艺术不同,你知道,传统艺术需要一个人去创作一件作品,而且其他人并没有真正的方法来投资其中。
这不同,对吧?就像我们有很多空间可以利用人们想要使用的服务来获利。因此,实现盈利是一件我认为只会变得越来越可持续的事情。这实际上很有趣。
我们分享的一部分宣传是,当我们增加货币化功能,当我们启动公交系统并开始收取生成费用时,我们实际上看到了参与度的增加,以及社区内创作者数量的增加。所以这很酷,因为它实际上以一种现在不存在的方式使艺术和社区变得可持续,因为它增加了一种全新的参与方式,自然地吸引了资金。所以我希望我们能够保持这种方式,使其可持续发展。到目前为止,看起来我们正在按计划进行,但获得这些资金确实帮助了我们。我们曾认为我们可以最初依靠自身力量,但要同时为一百万人做到这一点,对于一家小型公司来说是一件很难的事情。
Max,还有什么要补充的吗?
是的,我想说一件有趣的事情是,每个人都在寻找可比物,尤其是在风险投资领域,比如,你知道,你正在颠覆哪个行业,或者你目前正在取代谁?你正在做什么?很难做到的是,哦,不,我们实际上是在设计一种全新的内容和内容消费形式。
感觉它不仅仅是关于创作,它完全是关于消费以及如何转变的。你谈到了重混的概念,它在某种程度上使创作更容易获得,因为你没有这个空白画布的问题,对吧,就像突然你有一个起点,或者你有可以组合在一起以创造完全不同事物的多个已知基元。
我思考的一件事是回到重混的短视频类比,这些平台是如何快速地反向工程你的灵魂的,就像它们弄清楚你喜欢什么类型的内容一样。当然,你有一端是用户生成的内容,另一端是用户。
还有一个算法进行匹配。我不禁想象,未来我们将走向内容将被个性化、一次性使用,并为你及时创建。你们如何看待消费的未来将随着我们正在构建的工具和能力而发展?
我喜欢你思考的方式。我完全同意。我认为,我的意思是,现在可以创作如此多的内容,没有理由不将其全部个性化。即使它是其他人制作的,即使是用非母语制作的,它也会被翻译。我的意思是,为什么不会呢,对吧?
所以,我认为,你知道,看着我们已经身处其中的这些算法的泡沫,为我们提供我们想要看到的东西,并将其提升到另一个层次,因为它会进一步个性化,这将很有趣,而那些限制可能是什么。所有的广告都会包含我的照片、家人的照片或他认为我最有吸引力的人的照片吗?思考这些约束可能是什么,以及我们如何在其中仍然拥有协作体验,这是一种很长远的事情,对吧?
如果一切都是个性化的,我们如何联系?我们可以查看相同的内容吗?但是其中会有细微的差别吗?我仍然可以围绕《绝命毒师》的故事与你联系吗?
即使这个系列中我看到的部分与你的完全不同,看看随着我们所看到的内容而变化的世界将会很有趣。我们今天看到的内容更像是一个宇宙,而不是一个快照。所以,期待着……
宇宙的比喻是一个有趣的比喻,我确实听到了你的名言,“不要制作电影,要制作宇宙”,是的,这正是我想知道的问题的核心。就像,共享体验的未来是什么?你看过《CSI:迈阿密》的第十七季吗?情况会是这样吗?就像这些共享故事和体验将我们联系在一起,而不是迷失在我们自己的个性化内容岛屿中。最近让我想到这一点的一件事是,每当我问别人他们最喜欢的 YouTube 频道是什么时,我都会得到三个新名字,我查了一下,他们都有数百万粉丝,而我从未听说过他们,所以我想象一下,在上面生成 AI,它就像一个无限分形的乌龟。嗯,我很想知道这是否会引起你们的任何回应,因为它似乎正朝着这个方向发展,是的,不。
嗯,我谈论过很多次了。我个人的观点是,是的,我们基本上只是进入我们自己媒体创作的兔子洞,我们永远不会出来,因为没有激励,我的意思是,为什么你会呢,对吧?就像如果你看看 TikTok 的流行程度,TikTok 完全就是一个发生在内容上的算法,对吧,这就是 TikTok 的价值所在。
如果你让 TikTok 能够根据你想要看到的一切,随时随地按需生成这些内容,就像你永远不会让人们离开它一样,他们将无法逃脱。我认为这将是很大一部分人口的命运,可以肯定。这让我想起了《WALL-E》中的场景。
那里的人们就像漂浮在海面上,它只是一座垃圾山,直接通向虚无。老实说,呃,这也带来了一种非常有趣的,嗯,你们两位作为创始人所拥有的化学反应,你们有点像一对奇怪的组合,或者只是,你让我觉得你更像是一个人工智能乐观主义者,而 Max,我不愿意称你为悲观主义者,但你肯定有更务实的视角。
我认为自己是现实的乐观主义者,因为……
这意味着悲观主义,啊,这是一种美好的悲观主义。我很好奇,当你们建立这家公司并做出产品决策以及确定发展方向时,这种动态是如何发挥作用的?
我个人认为它运作得非常好。进入平台本身的大多数功能都是 Justin 的创意,他从社区的反馈中获得这些创意。我们花了很多时间从社区获得反馈,然后总是很有趣,因为他们会说,哦,我们应该这样做。
我们应该这样制作,就像,不,人们会滥用它。如果我们实施它,我们将损失金钱,你知道,就像我们可以这样做。嗯,嗯,所以这很好,Max 基本上……
会告诉我人们滥用它的所有方法,因为这是悲观的观点,而且……
就像红帽,你知道……
节省了我们大量的法律费用,对吧?
因为我只是做……你是对的,你是对的,我们可以这样做。
所以这对于平台建设来说非常棒,因为它在平衡方面做得很好,就像,好吧,这是一个我们真正想要加入的东西。但是,你知道,它可能会怎样,对吧,对吧?然后,大多数时候,你知道,我甚至知道,我认为,我的悲观主义的优点是,我的一部分人真的想看到它失败,对吧。
所以我仍然想这样做,无论如何都要推动它。我想看看什么会坏掉。这意味着我们非常快速地推出很多功能。我认为这对平台来说效果很好。
喜欢这个。Maxfield,你认为你对“死互联网理论”的看法是否会影响你的世界观?你能向那些不了解的人解释一下这是什么吗?
当然。是的。我个人对“死互联网理论”的定义是这样的想法:我们用足够多的互联网内容来替换互联网上的内容,这些内容本身实际上来自其他人,或者你可以本能地认为它来自其他人,或者你根本不在乎它是否来自其他人,以至于它失去了所有内在价值。
而且没有真正的理由在整个互联网上存在,除了作为一个娱乐设备。是的。不,我认为我们实际上正在促成它。
我认为人工智能正在积极地促成它。我个人认为这是一件好事。多年来我一直对互联网感到失望,如果可能的话,我希望整个互联网都烧毁。所以如果我们能帮上忙的话。
那么我全力支持。你对 Maxfield 的这种看法怎么看?
我的意思是,我坐在那里笑着,因为他已经和我谈论过很多次了,而且他并没有错。我的意思是,这绝对是一个挑战。制作如此多的内容、如此多的 AI 垃圾(他们现在这样称呼它)是如此容易,这仅仅是个开始。
同样,这将需要我们以不同的方式思考。互联网将不得不改变,比如,直到互联网上只有 10% 的内容是由人类制作的,还需要多长时间?我想另一部分是,这实际上并不重要。就像有些人,我已经希望我实际上不必与他们交谈,我可以说,嘿,让我和这个人谈谈,我必须管理这种关系……
就像 Justin 的数字孪生。
是的,我们可以让 Justin 代理人帮我处理事情吗?
每次我被迫上 Twitter 时,这都会很棒。你知道,如果这些是 AI 聊天机器人,情况会更好。我认为如果整个 Twitter 只是 AI 混乱,那实际上会是一种更好的体验,因为它现在就像我被迫经历这种垃圾一样。
所以我同意你的观点。这不可避免地,你知道,这是一件奇怪的事情,你正在做一些提示,将我的几个要点转换成电子邮件,而另一个人正在使用新的苹果人工智能来总结它,为什么我们不能只发送要点呢?所以这就像正在发生的压缩和解压缩,但在其核心仍然是人类密集型的。但你可以很容易地看到这种情况会发生变化,例如我们正在推测的完全生成的 TikTok 信息流。所以我必须问,你认为三年后的创作会是什么样子?
我认为让它仍然很困难的一件事是,我看看视频在过去一年中发展得有多快。我不知道你们是否看过,比如,一年前威尔·史密斯吃东西说话的 TikTok 与今天相比,它就像,那实际上可能是威尔·史密斯,嗯,我不知道自动生成的 TikTok 事情是否可能实现。我不会感到惊讶。
三年后已经有了自动生成的短视频,也许它们还没有完全个性化,但它们可能正在朝着这个方向努力。我认为另一个让我非常感兴趣的是游戏开发,感觉我们仍在考虑,你知道,我们如何降低成本,但实际上,在你改变从关注效率到关注好吧,我们可以用这个做些什么有趣的事情?以及这如何改变游戏?
你能双击一下游戏点吗?这很有趣。我确实有机会在GTC上问詹森这个问题,他预测未来一切都会生成,而不是渲染。我认为思考一下当模型不再是创作手段,而是你体验的内容本身时会发生什么很有趣。这是否激发了你的任何想法?
是的,有几件不同的事情。嗯,大约两三个月前,在一个周末,我有机会制作我自己的小型AI游戏,并使用AI代理作为管理游戏的人,游戏中的角色,为游戏创作内容的人。
他很明确地说,嘿,如果我们现在已经可以做到这一点,而我在周末就做到了这一点,那么我们肯定会有这些AI生成的 游戏,就像你进来一样。也许其中一些是由其他人构建的,也许不是,但一切都可以按需制作,并且可以调整自身以适应你正在做的事情。我认为我所想象的是,未来大部分将要生成的内容都将是游戏的内容,而人们并不在那里。
创作并非一项创造性行为。它关乎享受内容,关乎探索,关乎做出选择并观察结果。我认为这可能会改变游戏,并可能让更多以前不是游戏玩家的人成为游戏玩家,因为现在它可以适应任何东西。
这让我对个性化产生了兴趣。所以,Max,每个人都在谈论用AI制作电影,这在推特上似乎非常流行。但是,当我查看人们实际用眼睛观看并推动观看时间的內容时,它有很多短视频内容。我认为这确实吸引了很多注意力。你认为几年后最主要的消费形式是什么?
一件事情是现在的短视频内容,对吧?我的意思是,注意力只会越来越短,如果不是已经这样了的话。我的意思是,谷歌的有趣之处是什么?谷歌出现在我们把很多监控记忆外包给互联网的场景中,我们只是停止了增强自身的能力。
随着ChatGPT和其他通用工具在我们生活中越来越普遍,我们将把越来越多的可变性外包出去,去思考、创造,以及真正地参与。我的意思是,你知道,在YouTube上你可以看到最流行的内容形式之一是,在新的电影上映后,是一堆解释性视频,这些视频会进行回顾或评论,对吧?因为人们不喜欢,我不想要看这部电影。
我只想看它8分钟的回顾,并且有人可以告诉我结局是什么,这样我就不必去思考它是什么了。在我看来,我认为90%的人与内容互动的方式是,他们只想得到它的短视频版本,这并不是因为他们懒惰,而是因为他们的思维已经被这样训练了。
这就像我能最轻松地把东西塞进脑袋里的方式。我已经到了不再以两倍速度消费任何媒体的地步了,因为它现在太长了。我无法忍受观看任何不是加速播放的东西。
是的。内容的数量也在增长,对吧?所以我们有更多可供选择的东西,而不是像书籍、电影、电视节目之类的清单,当然,社交媒体内容绝对是爆炸式的增长。所以这是一种理解它的方法,只是快速浏览一下。对我来说,看到有声书的爆炸式增长以及人们喜欢获得播客摘要,这真的很有趣。它就像你最舒服的消费方式,你可以把任何内容转换成任何内容,并且它具有我在你的平台上看到的重混功能,因为它更疯狂,但我可以想象它会更倾向于消费。
更进一步的推论是,你知道,我现在至少有一天,我有一个记录我参加的每一个会议的AI,检查我发送的每一封电子邮件,并且它只是在我的数据库中建立了一个我的账本,对吧?我可以预见一个非常非常可能的未来,在那里,与其让我参加播客,不如说,嘿,你用我的AI等价物来做这件事,然后他们甚至会给我一个口袋,让我这样做,你将来可以拥有我的等价物,只要问他们问题,如果你对这些问题感兴趣,或者你知道我可以拿你的等价物,让你替我问我的等价物问题,用不同的方式为我总结它,所以就像,好吧,你知道,在这一点上,你知道,像什么才是我能获得的最简洁的内容形式,对吧?我们是否需要为此费心?或者我可以直接得到一个要点列表?就像这个人相信什么,然后继续。
我认为从某种意义上说,这是不可避免的。我们将有一堆代理,我们委托他们进行一堆互动。我们互相交谈,谈判,做各种有趣的事情。所以,在我们结束的时候,我很想知道你们每个人在这个新世界中,艺术和创造力有什么深刻的价值?Civitai如何为你们的社区放大这种价值?
你知道,你的第一个,只是,儿子,给我一秒钟。
当然,当然。慢慢想。
我必须向你报告我正在思考什么。
没错。这与TED的宗旨相悖。我们可以看到真正的思想的羞耻。
不用快速过一遍。Justin,如果你想的话,说说你的想法。是的,是的。
不,我认为我认为关于所有这些创造性方面真正让我感兴趣的事情是它不那么人性化的一面,对吧?这就是想法,当然人类会给出某种指导。但实际上,它几乎就像机器中的幽灵。
我最喜欢的艺术,来自所有这些,是当人们结合这些资源,并且他们没有给出任何提示时,无论是什么?他们什么都不给它,让它自己去创作。而它产生的东西是奇特而奇怪的,显然是训练数据的产物。
但它与我认为人类艺术家会想到的东西不同,它在某种程度上缺乏意图,这对我来说是不寻常的,因为我认为我们推崇最高的艺术家能够以最超然的方式表达情感,这样你就能感受到某种感觉,而无需在某种艺术形式中明确地表达出来。而就我个人而言,这就是我从很多直接的机器人创作中得到的感觉,这些创作没有任何人为干预。这些模型越好,你实际上会失去很多东西。你会失去越来越多的这种静态感,而更多的是来自人们的意图,而这也很有趣,因为看到那些显然没有古典艺术技巧的人,无论如何,否则永远无法创作这些东西,能够表达一个对他们有价值和意义的想法,并且感觉能够以你否则可能无法做到的一种方式与某人交流,也许只是通过对话。
喜欢这个。Justin,你怎么看?
是的,我认为我认为我要说的是与Max说的内容一致,我认为我目前最兴奋的事情是赋能每个人能够以以前非常有限的方式进行创作和交流,这需要几十年的训练、经验和探索。
现在你可以看到其他人创作一些东西,然后创作出你自己的类似或更好的东西。在30秒内,你知道,我认为这从根本上改变了交流的能力,我认为提高我们的交流能力将帮助我们更好地合作。而这正是我想做的,我想帮助我们朝着我梦想中的乌托邦前进,而不是Max可能告诉我将会发生的可能的末日景象。
Max,Justin,非常感谢你们加入我们。
非常感谢你们邀请我们。
好的。与Justin和Max交谈后,我不禁觉得我们正处于一个令人着迷的转折点。最突出的是Civitai如何将整个创意配方烘焙进去。每个模型、每个提示、每个操作步骤都直接融入内容本身,就像在艺术作品中嵌入教程一样,创造了前所未有的重混、迭代和透明度水平。无论你看到的是图像还是视频,你都可以准确地看到它是如何制作的,并且可以以此为基础进行构建。
但这同时也引发了更深层次的问题,当内容变得不那么静态,而更具动态性,几乎是为每个观看者量身定制时,共享体验会发生什么?我们是否走向了AI生成内容的个人泡沫,完美地定制测试?或者我们将找到新的方法来一起构建共享宇宙,以我们无法想象的方式共同创作和重混?虽然Justin和Max可能在我们将走向乌托邦还是互联网的终结方面存在分歧,但他们都在帮助构建将定义我们在新时代如何表达自己和联系的工具,随着人类和AI生成内容之间的界限越来越模糊,像Civitai这样的平台提醒我们,社区和创造力将对接下来发生的一切至关重要。
TED AI Show是TED音频联盟的一部分,由TED与Cosmic Standard联合制作。我们的制作人是Dominic Jard和Alex Higgins。我们的编辑是Benj Bengtson。
我们的节目主持人是Evon Tucker。我们的工程师是Asia Simpson,我们的研究员和事实核查员是Christian Aparicio,我们的技术总监是Jacob Licklider,我们的执行制片人是Liza Smith。我是Bilawal Shahid。别忘了评分和评论,我们下期再见。