We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode ChatGPT introduces new feature to edit DALL-E images

ChatGPT introduces new feature to edit DALL-E images

2024/4/10
logo of podcast AI Education

AI Education

AI Deep Dive AI Chapters Transcript
Topics
OpenAI新功能介绍者:我今天要谈论的是OpenAI最近发布的一个令人兴奋的新功能更新,它允许用户直接在ChatGPT中编辑DALL-E生成的图像。这是一个非常强大的功能,它将彻底改变用户体验和创造潜力。这个更新已经同时在网页、iOS和Android平台上推出,这意味着它将惠及更广泛的用户群体。 该功能的核心在于,用户可以在生成图像后立即选择图像的特定部分,并使用简单的文本提示对其进行修改。例如,用户可以选中图像中的一只狗,并提示系统为其添加蝴蝶结。系统会根据提示,精确地修改图像中选定的部分,而不会影响图像的其他部分。 我个人测试了这个功能,发现它非常强大。我尝试生成了一张海盗船战斗的图片,并对其中的黑胡子进行了修改,尝试让他露出笑容。虽然由于黑胡子的胡子遮挡了嘴巴,效果并不完美,但该功能仍然展现出了强大的潜力。我还尝试将整艘海盗船修改成粉红色的汽车,结果也令人满意。 与Midjourney相比,ChatGPT的图像编辑功能在细节处理上可能还略逊一筹,但它具有其他工具不具备的独特优势。例如,ChatGPT可以根据用户对图像特定部分的指示进行精准修改,而无需重新生成整张图像。这将极大地提高图像编辑的效率。 目前,ChatGPT还不能直接编辑用户上传的图像,但这很可能是一个未来会添加的功能。总的来说,我认为这项功能非常令人兴奋,它将图像生成技术提升到了一个新的水平。它不仅可以帮助用户更轻松地创建理想的图像,还可能对图形设计等领域产生深远的影响,甚至可能颠覆Canva和Photoshop等传统图像编辑工具。 此外,这项技术未来还可能应用于视频编辑领域。我们可以想象,未来用户可以像编辑图像一样,选择视频中的特定部分,并使用文本提示对其进行修改。这将彻底改变视频制作的方式,并为创意内容创作带来无限可能。

Deep Dive

Chapters
OpenAI's latest update allows users to edit DALL-E images within ChatGPT across various platforms. This feature enables real-time modifications to generated images, addressing previous concerns about faked demos in other AI platforms. The update showcases integrity by demonstrating the generation process authentically.
  • ChatGPT now allows DALL-E image editing across web, iOS, and Android.
  • OpenAI's transparent demo builds user trust.
  • The feature allows for real-time image modifications based on user selections.

Shownotes Transcript

OpenAI 几个小时前发布了一个新的更新。我还没听到有人谈论这个,但我认为它绝对令人着迷,那就是你现在可以用一种非常有趣的新方式在 ChatGPT 中编辑 DALL-E 图片了。我在其他一些程序中见过这个功能。这是我第一次看到 OpenAI 涉足这个领域,而且它非常强大。所以我想告诉你一些他们正在做的事情,以及为什么我认为这很重要。首先我要说的是,他们在……

LinkedIn 和 X 上发布了这一公告。他们说你现在可以在网络、iOS 和 Android 上的 ChatGPT 中编辑 DALL-E 图片。这令人印象深刻。你知道,有时人们只向网络版本推出更新,稍后才会发布到移动端。这个功能已经在网络上发布了。我一直在玩它,测试它,显然它也在 iOS 和 Android 上发布了,虽然我还没有使用,但我强烈建议其他人如果拥有该应用程序,可以试一试。

这太棒了。它将进入更多人的手中。当我看到他们像这样向所有平台大规模推出,并真正表示“我们希望所有用户尽快使用它”时,我感到非常兴奋。从本质上讲,你将能够在生成实际图像后,立即选择图像的某些部分并对其进行编辑。他们展示了一个例子,他们生成了一只狗的图像,他们说,你知道,创建了一张可爱的小狗庆祝生日的图片。所以它就像一只戴着帽子的狗在庆祝它的生日。然后他们开始编辑它,他们在狗的头上高亮显示了两个位置,并说要添加蝴蝶结。现在,很多人都在评论他们所做的演示,因为他们实际上发布了一个关于整个生成过程的社交媒体片段。视频大约……

有一分钟长,而且视频的大部分时间你都在那里等待观看这个生成过程,但它能够生成出现在狗头上高亮显示位置的蝴蝶结,这令人印象深刻。所以我想说的是,很多人都在评论这个视频,上面有一些有趣的评论,我认为总的来说,人们……

对他们这样做感到高兴。评论中有人说:“我很感激 OpenAI 选择不在此预览中加快演示生成过程的视频速度。这展现了诚信,并有助于为产品的性能设定现实的期望。真实的预览对于潜在用户的信任大有帮助,在人工智能时代,信誉至关重要。”我实际上同意这一点。谷歌 Gemini 推出了他们的平台演示,结果他们……

被彻底批评了,因为这是一个你可以与之交谈的平台,它可以看到你正在看什么,它可以创建图像和视频,而且它正在做所有这些疯狂的事情。然后我们发现它基本上是伪造的或经过编排的。他们对视频进行了高度编辑。他们在……

实际上给出比他们告诉我们的更长的提示之前向它提问。所以看起来他们可以说,“这是什么?”然后它会说,“哦,那是你玩石头剪刀布。”但实际上,他们说的是,“我正在用手玩一个很流行的游戏。这是什么?”然后它会做出回应,但他们会剪掉所有上下文……

总之,这真的很可疑,我认为这使得谷歌和 Gemini 失去了很多信任。我相信他们已经吸取了教训,不会再那样做了。但我认为 OpenAI 和其他人工智能公司也在吸取教训。当他们现在给出这些演示时,我认为这非常有趣,他们只是让你观看,他们知道人们宁愿观看一分钟的图像加载,也不愿知道它是假的。所以我们知道这是真的。所以我尝试了这个新功能。我认为它非常令人印象深刻。我只是去了 ChatGPT。我当时想,哦,我的天哪,这个功能现在可以使用了。

起初我认为它不可用,说实话,我不得不回去再次观看视频才能学习如何使用它。所以如果你想尝试这个功能,我会告诉你。但我尝试着说,“创建一个海盗船与黑胡子和他的船员作战的照片”。它为我生成了图像。起初我以为,“没有办法编辑这个”。你实际上需要做的就是点击图像本身,它就会展开到全视图。在右上角,有一个叫做“选择”的东西,它本质上是一个工具……

你可以改变画笔的大小,你可以把它做成一个非常大的选择器,或者如果你想在图像中获得一些更小的细节,你可以把画笔改得很小。我做了很多不同的事情。举个例子,首先我选择了,所以我必须生成黑胡子在海盗船上。我选择了他的脸,并说给他一个咧嘴的笑容。现在,生成的图像的第二个版本,说实话,如果……

我的意思是,他的胡子遮住了他的嘴,但细节并不精确,你无法真正分辨出他是在皱眉还是咧嘴笑。说实话,我认为 Midjourney 在图像生成方面仍然是最好的,而且好很多,但这确实是一个令人印象深刻的功能,而且我……它有一些我没有在 Midjourney 中看到的东西。因此,我认为这很有趣。我想用一些可能更明显的东西来测试它。所以我实际上只是选择……

整艘海盗船,包括桅杆。我只是选择整个东西。我告诉它帮我把海盗船变成粉红色的汽车。它实际上能够做到这一点。而且,你知道,它看起来确实像一辆汽车正在撞向海盗船,我想这没关系,无论如何。这是它自己的诠释。但公平地说,在我生成的图像中,虽然一辆汽车撞向海盗船看起来很有趣,但图像中没有任何东西看起来……

或者说“破损”是我最好的解释方式。就像黑胡子仍然站在汽车顶部一样。有一些奇怪的东西从它身上冒出来。

所以我认为 Midjourney 在图像生成方面更好,但我对这个工具印象非常深刻。我认为你可以,我认为你可以做一些非常令人印象深刻的事情。现在,我认为另一件非常有趣的事情是,你可以做到,你知道,ChatGPT 正在与 DALL-E 链接。所以你实际上可以上传图像,对吧?这意味着你可以选择一个图像并将其上传到 ChatGPT。现在,

当我最初发现这一点时,我想看看它是否能够编辑你上传的图像。我实际上并没有看到这个确切的功能。所以对于一些人来说,我认为在 LinkedIn 的帖子中,人们说,“太好了,我不再需要花几个小时向我妹妹解释如何使用 Photoshop 来编辑她的度假照片了。”我觉得这很有趣。

但与此同时,她不能只是上传她的图像并进行编辑,对吧?所以它并没有完全取代 Photoshop。虽然这个工具,选择工具让我想起了 Photoshop 的选择工具,如果你熟悉的话。但不幸的是,当你做一些事情时,例如,当你上传图像时,你实际上无法……

该图像,这实际上有点不幸,因为我期待这个特定功能,并认为能够进行编辑会非常有趣。否则,图像就在那里。所以我相信这是一个他们将来会添加的功能。有很多变通方法。有一些方法你可以用 Midjourney 特别是来做到这一点。并且有很多不同的工具,你可以上传自己的照片,并让它……

编辑它们。我遗憾的是无法直接在 ChatGPT 中做到这一点。总的来说,这是一个令人惊叹的功能,我对此感到非常兴奋。我认为这将把图像生成提升到一个新的水平,因为现在你不再只是生成图像并希望它完全符合你的要求,你可以生成图像……

过去你会说,“好吧,再做一次,但改变这个,再做一次,但改变那个”。每次它都会重新生成,它并不完全相同,而且不会完全改变你想要的东西。现在你可以直接选择你想改变的图像部分,它可以改变它。我认为这对平面设计来说将是一件大事。这可能是平面设计的发展方向,Canva、Photoshop 和这些其他工具,我认为将会受到很大的冲击。所以我认为在这个……

领域将会有数亿美元受到冲击,无论是在今天还是明天。我能看到 OpenAI 发布更多、更多此类图像生成和编辑工具的世界,我认为这将非常强大。你还必须开始推断这将走向何方,这……现在就像,“好吧,很酷”。

图像,但接下来将是视频。所以当你使用 Sora 并进行视频生成时,我认为他们会遵循同样的先例。你将能够选择视频中的区域,并说,“好吧,我知道演员正在跑步,并且……你知道,从建筑物上跳伞。现在我想让他穿一件红衬衫。好吧。我想让他穿一件蓝衬衫。好吧。我想让他跳进直升机。”这将非常令人着迷地看到实际的……

视频生成流程是如何工作的,但我认为他们会这样做,他们会做这样的事情,你选择一个角色,并用提示改变它,它会改变视频中发生的事情。所以非常激动人心的时刻,很多事情即将到来。我一定会让你了解这个领域发生的一切。我认为我们将看到很多颠覆,无论是视频、图像、音频、多媒体,还有很多领域。非常感谢您的收听。如果您不介意的话,我真的很感激。如果您在 YouTube 上,请点击……

喜欢按钮。如果您在 Apple Podcasts 或 Spotify 上,请关注我们,并留下您的评论或评价。我非常感谢每一条评论,每一个评价。我都会阅读它们,并尽量回复。希望你们今天剩下的时间都过得愉快。