We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

ChatGPT introduces new feature to edit DALL-E images

2024/4/10

AI Education

OpenAI新功能介绍者：我今天要谈论的是OpenAI最近发布的一个令人兴奋的新功能更新，它允许用户直接在ChatGPT中编辑DALL-E生成的图像。这是一个非常强大的功能，它将彻底改变用户体验和创造潜力。这个更新已经同时在网页、iOS和Android平台上推出，这意味着它将惠及更广泛的用户群体。该功能的核心在于，用户可以在生成图像后立即选择图像的特定部分，并使用简单的文本提示对其进行修改。例如，用户可以选中图像中的一只狗，并提示系统为其添加蝴蝶结。系统会根据提示，精确地修改图像中选定的部分，而不会影响图像的其他部分。我个人测试了这个功能，发现它非常强大。我尝试生成了一张海盗船战斗的图片，并对其中的黑胡子进行了修改，尝试让他露出笑容。虽然由于黑胡子的胡子遮挡了嘴巴，效果并不完美，但该功能仍然展现出了强大的潜力。我还尝试将整艘海盗船修改成粉红色的汽车，结果也令人满意。与Midjourney相比，ChatGPT的图像编辑功能在细节处理上可能还略逊一筹，但它具有其他工具不具备的独特优势。例如，ChatGPT可以根据用户对图像特定部分的指示进行精准修改，而无需重新生成整张图像。这将极大地提高图像编辑的效率。目前，ChatGPT还不能直接编辑用户上传的图像，但这很可能是一个未来会添加的功能。总的来说，我认为这项功能非常令人兴奋，它将图像生成技术提升到了一个新的水平。它不仅可以帮助用户更轻松地创建理想的图像，还可能对图形设计等领域产生深远的影响，甚至可能颠覆Canva和Photoshop等传统图像编辑工具。此外，这项技术未来还可能应用于视频编辑领域。我们可以想象，未来用户可以像编辑图像一样，选择视频中的特定部分，并使用文本提示对其进行修改。这将彻底改变视频制作的方式，并为创意内容创作带来无限可能。

Deep Dive

Chapters

OpenAI's latest update allows users to edit DALL-E images within ChatGPT across various platforms. This feature enables real-time modifications to generated images, addressing previous concerns about faked demos in other AI platforms. The update showcases integrity by demonstrating the generation process authentically.

ChatGPT now allows DALL-E image editing across web, iOS, and Android.
OpenAI's transparent demo builds user trust.
The feature allows for real-time image modifications based on user selections.

Shownotes Transcript

OpenAI 几个小时前发布了一个新的更新。我还没听到有人谈论这个，但我认为它绝对令人着迷，那就是你现在可以用一种非常有趣的新方式在 ChatGPT 中编辑 DALL-E 图片了。我在其他一些程序中见过这个功能。这是我第一次看到 OpenAI 涉足这个领域，而且它非常强大。所以我想告诉你一些他们正在做的事情，以及为什么我认为这很重要。首先我要说的是，他们在……

LinkedIn 和 X 上发布了这一公告。他们说你现在可以在网络、iOS 和 Android 上的 ChatGPT 中编辑 DALL-E 图片。这令人印象深刻。你知道，有时人们只向网络版本推出更新，稍后才会发布到移动端。这个功能已经在网络上发布了。我一直在玩它，测试它，显然它也在 iOS 和 Android 上发布了，虽然我还没有使用，但我强烈建议其他人如果拥有该应用程序，可以试一试。

这太棒了。它将进入更多人的手中。当我看到他们像这样向所有平台大规模推出，并真正表示“我们希望所有用户尽快使用它”时，我感到非常兴奋。从本质上讲，你将能够在生成实际图像后，立即选择图像的某些部分并对其进行编辑。他们展示了一个例子，他们生成了一只狗的图像，他们说，你知道，创建了一张可爱的小狗庆祝生日的图片。所以它就像一只戴着帽子的狗在庆祝它的生日。然后他们开始编辑它，他们在狗的头上高亮显示了两个位置，并说要添加蝴蝶结。现在，很多人都在评论他们所做的演示，因为他们实际上发布了一个关于整个生成过程的社交媒体片段。视频大约……

有一分钟长，而且视频的大部分时间你都在那里等待观看这个生成过程，但它能够生成出现在狗头上高亮显示位置的蝴蝶结，这令人印象深刻。所以我想说的是，很多人都在评论这个视频，上面有一些有趣的评论，我认为总的来说，人们……

对他们这样做感到高兴。评论中有人说：“我很感激 OpenAI 选择不在此预览中加快演示生成过程的视频速度。这展现了诚信，并有助于为产品的性能设定现实的期望。真实的预览对于潜在用户的信任大有帮助，在人工智能时代，信誉至关重要。”我实际上同意这一点。谷歌 Gemini 推出了他们的平台演示，结果他们……

被彻底批评了，因为这是一个你可以与之交谈的平台，它可以看到你正在看什么，它可以创建图像和视频，而且它正在做所有这些疯狂的事情。然后我们发现它基本上是伪造的或经过编排的。他们对视频进行了高度编辑。他们在……

实际上给出比他们告诉我们的更长的提示之前向它提问。所以看起来他们可以说，“这是什么？”然后它会说，“哦，那是你玩石头剪刀布。”但实际上，他们说的是，“我正在用手玩一个很流行的游戏。这是什么？”然后它会做出回应，但他们会剪掉所有上下文……

总之，这真的很可疑，我认为这使得谷歌和 Gemini 失去了很多信任。我相信他们已经吸取了教训，不会再那样做了。但我认为 OpenAI 和其他人工智能公司也在吸取教训。当他们现在给出这些演示时，我认为这非常有趣，他们只是让你观看，他们知道人们宁愿观看一分钟的图像加载，也不愿知道它是假的。所以我们知道这是真的。所以我尝试了这个新功能。我认为它非常令人印象深刻。我只是去了 ChatGPT。我当时想，哦，我的天哪，这个功能现在可以使用了。

起初我认为它不可用，说实话，我不得不回去再次观看视频才能学习如何使用它。所以如果你想尝试这个功能，我会告诉你。但我尝试着说，“创建一个海盗船与黑胡子和他的船员作战的照片”。它为我生成了图像。起初我以为，“没有办法编辑这个”。你实际上需要做的就是点击图像本身，它就会展开到全视图。在右上角，有一个叫做“选择”的东西，它本质上是一个工具……

你可以改变画笔的大小，你可以把它做成一个非常大的选择器，或者如果你想在图像中获得一些更小的细节，你可以把画笔改得很小。我做了很多不同的事情。举个例子，首先我选择了，所以我必须生成黑胡子在海盗船上。我选择了他的脸，并说给他一个咧嘴的笑容。现在，生成的图像的第二个版本，说实话，如果……

我的意思是，他的胡子遮住了他的嘴，但细节并不精确，你无法真正分辨出他是在皱眉还是咧嘴笑。说实话，我认为 Midjourney 在图像生成方面仍然是最好的，而且好很多，但这确实是一个令人印象深刻的功能，而且我……它有一些我没有在 Midjourney 中看到的东西。因此，我认为这很有趣。我想用一些可能更明显的东西来测试它。所以我实际上只是选择……

整艘海盗船，包括桅杆。我只是选择整个东西。我告诉它帮我把海盗船变成粉红色的汽车。它实际上能够做到这一点。而且，你知道，它看起来确实像一辆汽车正在撞向海盗船，我想这没关系，无论如何。这是它自己的诠释。但公平地说，在我生成的图像中，虽然一辆汽车撞向海盗船看起来很有趣，但图像中没有任何东西看起来……

或者说“破损”是我最好的解释方式。就像黑胡子仍然站在汽车顶部一样。有一些奇怪的东西从它身上冒出来。

所以我认为 Midjourney 在图像生成方面更好，但我对这个工具印象非常深刻。我认为你可以，我认为你可以做一些非常令人印象深刻的事情。现在，我认为另一件非常有趣的事情是，你可以做到，你知道，ChatGPT 正在与 DALL-E 链接。所以你实际上可以上传图像，对吧？这意味着你可以选择一个图像并将其上传到 ChatGPT。现在，

当我最初发现这一点时，我想看看它是否能够编辑你上传的图像。我实际上并没有看到这个确切的功能。所以对于一些人来说，我认为在 LinkedIn 的帖子中，人们说，“太好了，我不再需要花几个小时向我妹妹解释如何使用 Photoshop 来编辑她的度假照片了。”我觉得这很有趣。

但与此同时，她不能只是上传她的图像并进行编辑，对吧？所以它并没有完全取代 Photoshop。虽然这个工具，选择工具让我想起了 Photoshop 的选择工具，如果你熟悉的话。但不幸的是，当你做一些事情时，例如，当你上传图像时，你实际上无法……

该图像，这实际上有点不幸，因为我期待这个特定功能，并认为能够进行编辑会非常有趣。否则，图像就在那里。所以我相信这是一个他们将来会添加的功能。有很多变通方法。有一些方法你可以用 Midjourney 特别是来做到这一点。并且有很多不同的工具，你可以上传自己的照片，并让它……

编辑它们。我遗憾的是无法直接在 ChatGPT 中做到这一点。总的来说，这是一个令人惊叹的功能，我对此感到非常兴奋。我认为这将把图像生成提升到一个新的水平，因为现在你不再只是生成图像并希望它完全符合你的要求，你可以生成图像……

过去你会说，“好吧，再做一次，但改变这个，再做一次，但改变那个”。每次它都会重新生成，它并不完全相同，而且不会完全改变你想要的东西。现在你可以直接选择你想改变的图像部分，它可以改变它。我认为这对平面设计来说将是一件大事。这可能是平面设计的发展方向，Canva、Photoshop 和这些其他工具，我认为将会受到很大的冲击。所以我认为在这个……

领域将会有数亿美元受到冲击，无论是在今天还是明天。我能看到 OpenAI 发布更多、更多此类图像生成和编辑工具的世界，我认为这将非常强大。你还必须开始推断这将走向何方，这……现在就像，“好吧，很酷”。

图像，但接下来将是视频。所以当你使用 Sora 并进行视频生成时，我认为他们会遵循同样的先例。你将能够选择视频中的区域，并说，“好吧，我知道演员正在跑步，并且……你知道，从建筑物上跳伞。现在我想让他穿一件红衬衫。好吧。我想让他穿一件蓝衬衫。好吧。我想让他跳进直升机。”这将非常令人着迷地看到实际的……

视频生成流程是如何工作的，但我认为他们会这样做，他们会做这样的事情，你选择一个角色，并用提示改变它，它会改变视频中发生的事情。所以非常激动人心的时刻，很多事情即将到来。我一定会让你了解这个领域发生的一切。我认为我们将看到很多颠覆，无论是视频、图像、音频、多媒体，还有很多领域。非常感谢您的收听。如果您不介意的话，我真的很感激。如果您在 YouTube 上，请点击……

喜欢按钮。如果您在 Apple Podcasts 或 Spotify 上，请关注我们，并留下您的评论或评价。我非常感谢每一条评论，每一个评价。我都会阅读它们，并尽量回复。希望你们今天剩下的时间都过得愉快。

ChatGPT introduces new feature to edit DALL-E images 08:55 Share

AI Education

Deep Dive

Shownotes Transcript

ChatGPT introduces new feature to edit DALL-E images