We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Edit DALL-E Images with ChatGPT's Latest Update

2024/4/9

No Priors AI

AI Deep Dive AI Chapters Transcript

People

主

主播

以丰富的内容和互动方式帮助学习者提高中文能力的播客主播。

Topics

主播：ChatGPT的最新更新允许用户以一种新颖有趣的方式编辑DALL-E生成的图像，这极大地增强了图像编辑能力，实现了在网页、iOS和Android平台上的全平台覆盖。这项功能允许用户直接选择图像部分并进行编辑，OpenAI希望所有用户都能尽快使用这项功能。在演示视频中，用户可以通过高亮选择图像区域，并添加新的元素，例如在狗的头上添加蝴蝶结。OpenAI在演示视频中展现了真实的图像生成过程，这有助于建立用户信任，避免像Google Gemini那样因视频造假而失去信任。主播亲身体验了ChatGPT的图像编辑功能，并认为这项功能令人印象深刻。ChatGPT的图像编辑功能需要用户点击图像，然后在右上角的“选择”工具中选择编辑区域大小，进行编辑。ChatGPT的图像编辑功能在细节处理上不如Midjourney，但仍然可以实现一些令人印象深刻的编辑效果，例如将海盗船变成粉红色的汽车。ChatGPT可以进行图像上传，但目前还不支持对上传图像的直接编辑。ChatGPT的图像编辑功能可以改变图像的特定部分，而无需重新生成整个图像，这对于图形设计等领域具有重要意义。ChatGPT的图像编辑功能可能会对图形设计行业产生重大影响，并可能扩展到视频编辑领域。未来ChatGPT的图像编辑功能可能会扩展到视频编辑领域，允许用户选择视频中的特定区域进行编辑。

Deep Dive

Chapters

This chapter explores the recent ChatGPT update that integrates DALL-E image editing. It discusses the cross-platform rollout and contrasts OpenAI's transparent demo with a previous, criticized demo from Google Gemini.

ChatGPT now allows DALL-E image editing on web, iOS, and Android.
OpenAI's demo emphasized authenticity, unlike a previous misleading Google Gemini demo.
The new feature lets users select parts of generated images and edit them with text prompts.

Shownotes Transcript

OpenAI在几个小时前发布了一个新的更新。我还没听到有人谈论这个，但我认为它绝对令人着迷，那就是你现在可以用一种非常有趣的新方式在ChatGPT中编辑DALL-E图像。我在其他一些程序中见过这个功能。这是我第一次看到OpenAI涉足这个领域，而且它非常强大。所以我想告诉你一些他们正在做的事情，以及为什么我认为这很重要。首先我要说的是，他们在……

LinkedIn和X上发布了这个公告。他们说你现在可以在网络、iOS和Android上的ChatGPT中编辑DALL-E图像。这令人印象深刻。你知道，有时人们只向网络版本推出更新，稍后才会发布到移动端。这个功能已经在网络版上推出了。我一直在玩它，测试它，显然它也在iOS和Android上推出，虽然我还没有使用，但我强烈建议其他人如果拥有该应用程序，可以试一试。

这太棒了。它将进入更多人的手中。当我看到他们像这样向所有平台大规模推出，并真正表示“我们希望所有用户尽快使用它”时，我感到非常兴奋。本质上，你将能够做到的是，一旦你生成一个实际图像，你将能够立即选择图像的某些部分并对其进行编辑。他们展示了一个例子，他们生成了一只狗的图像，他们说，创建了一张可爱的小狗庆祝生日的图像。所以它就像一只戴着帽子的狗在庆祝它的生日。然后他们去编辑它，他们在狗的头上高亮显示了两个位置，并说“在上面加上蝴蝶结”。现在，很多人都在评论他们所做的演示，因为他们实际上是在社交媒体上发布了这段整个生成过程的剪辑。视频大约……

有一分钟长，而且视频的大部分时间你都在那里等待观看这个生成过程，但它能够实际生成出现在狗头上高亮显示位置的蝴蝶结，这令人印象深刻。所以我想说的是，很多人都在评论这个视频，上面有一些有趣的评论，我认为总的来说，人们……

对他们这样做感到高兴。评论中有人说：“我很感激OpenAI选择不在此预览中加快演示生成过程的视频速度。这展现了诚信，并有助于为产品的性能设定现实的期望。真实的预览对于潜在用户的信任大有帮助，在人工智能时代，信誉至关重要。”我实际上同意这一点。谷歌Gemini推出了他们的平台演示，他们……

被彻底批评了，因为这是一个你可以与之交谈的平台，它可以看到你正在看什么，它可以创建图像和视频，而且它正在做所有这些疯狂的事情。然后我们发现它基本上是伪造的或经过编排的。他们对视频进行了高度编辑。他们在……

实际上给出比他们告诉我们的更长的提示之前向它提问。所以看起来他们可以说，“这是什么？”然后它会说，“哦，那是你玩石头剪刀布。”但实际上，他们说的是，“我正在用手玩一个很流行的游戏。这是什么？”然后它会回应，但他们会剪掉所有上下文……

总之，这真的很可疑，我认为这使得谷歌和Gemini失去了很多信任。我相信他们已经吸取了教训，不会再那样做了。但我认为OpenAI和其他人工智能公司也在吸取教训。当他们现在给出这些演示时，我认为这真的很有趣，因为他们实际上只是让你观看，他们知道人们宁愿观看一分钟的图像加载，也不愿知道它是假的。所以我们知道这是真的。所以我尝试了这个新功能。我认为它非常令人印象深刻。我只是去了ChatGPT，我想，“我的天哪，这个功能现在可以使用了。”

起初我认为它不可用，说实话，我不得不回去再次观看视频才能学习如何使用它。所以如果你想尝试这个，我会告诉你，但我去了，我说，“创建一个海盗船与黑胡子和他的船员作战的照片。”它为我生成了图像。起初我以为，“不可能编辑这个。”你实际上需要做的就是点击图像本身，然后它会扩展到全视图。在右上角，有一个叫做“选择”的东西，它本质上是一个工具……

你可以改变画笔的大小，你可以把它做成一个非常大的选择器，或者你可以把画笔改得很小，如果你想在图像中获得一些更小的细节。我做了很多不同的事情。一个例子是，起初我选择了，所以我必须生成黑胡子在海盗船上。我选择了他的脸，并说给他一个咧嘴的笑容。现在，生成的图像的第二个版本，说实话，如果……

我的意思是，他的胡子遮住了他的嘴，但细节并不精确，你无法真正分辨出他是在皱眉还是咧嘴笑等等。说实话，我认为Midjourney在图像生成方面仍然是最好的，而且好很多，但这确实是一个令人印象深刻的功能，而且我……它有一些我没有在Midjourney中看到的东西。因此，我认为这很有趣。我想用一些更明显的东西来测试它。所以我实际上只是选择……

整艘海盗船，包括桅杆。我只是选择整个东西。我告诉它帮我把海盗船变成粉红色的汽车。它实际上能够做到这一点。而且，你知道，它实际上看起来像一辆汽车正在撞向海盗船，我想这没关系，随便吧。这是它自己的诠释。但公平地说，在我生成的图像中，虽然一辆汽车撞向海盗船看起来很有趣，但图像中没有任何东西看起来……

或者说“破损”是我最好的解释方式。就像黑胡子仍然站在汽车顶部一样。有一些奇怪的东西从它身上冒出来。

所以我认为Midjourney在图像生成方面更好，但我对这个工具印象非常深刻。我认为你可以，我认为你可以做一些非常令人印象深刻的事情。现在，我认为另一件非常有趣的事情是，你可以做，你知道，ChatGPT正在与DALL-E连接。所以你实际上可以上传图像，对吧？这意味着你可以选择一个图像并将其上传到ChatGPT。现在，

当我最初发现这一点时，我想看看它是否能够编辑你上传的图像。我实际上并没有看到这个确切的功能。所以对于一些人来说，我认为在LinkedIn帖子中，人们说，“太好了，我不再需要花几个小时向我妹妹解释如何使用Photoshop来编辑她的度假照片了。”我认为这很有趣。

但与此同时，她不能只是上传她的图像并进行编辑，对吧？所以它不像完全取代了Photoshop。虽然这个工具，选择工具让我想起了很多Photoshop的选择工具，如果你熟悉的话。但不幸的是，当你做一些事情时，例如，当你上传图像时，你实际上无法……

该图像，这老实说有点不幸，因为我期待这个特定功能，并认为能够编辑它会非常有趣。否则，图像就在那里。所以我相信这是一个他们将来会添加的功能。有很多变通方法。有一些方法你可以用Midjourney来做到这一点。有很多不同的工具，你可以上传自己的照片，让它……

编辑它们。我无法直接在ChatGPT中做到这一点。总的来说，这是一个令人惊叹的功能，我真的很兴奋。我认为这将把图像生成提升到一个新的水平，因为现在你不再只是生成图像并希望它完全符合你的要求，你可以生成图像……

过去你会说，“好吧，再做一次，但改变这个，再做一次，但改变那个。”每次它都会重新生成，它并不完全相同，而且不会完全改变你想要的东西。现在你可以直接选择你想要更改的图像部分，它可以更改它。我认为这对平面设计来说将是一件大事。这可能是平面设计的发展方向，Canva、Photoshop和这些其他工具，我认为将会受到很大的冲击。所以我认为在这个……

领域将会有数亿美元受到冲击，无论是在今天还是明天。我能看到OpenAI发布更多、更多此类图像生成和编辑工具的世界，我认为这将非常强大。你还必须开始推断这将走向何方，你知道，现在就像，“好吧，很酷。”

图像，但接下来是视频。所以当你使用Sora并进行视频生成时，我认为他们会遵循同样的先例。你将能够选择视频中的区域，并说，“好吧，我知道演员正在跑步，并且从建筑物上跳伞。现在我想让他穿一件红衬衫。好吧。我想让他穿一件蓝衬衫。好吧。我想让他跳进直升机。”这将非常有趣地看到实际的……

视频生成流程是如何工作的，但我认为他们会这样做，他们会做这样的事情，你选择一个角色，你用提示改变它，它会改变视频中发生的事情。所以非常激动人心的时刻，很多事情即将到来。我一定会让你了解这个领域发生的一切。我认为我们将看到很多颠覆，无论是视频、图像、音频、多媒体，还有很多领域。非常感谢收看。如果你不介意的话，我真的很感激。如果你能在YouTube上点赞的话。如果你在Apple Podcasts或Spotify上，请关注我们，并留下评论或评价。我真的很感激每一个评论，每一个评价。我都会阅读它们，并尽量回复。希望你们今天剩下的时间都过得愉快。

Edit DALL-E Images with ChatGPT's Latest Update 08:55 Share

No Priors AI

Deep Dive

Shownotes Transcript

Edit DALL-E Images with ChatGPT's Latest Update