OpenAI 几个小时前发布了一个新的更新。我还没听到有人谈论这个,但我认为它绝对令人着迷,那就是你现在可以用一种非常有趣的新方式在 ChatGPT 中编辑 DALL-E 图片了。我在其他一些程序中见过这个功能。这是我第一次看到 OpenAI 涉足这个领域,而且它非常强大。所以我想告诉你一些他们正在做的事情,以及为什么我认为这很重要。首先我要说的是,他们在……
LinkedIn 和 X 上发布了这一公告。他们说你现在可以在网络、iOS 和 Android 上的 ChatGPT 中编辑 DALL-E 图片。这令人印象深刻。你知道,有时人们只向网络版本推出更新,稍后才会发布到移动端。这个功能已经在网络上发布了。我一直在玩它,测试它,显然它也在 iOS 和 Android 上发布了,虽然我还没有使用,但我强烈建议其他人如果拥有该应用程序,可以试一试。
这太棒了。它将进入更多人的手中。当我看到他们像这样向所有平台大规模推出,并真正表示“我们希望所有用户尽快使用它”时,我感到非常兴奋。从本质上讲,你将能够在生成实际图像后,立即选择图像的某些部分并对其进行编辑。他们展示了一个例子,他们生成了一只狗的图像,他们说,你知道,创建了一张可爱的小狗庆祝生日的图片。所以它就像一只戴着帽子的狗在庆祝它的生日。然后他们开始编辑它,他们在狗的头上高亮显示了两个位置,并说要添加蝴蝶结。现在,很多人都在评论他们所做的演示,因为他们实际上发布了一个关于整个生成过程的社交媒体片段。视频大约……
有一分钟长,而且视频的大部分时间你都在那里等待观看这个生成过程,但它能够生成出现在狗头上高亮显示位置的蝴蝶结,这令人印象深刻。所以我想说的是,很多人都在评论这个视频,上面有一些有趣的评论,我认为总的来说,人们……
对他们这样做感到高兴。评论中有人说:“我很感激 OpenAI 选择不在此预览中加快演示生成过程的视频速度。这展现了诚信,并有助于为产品的性能设定现实的期望。真实的预览对于潜在用户的信任大有帮助,在人工智能时代,信誉至关重要。”我实际上同意这一点。谷歌 Gemini 推出了他们的平台演示,结果他们……
被彻底批评了,因为这是一个你可以与之交谈的平台,它可以看到你正在看什么,它可以创建图像和视频,而且它正在做所有这些疯狂的事情。然后我们发现它基本上是伪造的或经过编排的。他们对视频进行了高度编辑。他们在……
实际上给出比他们告诉我们的更长的提示之前向它提问。所以看起来他们可以说,“这是什么?”然后它会说,“哦,那是你玩石头剪刀布。”但实际上,他们说的是,“我正在用手玩一个很流行的游戏。这是什么?”然后它会做出回应,但他们会剪掉所有上下文……
总之,这真的很可疑,我认为这使得谷歌和 Gemini 失去了很多信任。我相信他们已经吸取了教训,不会再那样做了。但我认为 OpenAI 和其他人工智能公司也在吸取教训。当他们现在给出这些演示时,我认为这非常有趣,他们只是让你观看,他们知道人们宁愿观看一分钟的图像加载,也不愿知道它是假的。所以我们知道这是真的。所以我尝试了这个新功能。我认为它非常令人印象深刻。我只是去了 ChatGPT。我当时想,哦,我的天哪,这个功能现在可以使用了。
起初我认为它不可用,说实话,我不得不回去再次观看视频才能学习如何使用它。所以如果你想尝试这个功能,我会告诉你。但我尝试着说,“创建一个海盗船与黑胡子和他的船员作战的照片”。它为我生成了图像。起初我以为,“没有办法编辑这个”。你实际上需要做的就是点击图像本身,它就会展开到全视图。在右上角,有一个叫做“选择”的东西,它本质上是一个工具……
你可以改变画笔的大小,你可以把它做成一个非常大的选择器,或者如果你想在图像中获得一些更小的细节,你可以把画笔改得很小。我做了很多不同的事情。举个例子,首先我选择了,所以我必须生成黑胡子在海盗船上。我选择了他的脸,并说给他一个咧嘴的笑容。现在,生成的图像的第二个版本,说实话,如果……
我的意思是,他的胡子遮住了他的嘴,但细节并不精确,你无法真正分辨出他是在皱眉还是咧嘴笑。说实话,我认为 Midjourney 在图像生成方面仍然是最好的,而且好很多,但这确实是一个令人印象深刻的功能,而且我……它有一些我没有在 Midjourney 中看到的东西。因此,我认为这很有趣。我想用一些可能更明显的东西来测试它。所以我实际上只是选择……
整艘海盗船,包括桅杆。我只是选择整个东西。我告诉它帮我把海盗船变成粉红色的汽车。它实际上能够做到这一点。而且,你知道,它看起来确实像一辆汽车正在撞向海盗船,我想这没关系,无论如何。这是它自己的诠释。但公平地说,在我生成的图像中,虽然一辆汽车撞向海盗船看起来很有趣,但图像中没有任何东西看起来……
或者说“破损”是我最好的解释方式。就像黑胡子仍然站在汽车顶部一样。有一些奇怪的东西从它身上冒出来。
所以我认为 Midjourney 在图像生成方面更好,但我对这个工具印象非常深刻。我认为你可以,我认为你可以做一些非常令人印象深刻的事情。现在,我认为另一件非常有趣的事情是,你可以做到,你知道,ChatGPT 正在与 DALL-E 链接。所以你实际上可以上传图像,对吧?这意味着你可以选择一个图像并将其上传到 ChatGPT。现在,
当我最初发现这一点时,我想看看它是否能够编辑你上传的图像。我实际上并没有看到这个确切的功能。所以对于一些人来说,我认为在 LinkedIn 的帖子中,人们说,“太好了,我不再需要花几个小时向我妹妹解释如何使用 Photoshop 来编辑她的度假照片了。”我觉得这很有趣。
但与此同时,她不能只是上传她的图像并进行编辑,对吧?所以它并没有完全取代 Photoshop。虽然这个工具,选择工具让我想起了 Photoshop 的选择工具,如果你熟悉的话。但不幸的是,当你做一些事情时,例如,当你上传图像时,你实际上无法……
该图像,这实际上有点不幸,因为我期待这个特定功能,并认为能够进行编辑会非常有趣。否则,图像就在那里。所以我相信这是一个他们将来会添加的功能。有很多变通方法。有一些方法你可以用 Midjourney 特别是来做到这一点。并且有很多不同的工具,你可以上传自己的照片,并让它……
编辑它们。我遗憾的是无法直接在 ChatGPT 中做到这一点。总的来说,这是一个令人惊叹的功能,我对此感到非常兴奋。我认为这将把图像生成提升到一个新的水平,因为现在你不再只是生成图像并希望它完全符合你的要求,你可以生成图像……
过去你会说,“好吧,再做一次,但改变这个,再做一次,但改变那个”。每次它都会重新生成,它并不完全相同,而且不会完全改变你想要的东西。现在你可以直接选择你想改变的图像部分,它可以改变它。我认为这对平面设计来说将是一件大事。这可能是平面设计的发展方向,Canva、Photoshop 和这些其他工具,我认为将会受到很大的冲击。所以我认为在这个……
领域将会有数亿美元受到冲击,无论是在今天还是明天。我能看到 OpenAI 发布更多、更多此类图像生成和编辑工具的世界,我认为这将非常强大。你还必须开始推断这将走向何方,这……现在就像,“好吧,很酷”。
图像,但接下来将是视频。所以当你使用 Sora 并进行视频生成时,我认为他们会遵循同样的先例。你将能够选择视频中的区域,并说,“好吧,我知道演员正在跑步,并且……你知道,从建筑物上跳伞。现在我想让他穿一件红衬衫。好吧。我想让他穿一件蓝衬衫。好吧。我想让他跳进直升机。”这将非常令人着迷地看到实际的……
视频生成流程是如何工作的,但我认为他们会这样做,他们会做这样的事情,你选择一个角色,并用提示改变它,它会改变视频中发生的事情。所以非常激动人心的时刻,很多事情即将到来。我一定会让你了解这个领域发生的一切。我认为我们将看到很多颠覆,无论是视频、图像、音频、多媒体,还有很多领域。非常感谢您的收听。如果您不介意的话,我真的很感激。如果您在 YouTube 上,请点击……
喜欢按钮。如果您在 Apple Podcasts 或 Spotify 上,请关注我们,并留下您的评论或评价。我非常感谢每一条评论,每一个评价。我都会阅读它们,并尽量回复。希望你们今天剩下的时间都过得愉快。