OpenAI在几个小时前发布了一个新的更新。我还没听到有人谈论这个,但我认为它绝对令人着迷,那就是你现在可以用一种非常有趣的新方式在ChatGPT中编辑DALL-E图像。我在其他一些程序中见过这个功能。这是我第一次看到OpenAI涉足这个领域,而且它非常强大。所以我想告诉你一些他们正在做的事情,以及为什么我认为这很重要。首先我要说的是,他们在……
LinkedIn和X上发布了这个公告。他们说你现在可以在网络、iOS和Android上的ChatGPT中编辑DALL-E图像。这令人印象深刻。你知道,有时人们只向网络版本推出更新,稍后才会发布到移动端。这个功能已经在网络版上推出了。我一直在玩它,测试它,显然它也在iOS和Android上推出,虽然我还没有使用,但我强烈建议其他人如果拥有该应用程序,可以试一试。
这太棒了。它将进入更多人的手中。当我看到他们像这样向所有平台大规模推出,并真正表示“我们希望所有用户尽快使用它”时,我感到非常兴奋。本质上,你将能够做到的是,一旦你生成一个实际图像,你将能够立即选择图像的某些部分并对其进行编辑。他们展示了一个例子,他们生成了一只狗的图像,他们说,创建了一张可爱的小狗庆祝生日的图像。所以它就像一只戴着帽子的狗在庆祝它的生日。然后他们去编辑它,他们在狗的头上高亮显示了两个位置,并说“在上面加上蝴蝶结”。现在,很多人都在评论他们所做的演示,因为他们实际上是在社交媒体上发布了这段整个生成过程的剪辑。视频大约……
有一分钟长,而且视频的大部分时间你都在那里等待观看这个生成过程,但它能够实际生成出现在狗头上高亮显示位置的蝴蝶结,这令人印象深刻。所以我想说的是,很多人都在评论这个视频,上面有一些有趣的评论,我认为总的来说,人们……
对他们这样做感到高兴。评论中有人说:“我很感激OpenAI选择不在此预览中加快演示生成过程的视频速度。这展现了诚信,并有助于为产品的性能设定现实的期望。真实的预览对于潜在用户的信任大有帮助,在人工智能时代,信誉至关重要。”我实际上同意这一点。谷歌Gemini推出了他们的平台演示,他们……
被彻底批评了,因为这是一个你可以与之交谈的平台,它可以看到你正在看什么,它可以创建图像和视频,而且它正在做所有这些疯狂的事情。然后我们发现它基本上是伪造的或经过编排的。他们对视频进行了高度编辑。他们在……
实际上给出比他们告诉我们的更长的提示之前向它提问。所以看起来他们可以说,“这是什么?”然后它会说,“哦,那是你玩石头剪刀布。”但实际上,他们说的是,“我正在用手玩一个很流行的游戏。这是什么?”然后它会回应,但他们会剪掉所有上下文……
总之,这真的很可疑,我认为这使得谷歌和Gemini失去了很多信任。我相信他们已经吸取了教训,不会再那样做了。但我认为OpenAI和其他人工智能公司也在吸取教训。当他们现在给出这些演示时,我认为这真的很有趣,因为他们实际上只是让你观看,他们知道人们宁愿观看一分钟的图像加载,也不愿知道它是假的。所以我们知道这是真的。所以我尝试了这个新功能。我认为它非常令人印象深刻。我只是去了ChatGPT,我想,“我的天哪,这个功能现在可以使用了。”
起初我认为它不可用,说实话,我不得不回去再次观看视频才能学习如何使用它。所以如果你想尝试这个,我会告诉你,但我去了,我说,“创建一个海盗船与黑胡子和他的船员作战的照片。”它为我生成了图像。起初我以为,“不可能编辑这个。”你实际上需要做的就是点击图像本身,然后它会扩展到全视图。在右上角,有一个叫做“选择”的东西,它本质上是一个工具……
你可以改变画笔的大小,你可以把它做成一个非常大的选择器,或者你可以把画笔改得很小,如果你想在图像中获得一些更小的细节。我做了很多不同的事情。一个例子是,起初我选择了,所以我必须生成黑胡子在海盗船上。我选择了他的脸,并说给他一个咧嘴的笑容。现在,生成的图像的第二个版本,说实话,如果……
我的意思是,他的胡子遮住了他的嘴,但细节并不精确,你无法真正分辨出他是在皱眉还是咧嘴笑等等。说实话,我认为Midjourney在图像生成方面仍然是最好的,而且好很多,但这确实是一个令人印象深刻的功能,而且我……它有一些我没有在Midjourney中看到的东西。因此,我认为这很有趣。我想用一些更明显的东西来测试它。所以我实际上只是选择……
整艘海盗船,包括桅杆。我只是选择整个东西。我告诉它帮我把海盗船变成粉红色的汽车。它实际上能够做到这一点。而且,你知道,它实际上看起来像一辆汽车正在撞向海盗船,我想这没关系,随便吧。这是它自己的诠释。但公平地说,在我生成的图像中,虽然一辆汽车撞向海盗船看起来很有趣,但图像中没有任何东西看起来……
或者说“破损”是我最好的解释方式。就像黑胡子仍然站在汽车顶部一样。有一些奇怪的东西从它身上冒出来。
所以我认为Midjourney在图像生成方面更好,但我对这个工具印象非常深刻。我认为你可以,我认为你可以做一些非常令人印象深刻的事情。现在,我认为另一件非常有趣的事情是,你可以做,你知道,ChatGPT正在与DALL-E连接。所以你实际上可以上传图像,对吧?这意味着你可以选择一个图像并将其上传到ChatGPT。现在,
当我最初发现这一点时,我想看看它是否能够编辑你上传的图像。我实际上并没有看到这个确切的功能。所以对于一些人来说,我认为在LinkedIn帖子中,人们说,“太好了,我不再需要花几个小时向我妹妹解释如何使用Photoshop来编辑她的度假照片了。”我认为这很有趣。
但与此同时,她不能只是上传她的图像并进行编辑,对吧?所以它不像完全取代了Photoshop。虽然这个工具,选择工具让我想起了很多Photoshop的选择工具,如果你熟悉的话。但不幸的是,当你做一些事情时,例如,当你上传图像时,你实际上无法……
该图像,这老实说有点不幸,因为我期待这个特定功能,并认为能够编辑它会非常有趣。否则,图像就在那里。所以我相信这是一个他们将来会添加的功能。有很多变通方法。有一些方法你可以用Midjourney来做到这一点。有很多不同的工具,你可以上传自己的照片,让它……
编辑它们。我无法直接在ChatGPT中做到这一点。总的来说,这是一个令人惊叹的功能,我真的很兴奋。我认为这将把图像生成提升到一个新的水平,因为现在你不再只是生成图像并希望它完全符合你的要求,你可以生成图像……
过去你会说,“好吧,再做一次,但改变这个,再做一次,但改变那个。”每次它都会重新生成,它并不完全相同,而且不会完全改变你想要的东西。现在你可以直接选择你想要更改的图像部分,它可以更改它。我认为这对平面设计来说将是一件大事。这可能是平面设计的发展方向,Canva、Photoshop和这些其他工具,我认为将会受到很大的冲击。所以我认为在这个……
领域将会有数亿美元受到冲击,无论是在今天还是明天。我能看到OpenAI发布更多、更多此类图像生成和编辑工具的世界,我认为这将非常强大。你还必须开始推断这将走向何方,你知道,现在就像,“好吧,很酷。”
图像,但接下来是视频。所以当你使用Sora并进行视频生成时,我认为他们会遵循同样的先例。你将能够选择视频中的区域,并说,“好吧,我知道演员正在跑步,并且从建筑物上跳伞。现在我想让他穿一件红衬衫。好吧。我想让他穿一件蓝衬衫。好吧。我想让他跳进直升机。”这将非常有趣地看到实际的……
视频生成流程是如何工作的,但我认为他们会这样做,他们会做这样的事情,你选择一个角色,你用提示改变它,它会改变视频中发生的事情。所以非常激动人心的时刻,很多事情即将到来。我一定会让你了解这个领域发生的一切。我认为我们将看到很多颠覆,无论是视频、图像、音频、多媒体,还有很多领域。非常感谢收看。如果你不介意的话,我真的很感激。如果你能在YouTube上点赞的话。如果你在Apple Podcasts或Spotify上,请关注我们,并留下评论或评价。我真的很感激每一个评论,每一个评价。我都会阅读它们,并尽量回复。希望你们今天剩下的时间都过得愉快。