We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Firefly Image 3: Adobe's Cutting-Edge AI Image Model Revealed

Firefly Image 3: Adobe's Cutting-Edge AI Image Model Revealed

2024/4/24
logo of podcast AI Education

AI Education

AI Deep Dive AI Chapters Transcript
People
主播
以丰富的内容和互动方式帮助学习者提高中文能力的播客主播。
Topics
我作为一名科技博主,最近体验了Adobe新发布的AI图像生成模型Firefly Image 3,它在生成逼真图像方面表现出色,令人印象深刻。其主要功能包括生成照片般真实的图像,并提供多种风格选择,例如超写实、艺术、插画等,用户还可以设置情绪和光线等参数。与Midjourney相比,Firefly Image 3在易用性方面更胜一筹,它拥有清晰的菜单选项和简化的操作流程,无需学习复杂的提示词参数。 Firefly Image 3的一大亮点是其“参考图像”功能,用户可以上传自己的图像作为参考,从而生成类似风格的图像,这极大地简化了图像生成的流程,也解决了传统提示词输入的痛点。Adobe官方也强调了该功能的商业用途安全性,并承诺不会将上传的图像用于模型训练。 此外,Firefly Image 3 还具备生成相似图像、调整背景等功能,这些功能都将集成到Photoshop中,方便数百万Adobe用户直接使用。虽然在角色一致性方面,Firefly Image 3目前还不如Midjourney,但在照片真实感和图像质量方面,Firefly Image 3已经取得了显著的进步。总而言之,Firefly Image 3的出现标志着AI图像生成技术的一次重大飞跃,它将对数字设计行业产生深远的影响。

Deep Dive

Chapters
This chapter introduces Adobe's Firefly Image 3, focusing on its photorealistic image generation capabilities and user-friendly interface. It compares its features to Midjourney, highlighting strengths and weaknesses.
  • Firefly Image 3 generates realistic images.
  • It has a user-friendly interface with clear menu options.
  • It offers various styles, moods, and lighting options.
  • It allows for aspect ratio changes and content type selection (photo or artistic).
  • Its photorealism is comparable to Midjourney, but may require less prompt engineering skill.

Shownotes Transcript

Adobe刚刚发布了一个全新的AI模型,这是一个新的图像生成器。它是Firefly Image 3。这个东西有很多惊人的功能。我将介绍所有这些功能,并向您展示一些演示。我最近实际上手使用了这款产品,我对Adobe所做的一些事情印象深刻。因此,他们发布了一份大型新闻稿,概述了这里发生的一切。

但是,你知道,有趣的是,我如今获取很多新闻的地方实际上只是X。所以我实际上是在X上首先看到的这个。如果您有兴趣关注Adobe的网红,克里斯·卡斯图诺瓦是一位很棒的网红。她在Adobe工作,她总是会在推特上发布最新消息。无论如何,她最近分享了一个非常有趣的视频……

这个东西可以生成的图像。她主要说的是它擅长生成逼真的图像。所以这个新的版本,我们看到了与Midjourney非常相似的进步,它开始非常擅长幻想。然后它开始擅长各种类型的艺术。最终,这个东西能够直接生成看起来非常类似于逼真照片、照片般逼真的照片。我认为这是他们关注的一大重点。所以人们一直在评论这件事。嗯,不同的人一直在做他们自己的测试,展示他们能够用它生成什么。呃,人们有……

蓝色头发和蓝色连衣裙的模特等等,但它们看起来像真实的人一样逼真。所以它非常好。有人问了一个有趣的问题,我将介绍这个问题,因为我没有在任何新闻稿或其他地方看到这个问题。所以感觉Twitter是唯一能看到这个问题的地方。有人说你认为它有角色一致性吗?克里斯说

有风格和结构的一致性。有一种方法可以诱导它达到某种程度的角色一致性。她有一个教程和视频,向你展示了如何做到这一点。话虽如此,这不是它专门做的事情。绝对Midjourney在这方面仍然领先,因为Midjourney最近推出了一项功能,可以让角色保持一致,这意味着你可以在不同的图像和不同的地方拥有相同的角色

在不同的图像和不同的位置。这绝对是Midjourney领先的一点,如果你想做一本什么样的书,或者在你的网站上做一些图形,你需要在多个不同的位置或地方或镜头中使用相同的角色,这是一个很大的问题。

Midjourney现在能够做到这一点,而且做得相当好。我认为它在3月份宣布了这项功能。所以Midjourney已经做了一段时间了。看起来Adobe在很多方面都在迎头赶上,但这似乎并不是他们已经完全赶上的东西。所以希望这是他们能够做到的事情。我想说的一件事是,Tom's Guide上有一篇关于这件事的有趣的博客文章。

Ryan Morrison发表了一篇关于这篇文章的文章。我想到的一件有趣的事情是,他说:“Adobe表示,Firefly 3的工作重点是加快构思速度,让设计师能够在尽可能短的时间内,以尽可能少的摩擦力,从一个想法过渡到一个完整的图像。我认为他们做到了。与Midjourney不同的是,你不需要学习多个参数以及如何实现它们,Firefly有一系列定义明确且清晰的菜单选项。”现在,这是真实的事情。我已经测试过了,我会向你展示一些演示。

但是他们确实有更多的菜单选项,对吧?所以想想下拉菜单,比如,你想要什么风格?它是超现实的,对吧?所以他们有这些,感觉有点……

你知道,感觉学习如何成为一个不那么硬核、非常优秀的提示工程师的难度降低了。他还说的一件事是,Firefly 3似乎具有更好的照片真实感,从单个提示中可以获得各种各样的输出,包括照片、艺术、插图等风格,以及设置情绪或照明的选项。所以它有很多很酷的功能。当我玩它的时候,

我实际上要求它生成一些东西。我已经做过几件事了。我首先要求它做的是生成一栋房子和一间小屋的图片。这是一种默认提示,它做得很好。我要说的一件有趣的事情是,我使用了“超现实”这个词,如果你在……

如果你在Midjourney上这样做,它是超现实的。最初为我生成的图像不是。然后我又改变了它,要求一个城堡。我说一个木制城堡,并说要使其超现实,说要有雕像。它实际上生成了,看起来像一张照片。它完美吗?我会说可能不是,但它看起来确实非常棒。背景中有一位人物,有雕像,有山,有一个

有一个城堡,城堡有很多木质元素,这就是我要求的,所以我认为它很酷。当然,它像很多这些图像生成器一样,生成了四个变体。我会说,有些比其他的更好。在一些图像中,窗户是用砖头填满的,而其他的看起来更逼真。所以是的,你得到的是你付出的代价。但我认为就……

就这一点而言,与Midjourney类似,你将能够生成几个。现在,我要说的另一件事是,如果你想生成正方形或纵向、宽屏、横向图像,你可以更改纵横比。这真的很好。我没有在所有图像生成器上看到这个功能。内容类型,你可以让它生成照片或更艺术的风格,你可以打开和关闭它,这样你就可以看到你想要它做什么。

所以,是的,有很多非常有趣的事情。我想介绍一下他们实际公布的一些非常具体的功能。

其中一个重要的功能叫做参考图像。使用参考图像,你实际上可以上传一张图像,并根据你的提示生成类似的东西。以下是Adobe数字媒体首席技术官Ellie Greenfield的一段话。Ellie说,提示很烦人。为什么要花一个小时来编写一个三段的提示?如果你有一张你创建的图像,那就是……

那就是你想要参考的东西。俗话说,一图胜千言,这句话在这里适用,对吧?所以你实际上可以这样说,

我有一张很棒的城堡图片。现在我想让它为我生成一张城堡的图片,但是要改变这个元素或那个元素,你可以直接使用你自己的图像而不是提示,我认为这太棒了,因为我用ChatGPT也做了同样的事情。例如,我想让它为我写一种特定的推文或我文章的一段话。我不想考虑我的写作风格是什么,才能让它帮我克隆它。我只是想说,

像我一样写。所以我总是做的是,我只是把一整篇文章插入我的提示中。我说,嘿,写一段关于X、Y和Z的文章。用我之前的写作风格来写。这是一段我之前写过的摘录。它只是读了那段话。然后砰的一声,它就会输出一些与我过去写作方式类似的东西。嗯,

这太棒了。用图像做到这一点实际上是不可能的,所以Adobe正在使其成为可能。现在,很多人对此有一些担忧,原因有几个。所以我想读一段The Verge的一篇文章,它讨论了这个问题。他们说,用户应该有权使用他们想要参考的图像。Greenfield告诉The Verge,当第一次使用该工具时,一条消息会标记此……

一条消息会标记此所有权要求,并且该公司正在为Adobe的内容真实性倡议开发一个通用的“禁止训练”标签,该倡议还将阻止图像被用作参考。因此,上传作为参考材料的图像不会用于训练Firefly。首先,我认为这很好。你知道,如果你上传一张图片来……

来做某事,然后所有上传的内容都被吸入他们的巨大数据集,这会非常烦人。我认为人们不想要那样,尤其是公司。所以我认为这是一件好事。他们还说,引用:“尽管所有权责任由用户承担,但Adobe表示,这个新的参考工具仍然是‘安全用于商业用途’的。Adobe声称Firefly比竞争对手公司最显著的优势之一。”

生成式AI模型。所以他们说这仍然适合商业用途。所有内容都使用他们的数据集进行训练。Adobe一直非常重视这一点。所以我认为这将很有趣。所有这些都将被烘焙到Photoshop中,这再次令人兴奋。我,有一些其他的生成式AI工具,它们有点……

已经在这里了,很多东西都是我们一直在看到的,对吧?他们有一个生成式AI生成背景,你可以上传你的产品图片,例如,然后它可以想出许多不同的背景。你可以说,你知道,他们有一个例子,比如一瓶香水,然后他们说,用粉红色的牡丹或兰花或水生成一个背景,它就像改变这瓶香水后面的背景一样。他们还有一个叫做“生成相似”的功能。这基本上将用于……

它可以生成相似的图像或想出相同图像的不同变体,这非常有趣。然后他们的第三个,他们这个新模型在生成这些图像方面的能力要高得多,比所有……

比它之前的版本都要高得多。所以它将能够做很多有趣的事情。他们最近添加了一个叫做调整画笔的功能。他们展示了一个演示,比如……

老实说,它让我想起了Lightroom中已经存在的一些东西,所有摄影师都在使用它来创建滤镜和东西。本质上,他们有一个画笔,他们用它来突出某人的眼镜,然后他们可以用它来改变眼镜的颜色。所以,我的意思是,这感觉像是你在其他地方看到过的Adobe工具。但这也是将被烘焙到其中的东西。

总而言之,我认为这非常令人印象深刻。这里的重大新闻是,这个模型在生成逼真的照片方面变得多么好,虽然不完美。而且我实际上并不认为它现在比Midjourney好。当你听到人们谈论这件事时,这很有趣,他们说,这比Midjourney好得多,因为你不需要学习这些复杂的提示。是的,但是……

但与此同时,我认为Midjourney的质量仍然好一点。所以也许学习提示有点复杂,但如果你想要最好的,那就是Midjourney。总而言之,我认为现在是制作这些照片的非常有趣的时期。随着他们推出……

并添加新功能,我会随时向您更新。但总的来说,我认为这是一个惊人的更新,Adobe做得很好,跟上了这个新的图像模型。当然,关于Photoshop或Adobe的惊人的事情是,你甚至不会在像Midjourney这样的其他人那里看到,他们已经在创意领域拥有如此流行的软件工具和图像和视频生成或编辑工具,现在他们可以将其插入,数百万用户将直接访问它。所以我认为,你知道,你不能低估Adobe。你不能把它们排除在外,因为它们拥有如此庞大的用户群。这已经被插入了,他们只是……

将它集成到一个工具中,数百万用户将立即使用它。如果您喜欢今天的节目,我真的很感激您能留下评论,如果您在YouTube上观看,请点赞视频,或者在Spotify和Apple上关注我们,给我们留下评论。我爱他们所有人。希望你们今天剩下的时间都过得愉快。