We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Unleashing Firefly Image 3: Adobe's latest AI innovation

2024/4/24

No Priors AI

AI Deep Dive AI Chapters Transcript

People

主

主持人

专注于电动车和能源领域的播客主持人和内容创作者。

Topics

Adobe发布了新的AI图像生成模型Firefly Image 3，该模型具有许多令人印象深刻的功能，例如生成逼真的图像，其质量虽然不如Midjourney，但在易用性方面具有优势。Firefly Image 3专注于加快创意过程，用户可以通过清晰的菜单选项快速生成图像，而无需学习复杂的参数。它具有更好的照片真实感，可以从单个提示生成各种风格的输出（照片、艺术、插图等），并可以设置情绪或灯光。此外，Firefly Image 3还具有参考图像功能，允许用户上传图像并基于提示生成类似的图像，简化了提示编写过程。该功能类似于ChatGPT根据示例文本生成文本的方式。虽然该功能要求用户拥有上传图像的权利，但Adobe正在努力阻止未经授权的图像被用作参考，并声称该功能安全用于商业用途。Firefly Image 3已集成到Photoshop中，并包含其他生成式AI工具，例如生成背景和生成类似图像的功能，其图像生成质量比以前版本更高，并包含一个新的调整画笔工具，类似于Lightroom中的工具。Adobe的优势在于其庞大的用户基础和已有的软件工具，这使得Firefly Image 3能够迅速被广泛使用。

Deep Dive

Chapters

This chapter introduces Adobe's new AI image generator, Firefly Image 3, highlighting its ability to create photorealistic images and comparing it to Midjourney. It discusses the user-friendly interface and features like aspect ratio adjustment and content type selection.

Firefly Image 3 excels at generating realistic images.
It offers a user-friendly interface with clear menu options.
It allows for aspect ratio and content type adjustments.

Shownotes Transcript

Adobe刚刚发布了一个全新的AI模型，这是一个新的图像生成器，名为Firefly Image 3。它拥有一系列令人惊叹的功能。我将介绍所有这些功能，并向您展示一些演示。我最近上手使用了这款产品，并且对Adobe所做的一些事情印象深刻。他们发布了一份大型新闻稿，概述了这里发生的一切。

但是，有趣的是，我如今获取许多新闻的途径实际上仅仅是X（推特）。我实际上是在X上首先看到的这个消息。如果您有兴趣关注Adobe的网红，克里斯·卡斯图诺瓦是一位很棒的网红。她在Adobe工作，并且总是发布关于最新动态的推文。无论如何，她最近分享了一个非常有趣的视频……

展示了这款工具可以生成的一些图像。她主要提到的是它擅长生成逼真的图像。这个新版本，我们看到了与Midjourney非常相似的进步，它最初擅长生成奇幻图像。然后它开始擅长各种类型的艺术风格。最终，这款工具能够直接生成看起来非常像真实照片的图像，也就是照片级逼真的照片。我认为这是他们关注的一大重点。人们一直在对此发表评论。一些人一直在进行自己的测试，并展示他们能够用它生成的内容。例如，有人展示了……

蓝色头发和蓝色连衣裙的模特，但她们看起来像真实的人一样逼真。它非常好。有人提出了一个有趣的问题，我将介绍这个问题，因为我在任何新闻稿或其他地方都没有看到这个问题。感觉Twitter是唯一能看到这个问题的地方。有人问：你认为它具有角色一致性吗？克里斯说：

存在风格和结构一致性。有一种方法可以诱导它实现某种程度的角色一致性。她有一个教程和视频，展示了如何做到这一点。话虽如此，但这并不是它的特定功能。Midjourney在这方面仍然领先，因为Midjourney最近推出了一项具有角色一致性的功能，这意味着你可以在不同的图像和不同的位置使用同一个角色。

这绝对是Midjourney领先的一点，如果你想制作书籍或网站上的图形，并且需要在多个不同位置或场景中使用同一个角色，这将非常重要。

Midjourney现在能够做到这一点，并且做得相当好。我认为他们在3月份宣布了这项功能。所以Midjourney已经这样做了有一段时间了。Adobe似乎在很多方面都在迎头赶上，但似乎它还没有完全赶上这一点。所以希望这是他们能够做到的事情。我想说的一件事是，Tom's Guide上有一篇关于这件事的有趣的博客文章。

Ryan Morrison发表了一篇关于此事的文章。我想到的一件有趣的事情是，他说：“Adobe表示，Firefly 3的工作重点是加快构思速度，让设计师能够在尽可能短的时间内，以尽可能少的摩擦，从一个想法过渡到一个完整的图像。我认为他们做到了。与Midjourney不同的是，你不需要学习多个参数以及如何实现它们，Firefly有一系列定义明确且清晰的菜单选项。”现在，这是事实。我已经测试过了，我会向您展示一些演示。

但是他们确实有更多菜单选项，对吧？例如，下拉菜单，例如，你想要什么风格？是超现实主义的吗？所以他们有这些选项，感觉有点……

你知道，感觉学习起来没那么难，不需要成为非常优秀的提示工程师。他还说，Firefly 3 似乎具有更好的照片真实感，从单个提示中可以获得各种各样的输出，涵盖照片、艺术、插图等风格，以及设置情绪或照明的选项。它有很多非常酷的功能。当我使用它时，

我实际上要求它生成一些东西。我做了一些事情。我首先要求它生成一栋房子和一间小屋的图片。这是一个默认提示，它做得很好。我想说的一件有趣的事情是，我使用了“超现实主义”这个词，如果你在……

如果你在Midjourney上使用“超现实主义”这个词，它会生成超现实主义的图像。最初为我生成的图像并非如此。然后我又改变了要求，要求生成一座城堡。我说是一座木制城堡，并要求它是超现实主义的，并要求有雕像。它生成的图像看起来像一张照片。它完美吗？我会说可能不是，但它看起来确实相当不错。背景中有人，有雕像，有山，有一座……

有一座城堡，城堡有很多木质元素，这正是我要求的，所以我认为它很酷。当然，它像许多这些图像生成器一样，生成了四个变体。我会说，有些比其他的更好。在一些图像中，窗户是用砖头填满的，而其他的看起来更逼真。所以，你得到的结果与你付出的成正比。但我认为就……

就这一点而言，与Midjourney类似，你将能够生成几个。现在，我还想说的一件事是，如果你想生成正方形或纵向、宽屏、横向的图像，你可以更改纵横比。这非常好。我没有在所有生成器上看到这个功能。内容类型，你可以让它生成照片或更艺术化的风格，你可以打开或关闭这个选项，这样你就可以看到你想要它做什么。

所以，是的，有很多非常有趣的事情。我想介绍一些他们实际公布的非常具体的功能。

其中一个重要的功能叫做参考图像。使用参考图像，你实际上可以上传一张图像，并根据你的提示生成类似的图像。以下是Adobe数字媒体首席技术官Ellie Greenfield的一段话。Ellie说：“提示很麻烦。为什么要花一个小时来编写一个三段的提示？如果你有一张你已经创建的图像，它正是你想要参考的内容。俗话说，一图胜千言，这里也适用，对吧？所以你实际上可以这样做，

我有一张很棒的城堡图片。现在我想让它为我生成一张城堡的图片，但是要改变这个元素或那个元素，你可以直接使用你自己的图像而不是提示，我认为这太棒了，因为我用ChatGPT也做过同样的事情。例如，我想让它为我写一种特定类型的推文或文章的一段话。我不想考虑我的写作风格是什么，让它帮我克隆它。我只是想说，

像我一样写。所以我总是做的是，我只是把整篇文章都添加到我的提示中。我说，嘿，写一段关于X、Y和Z的文章。用我之前的写作风格来写。这是一段我之前写过的摘录。它会读取这段摘录。然后，它就会输出一些与我过去写作风格类似的内容。

这太棒了。用图像做到这一点实际上是不可能的，所以Adobe正在使其成为可能。现在，很多人对此有一些担忧，原因有几个。我想读一段The Verge的一篇文章，它讨论了这个问题。他们说，用户应该有权使用他们想要参考的图像。Greenfield告诉The Verge，当第一次使用该工具时，一条消息会标记此……

一条消息会标记此所有权要求，并且该公司正在为Adobe的内容真实性倡议开发一个通用的“禁止训练”标签，该标签还将阻止图像被用作参考。因此，上传作为参考材料的图像不会用于训练Firefly。首先，我认为这很好。如果你上传一张图片来……

来做一些事情，然后所有上传的内容都被吸收到他们的巨大数据集里，这会非常烦人。我认为人们不希望这样，尤其是公司。所以我认为这是一件好事。他们还说：“尽管所有权责任由用户承担，但Adobe表示，这个新的参考工具仍然是安全的商业用途。Adobe声称Firefly相对于竞争对手公司的一个最显著的优势是生成式AI模型。”

他们说这仍然适合商业用途。所有内容都使用他们的数据集进行训练。Adobe一直非常重视这一点。所以我认为这将很有趣。所有这些都将集成到Photoshop中，这再次令人兴奋。我，有一些其他的生成式AI工具，它们……

已经在这里了，很多东西都是我们已经看到的东西，对吧？他们有一个生成式AI生成背景的功能，你可以上传你的产品图片，例如，然后它可以生成许多不同的背景。你可以说，例如，他们有一个例子，比如一个香水瓶，然后他们说用粉红色的牡丹、兰花或水来生成背景，它就像改变这个香水瓶后面的背景一样。他们还有一个叫做“生成相似”的功能，这基本上将用于……

它可以生成相似的图像或提出同一图像的不同变体，这非常有趣。然后他们的第三个，他们这个新模型在生成这些图像方面的能力要高得多，比所有……

比它之前的版本都要高得多。所以它将能够做很多有趣的事情。他们最近添加了一个叫做调整画笔的功能。他们展示了一个演示，基本上……

老实说，它让我想起了Adobe中已经存在的功能，比如……我忘了。所有摄影师使用的那个，他们用来创建滤镜和东西的软件。Lightroom，就是这样。基本上，他们有一个画笔，他们用它来突出某人的眼镜，然后他们可以用它来改变眼镜的颜色。所以，我的意思是，这感觉像是你在其他地方看到过的Adobe工具。但这也是将要集成到这个工具中的功能。

总而言之，我认为这非常令人印象深刻。这里最大的新闻是这个模型在生成逼真的照片方面变得多么好，虽然不完美。而且我实际上并不认为它现在比Midjourney好。当你听到人们谈论这件事时，这很有趣，他们说，这比Midjourney好得多，因为你不需要学习这些复杂的提示。是的，但是……

但与此同时，我认为Midjourney的质量仍然好一点。所以，也许学习提示有点复杂，但如果你想要最好的，那就是Midjourney。总而言之，我认为现在是制作这些照片非常有趣的时期。随着他们推出……

并添加新功能，我会随时向您更新。但总的来说，我认为这是一个惊人的更新，Adobe做得很好，跟上了这个新的图像模型。当然，关于Photoshop或Adobe令人惊叹的事情是，你甚至在Midjourney等其他公司那里都看不到，他们已经在创意领域拥有如此流行的软件工具和图像和视频生成或编辑工具，现在他们可以将此集成进去，数百万用户将直接访问它。所以我认为，你知道，你不能低估Adobe。你不能忽视它们，因为它们拥有如此庞大的用户群。这已经被集成进去了，他们只是……

将它集成到一个工具中，数百万用户将立即使用它。如果您喜欢今天的节目，我非常感谢您留下评论，如果您在YouTube上观看，请点赞视频，或者在Spotify和Apple上关注我们，给我们留下评论。我很喜欢所有的评论。希望你们今天剩下的时间都过得愉快。

Unleashing Firefly Image 3: Adobe's latest AI innovation 11:31 Share

No Priors AI

Deep Dive

Shownotes Transcript

Unleashing Firefly Image 3: Adobe's latest AI innovation