We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode S3E87|一句话生成图片初体验,AI挑战艺术家谁会赢?|AIGC特辑

S3E87|一句话生成图片初体验,AI挑战艺术家谁会赢?|AIGC特辑

2022/10/20
logo of podcast 硅谷101

硅谷101

AI Deep Dive AI Chapters Transcript
People
汪昭然
钟凯祺
黄泓君
Topics
黄泓君:本期节目探讨了一句话生成图片技术的爆火及其应用,并指出该技术引发的争议,以及未来发展趋势。 钟凯祺:分享了使用AI绘画工具的个人体验,包括高质量、访问限制、安全性等方面,并指出了图片质量受随机种子和prompt影响,以及图片好坏评判的主观性。 汪昭然:分析了可控生成是AI大模型应用于实际场景的重要障碍,并探讨了如何通过用户的反馈来改进模型,以及数据确权和版权等问题。 黄泓君:探讨了Midjourney和DALL·E 2等模型的优劣,以及如何提升AI绘画效果,包括利用素材库和艺术家风格关键词,并指出获奖作品《太空歌剧院》并非完全由AI生成,而是经过人工精修。 钟凯祺:分享了个人创作AI绘画的经验,包括明确指定艺术风格和细节描述的重要性,以及AI模型的in painting和out painting功能。 汪昭然:分析了AI绘画效果受多种因素影响,包括模型本身、训练数据和用户描述的精确度,并探讨了用户与AI模型的交互过程本身就是一种反馈机制。 黄泓君:介绍了Meta的一句话生成视频技术及其山寨方法,并探讨了视频生成技术面临的挑战,包括保证视频中元素的时间序列一致性。 钟凯祺:分析了Meta的Make-A-Video模型在视频生成质量上的提升,以及AI视频生成技术面临的挑战,包括对三维空间和视觉效果的理解。 汪昭然:探讨了不同AI模型的技术差异,以及产品化策略和社区建设的重要性,并分析了AI模型的数据确权和版权问题,以及AI生成内容的安全性和可控性问题。 黄泓君:探讨了AI生成图片的版权归属问题,以及AI技术生成虚假内容带来的安全挑战。 钟凯祺:分析了不同AI模型的美学风格差异,以及数据来源和版权协议等问题。 汪昭然:探讨了生成式AI可能改变艺术家的商业模式,从卖画到卖风格,以及生成式AI未来成为新时代搜索引擎的可能性,并分析了生成式AI对各行各业从业人员的影响,以及未来工作方式和效率的改变。

Deep Dive

Chapters
本期节目讨论了AI一句话生成图片的体验,嘉宾们分享了各自使用Midjourney和DALL·E 2等模型的感受,并指出可控生成是目前大模型应用的重要障碍。
  • AI一句话生成图片技术爆红网络
  • 嘉宾们分享了各自的试用体验,包括生成科幻题材图片、中国国画风格图片等
  • 可控生成是目前大模型应用的重要障碍
  • Midjourney生成的图片比DALL·E 2更加精细

Shownotes Transcript

老牌杂志《经济学人》的封面一向以辛辣和构思独特取胜,而今年年中,《经济学人》的杂志封面《AI‘s New Frontier》竟是一张Midjourney人工智能生成的图片。美国科罗拉多州博览会美术大赛的冠军作品——《太空歌剧院(Théâtre D'opéra Spatial)》,也是由AI所生成。

普通人可以用AI生成媲美艺术家的作品,这让“一句话生成图片”在网络上爆红。硅谷知名投资机构红杉也写了一篇文章,叫做《Generative AI: A Creative New World》,一时间,也成为投资人竞相追逐的赛道,业内人士将生成式AI的赛道称之为AIGC(Artificial IntelligenceGenarated Content)。

《硅谷101》接下来将推出AI特辑,盘点人工智能发展的前沿趋势,以及如何应用到各行各业。 第一期,我们会先来聊聊我们的使用体验,回答“一句话生成图片”是什么? 在接下来的一期里,我们也会聊到整个生成式AI的行业格局与主流玩家,欢迎大家持续关注。

还有一个小惊喜,本期播客封面图由《硅谷101》利用Midjourney自动生成。

【主播】 泓君,资深媒体人 【嘉宾】 汪昭然,美国西北大学工业工程及管理科学系和计算机科学系助理教授 钟凯祺,大厂数据科学家

【你将听到】 02:25 一句话生成图片试用体验 04:36 可控生成是大模型应用的障碍 05:46 生成上一期封面图经历 08:17 技巧:素材库+艺术家风格的关键词 09:14 误解获奖作品《太空歌剧院》:并不完全是机器生成 13:45 Meta一句话生成视频 PK 山寨生成 21:39 西式美学风格:Midjourney 22:54 数据确权、隐私与版权争议 29:01 生成式AI:未来的搜索引擎? 30:46 艺术家的机会与挑战:从卖画到卖风格

【名词解释】 【OpenAI】 一个人工智能实验室,由营利组织OpenAI LP与母公司非营利组织OpenAI Inc组成,是特斯拉创始人Elon Musk与前YC总裁Sam Altman共同创建。

【DALL·E·2】 一个通过文本描述生成图像的人工智能工具,是OpenAI旗下的模型。

【Midjourney】 一款AI绘画工具,只要输入你想到的文字,就能通过人工智能产出相对应的图片,耗时只有大约一分钟。

【相关阅读】 《Generative AI: A Creative New World》——Sequoia https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/) 中文版《生成式AI:一个创造性的新世界》 https://www.woshipm.com/ai/5611423.html)

【后期】 Amei

【BGM】 Jazz in Paris - Radio Night

【硅谷101新节目】 《硅谷101》视频 跟播客比较起来,我们的视频内容更倾向于用精炼的语言,15分钟讲清楚一个复杂的科技事件。欢迎大家在Youtube上搜索《硅谷101》,中国听众可以在B站、微信视频号、微博上来订阅我们。

《Web3 101》 另外,《硅谷101》播客也正在分叉出一档探索Web3世界的节目《Web3 101》,这档节目会讲述Web3世界发生的大事件。中国听众可以在苹果播客和小宇宙上收听,美国听众可以在苹果播客、Spotify上收听。

【在这里找到我们】 公众账号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Google Podcast|Amazon Music 联系我们:[email protected])

Special Guests: 汪昭然 and 钟凯祺.