We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode What You Missed in AI This Week (Google, Apple, ChatGPT)

What You Missed in AI This Week (Google, Apple, ChatGPT)

2025/6/13
logo of podcast a16z Podcast

a16z Podcast

AI Deep Dive AI Chapters Transcript
People
J
Justine
O
Olivia
Topics
Justine: 我认为AI视频在一周内迅速占领了社交媒体,这种现象非常惊人。VEO3就像是AI视频领域的ChatGPT时刻,我们突然看到大量的VEO3生成内容获得了数百万的观看次数。我认为VEO3为AI故事叙述,特别是视频形式,开启了无限可能。当然,对于AI创意工作者来说,现在是一个既美好又疲惫的时代,因为需要测试的东西实在太多了。 Olivia: 我认为AI视频发展迅速,从不那么逼真到完全占领社交媒体只用了一周。现在人们可以通过一个提示生成完整的视频博客或会说话的视频,这使得像《星球大战》风暴兵视频博客在TikTok和Instagram上爆红。我认为11v3和VEO3为AI故事叙述开辟了一个充满可能性的世界,但这也使得人工智能创意工作者正经历一个既美好又疲惫的时代。

Deep Dive

Shownotes Transcript

一周之内,AI 视频完全接管了我们的社交信息流,这绝对令人难以置信。VO3有点像AI视频领域的ChatGPT时刻,我们突然看到所有这些VO3生成的视频爆火,点击量达数百万。感觉VO3和它之间,为AI讲故事,尤其是在视频形式上,打开了一个充满可能性的世界。是的,对AI创作者来说,这是一个令人筋疲力尽的时代。很棒,但也令人筋疲力尽。

中位数年度经常性收入(ARR,年度收入运行率)现在消费者初创企业的第12个月为420万美元。消费者回归。在今天的节目中,我们进行了一次接管。Justine和Olivia Moore是孪生姐妹、创作者以及A16Z消费者团队的合伙人。她们深入探讨了快速发展的消费者AI领域发生的一切,从AI生成视频内容在您的信息流中爆炸式增长,到为下一波创意初创企业提供动力的工具。

您将听到她们演示谷歌新的VO3视频模型,分解Chai Chippy Tea和Eleven Labs等语音工具的主要升级,并逐步讲解Justine如何使用AI创建一个完整的冷冻酸奶品牌,包括徽标、产品照片和店面。这是一个快节奏的视角,展示了创作者、建设者和消费者AI公司的新事物、有效的事物以及未来的发展方向。让我们开始吧。

提醒一下,此处的內容仅供參考。不应将其视为法律、商业、税务或投资建议,也不应将其用于评估任何投资或证券,并且不针对任何A16Z基金的投资者或潜在投资者。请注意,A16Z及其关联公司也可能持有本播客中讨论的公司投资。有关更多详细信息,包括我们投资的链接,请访问a16z.com/disclosures。

我是Justine。我是Olivia。这是我们消费者AI本周要闻的第一期。我们俩都是A16C投资团队的合伙人,我们也是同卵双胞胎。非常令人困惑。极其令人困惑,但对播客来说应该很有趣。我们很高兴聊聊本周我们在消费者AI的奇妙世界中看到的一些很酷的东西,首先是VO3。是的。事情发展得如此之快,感觉我们从……

令人兴奋但可能不太真实的AI视频转变为一周之内AI视频完全接管了我们的社交信息流,这绝对令人难以置信。是的。

几年来我一直关注AI视频。你可能记得我曾经是所有这些模型的早期用户。我一直希望它们能够发挥作用,并创造出普通人喜欢的很酷的东西。我想说VO3有点像AI视频领域的ChatGPT时刻,我们突然看到所有

所有这些VO3生成的视频爆火,点击量达数百万,仅包含VO3视频的频道在几天内就获得了数十万订阅者。VO3究竟有什么不同?是的,我应该先做一个概述。因此,VO3是谷歌DeepMind最新的视频模型成果。

他们在去年年底发布了VO2,这是首次突破,表明您可以获得非常高质量的视频,例如一致的场景、一致的角色、物理效果,就像看起来不错的东西一样。VO3是该模型系列的下一个迭代。它与众不同的地方在于,它在生成视频的同时原生生成音频。

因此,您可以使用文本提示来提示它,例如,“街头风格的采访,一名男子和一名女子正在谈论约会应用程序”。

或者您可以更具体地说,例如,“街头风格的采访,一名男子走到一名女子面前问她,你在使用哪些约会应用程序?她回答说,你为什么问?然后给了他一个怀疑的眼神。”因此,您不再需要转到另一个平台来进行音频旁白或任何类似的操作。您可以在一个地方获得一个功能齐全的、有多个角色的会说话的人的视频。是的。作为不太关注AI视频的人,我觉得这是一个真正的突破,人们现在——

能够在一个提示中生成完整的视频博客、完整的说话人视频,以及看起来像播客的东西。是的。一次完成。我认为这就是为什么我们看到像风暴突击队员视频博客在TikTok和Instagram上彻底爆火的原因。是的。VO3有趣的一点是,它仅限于8秒的生成。如果您从图像到视频开始,它不会生成音频,只有从技术开始时才会生成。

这意味着,除非在您的文本提示中引用模型已知的角色,否则很难拥有超过8秒的具有角色一致性的剪辑。这就是为什么我们看到所有这些病毒式视频博客的技巧,其中包含风暴突击队员或雪人。因为你看不到他们的脸,他们的脸被面具遮住了。是的,或者模型知道雪人或水豚的样子。如果它不是人脸,我认为我们对8秒剪辑之间的小变化不太敏感。

因此,人们正在生成看起来像一致视频博客角色的几分钟长的视频。是的,观看它们非常有趣。那么你如何实际使用VO3呢?感觉上有一些困惑。是的。VO3刚发布时,它只能在谷歌AI Ultra计划中使用。好的。非常令人困惑。通过谷歌新的创意工作室Flow。您必须使用每月250美元的计划。因此,有很多炒作,很多害怕错过。现在……

该模型可通过API获得。这意味着许多消费者视频平台(如Hydra或CREA)在其每月10美元的计划中提供对VO3的访问。或者一些更面向开发人员的API平台(如Fall或Replicate)提供按视频付费的生成。目前每秒的价格约为75美分。所以它仍然相当昂贵。您必须小心如何提示它,但结果令人惊叹。

那么接下来我们期待什么,无论是来自谷歌还是来自创作者?这对AI视频意味着什么?是的,我认为在创作者方面,我们已经开始看到这种爆炸式增长,基本上,我认为人们称之为“无脸频道”。所以这个想法是这样的,现在你不需要把自己的脸放在

摄像头或屏幕后面才能谈论某个话题或拍摄视频博客之类的东西,你可以有一个完全由AI生成的虚拟人物来讲述你的故事或为你演绎你的叙事,这意义重大。我认为,人们正在用它来讲述极其好笑的笑话,讲述这些叙事故事,例如,格雷格,这位无能的风暴突击队员,他破坏了所有任务,诸如此类的事情,人们对此非常投入。

就模型提供商和公司而言,VO3的运行成本显然非常高。因此,我认为谷歌希望训练下一个更大的模型,能够生成更长的视频。但我们会努力解决诸如连贯性之类的问题,我们还会努力解决,说实话,模型的定价问题。希望我们会看到更多经过压缩、优化、提炼的模型,能够以更低的成本做类似的事情。

好的,上周有很多新闻,所以这有点被忽略了,但我听说ChatGPT的高级语音模式有了重大更新。是的,他们在周六宣布了这一消息,这是一个有趣的选择。发布的时机很奇怪。是的,我认为他们实际上在上周四或周五发布了改进。最初它只适用于所有付费用户,现在我认为它已开始向更广泛的用户群推出。但本质上,他们使高级语音模式可用

是的。

但他们并没有真正改进产品或模型太多,至少在我看来是这样。我们看到芝麻和其他开源提供商推出了可以说是更好、更人性化的模型。我们看到了Gemini,我们看到了Grok推出的语音产品,这些产品更逼真。因此,我认为对于很多人来说,ChatGPT在消费者语音方面做了什么是一个问号。

那么现在是什么让它变得更好,或者主要升级是什么?我们实际上可能应该与它交谈并看看。朋友们,现场演示时间到了。嘿,ChatGPT,你在吗?嘿,我在,准备好了演示。今天我能帮你什么忙?他们在过去一周对你的声音进行了一些改进吗?

是的,他们做到了。他们一直在推出一些更新,使我的声音听起来更自然、更富有表现力。我很高兴你注意到了。是的,我能听到你的声音在接近问题时可能会向上弯曲,或者有时你会说“嗯”或“呃”之类的词,听起来像个错误,但实际上让你听起来更人性化。

没错。这些细微的处理都是为了让对话感觉更自然、更贴切。我认为这确实让事情变得更有趣、更引人入胜。太酷了。

太棒了。是的,听到这个真是太疯狂了。当语音模型咳嗽,甚至更有趣的事情,例如采用口音或用另一种语言说话之类的事情时,总是很疯狂。但我也认为,所展示的语音的纯粹真实性也令人印象深刻。这也很有趣,因为当高级语音模式首次推出时,我的感觉是,哇,这太棒了。这太不可思议了。这太人性化了。

但一个月或两个月后,Notebook LM出现了。这是第一个真正将“嗯”、“啊”、“停顿”等非常人性化的东西融入语音体验的体验,感觉就像一个巨大的升级。然后当你使用高级语音模式时,你会觉得,这已经不那么先进了。所以现在它终于来了,这非常令人兴奋。所以它从高级语音模式变成了基本语音模式,然后又变成了高级语音模式。再次成为高级语音模式。是的。我认为我当时的一个问题是,他们花了这么长时间做什么?对。

因为他们在许多模型的尖端,但我觉得他们花了六个多月的时间才推出我们从其他模型公司那里更快看到的改进,这对我来说有点奇怪。老实说,我认为很大一部分原因可能是当他们第一次发布高级语音模式时,

如果你还记得围绕她的所有争议。是的。这将成为一个取代人类的伴侣,以及人们认为的这种事情的一些可怕的含义吗?对。这似乎有点吓到他们了,所以他们不想发布任何听起来过于人性化的东西。

是的,我的意思是,还有,我的意思是,OpenAI一直非常忙碌。我认为这始终是关于前沿的问题,主要是LLM实验室,这就像他们如何平衡优先级,即基于文本的AGI的北极星,然后是他们在Sora中做的视频工作,他们所做的所有图像工作,稍后我们将讨论4.0图像模型、推理,所有这些事情。是的,完全正确。它实际上让我想起另一个——

我说大型科技公司,就像OpenAI现在在某种程度上是大型科技公司一样。它算数。但本周另一个大型科技消费者更新是苹果开发者大会。是的。以及他们在AI方面宣布的所有事情。或者没有宣布。或者没有宣布。对。而且我认为人们到目前为止对苹果智能(他们捆绑的一套AI功能)有点失望。是的。我认为我们都在等待Siri的AI版本或某种真正的移动个人助理。是的,所以……

我前几天遇到了这种情况,我问Siri,好的,明天是星期一。它是本月的哪个星期一?因为旧金山街道清洁,我必须知道它是否是本月的第二个星期一。它说,我不知道。我可以帮你搜索ChatGPT吗?我说,Siri,你怎么连这个问题都回答不了?好的,从苹果发布的许多更新来看,他们似乎正在将许多真正的AI功能外包给在你的手机上运行的ChatGPT。

我认为类似的故事是,当他们推出那些AI驱动的通知摘要时,他们会将三四个通知分组到一个通知中,而且它们有点混乱,人们感到不安。这似乎有点吓到苹果了,他们一直在缩短发布AI Siri的时间表。所以我们拭目以待。他们至少在昨天的公告中倾向于诸如Genmoji更新和——

通话转录。我认为我看到的最酷的事情是实时翻译通话和FaceTime。是的。跨语言。我很惊讶我们还没有看到更多关于这方面的内容,因为这感觉是一个非常自然和明显的用例。是的。特别是,我认为,谷歌,我认为谷歌可能做过实时翻译,但我还没有看到很多采用。我确实第一次看到一个病毒式Gen Z TikTok使用了Genmoji,我很惊讶它花了这么长时间才流行起来,因为Gen Z喜欢Genmoji。是的。

希望这些能真正大受欢迎。是的。好的,在我们离开语音之前,我们应该谈谈11v3吗?是的。因此,文本转语音公司Eleven Labs(更广泛的AI语音公司)在上周也发布了他们的第三代模型11v3。是的。我相信可能是上周四或周五。语音方面非常忙碌的一周。是的。

让11v3真正特别的是,它对语音做了一些事情,你以前必须通过语音到文本到语音来做。因此,以前,如果你想要一个哭着说话或有某种情绪甚至有奇怪的语调的角色,你必须自己录制这样说的话,将其上传到11,然后他们会将其翻译成AI语音。是的。

现在他们基本上将所有奇怪的语调、情绪甚至口音都变成了文本提示,通过这些称为标签的东西。因此,基本上,11个界面是一个编辑器,您可以使用您希望角色说的句子,选择您的声音,编写您的句子,然后您可以对其进行标记,例如。

或者辞职或低语或类似的东西。你也可以做音效,对吧?这太棒了。好的,我做了这个。提示是什么?哦,这是一个文本提示。它会说,“嘿,大家好,我叫奥斯汀。我来自沃斯堡的家族农场,现在向你们直播。”然后他会讲解挤牛奶的过程,有人会打断他。好的。“嘿,大家好,我叫奥斯汀。我来自沃斯堡的家族农场,现在向你们直播。”好的。

今天,我将讲解一下它的过程。奥斯汀,你又在假装口音了吗?这不是假装。我出生在这里。如果每个人都知道,你不会那样说话。所以我最喜欢的一点是,它展示了模型的几个方面。它可以做不好的口音。它可以做糟糕的口音。它可以做很棒的口音。那是两个不同的角色。起初,我提示奥斯汀角色带有浓厚的德克萨斯口音。好的。

然后我提示奶牛哞哞叫。然后你还可以提示中断,这真的很酷。所以标签实际上就像开始说话并被中断一样。然后出现的下一个角色,你可以说打断另一个角色。因此,对于叙事故事、广告、营销等任何内容,它都会让它听起来像一次自然的对话,而我们以前从未在AI语音中拥有过这种功能。感觉VO3和它之间,就像……

就像为AI讲故事,尤其是在视频形式上,打开了一个充满可能性的世界。是的,对AI创作者来说,这是一个令人筋疲力尽的时代。很棒,但也令人筋疲力尽,因为有太多有趣的东西需要测试。是的。我认为Eleven现在正在举办一场比赛,他们正在征集……

来自世界各地的人们使用V3的最佳示例。所以我非常好奇地想看看。我们制作了各种有趣的东西,但是专业的叙事构建者和故事讲述者是如何使用它的,因为我认为我们只是触及了这里可能的表面。

好的,所以你上周发布了一些关于AI收入增长以及公司增长速度的数据。让我们讨论一下主要结论。是的,所以基本上这里的方法论,或者甚至备份,这里的目的是我认为我们都有这个想法,或者我们有这个想法是因为我们已经听过无数次了,那就是我们现在正处于一个新的增长时代。

多亏了AI,公司比以往任何时候都发展得更快。但我的问题是,这到底意味着什么,速度有多快?比我们之前看到的快20%吗?比AI之前的快50%吗?对。所以我们有幸每天都能遇到很多公司。我们每周都会遇到几十家公司。

因此,我们回顾了过去,基本上只是提取了我们在生成式AI时代遇到的所有公司的数据,我认为这是过去22到24个月。对。我们观察到,一旦他们开始盈利,他们的增长速度有多快?对。

我认为在AI之前,如果您是一家向企业销售产品的B2B初创公司,如果您在第一年达到100万美元的ARR,那就像令人惊叹的、一流的。那是经验法则。我记得那是已知的指标。非常令人兴奋。如果您是消费者初创公司,您将不会赚钱ARR。

三年、五年,甚至更长时间。是的。整个想法是建立用户群,然后可能通过广告直接将其货币化。或者像市场一样进行交易,也许吧。是的,以后再说。也有一些反例,一些订阅公司,但这绝对不是主导模式。是的。这在AI时代已经完全改变了,现在大多数公司都是通过订阅直接从消费者那里赚钱。对。

我们发现的结果实际上相当令人惊讶,那就是消费者初创企业的第12个月中位数年度经常性收入(ARR,年度收入运行率)现在为420万美元。最低四分位数为290万美元。是的。最高四分位数为870万美元。哇。

所以像AI时代的中位数公司、中位数B2C公司一样,一年后就能达到400万ARR。是的。而一流的公司一年就能达到800万。超过800万,接近900万。在AI时代之前,我们从未见过这样的情况。更令人惊讶的是,这些数字是AI时代B2B基准的两倍。因此,消费者公司的收入增长速度实际上更快,这再次与我们之前看到的情况完全相反。是的。

我认为出现这种情况有几个原因。首先,就像,为什么消费者AI公司采用了订阅模式?他们是被迫这样做的,尤其是在模型的早期,它们非常昂贵,以至于作为一家公司,你们的制造成本非常高。对。你的意思是推理成本?是的。运行模型的成本。对。

因此,从历史上看,软件的好处是几乎没有边际成本。所以你做了一个应用程序。为下一个用户提供服务没有额外的成本。在AI中,这实际上根本不是真的。特别是如果您在模型上运行推理,它会花费您几美分。是的。

甚至可能每条查询几美元。因此,每个用户每月可能要花费您数十美元。是的,绝对正确。因此,许多公司至少必须尝试收费。对。事实证明,这些新的AI原生产品非常强大,以至于消费者愿意为此付费。对。

因此,我们还进行了一些额外的数​​据分析,结果表明,消费者AI初创公司平均向每个用户每月收取22美元,这再次是AI之前他们能够向订阅公司收取的平均费用的两倍多。对。

我们有理论吗?我的意思是,在创意工具方面,我看到的是,对于那些没有创意的人来说,AI工具允许他们,例如,我可以第一次制作照片、图像或艺术品。我可以制作视频。我可以制作动画。然后对于有创意的人来说,例如,我们有一个表兄是创意人员,他们可以真正利用它来增强他们的工作流程,并更快地完成工作。所以他们愿意为此付费。我们在创意工具之外看到过这样的例子吗?

这是一个好问题。我认为我们在伴侣应用程序方面看到了一些。对,是的。再次,产品非常强大,可以随时随地与你为伴,人们很乐意为此付费。我们还在语言学习、教孩子阅读等类别中看到了这一点,以前你必须为此支付每小时50美元的人工费用,如果那样的话,现在每月22美元的AI费用感觉相当便宜。

完全正确。我的意思是,我甚至在营养或辅导方面看到了一些被货币化的东西,在那里,由于视觉模型,你可以第一次拍摄你正在吃的东西的照片,并让视觉模型提取其中有多少卡路里,有多少蛋白质,然后在一天或一周结束时总结你应该多吃或少吃什么的见解,这是

AI之前,人们,我不知道,你可以拍张照片并将其上传到论坛。是的。但是,它没有经过测试。或者你必须找到一位营养师,等待几周才能预约,也许从你的医生那里获得推荐。就像,这将花费很长时间。所以这真的很令人兴奋。我认为它正在将那些以前从未为此付费的人货币化。是的。然后那些为此付费的人正在转向AI版本,或者他们愿意支付更多费用,这非常令人兴奋。是的。

我认为人们对另一个问题或疑问是,好的,他们的增长速度很快,但他们并没有留住很多用户。对。

我们也对此进行了一些分析。肯定有很多旅游。我们称之为AI旅游行为,指的是免费用户,这意味着您的网站实际上获得了大量点击。而且大多数用户都不会留下。但是,如果您从付费用户的角度来看,那么一旦您真正订阅,消费者AI公司的留存率与中位数几乎相同。

与AI之前的消费者公司一样,这真的很令人兴奋。我觉得我们所看到的,尤其是在收入留存方面,这很有趣,就像你可能有更多的游客,所以你可能有更多订阅然后取消的人。但是,你第一次看到了消费者订阅中的真正追加销售活动,而你不仅仅是每月支付10美元来使用该应用程序。你每月支付10美元来使用图像模型。但是如果你喜欢它并且用完了积分,

在下一个月的订阅开始之前,你会再支付10美元、12美元或50美元来购买额外的积分包。这意味着你现在在消费者中看到了收入扩张的机会,而我们以前只在企业中看到过。或者说实话,在游戏中,他们称之为“将鲸鱼货币化”,即那些真正高消费的人。

对我来说,这是目前消费者AI产品最令人兴奋的事情之一。是的。而且我们看到,我认为,公司将消费者收入转化为企业收入的速度比以往任何时候都快。例如,Canva公司以前花了……

五年、六年、七年甚至更长时间才能真正从消费者专业人士转向企业。对。现在我们看到像Eleven Labs这样的公司就是一个很好的例子。是的。有人可能会开始使用它作为每月10美元的计划来制作他们自己的有趣视频。是的。为他们有趣的家庭视频制作旁白。

然后事实证明他们在一些大型娱乐公司工作。是的。他们把它带到那里工作,然后他们转换为一个非常高的CB企业合同,这非常令人兴奋。我的意思是,我觉得我们甚至在消费者AI的早期就看到了这一点。我记得我们广告公司或娱乐公司的朋友会告诉我们,他们正在使用Midjourney来模拟东西,甚至在他们的最终工作产品中使用这些图像。所以它就像一个真正的企业用例,但自下而上地增长,这是一个引人入胜的动作。是的。

这令人兴奋。消费者回来了。好的。太棒了。我们接下来要进行本周的演示。关于我们一个有趣的事实是,我们真的喜欢,至少对我来说,这可能是我现在最喜欢的爱好,尝试所有AI创意工具,尤其是更广泛的AI消费者产品,找出如何制作很酷的东西,然后与那些最喜欢的爱好不是这样做并且没有我们的人分享工作流程。所以本周我们将讨论品牌增长。

使用AI进行创作和构思。我创建了一个名为Melt的新冷冻酸奶品牌,我用ChatGPT对其进行了迭代。然后我转向Ideagram,然后我转向CREA来进行最后的润色,并制作这些非常酷的产品照片,甚至还有商店照片。我认为最初的想法是看到Flux Context问世,这是Black Forest Labs的新图像编辑模型,它托管在CREA上。

在Flux Context中,你可以把它想象成GPT-4.0的图像模型,你可以上传一张图片,然后你可以说,你知道,把它做成吉卜力风格(这是个很火的例子)。你也可以说,比如把照片里的人放到一个新的环境中,或者稍微修改一下logo。是的。添加或移除物体。我看到有人把它描述成一种类似Photoshop的东西,但是是用

自然语言提示。是的。就像你第一次可以用文字进行编辑一样。我认为这与4.0图像模型的不同之处在于,它保留项目、角色或任何其他东西的一致性要好得多得多。我们会在后面展示一些例子。但基本上,如果你拍下自己的照片并上传到GPT-4.0,然后说,

把我放到一个播客工作室里,你最终在新的照片中看起来很可能与初始照片中的你完全不同。或者可能有一些相似的特征,但相当不同。而这个模型在保持一致性方面做得非常好。所以这激发了我这样一个想法:哦,这意味着这实际上可以用于品牌、新产品照片或其他类型的营销宣传材料。

因为logo和产品可以保持一致。你知道我是一个非常喜欢冻酸奶的人。我觉得冻酸奶近年来受到了不公平的待遇。它有点像小孩子的东西。

所以我想要做一个很酷、很时尚、很现代的,属于20年代纽约的冻酸奶品牌。我和ChatGPT反复讨论了这个想法,最终确定了名字“Melt”(融化),我很喜欢这个名字,并且确定了品牌形象,比如logo的字体大概是什么样子。这就是包装的颜色。好的。

然后我把logo的提示带到了Ideogram,这是一个图像生成和某种编辑画布。我认为它在logo、排版、任何与产品或文字相关的东西方面都非常出色。我让它生成了这张漂浮在空中的冻酸奶杯的照片,上面有Melt的logo和品牌标识。是的。

然后我下载了这张照片,并把它带到了CREA,在那里我使用了Flux Context新的编辑模型来运行各种各样的场景。真正很酷的是,你可以上传照片,然后你可以说,把这个冻酸奶放在一家时尚餐厅的柜台上。把它放在公园里一个女人的手里。

或者甚至把冻酸奶杯从蓝色变成白色,并加上粉红色的边框。如果他们有紫薯冻酸奶特价,就把冻酸奶本身做成紫色的。然后我认为下一步,我没有在这里做,我停在了产品图片上,我还制作了一张商店的图片。我拿了logo,把它叠加到我生成的一家商店上。我知道,你很想进去看看。是的。

但更进一步的下一步将是视频。是的。所以我的想法是把所有这些产品照片带到VO3或Higgs field,它可以制作非常酷的特效。是的。让冻酸奶杯动起来。看看它们有多好。让它真的从杯子里融化出来。它必须融化。我非常好奇地想知道,模型是否理解冻酸奶的物理特性?比如如果把杯子抛到空中。是的。

冻酸奶是怎么落地的?它是否像我们都知道的那样,在现实生活中会像那样掉下来?是的。显然,这对我来说只是一个有趣的实验。不幸的是,我实际上不会开始一个冻酸奶品牌。但这让你开始思考,例如,如果你在广告公司工作,并且你正在为你的客户制作关于你最新活动的演示文稿,你为什么不使用这样的东西来向他们展示它可能是什么样子呢?你是在不到几个小时内完成的。老实说,这个品牌——

看起来比我们看到的许多专业品牌都要令人兴奋。所以这让我想到,下一代企业家将在他们正在制作的许多资产中得到人工智能的完全辅助。我认为他们将能够制作全栈人工智能品牌。还有一些产品,你可以用人工智能进行设计。你可以用人工智能制作广告。我认为,任何人都没有理由不拥有自己的产品线、小企业,如果他们想开店的话。就像,

人工智能也在协助这些事情。完全正确。是的。我认为我们将看到这样的品牌:logo、产品照片,甚至可能是产品本身都是由人工智能设计的,氛围编码/氛围设计的网站或移动应用程序,以及

然后直接发货给最终消费者。社交媒体广告也是由人工智能生成的。一个为你举起它并在TikTok上销售它的化身。是的,它是由人工智能网红推广的,他们是VO3。他们实际上并不存在。我认为这种事情将会非常有趣,因为它就像你不再需要知道如何使用所有这些你必须使用的技术工具一样。即使是Photoshop,也有很多按钮。是的。

它非常复杂。现在你只需要用文字提示要求你想要的东西,生成一些东西,然后不断迭代,直到你得到你真正喜欢的东西,我认为这非常强大。太棒了。感谢收听A16Z播客。如果你喜欢这一集,请在ratethispodcast.com/A16Z留下评论。我们还有更多精彩的对话即将到来。下次再见。