We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode In search of the perfect movie recommendation

In search of the perfect movie recommendation

2024/7/28
logo of podcast The Vergecast

The Vergecast

AI Deep Dive AI Chapters Transcript
People
D
David Pierce
知名技术记者和播客主持人,专注于社会媒体、智能家居和人工智能等领域的分析和评论。
D
Diana Pupescu
Topics
David Pierce: 我经常在流媒体平台上花费大量时间寻找想看的电影,这说明现有的电影推荐系统并不完善。AI技术有潜力解决这个问题,即使推荐结果并非完美无缺,也能极大地改善用户体验。我尝试过使用ChatGPT等AI工具进行电影推荐,它们能够根据自然语言描述提供推荐,但结果有时缺乏新意。AI推荐的优势在于能够整合大量数据,并根据用户观看历史和相似用户偏好进行推荐,但其局限性在于难以完全捕捉用户复杂多变的喜好,以及对电影内容特征(如情绪、节奏等)的深度理解。 Spotify的音乐推荐系统为AI电影推荐提供了借鉴,它通过机器收听内容、转录和理解内容,构建知识图谱并结合用户收听数据,实现了精准推荐。Google Gemini 1.5 的大上下文窗口功能使其能够处理整个电影,并根据文本或图像提示提取特定信息,这为电影推荐提供了新的可能性。然而,要让AI真正理解电影和用户喜好,还需要克服诸多挑战,例如版权问题和对用户情感的深度理解。 RealGood 通过 AI 分析用户喜好和电影特征,提供更解释性的推荐,而非单纯的推荐列表。AI 理解电影和用户喜好的深度仍然有限,难以完全捕捉人类的情感和观看体验。目前,AI 电影推荐可以从理解电影情绪和用户观看时的情绪入手,逐步提升推荐精准度。电影推荐的难度在于用户观看电影时的情绪会影响其喜好,AI难以完全捕捉这种动态变化。 为了获得更好的电影推荐,建议用户尽量在一个或少数几个平台上观看电影,并积极维护自己的观看记录。虽然AI电影推荐技术仍在发展中,但目前最好的方法仍然是多观看电影,积累观看历史,以便平台更好地了解用户的喜好。 Diana Pupescu: AI在电影推荐方面有两个主要优势:整理和组织大量数据,以及将这些数据结构化成可用的信息库。AI可以整合来自互联网上的各种信息,例如评论、社交媒体帖子等,并将其转化为可用于电影推荐的结构化数据。 Gustaf Alströmer: Spotify的音乐推荐系统通过机器收听内容、转录和理解内容,构建知识图谱并结合用户收听数据,实现了精准推荐。 Pablisha: AI 理解电影和用户喜好的深度仍然有限,难以完全捕捉人类的情感和观看体验。

Deep Dive

Chapters
Streaming services often overwhelm users with excessive content, making it difficult to choose what to watch. Personalized recommendations frequently miss the mark, leaving viewers scrolling endlessly through irrelevant suggestions. This issue highlights the need for a more effective recommendation system.
  • Current streaming platforms struggle to provide relevant recommendations.
  • Users are often overwhelmed by the sheer volume of content.
  • Personalized suggestions frequently fail to align with user preferences.

Shownotes Transcript

在本期The Vergecast节目中,我们探讨了电视和电影推荐为何如此复杂,以及人工智能是否能够改进它们。如果Spotify能够构建你喜欢的无限音乐播放列表,YouTube和TikTok似乎总能准备好完美的内容,为什么Netflix、Hulu或Max却做不到呢?如果你想了解更多关于我们在本期节目中讨论的内容,以下是一些链接,帮助你开始: Movievanders Reelgood 互联网是一个持续推荐的机器——但它需要你让它工作 Netflix的Greg Peters关于新的文化备忘录以及广告、人工智能和游戏如何融入其中 来自《科学美国人》:推荐算法的工作原理——以及它们为什么会出错

<raw_text>0 对verge cast的支持来自Stripe。Stripe是一个支付平台,支持全球数百万家企业,包括Uber、BMW和DoorDash等公司。Stripe帮助无数初创企业和成熟企业实现增长,在排放方面取得进展,并在全球范围内接触更多客户。该平台提供一系列专门的功能和工具来加快增长,例如Stripe Billing,它使处理基于订阅的收费、发票和所有相关的收入管理需求变得容易。您可以在stripe.com了解Stripe如何帮助各种规模的公司取得进展,访问stripe.com了解更多信息,对,取得进展。

欢迎收听Vergecast,这是关于兴趣集群的旗舰播客。我是阿米特·查特吉,戴维·皮尔斯,这是我们关于现实世界中人工智能的系列节目的第三集也是最后一集,我们现在经常谈论人工智能,显然也经常在节目中谈论,但不知何故,它在大多数时候都感觉非常抽象、庞大且充满了技术术语。所以我们想找到一些人工智能在现实生活中实际出现的地方。

到目前为止,我们已经讨论了使用人工智能作为工具来赋予每个人完美的记忆。我们还与一位艺术家进行了交谈,他使用人工智能让我们以不同的方式思考隐私、监控和生活本身。今天,我想谈谈电影,更具体地说,为什么很难决定看什么。

对于任何通过流媒体获取娱乐的人来说,这是一个非常熟悉的问题,对吧?你坐下来,打开电视,然后花两到两千分钟的时间寻找一些东西。

观看,无论你往哪里看,都是内容。所以我打开了Netflix。首先显示的是《地铁》,更多的是《水印卡达的传说》,我觉得,不,谢谢。

可能不适合我。对水印卡达没有冒犯的意思。我只是不知道然后我们看到我的继续观看列表,一些新的Netflix热门节目,因为我观看了《破产姐妹》所以进入了这个二元电视节目。

今天我的热门选择,比如八个玫瑰下降。它给了我个性化的推荐。然后我们看到一些浪漫的收藏。

我的列表,古怪的电视节目,滑稽的喜剧,你的下一个观看,备受好评的电视节目。这些都差不多。我们在这里做什么?我不明白。

那是其他的。好吧?我们有一个整体,它首先需要很长时间才能加载,然后我们得到服装。我的巡演,这对我来说没有机会,嗯,我们得到了一堆直播内容和真正关心的电视节目,对我来说,服装我的巡演再次一堆犯罪纪录片,我的妻子,家庭节目,短于电影,对我来说。

继续观看任何提名作品,因为我看过《你的母亲》热门节目,另一个关于同一热门节目的推荐,正在流行的、新添加的电视节目、完整的系列喜剧、新添加的电影。这些就像……谁戴帽子?这些都不像真正针对我的,好吧。现在我们试试Max。

Max首先向我展示了CNN节目,然后是《与巨人硬碰硬》,我会观看并非常喜欢,嗯,推荐给我的在顶部,我欣赏它们,继续观看今天的选择,实际上是《权力的游戏》和《正义联盟》以及《蛋糕人》和一部纪录片,这感觉像是我,然后是一堆热门节目,直播、犯罪、设计之家,好吧,这感觉更像是我。但它仍然只是像,这里有一些我们在Max上拥有的东西,这就是氛围,就像你想看这个吗?这里有一些东西。

就像我说的,有很多东西,但这里没有任何东西告诉我应该看什么。事实上,这在我看来是人工智能应该能够做得非常好的事情。风险很低,因为如果模型没有推荐客观上完美的东西,或者它甚至编造了一部电影,因为这些系统往往会编造很多东西,这不是什么大问题,对吧?

我只想能够告诉聊天机器人我想要什么,然后得到一些推荐。公平地说,现在实际上有很多方法可以做到这一点。你可以用ChatGPT做到这一点。有什么电影像《碟中谍》或《谍影重重》,但不是这两部电影中的任何一部?

你可能会喜欢《天幕杀机》。这是一部詹姆斯·邦德电影。

我看过所有邦德电影。还有什么?

在这种情况下,你可能会喜欢《碟中谍5:神秘国度》。这是一部风格化的间谍电影,有很多动作和幽默感。与《碟中谍》和《谍影重重》相似。

ChatGPT中也有很多插件,自定义GPT明确为此而设计,尽管它们大多只是在相同答案的基础上进行了更好的格式化,对吧?我的意思是,MoviesGPT,它本身,我去MovieClipDia,所以就这样吧。我刚看完《疯狂愚蠢的爱》,很喜欢。

有什么类似的电影我可能没看过?它说,如果你喜欢《疯狂愚蠢的爱》,你可能会喜欢《五年之约》。这部由尼古拉斯·斯托勒执导的浪漫喜剧电影,主演是杰森·席格尔和艾米·波勒,讲述了一对夫妇长期订婚的起起伏伏。这部电影融合了幽默和感人的时刻,以一种既动人又有趣的方式探索了恋爱关系的动态,类似于《疯狂愚蠢的爱》。我会接受这个。你也可以使用其他人工智能系统,比如谷歌。谷歌人工智能,有哪些经典的80年代动作电影是我必须看的?

80年代是动作电影的黄金时代,创造了一些影史上最具标志性的角色和令人难以置信的台词。以下是几个你不能错过的经典之作:《虎胆龙威》(1988年)。布鲁斯·威利斯用这部电影重新定义了动作英雄。

我们可以不用听这个,但是注册,《虎胆龙威》、《洛杉矶大逃亡》、《终结者》、《铁血战士》、《比弗利山警探》。它说,这只是80年代众多优秀动作电影的一小部分样本。还不错。

我不知道。我并没有从中学到任何新的电影,但这算是一个不错的开始。这些模型会很乐意为你提供电影推荐,你可以用非常自然的语言向它们提出请求,这是核心。所以你不必只搜索电影或类型。你实际上可以说,我想要一部时长不到两小时的浪漫电影,这部电影有趣且不悲伤,你就会得到。

《疯狂愚蠢的爱》怎么样?这是一部浪漫喜剧,它既有趣又温馨,不会让人悲伤,我刚看完……

很棒的推荐。但是你可以给我一个不同的吗?

当然。那《我恨你的十件事》怎么样?这是一部有趣而迷人的浪漫喜剧,时长不到两小时。它是莎士比亚作品《驯悍记》的现代诠释,有很多精彩的时刻。还不错。

对吧?它并不完全具有突破性。像《疯狂愚蠢的爱》和《我恨你的十件事》这样的新标题想法,你可以在谷歌上找到。

但这些都是不错的推荐,并且这种互动中有一些重要的东西。我认为这实际上是人工智能的一个重要信号。

这对我来说可能是一件大事。多年来,我一直问人们关于推荐的问题,多年来,我得到的答案大致相同。推荐很难做得很好,非常非常难。

我们随着时间的推移发现的最有效的方法基本上是说,好吧,你喜欢这组东西,我们知道这一点,因为你对它们进行了高度评价,或者多次观看它们,或者做了其他让我们确信你喜欢它们的事情。也许你给了我五星评价。还有一些其他人也喜欢这组相同的东西。

哦,他们也喜欢你还没看过的另一件事。所以我们打赌你也会喜欢那件事。很简单。

这就是推荐一直以来的运作方式。但这确实有效。但人工智能有可能以完全不同的方式来解决这个问题。

所以一般来说,人工智能似乎是两种组件的良好工具。

对吧?这是戴安娜·普皮斯,一位开发者和企业家,最近启动了一款名为Movievander的人工智能电影推荐工具。

我们是哈里·贝特的忠实朋友,对吧?我们开玩笑说,你知道,电影必须选择你。这不仅仅是你选择电影,对吧?你知道,所以我们说,这听起来像Movievander,你知道,选择你的人,所以我们说,好的,魔法加上这种概念,Movievander听起来真好。这就是名字的由来。

我有一个很棒的名字。但回到这两个组成部分。人工智能真正擅长做的第一件事就是组织数据。如此多的数据,所有流派和演员姓名以及你通常与电影相关的任何东西,以及所有其他各种东西。

人们可能给出的任何反馈,我们可能会阅读它,Twitter、Facebook,任何社交媒体。我们提供了我们认为正确的更多信息。每一次点击,我们都在做的事情,它正在进行,它正在进行,它正在提供的信息会传到某个地方,它以某种方式与其他信息交互,并产生某种行为,这些行为很容易被纳入人工智能中进行学习。

第二个组成部分是,人工智能可以为你组织这些数据,并将所有这些文章、评论、推文、编辑帖子以及其他所有内容转换成某种类似于可用的信息数据库。

所以如果我说我想看一部有狗的电影,而且它不悲伤,拜托,因为我是一个非常敏感的人,所有这些事情,不知何故,它正在与已经在互联网上飞行的信息进行交互,以及这些生成式人工智能是如何工作的。我们并不完全确定最近戴安娜和……

其他人对人工智能感到兴奋,因为它能够理解所有关于电影和节目的信息,否则这些信息实际上并不存在。为了解释我的意思,我们必须稍微谈谈数据和元数据。多年来,在我与这个领域的焦点人物交谈的过程中,我了解到,关于节目或电影,基本上有四种有用的信息。

首先是元数据,这只是关于事物本身的信息,它的名称、谁在其中、谁导演了它、海报。这些是你可以在IMDB搜索中找到的东西。第二件事是观看数据,一个人能给你关于他们对某件事感觉如何的最佳信号是他们如何观看它。

他们是否完整地观看了它?他们是否中途关闭了它?他们是否每晚连续观看它十二个晚上?他们是否看了一半?然后,账单,这都是非常非常有用的信息。

但是这些信息并不存在于任何真实的规模上,至少对于流媒体服务而言是这样。它肯定不存在于公开场合。Netflix知道你在Netflix上做了什么。

谁在Hulu上做什么?Max在Max上。Peacock在Peacock上。

但他们不知道其他所有内容,观看数据,即使是你有时从这些服务中看到的那些最受欢迎的标题列表,也是一个非常严格保守的秘密。这是至关重要的数据,没有人愿意分享它。第三件事只是推荐的东西。

老实说,这有点被低估了,根本不是人工智能的故事。但是你得到的推荐只会和你所能推荐的东西一样好,对吧?即使你确切地知道我喜欢什么,但这只有在你能够提供给我那件东西的情况下才重要。

大多数流媒体服务都有几千个节目和几千部电影。老实说,有时甚至没有那么多。理论上,即使有人拥有有史以来所有可用的电视节目和电影的完整库,它也不是一个非常大的库。

IMDB的库包含68.5万部电影和26.5万部电视节目,这很多,比你一生中能看的还要多。但这与每天上传到TikTok、YouTube和Instagram的内容量相比,简直微不足道。

关于电影和节目,第四个重要的信息。也许是最难的,也许对人工智能来说最有趣的是,你可以称之为特征,关于事物本身的深入信息,不仅仅是谁在其中,或者它是否是喜剧或惊悚片,而是比这深一层、两层或三层。那是一部悲伤的电影还是一部快乐的电影?它的节奏快吗?它的节奏慢吗?

它需要一段时间才能吸引你吗?还是它能立即吸引你?配乐很棒吗?还是配乐很糟糕?

这是一部你一边看手机一边可以看的电影吗?这是一部你可以在沙发上睡着的电影吗?这是一部你应该独自观看的电影吗?读者,这确实很重要。这是关于标题的信息,除非你真正了解事物本身,否则很难知道。我认为理解这在实践中可能是什么样子的最简单方法是通过音乐,实际上音乐在2021年就做对了很多这些事情,我采访了Gustaf Alströmer,他现在是Spotify的联席总裁,关于该公司的推荐系统。他实际上完美地描述了整个想法。

如果你实际上没有对人类内容进行时间推移,那么你就可以利用实际上能够机器收听内容、转录它并理解它的优势。然后,这个问题实际上与文本推荐非常相似。

如果你仔细想想,那么我们想让音乐与众不同的地方有几件事。在音乐中,我们有这些,你的手机和数十亿的播放器,人们手动设置,组织世界,将7000万首曲目组织在一起,就像它们是如何组合在一起的。播客没有这样的东西,甚至在竞争平台上也没有,对吧?所以我们必须以某种方式进行引导。

0 我们一开始做的就是构建所谓的知识图谱,跟艺术家图谱非常相似。这位艺术家有这些专辑,这些歌,你知道,属于这些流派。所以在我们拥有收听数据之前,我们就开始构建知识图谱,一个传统的知识图谱。

然后我们开始向其中添加收听数据,这样我们就能看到听这个的人也听那个。所以我们开始构建一个相当简单的系统,一种硬编码的图。然后,好吧,现在我们有很多收听数据了,我们开始使用更多基于机器学习的算法进行推断,既有基于内容的,也有传统的协同过滤,人们听这个,也听那个,这有点像播放器所关心的,人们,播放器。

这也是播放器方面。但我们也开始添加更高级的技术,比如让机器实际收听内容并对其进行总结,以便我们能够进行诸如播客主题搜索之类的操作。而且实际上,我们不仅仅是查看标题。

我们实际上是在收听内容,或者说阅读内容的转录文本,并对其进行总结。然后我们将它放入所谓的嵌入空间中,以了解它与其他事物有多相似。

那就是魔法所在。这种组合是每个人似乎都同意最佳效果发生的地方。顺便说一句,当他谈到机器收听时,他指的是Spotify拥有的技术,这种技术实际上可以自动将歌曲分解成其组成部分。

因此,有了这项技术,Spotify的计算机可以识别这首歌的节奏是每分钟110拍。它有强劲的吉他旋律,有小提琴,女声主唱,反向氛围等等,还有许多其他内容,大量不同的类别和分类器来描述这首歌到底是什么。而对内容层面某事物实际含义的理解,对于获得正确的推荐至关重要。

而这在视频中之前并不存在。实际上,这甚至都不可能实现。但就在最近,情况发生了变化。我们取得了突破。然后我会告诉你那是多么的伟大。

本节目的支持来自美国公民自由联盟(ACLU)。ACLU确切地知道第二个唐纳德·特朗普任期会带来什么威胁,他们已经准备好应对这场考验。ACLU对第一届特朗普政府提起过434次法律诉讼,他们将再次这样做,以保护移民权利,捍卫生育自由,维护言论自由,并为我们所有人的基本权利和自由而战。今天就加入ACLU,帮助阻止极端主义的“2025议程”。访问aclu.org了解更多信息。

欢迎回来。让我告诉你一个AI的突破。因此,在今年2月,谷歌推出了其最新的AI模型,称为PaLM 2。PaLM 2拥有新AI模型通常具备的所有特性:速度更快,更智能,在基准测试中表现出色,所有这些它都具备。

但其最大的新特性是一个新的上下文窗口,它基本上指的是模型在单次查询期间可以获取并考虑的信息量。例如,一个标记是几个字母。PaLM 2可以处理一百万个标记。

那就像一本书。你可以一次性输入一本书。或者,正如谷歌在一个演示中展示的那样,是一部电影。

该公司用一部45分钟的Buster Keaton电影《Charlot Junior》演示了PaLM 2。这部电影包含696417个标记。如果你好奇,可以听听演示过程。

在Google AI Studio中,我们上传了视频,并询问:“找到从人物口袋中取出纸张的那一刻,并告诉我一些关于它的关键信息以及时间码。”

然后整个过程花了整整1分57秒。答案是:

该模型给出了这样的回应,解释说这张纸是高盛公司的经纪人提供的认购券,上面标注了日期和成本。它给了我们时间码12:01。当我们调出该时间码时,我们发现它是正确的。该模型找到了人物从口袋中取出纸张的确切时刻,并准确地提取了文本。

我记得第一次看到这个演示时,我完全被它震撼了。这是一个AI模型,第一次处理整部电影,并在不到一分钟的时间内识别出其中的某一事物。那里还有一个其他的演示。

接下来,我们给它看了一幅我们正在考虑的场景的图画,并询问:“这个场景发生的时间码是什么?”

这幅画就像一个粗糙的简笔画,我认为是一个水塔,一个棕色的大家伙,有两条腿。下面一个人。被水喷到,要么是UFO绑架了某人,要么是一个水塔。无论如何,效果如下:

该模型返回时间码15:34。我们调出该时间码,发现它是正确的场景。像所有生成模型一样,响应会有所不同,并不总是完美的。但请注意,我们不必解释图画中发生了什么。像这样的简单图画是测试模型是否可以仅根据一些抽象细节找到某事物的好方法,就像我在这里做的那样。

这显然只是一个测试演示,大多数事情并非如此简单和完美,但这个想法的可能性是巨大的。突然之间,我们正朝着这样的世界前进:你可以将一部电影上传到AI模型,然后该模型可以开始理解它的一些信息。诚然,识别水塔比弄清楚电影的情绪和氛围更容易,但这仍然是在那条道路上迈出的一大步。

顺便说一句,这是一次充满版权侵犯和复杂法律问题的飞跃。但就我们今天的节目而言,我现在先把这些放在一边,因为很多即将出现的AI技术都将在法庭上决定。

但在那之前,这就是我们将得到的东西,这就是我们将要面对的。在整个AI推荐领域中,也许最核心、最棘手的问题是:什么才算是一个好的推荐?实际上,还有一个更大的问题。

你为什么喜欢你喜欢的?我举个例子,《王冠》,比如前几季,我非常喜欢,我不知道为什么,但我就是很喜欢。但我注意到,无论是在哪个流媒体服务上,它都开始向我推荐英国的节目,或者说英国皇室的节目,而我对英国皇室节目毫无兴趣。

有一些难以捉摸的东西,我不知道是什么。《王冠》前几季抓住了我什么?这就是棘手的地方。

那是David Sanderson。他是Reelgood公司首席执行官。Reelgood是那些告诉你可以在哪里流媒体观看某个节目或电影的产品之一。但它也正成为流媒体行业中非常重要的数据提供商。

正如我前面提到的,关于电视节目和电影,它们是什么,谁在其中,谁制作了它们以及你可以在哪里找到它们,根本就没有好的通用数据来源。我知道有一个,但事实是,数据根本不存在。因此,Reelgood有自己的消费者产品,你也可以使用,但它也是许多其他流媒体搜索提供商背后的数据库。

但想想那个例子,《王冠》或任何你喜欢的其他节目或电影,你是否因为明星而喜欢它?也许吧。也许这意味着你会看任何有这个人出演的电影。这是一个简单的推荐问题。

但是,你怎么解释有人喜欢《绝命毒师》,但不喜欢《风骚律师》;或者非常喜欢《卖房子的阳光》,但只看了第一季;如果你喜欢《权力的游戏》,是否意味着你会喜欢《龙族》或任何其他有龙的节目?或者是你喜欢宫廷阴谋?或者只是裸体的人?或者其中一个演员,但不是其他演员?

或者星巴克杯事件让你喜欢它,或者完全是其他原因?正如人们所说,萝卜青菜,各有所爱。但坦白说,我讨厌这样。我希望AI能帮我解决这个问题。

因此,Reelgood最近一直在尝试使用AI,主要是一种尝试解释你是否可能喜欢某事物的途径。这更像是一种非主动推荐,而是一种使用方式。我对这个感兴趣。

你认为我会喜欢吗?在他们的应用程序中,你进入一个标题,点击图标,它会根据它对你了解的信息,花几秒钟来分析你是否可能喜欢。所以在Reelgood应用中,它给我推荐的一个是《艾瑞克》,我以前从未听说过,一个悲伤的父亲,他的儿子失踪了,在与艾瑞克的友谊中找到了慰藉。

怪物住在艾瑞克·爱德华兹的床上。是的,这看起来有点像恐怖片。无论如何,我讨厌那个“我应该看这个吗”的按钮,它说它只是为我分析,它说,鉴于其6.9分的IMDb观众评分和Reelgood的79分,艾瑞克可能并不适合你。

然而,这部犯罪和剧情类型的节目与你对悬疑和剧情的兴趣相符,这部关于父亲寻找失踪儿子的悬疑故事可能会让你着迷,但床下怪物的元素可能不符合你的口味。然后如果我点击“关于”,它会建议类似的节目,它只是向我展示了一堆我可能喜欢也可能不喜欢的其他东西,包括《熊》、《推定无罪》、《阳光先生》和《龙族》,所有这些我都很喜欢。所以也许我需要看《艾瑞克》。当你考虑推荐的四个方面时:元数据、观看数据、观看内容和特征,Reelgood是一个非常有趣的案例。

它有很多元数据,这是它多年来一直在构建的数据库。它几乎没有观看数据,因为Netflix和其他公司不与Reelgood共享这些数据,就像其他任何平台一样。同样,所有这些其他推荐系统都迫切希望你告诉他们你喜欢哪些节目以及你看过哪些节目,以便他们能够尝试反向推导出一些观看数据。但它永远不会拥有像Netflix那样的网络。另一方面,Reelgood有更多可供观看的内容,更多可供你选择的东西,因为它的库包含许多流媒体服务。当谈到特征,即真正理解内容本身时,这很复杂,这是Alessia Public,负责Reelgood的工程和数据方面的人。

同样的事情,就像看一场比赛,对吧?这是一个完全不同的问题,一个更全面的问题?看看,好的,某个东西的架构是什么,以及类似的东西,比如由实际的人制作的,现在是电影和肩膀。他们就像在看架构,以及它们的心理学。这可能就是我们喜欢电影的原因,喜欢角色的架构,我的意思是,我会说外星人是最好的,他们能解决这个问题,因为你不需要同时查看如此广泛的技术知识才能进行这种分析,就像人类那样。但我认为我们距离达到这种分析水平还有很长的路要走。

即使是在最好、最强大的情况下,Alessia 也怀疑我们能否教会大型语言模型(LLM)完全、深入地理解电影和节目,以及理解人们为什么喜欢它们。

我知道那些喜欢LLM的人认为它们像人类一样思考。我不认为是这样的。让我们这么说吧。但即使一秒钟后,我们仍然不像人类那样感知世界。人们给它们提供的是如此不同方式的数据。而且,我们提供给它们的数据是如此有限,缺少如此多的上下文,即使你给它们一千年的数据,它们仍然只是个体。想象一下,想想你观看电影和节目的方式,对吧?这是一种情感理解,你真的会产生感觉,因为你也在看,这取决于你和谁一起看电影,以及总是,Caterina,允许它们的数据不像,它不需要更聪明,就像生活在一个盒子里,对吧,我们这些生活在现实世界中的人,对吧?所以问题的一部分是这使得它变得困难得多,让它达到那个点。

Alessia还表示,她想知道深入研究这个兔子洞到底有多大用处。例如,如果一个模型知道你喜欢一部电影,而恰好在这部电影的4分6秒处有一只鸟,这是你为什么喜欢这部电影的原因吗?不,显然这不是你为什么喜欢这部电影的原因。对于我们的目的来说,这种细节基本上是完全无关紧要的,这是一种为问题寻找解决方案。但如果第一级理解只是标题、类型和演员阵容,那么现在可能还有第二级同样有用。

对吧?这就是我们正在使用的。但我们正在研究的,我认为是第二级,是内容的情绪。所以。

如果这是指人们在看电影时的情绪,这是一个第二维的问题,也是他们目前最积极关注的问题,因为它在某种程度上是可以解决的,对吧?你可以深入研究每个角色的架构。但快速总结一下,我会在下一次再详细讲解。所以,你是一个喜欢剧情片的人,我们正在关注这些。

在本期The Vergecast节目中,我们探讨了电视和电影推荐为何如此复杂,以及人工智能能否改进推荐。如果Spotify可以创建你喜欢的无限播放列表,YouTube和TikTok似乎总能提供完美的内容,为什么Netflix、Hulu或Max却做不到呢?如果你想了解更多关于我们在本期节目中讨论的内容,以下是一些入门链接: Movievanders Reelgood 互联网是一个持续推荐的机器——但它需要你让它工作 Netflix的Greg Peters关于新的文化备忘录以及广告、人工智能和游戏如何融入其中 来自Scientific America:推荐算法的工作原理——以及它们为什么可能会错过目标

<raw_text>0 请注意,内容本身的情绪和你观看它时的情绪都有关系,直到有人提到它,我才真正想到它。但是,这里有很多等式,而且推荐之所以如此困难的真正原因是,每当我坐下来看东西时,我的心情都会改变一切。是的,我喜欢间谍电影,但我并不总是想要一部间谍电影。

是的,我喜欢历史纪录片和愚蠢的浪漫喜剧,但如果你试图让我在星期二晚上观看二战纪录片,而我只是想看一个美食节目,那上帝保佑你,你知道吗?我的意思是,我觉得推荐可能永远不会完美,而且它们永远不会每次都找到正确的东西,因为我不希望每次都看相同的东西,我是一个人,而电脑不是。这可能永远是一个问题。那么,在我的寻找好东西观看的任务中,这一切都让我在哪里呢?我陷入了困境。

节目的支持来自坩埚时刻,这是范围资本的一个播客。我们都经历过人生的转折点,我们做出的决定最终会产生持久的影响。没有人比当今一些最具影响力、最令人难以置信的公司创始人更了解这一点。

让我们让听众了解那些定义了Dropbox、YouTube、Robinhood等主要公司的成败事件,这些事件由创始人自己讲述。收听第二季的关键时刻。今天,你可以在crucialmoments.stop.com或你收听播客的任何地方收听。

好的,让我们回到Movievanders,我们正在讨论的人工智能电影推荐服务。我只是快速问了一下Ana Pop,人们目前是如何使用这项服务的?他说,人们基本上在做两件事。

一个是,你可能已经心中有了一部电影,一部你已经看过的电影。这种情况经常发生在我身上,我知道很多人也喜欢这样做。我们看他们可能几年前看过的电影,他们甚至非常喜欢,但他们不记得名字了。

他们确实记得电影的某些元素,例如,他说,为了帮助纽约人出去,你知道,主角之类的东西,对吧?所以他们把这些输入进去,找到那部电影。所以他们在寻找……

一部特定的电影,但他们不知道那是什么。

他们不记得确切的名字了。所以那是查找选项,然后还有一个推荐器,就像我不知道我到底在找什么。我没有需要看的特定电影,但我想让它包含某些元素。

你可以深入到任何程度,对吧?你可以做得越好,你的请求越具体,结果就越好。所以你不必担心如果我提供了太多细节,就找不到任何东西,因为最终,如果你这样做的话,你会更准确。

当然。我的意思是,我可以自己搜索一些参考。我喜欢,因为他们有一个小孩,我喜欢汽车电影。所以我在想,我喜欢汽车。故事很好,但我不喜欢角色是汽车的事实。

有没有任何电影有那种故事,但没有汽车,比如好人,而Movievanders的结果非常好,你知道吗?我当时想,哦,是的,是的,当然,我想看他们解释的那些电影,这是真的。这确实是一个非常深刻的问题,我想要这个故事,但不是用汽车,而是用人。而且我很惊讶,人工智能达到了这种理解程度,以至于我不知道,我做了一些情节之间的比较,并说,哦,这两部电影之间有一些共同点。

最后一点实际上非常令人印象深刻,而且非常具有说服力。如果你现在去谷歌,然后你只是说,有哪些电影像《汽车总动员》?但主角是人,你要么得不到任何有用的东西,要么得到一个指向电影《汽车总动员》的链接。

它可能是电影《汽车总动员》。但人工智能的想法是,它可以浏览所有评论、所有突触大小、所有推文,然后说,哦,这部电影的讨论方式与人们讨论《汽车总动员》的方式一样,但它似乎没有任何汽车。

也许这会奏效。这是除了人工智能之外,没有其他系统能够很好地做到这一点,并且能够大规模做到这一点的事情。在我提到的第一个例子中,坦率地说,人工智能模型已经相当不错了,因为它们已经吸收了所有这些摘要、评论和转折等等。

他们可以很好地猜测你在寻找什么,只需综合来自网络各地的信息。所以,当你问,“吉姆·凯瑞主演的那部有船的电视剧是什么?”时,它会很快找到《楚门的世界》。

这与其说是推荐,不如说是非常方便。就我个人而言,我使用这些AI工具已经超过一年了,试图找到一些东西来看。我发现了一些真正有效的技巧。

第一个是“展示类似的东西”选项。我添加三部我喜欢的电影,并告诉模型找到其他类似的电影,这非常有效,这实际上是有道理的。这些模型已经学习了……

所有那些最佳间谍电影列表等等,可以轻松比较你在IMDB上找到的摘要。因此,将事物与类似的事物匹配实际上非常容易。但问题是,它通常会吐出非常明显的例子。

如果我喜欢《回到未来》、《万物皆允》和《我嫁给了一个杀人犯》,你认为我还可能喜欢哪些电影?

你可能会喜欢《十亿个脑袋》、《无限》、《冒险》、《热水浴缸时光机》和《斯科特朝圣者大战全世界》。

所以在这种情况下,我会做的是添加,但只推荐不太知名的作品,或者我只要求水下电影。这通常会列出一些最不为人知的作品。如果我喜欢《十一罗汉》、《绅士》和《火线追击》,有哪些被低估的电影?你认为我可能会喜欢?

你可能会喜欢《蛋糕师》、《内幕》和《城中》。这些电影有强大的、更高的……

我都看过这些了。给我更多被低估的例子。

当然。比如《简单的计划》、《银行抢劫案》和《枪火》?这些电影有引人入胜的故事和巧妙的转折,应该会吸引你。

好的,谢谢你。我现在做的另一件事是尝试只要求我想要的那种氛围。就像,这是我最近经常使用的一个提示。你能推荐一部好的浪漫喜剧吗?最好在九十分钟以内,而且不需要动太多脑筋?

当然。这里有一部完美的浪漫喜剧适合你。《赢得与泰德·汉密尔顿的约会》(2004年),时长轻松的84分钟,是一部轻松愉快的电影。它讲述的是罗茜(凯特·波茨沃斯饰),一个住在小镇的录像带店店员,她参加了一个赢得与巨星泰德·汉密尔顿约会的比赛。乔什·杜哈明……

它好吗?

《赢得与泰德·汉密尔顿的约会》是一部经典的浪漫喜剧,更注重魅力而非情节。它有一些可预测的元素,但其轻松幽默和凯特·波茨沃斯和乔什·杜哈明的表演仍然令人愉快。

它有点管用。我不知道这些是不是完美的推荐的理想典范,而且很多电影都很糟糕,但我到目前为止运气不错。正如我之前所说,我喜欢这种AI的使用方式,因为它风险很低。

如果它推荐一部我看过的电影,我就说我看过了,然后要求另一部,实际上将这些数据添加到我的搜索中通常会得到更好的结果。如果它推荐一部不存在的电影,公平地说,在过去一年左右的时间里,这种情况只发生过一两次,这很快就会变得很明显。我就继续前进。

我通过这种方式找到了很多好东西来看,它消除了我晚上很多漫无目的的浏览,仅仅因为这一点我就非常感激。它做不好的事情是匹配到我刚刚观看的和Reelgood之类的。这就像,我可以在哪里做这件事。

我必须得到一个推荐,然后去另一个地方才能找到我实际可以观看的地方。但这些问题很容易解决。像Movievanders这样的公司实际上已经开始将这两部分结合在一起了。

但在与很多人谈论这个问题之后,你知道我最棒的推荐是什么吗?那就是尽可能多地在尽可能少的服务上观看内容。因为我从每一个我交谈过的人那里听到的事情是,预测你接下来要看什么最好的方法就是你之前看过什么。如果你想要很棒的推荐,你需要一个观看历史记录。

这就是为什么YouTube和TikTok的推荐如此之好的原因,因为他们知道你看了什么。你看很多东西。你很快就会看完。这些系统能够构建一个关于你喜不喜欢什么的内部模型,而当你把观看分散到十个不同的流媒体服务时,这要困难得多。

如果你有精力和勤奋,坦率地说我没有,在Reelgood或JustWatch或Letterboxd之类的平台上维护你的个人资料,你可以在那里跟踪你所有看过的一切,也是获得良好推荐的一种极佳方式。你输入的数据越多,特别是那些有强烈信号的高评价以及你说你很喜欢某部电影等等,这些都非常重要。我认为最终我们可能会得到能够像人一样了解我们,能够深入而丰富地了解电影和节目的人工智能,并且实际上每次我们打开电视时都能推荐完美的东西,或者至少是一些完美的东西。

但我感觉这还需要一段时间。人工智能1.5的演示版并不是我们很快就会开始查询电影的方式。我认为,就目前而言,如果你想让Netflix或Peacock或其他任何公司为你找到一些很棒的东西,你可以在这些服务上做的最好的事情就是把你看过的东西从头到尾一遍又一遍地反复观看。听起来技术含量很低,但我不得不说,这并不是世界上最糟糕的工作。

好的?这就是今天关于The Vergecast的判决,这也是我们人工智能迷你系列的结束。感谢所有参加节目的嘉宾。一如既往,感谢您的收听。