We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Inside the AI memory machine

Inside the AI memory machine

2024/7/14
logo of podcast The Vergecast

The Vergecast

AI Deep Dive AI Chapters Transcript
People
D
Dan Siroker
D
David Pierce
知名技术记者和播客主持人,专注于社会媒体、智能家居和人工智能等领域的分析和评论。
Topics
David Pierce: 我个人对AI记忆工具非常感兴趣,因为我患有阿法吉亚症,无法在脑海中形成图像,这让我对能够在脑海中想象图像的人感到好奇,也让我更加渴望借助科技来弥补我的记忆缺陷。我认为,能够记住我生活中的一切,并在需要时将其呈现给我,这样的AI工具将彻底改变我的生活,尽管这其中存在巨大的隐私和数据安全问题。未来的人们可能会对我们今天遗忘大部分事情的生活方式感到震惊。AI 的潜力在于,它不仅能够帮助我们找到信息,还能帮助我们基于已有的信息创造新的内容。个性化 AI 隐私悖论:为了构建更有用的个性化 AI,需要记录更多上下文信息,但这会引发更多隐私问题,从而需要更强大的数据保护措施,而这反过来又会使构建更个性化的 AI 变得更加困难。我更喜欢那些允许用户选择需要记住的内容,并由 AI 自动整理的记忆工具。即使无法在脑海中看到图像,也能通过 AI 工具找到它们,这已经足够好了。 Dan Siroker: 人类非常擅长遗忘,我们的记忆会随着时间推移而衰退,也会因为注意力不集中而遗忘,并且我们的记忆会受到偏见的影响,并不完美。我们已经习惯了依靠科技来记住一些事情,例如电话号码和路线,而我们并没有因此感到不便。拥有完美的记忆力,无论是在人际关系还是生产力方面,都将带来巨大的改变,就像我们如今无法想象没有眼镜或隐形眼镜的生活一样。Limitless 最初的产品是一个会议机器人,用于记录和转录 Zoom 会议。用户的需求推动了 Limitless 产品的迭代,从会议机器人到能够记录更多生活内容的应用。大型语言模型的出现,特别是 GPT-3 及其后续版本,极大地提升了 Limitless 产品的功能,使其能够更好地利用已有的数据进行信息检索和内容生成。成功的个性化 AI 产品应该专注于解决用户的实际问题,而不是炫耀技术本身。Limitless 的目标是帮助用户节省时间,提高效率,并专注于他们擅长的事情。AI 可以帮助用户克服“从零开始”的困难,例如撰写文章或发送电子邮件。AI 可以帮助用户更好地记住和利用会议内容,例如会议摘要和后续行动。AI 记忆工具的目标是解决问题,而不是简单地帮助用户记住事情。AI 可以帮助用户进行自我反思和改进,例如分析他们一天中情绪变化、人际交往模式等。目前大多数 AI 记忆工具都专注于商业用途,因为商业场景中的数据更容易收集和处理。Limitless 的挂件旨在捕捉更多人际间的对话内容。Limitless 的挂件可以帮助改善人际关系,减少因误解和遗忘造成的冲突。很多人像僵尸一样生活,从未想过如何改善自己的生活。用户可以根据自己的需求选择是否使用 Limitless 的挂件。使用 AI 记忆工具是一个选择,就像选择是否戴眼镜一样。微软 Recall 的隐私问题反而为 Limitless 创造了市场机会。

Deep Dive

Chapters
Humans struggle with memory, but AI offers potential solutions. Microsoft's Recall, Apple's Personal Intelligence, Google's AI, and various startups aim to enhance memory by storing, organizing, and retrieving information.
  • AI can store, sort, and recognize vast amounts of data, potentially revolutionizing personal memory.
  • Privacy and data security are major concerns with AI memory tools.

Shownotes Transcript

人类非常擅长遗忘。在本期The Vergecast节目中,我们与一位长期致力于解决这个问题的人进行了交谈:Limitless的首席执行官Dan Siroker。我们讨论了构建优秀的记忆辅助工具需要什么,我们将来如何使用它们,以及为什么这么难做到正确。我们还讨论了其中的人性方面——当我们不再遗忘事情时,我们的生活会发生怎样的变化?当实际上是AI模型在记住朋友的生日时,这会有所不同吗?这些工具最终真的能在工作之外发挥作用吗?像Limitless这样的工具发展迅速,改进也很快,我们将不得不弄清楚如何与它们共存。 延伸阅读: 《纽约时报》:你无法在脑海中看到图像吗?你不是一个人。

Recall是微软解锁PC未来的一把钥匙 微软无所不知的Recall AI功能被推迟 Pixel 9的“Google AI”类似于微软Recall,但没那么令人毛骨悚然 苹果宣布推出iOS 18,其中包含新的AI功能和更多可自定义的HomeScreen Notion AI可以自动为你撰写笔记、议程和博客文章 请发送电子邮件至[email protected]或致电866-VERGE11,我们很乐意收到您的来信。了解您的广告选择。访问podcastchoices.com/adchoices</context> <raw_text>0 The Vergecast 的支持来自 Stripe。Stripe 是一个支付平台,为全球数百万家企业提供支持,其中包括 Uber、BMW 和 DoorDash 等公司。Stripe 已帮助无数初创企业和老牌公司实现增长目标、在减排方面取得进展以及覆盖更多全球客户。该平台提供了一套专门的功能和工具来加快增长,例如 Stripe Billing,它使处理基于订阅的收费、发票和所有相关的收入管理需求变得容易。您可以在 stripe.com 上了解 Stripe 如何帮助各种规模的公司取得进展,访问 stripe.com 了解更多信息,对,取得进展。

欢迎收听 The Vergecast,这是关于全面回忆的旗舰播客,但指的是概念和电影,只是第一部电影,而不是续集。无论如何,我是 David Pierce,这是我们最新系列的第一集,全部关于 AI。我们现在谈论 AI 很多,而且很多内容都很抽象。

AI 是一个庞大而混乱的概念,很容易迷失在其中的所有理论和后果中。当然,这些事情很重要,非常重要,但我们也希望尝试获得一些关于 AI 的实际用途以及它是否真正有用的第一手资料。今天,我想谈谈 AI 的一种用途,它突然出现在各处。

它有很多名称,微软称之为 Recall。使用 Recall,我们将利用 AI 的强大功能和新的系统性能来实现它。您在 PC 上见过的几乎所有东西,苹果称之为个人智能。

它了解您照片库中的人物,因此您可以直接要求照片创建一部关于 Leo 学习钓鱼的电影。

对于谷歌来说,这是德国最重要的功能之一。你还记得在哪里看到我的眼镜了吗?

是的,我记得。你的眼镜在桌子上的红色苹果旁边。还有……

许多初创公司、企业公司和其他公司。你可以想象很多公司都在做类似的事情,他们称这个功能为任何你想要的名字,但他们的目标都是一样的:记住你需要记住的一切,并在恰当的时刻以恰当的方式将其反馈给你,作为一个想法。

我觉得这非常引人注目。我认为我比大多数人更觉得它引人注目。我患有一种叫做aphantasia的疾病,这意味着我无法在脑海中看到图像,例如,如果我现在告诉你一张苹果的图片,你会想象出各种各样的东西。

也许你会看到一个色彩鲜艳、细节丰富的苹果,上面有叶子和茎,周围还有整个宇宙。或者你可能只看到一个卡通风格的苹果,就像你见过的最简单的苹果。也许你只是在脑海中看到苹果的粗略形状。

如果你像我一样,你什么也看不到,一片漆黑。我可以告诉你苹果是什么样的。我知道苹果是什么样的,但我无法在脑海中看到它。

说实话,我一直以为,当人们谈论在脑海中想象东西时,他们并不是字面意义上的,这让我难以理解。直到今天,每当我想到人们可以在脑海中随意想象图像并看到它们时,我都无法理解。而那些能看到图像的人也无法理解我为什么看不到。

大脑很奇怪。关于像我这样患有aphantasia的人似乎是真的,那就是我们不一定拥有特别好的视觉记忆。例如,我无法凭空想象出我童年家园的照片。

你知道,我记得很多事情。需要明确的是,我不认为aphantasia是一种残疾,而是一种大脑运作方式的不同,但我就是没有那种视觉记忆。所以这些年来,我一直非常依赖技术来帮助我解决这个问题。

我拍了很多照片,我喜欢手机和 Google 相册中所有“这一天”和自动生成的相册。这些年来,我尝试更多地写日记,因为回顾文字、图片和视频确实能让我回到过去,比闭上眼睛试图回忆某件事要好得多。任何认识我的人都会告诉你,我是一个痴迷于做笔记和列清单的人,因为这有助于我保持生活的井然有序,这就是我们如何记住事情并回顾事情的方式。

所有这些都是为了说明,像这些公司描述的那种工具正是我梦寐以求的东西,它可以记住我读过的每一篇文章、收到的每条消息、我需要做的每一件事、遇到的每一个人、去过的每一个地方以及我生活中发生的任何其他事情,然后既存储所有这些信息供我访问,又在需要时向我呈现这些信息,这将彻底改变我的生活。显然,这其中涉及到巨大的、复杂的隐私和数据安全问题,以及所有这些是如何运作的。我想谈谈这个。

但这是 AI 实际上相当擅长的一件事,即存储、排序和识别海量数据。如果这些数据可以是我的生活呢?我想了解一下实际实现这一目标需要什么。所以我给一位长期致力于此的人打了电话,Dan Siroker。

Limitless 的联合创始人兼首席执行官。

这是 Dan 的简短介绍。他大学毕业后在谷歌工作,然后创办了一家名为 Optimized 的公司,并在 2020 年将其出售。在此期间,他开始失去听力,正如他向我描述的那样,他有一种非常直观的体验。

他第一次戴上助听器时,他告诉我他感觉就像获得了超能力。他开始寻找其他方法来赋予自己和其他人类似的科技超能力。他最终选择了记忆。

作为人类,我们非常擅长遗忘。随着时间的推移,我们会忘记事情。我们会立即忘记事情,因为我们在学习时根本没有注意。

我们会记住一些事情,但我们可能不记得它们来自哪里。我们会选择性地记住事情,因为我们对所有事情都有特定的偏见。有些人比其他人记忆力更好,但没有人的记忆是完美的。Dan 认为他或许可以帮助解决这个问题。

他从这个想法开始。好吧,如果助听器用于听力,眼镜用于视力,那么记忆的等效物是什么?

Limitless 的第一个版本实际上被称为 Rewind,你可以将其安装到你的 Mac 中,它会立即开始通过你的麦克风捕捉音频,还会不断截取你屏幕上正在进行的操作的屏幕截图。这项基本技术非常简单,对吧?捕捉音频片段,拍摄大量屏幕截图。

在试图弄清楚你在电脑上做什么方面,它能让你走得很远。然后问题就变成了如何利用所有这些?对某人来说,一开始这意味着什么才能拥有更好的记忆?这是 Rewind 面临的重大问题。

最好将其比作一个类比,就像今天有很多事情你记不起来,但你很高兴有技术来帮你记住。一个很好的例子是电话号码,你上次在手机上输入实际电话号码是什么时候?

现在你只需要打开手机,点击那个人的名字就可以了。在我年轻的时候,有一段时间我必须记住每个人的电话号码,这样我才能给他们打电话。同样,在出行方面,我们生活中也有一段时间需要记住路线,我们需要记住如何导航世界。

现在我们只需要告诉电脑我们想去哪里,它就会实时地给我们指路。我们可以利用它。就像我们对这些事情的记忆一样,我用这些作为非常基本的例子,我们一点也不想念它们。

我们生活中还有其他类似的事情,我们甚至没有意识到我们忘记了,因为我们的记忆力很差。你知道,一个很好的例子是,如果我认识一个人,然后几个月后我们再次见面,你的孩子多大?知道这些细节实际上有助于建立联系和联系,让我们彼此感觉更有人情味。

让你的电脑帮你记住这些事情看起来可能很机械化,但它们也创造了一种令人惊叹的联系,如果你想象一下,想象一下一个拥有完美记忆的世界,你可以在联系方面、生产力方面做些什么。同样,想象一下,如果你今天戴着眼镜或隐形眼镜,你能想象一天不戴它们吗?就像,你为什么要让你的生活变得模糊不清?记忆也是如此。你为什么要让你的生活在模糊的记忆中度过?

这是一个非常有趣的人生哲学问题,对吧?因为我觉得你对这个问题的思考方式与听力不同,这很有趣。因为我认为你的想法更像是让我们解决你遇到的问题,对吧?然后把某些东西恢复到你拥有它或希望拥有的水平。

而更多的是像 Limitless 如何构建这个东西?就像,如果你不是使用大脑的 10%,而是使用大脑的 100% 会怎么样?这是一个非常有趣的问题,如果你拥有所有这些东西,这意味着什么?你见过人们对约会网站的反应吗?当人们拥有这些非常庞大的数据库,记录着他们与之约会的所有人时,一方面,这完全说得通,但另一方面,我认为这以我从未真正能够描述的方式赋予了人们某种人性。这是一个我们现在在很多方面都在处理的技术问题,就像如果所有这些东西都对我可用,我该如何使用它才能让它仍然感觉像我自己,感觉有人情味,感觉诚实,感觉真实?我不知道,这甚至不是一个问题,它只是打开了一个非常复杂的人生哲学思考,以至于现在很多 AI 问题对我来说都是如此。

是的,我经常想象,未来的人们会如何看待我们今天?思考这个问题的一种方法是思考我们如何看待 50 年、100 年、150 年前的人们,以及你所描述的那种感觉,即使用电脑来做你认为应该只用去酒吧认识某人的事情的那种感觉。这种感觉实际上在某种程度上看起来很愚蠢。

这就像人们对汽车的看法一样。我爱我的马,他们对电话也有这种感觉。这种新鲜感、新奇感、与众不同的感觉。人们,作为人类,并不擅长应对变化。

我们不是……有些人对新事物非常兴奋,他们会购买最新的产品,无论是什么,无论它有多好,只要它是新的就足够了。还有一些人认为这是最糟糕的生活方式。他们对现状很满意。

而世界变化的速度比他们想象的要快,而且变化的速度比……你知道,我思考这个问题的方式是 5 年、50 年、100 年。现在我们将回顾今天,并对我们接受了我们现在的生活感到震惊,我们会忘记 90% 的事情,一周后我们认为这没关系。

当然。是的,我们拥有如此宝贵的大脑,这是一台不可思议的机器。我们只是让它忘记事情。

没关系。没什么大不了的。这就是生活。我认为人们会嘲笑这一点。你知道,我的孙子孙女会问我,真的吗?你就是这样度过人生的,忘记了大部分事情,这没关系吗?

我不知道我是否完全认同这种对未来的理论,无论它值不值得。但这是我在与 AI 从业者交谈时经常听到的一种理论。总的来说,随着我们找到更多方法来增强自身能力,情况确实变得更好。

我的意思是,看看,计算机是什么?它不就是一种比写在纸上更快地进行计算的方法吗?将我们不擅长的事情卸载到擅长这些事情的技术上,往往在很多方面都是一个相当好的结果。我们必须快速休息一下,然后我们将讨论一个应用程序在尝试给你更好的记忆时实际上做了什么。我们马上回来。

本节目的支持来自 ACLU。ACLU 非常清楚第二个唐纳德·特朗普任期会带来哪些威胁,他们已经准备好了一套经过实战检验的策略。ACLU 对第一届特朗普政府提起过 434 次法律诉讼,他们将再次这样做,以保护移民权利、捍卫生育自由、维护言论自由,并为我们所有人的基本权利和自由而战。今天就加入 ACLU,帮助阻止极端计划“2025 年议程”。在 aclu.org 了解更多信息。

好的,我们继续。所以当 Dan 开始认真开发他的记忆超能力应用程序时,时间是 2020 年初,每个人都突然开始在家工作,整天都在进行 Zoom 会议。

顺便说一下,这是在 ChatGPT 之前。在每个人都认为 AI 将立即永远改变一切之前,Zoom 非常流行。Dan 有一个关于记忆超能力的宏伟想法,但他最终决定从更狭窄的道路开始他的产品。

我们从一个会议机器人开始。每个人都在进行 Zoom 会议。这是一个机器人,它加入你的会议,捕捉、记录、转录它并使其可共享。

我们刚开始的时候,这很新颖。然后每周你都会发现新的东西出现。

是的,没错。所以这就变得非常拥挤。我们从用户那里了解到,这就是最佳创意的来源。

所有这些都是我们用户描述的问题的种子。他们喜欢全面性的想法。他们真的想捕捉更多生活中的内容,而不仅仅是会议。他们正在开会。这让我们想到,如何捕捉不仅仅是会议的内容。

大约在那个时候,苹果的芯片技术,比如苹果M1芯片,让我们能够在本地做更多的事情,卸载很多以前必须在云端完成的任务。也就是那时,我们从只记录会议转向了 Rewind Mac 应用。这远在 ChatGPT、GPT-3、3.5 出现之前,我们的模型就是基于此构建的。

然后我不得不说,我们运气比实力好,我们用 Rewind 捕捉到的数据非常适合 RAG(检索增强生成),比如能够使用这些数据,让像 GPT-3.5、4 或现在的 4.0 这样的模型,如果你让它说出某个人的名字,你今天直接问它,没有任何上下文,它不知道我的工作,也不知道 Sam 是谁,当然也不知道我是谁,也不知道我们之间的关系。但是,如果你用我们关系的上下文来增强它,比如他四年前投资了,我们现在正紧密合作进行这场迁移革命到 Limitless,所有这些上下文,你提供一个很大的范围,它就能起草一封完美的邮件,事实上,我给 Sam 发的那封邮件,人工智能就能起草出来。我们相处得很好,我们联系上了,就像这些事情,你以前需要一张白纸,有了你过去的上下文增强,就能更容易做到。

如果这些事情没有发生,你会怎么做?比如在一个平行宇宙中,ChatGPT 没有出现,我们也没有经历过去几年这种令人难以置信的进步?这并不是你所依赖的,你并没有说我们打算押注这项基础技术。在这个平行宇宙中,你会构建什么来让这些事情发挥作用?

是的,我会继续做同样的事情。我的意思是,我已经觉得它很有价值了,可以搜索你过去看到和听到的东西,大型语言模型只是让这个搜索更有用、更可操作、更……它承担了你本来必须自己完成的任务,比如,让我列出我与 Sam 的所有邮件。

现在我们想,好吧,我们什么时候见面?介绍我们认识,而不是手动测试,而是自动完成。所以我只是觉得这个类比很贴切,就像以前,你知道,我们正从马车到自动驾驶汽车的演变过程中。

在 ChatGPT 之前,我们的演变过程,也许我们增加了一辆带手动变速箱的汽车,比马车好得多,但是 ChatGPT 和我们使用的相关 API 让我们能够转向自动变速箱。所以我们还不是自动驾驶汽车,也就是你的大脑的自主 AI 模拟为你做事。是的,但是我们能够通过这种演变来节省你的时间,并为你创造很多价值。

所以这就是我们会做的事情。顺便说一句,现在我们的流程基本上是押注模型会越来越好,我们所做的一切都是基于这个前提,模型会越来越好。所以,只是以最好的方式收集数据,来抓住这波浪潮。

所以我们的心态肯定发生了转变。我们不再只是追求我们以前做过的事情,现在我们真的觉得,好吧,这些模型带来了一波惊人的变化,只会越来越好、越来越好,最终会达到顶峰。为什么不顺势而为,创建一个产品,让它自己变得越来越好呢?它更便宜,随着模型的改进,它也会自己变得更好?

汽车的比喻有点混乱,但这是思考我们目前在人工智能领域所处位置的一种有趣的方式。我们花了大约二十年的时间与谷歌和 Facebook 等产品打交道,它们构建了非常智能和复杂的系统,用于查看海量信息并以数百万种不同的方式对其进行排名。这些系统总的来说非常好。

但人工智能的承诺是,它可以获取所有这些信息,并真正理解它,而不仅仅是找到你正在寻找的东西,比如把你放在医院的候诊名单上,而是找到你没有寻找的完美的东西,或者利用你已经知道的一切来帮助你做下一件事。我们不需要人工智能来进行谷歌搜索。我们真的不需要。

谷歌目前也在向我们展示我们有多不需要人工智能,因为它试图在谷歌搜索中加入更多人工智能。但是,如果所有的人工智能支持者都是对的,我们可以使用人工智能不仅是查找事物,而且是在它们之上构建新的事物。在个人环境中,这带来了所有这些人工智能系统的一个核心问题。为了让一个外部系统了解你的一切,它需要了解你所做的一切。你想让你的电脑存储和保存你所做的一切,你点击的所有内容,你输入的所有文字,你浏览的所有 TikTok 视频,你查看的所有图片,你做的每一件事。

先不考虑一下这个背后的数据安全风险,就作为一个普通人,知道所有这些东西都被记录和存储在一个实体中,感觉如何?你的电脑需要变得多有用?它需要用这些数据做什么才能值得这种交换?Dan 已经思考这个问题很久了,他称之为个性化人工智能隐私悖论。

它是这样的:为了构建一个更有用的个性化人工智能,你需要记录更多上下文,但这会引发更多隐私问题,这需要更多的数据保护需求,这使得构建更个性化的人工智能变得更加困难。所以,个性化人工智能的愿望,一部分是,好吧?我们想让事情变得更好。

这个上下文会很有用。但是,如果你沿着这条路走下去,在某个时刻,这会让最初的目标更难实现。你可以在微软的两种截然不同的方式中看到这种悖论的体现。

你知道,当他们推出 Windows Recall 时,他们在隐私方面相当漫不经心,有很多话要说,但是当他们推出 Windows Recall 时,它看起来非常熟悉,但他们采取了一种非常、非常不谨慎的隐私方法。这真的伤害了他们。另一方面,苹果的智能似乎尊重隐私,但这实际上限制了苹果在实用性方面所能做的事情。

所以他们有点处于生产的两端。我们实际上在这个领域犯了很多错误。我认为我们思维的最新演变确实为我们未来的发展奠定了良好的基础,但这并不明显。

这并不简单。这就像那些你必须在人工智能和隐私之间仔细权衡才能找到正确道路的事情之一。这并不是在隐私和社区之间做出选择,而是同时让产品足够有用,因为你能够以一种能够提供个性化体验的方式使用数据。

我同意这一点,但是你必须把它摆在用户面前,对吧?我认为,即使是像“这是一个应用程序,它显示了我访问过的每个网页的时间线”这样的想法,对某些人来说也感觉很奇怪,对吧?我认为观看这一切非常有趣,因为,当然,你的浏览器知道你访问过的所有网页,这就像一个巨大的网络黑盒子。

是的,这就是它的工作方式。但我认为,最近几个月发生的事情有很多,人们开始慢慢地理解他们的技术对他们正在做的事情有多了解,这是一种每个人可能以前都应该有,但没有的意识。我觉得你所做的事情,尤其是在 3.1 的早期,真的加快了这个过程,真的,真的像这样。

这个应用程序知道一切,而了解一切实际上是它的工作。我想知道这是否有帮助,因为它是你必须下载的东西。所以,根据定义,你会得到那些更习惯于此的人,而不是像构建一个嵌入式系统那样。

但是你必须这样做,我认为我们会立即意识到,好吧,这要求很高。它会了解很多关于你的信息。我必须立即向你解释为什么它值得这样做。我觉得这是一个相当大的障碍,必须立即清除。

是的,我认为我们肯定为此铺平了道路,但我不会说我们没有犯任何错误。我认为显示你所看到的一切的时间线很有趣,这是一个很酷的把戏,它能让你产生一种神奇的时刻,哇,我没有意识到这一点,人们喜欢这个。部分原因是我们需要第一个 Rewind 这样的产品。

但是,如果我必须说实话,人们并不关心技术,他们只关心解决他们的问题。技术是手段,而不是目的。而这对于产品来说,太过于酷炫了。让我们看看这项技术能做什么,除非这里是我们试图为你解决的问题。所以我认为,在个性化人工智能上的正确用户体验,是对用例非常有主见的。

它是什么?你生活中每天遇到的哪些问题是我们试图为你解决的?我们如何为你节省时间?我们如何让你有时间在晚上与年幼的孩子一起吃晚餐?那是……

这些是人们关心的事情,技术有多复杂,他们根本不在乎,比如数据、架构。这很重要,因为这是我们构建产品的方式,但对于用户来说,这只是一个实现细节。

所以我认为 Limitless 在这方面做得更好。这就是我们不断发展的原因。甚至部分原因是产品名称,提醒是核心体验。时间不是人们想要的核心事物。要做的事情是:给我更多时间,让我更有生产力,帮我分担一些事情,我每天做的事情中,哪些事情坦白说我根本不需要做,机器可以做得更好,更可靠,只是给我更多时间,让我去做那些我独一无二擅长的事情。所以这些都是我认为最终在这个个性化人工智能世界中获胜的那种体验。

你早期确定的一些解决他们描述的问题的方案是什么?

是的,我的意思是,一个很大的问题是一张白纸。作为知识工作者,你经常会从一张白纸开始。

也许是一篇文章、一封邮件,甚至是一条简单的短信。作家的障碍是这个问题的一个大版本,但这是从零开始要困难得多的想法。

机器可以独一无二地完成的部分工作是捕捉你从零开始时可能需要的上下文。一个很好的例子是起草电子邮件,我举了一个开始起草的例子。从头开始要困难得多,要花费更多的时间和精力,而机器可以为你完美地提供你可能需要的东西,你可以把它想象成你生活的自动完成。

为什么?为什么很多时候你必须从空行开始?机器可以在哪里提供一个选项?它不是自主的,对吧?你可以编辑、调整、更改和删除任何东西。

这就像你和我的完美结合,我想,在马车和自动驾驶汽车之间。总有一天,它可以自主地完成事情。我们可以相信它可以为你和你的妻子预订三个月后的意大利之旅。

你知道,它会把合适的座位和所有东西都安排好。我认为,很快就会出现的用例是这些半自主的用例。比如起草笔记。

这只是众多用例中的一个,那就是记忆,虽然它在某种意义上是记忆,因为上下文对这些时刻有用,这些都是记忆。它们是你过去的事情,关于你最后一次谈话的细节。如果你考虑一下我们忘记了 90% 的事情发生在一周之后这个想法。

举个例子,每周的团队会议。很多听众可能每周都会和我们团队开会,开很长的会。充其量,人们只记得上次会议的六分钟内容。所以,你知道,像在上次会议中所说的话的上下文中跟进,做出的决定,这些决定,这些用例,会议总结,为会议做准备,在会议期间做现场笔记,所有这些都是非常棒的用例,个性化人工智能可以帮助你解决。

我觉得这里几乎有太多事情在发生了,因为一方面,事情是这样的,好吧,我会让你更容易记住你上周一个小时的会议的所有重要部分,对吧?这样,当你参加下一次会议时,你可以非常快速地回忆起上周谈论的所有事情。

人类很擅长遗忘。在本期The Vergecast节目中,我们与一位长期致力于解决这个问题的人进行了交谈:Limitless首席执行官Dan Siroker。我们讨论了构建优秀的记忆辅助工具需要什么,我们将来如何使用它们,以及为什么这么难做到。我们还讨论了其中的人性方面——当我们不再遗忘事情时,我们的生活会发生怎样的变化?当实际上是AI模型在记住朋友的生日时,这会有所不同吗?这些工具最终能在工作之外发挥作用吗?像Limitless这样的工具发展迅速,改进也很快,我们将不得不弄清楚如何与它们共存。 延伸阅读: 《纽约时报》:你无法在脑海中看到图像吗?你不是一个人。

召回是微软开启PC未来大门的关键 微软的全知Recall AI功能被推迟 Pixel 9的“Google AI”类似于微软Recall,但没那么令人毛骨悚然 苹果宣布推出iOS 18,其中包含新的AI功能和更多可自定义的HomeScreen Notion AI可以自动为你撰写笔记、议程和博客文章 请发送电子邮件至[email protected]或致电866-VERGE11,我们很乐意收到您的来信。了解您的广告选择。访问podcastchoices.com/adchoices</context> <raw_text>0 我认为很多AI公司正在追求的是,比如记下大量笔记,或者我们帮你记笔记,然后我们会让你快速回忆起这些笔记。但我感觉你描述的更进一步,那就是,与其帮助你主动记住某些东西,不如利用你忘记的所有事情来帮助你做新的事情。是的,对我来说,这些感觉是不同的。

它们是两件不同的事情。但合金原料可以追溯到GPS或电话号码,记住某些东西。电话号码是手段,是与该人的谈话的结束。如果你不必记住电话号码,而可以直接进行谈话,那么理解就超越了手段,手段是达到目的的一种方式。如果你可以直接到达一个更好的地方,我必须考虑一下。

当人们想到我们正在解决记忆问题并试图帮助你捕捉你的记忆时,这指的是手段和目的,这与你拥有这些记忆的年限无关,并且紧紧抓住它们是很好的。目标是试图解决一个问题,例如向某人起草一份文件,在你们关系的背景下使用。所以这些都是手段。最终目标是我们关注的事情,是我们能为你解决的问题之一,AI能做好什么,以及我们捕捉到你记忆中的数据和信息就是达到目的的手段。

你认为手段本身有价值吗?我认为你提到人们实际上并没有花很多时间翻阅他们的旧东西。但我想到的是整个日记社区,对吧?人们真正相信拥有这些记录并定期回顾它们,让它们回到你身边,仅仅是重新审视过去的这个过程本身就具有真正的价值。你认为在这种情况下这很重要吗?

是的,我认为很重要。这只是众多案例之一,我认为很多人在不做什么的情况下也能从Limitless中获得价值,而其他人也会获得更多价值的绝佳例子。深入了解你的生活,你哪一天最兴奋?

你知道,你生活中谁给了你能量?你生活中谁消耗了你的能量?回顾你与人们的谈话,是回答这些问题的绝佳方法,你知道你打断别人的次数有多少吗?你使用了多少过滤器奖励?你什么时候使用它们?

所有这些事情,某种程度上是自我反省的量化……你可以思考,你知道睡眠健康……你知道Eight Sleep介绍了各种睡眠产品,但还有一整套与心理健康相关的产品,比如我如何通过我的谈话来了解这个世界,以及我该如何改进和变得更好,所以我绝对相信这一点。我不知道你是否必须逐字阅读所有内容。我认为有些事情,再说一次,我可以在这个领域做得很好,以帮助你根据过去进行反思和改进。但这只是一个例子,说明我们一旦忘记就会失去的所有东西。

最终,在与他们以及其他人讨论这些事情时,似乎在任何类型的AI记忆产品中都有两个巨大的挑战需要解决。第一个是AI方面的问题,我实际上认为这将是困难的部分,但我越来越相信这是容易的部分。

这只是如何找出人们收集的所有数据中哪些实际上是相关的?比如我坐在电脑前,点击75个链接,看了20个TikTok,发送了300条短信,开了4个会。

Rewind、Recall或其他任何东西如何理解这些?对我来说,在这个领域的大部分关注点实际上并不认为这是一个挑战,或者这将永远是一个挑战。这是一个很大的计算开销,但这并不是一个未解决的技术问题。

我们必须再休息一下,然后我们将深入探讨使这项技术发挥作用的技术。更难的问题,我会回来。节目的支持来自Scope Capital的Crucial Moments播客。

我们都经历过人生的转折点,我们做出的决定最终会产生持久的影响。没有人比当今一些最有影响力的公司创始人更了解这一点,在关键时刻。让我们让听众了解那些定义了Dropbox、YouTube、Robby's、OD等主要公司的成败事件,这些事件由创始人自己讲述。

收听Crucial Moments第二季。今天你可以在crucialmoments.show.com或任何收听播客的地方收听。好了,我们回来了。所以,理解你在电脑上所做的大量数据的整个问题,Rewind、Recall以及其他公司提出的解决方案,是一种叫做检索增强生成的技术,每个人都简称RAG。基本上,在RAG系统中,你只将AI模型应用于你已选择并知道是良好且相关的特定数据集。这意味着模型只能访问该数据集中的信息来回答你的问题。

例如,如果你想问关于一本书的问题,你不想向整个互联网询问关于这本书的问题,你只想问关于这本书的问题。仅仅通过向RAG提供这本书,就有一些证据表明使用RAG可以降低AI模型找到不正确答案或编造新答案的可能性。我认为,它在当前的商业环境中特别有用,在这种环境中,模型可以访问你公司的内部维基,而不能访问其他任何内容。

因此,它更有可能找到正确的答案。将这个想法应用到你每天在电脑上做的许多不同的事情中有点困难,但这仍然是朝着正确方向迈出的一大步。更难的问题是首先将所有这些数据输入系统。

屏幕截图和音频是你整天在电脑上所做事情的不错近似值。但是,当你使用手机或在车里,或者看电视,或者在现实世界中,那里有其他人,根本没有与屏幕互动时呢?如果你认同更多数据更好,并且你收集的数据越多,你的AI工具就越有用,那么你需要访问人类看到、触摸、听到、品尝的所有东西,以及他们所有的内部生物特征和其他无数事物。

此外,无论科技界任何人告诉你什么,我们都不会很快获得这项技术,这根本不会发生。这就是为什么大多数这些产品现在都专注于商业的原因。顺便说一句,它们旨在帮助你记住会议上发生的事情,这是一件你可以记录和总结的有限且可控的事情。

它有一个开始和一个结束,以及结果,距离将这些想法应用到你的余生和你的其余记忆还有很长的路要走。然而,与此同时,问题是这些工具需要多少才能发挥作用,就像我们可以做整件事一样,但你怎么做下一步呢?我在上面提到的苹果功能就是一个很好的例子。

你的iPhone并不是每次感知到有趣的事情发生时都会自动拍照。它只是试图拍摄你已经拥有的照片,并以你想要的方式将它们组合在一起,这在技术上是可行的,而且非常有用。那么,这些工具还能做些什么呢?这个问题导致Dan和他的团队将他们的公司从Rewind改名为Limitless,并除了他们的应用程序之外还开发了一款小工具。

我认为你们特别的谈话是我们发现非常有价值的谈话,而今天没有任何东西被捕捉到是一件非常人性化的事情。就我们能够创造的价值而言,这对于人际间的谈话来说是如此低垂的果实,特别是面对面的谈话。我们开发这款吊坠的一个重要原因是为了捕捉不仅仅是Zoom会议,还有面对面的谈话。

他谈到的吊坠叫做Limitless吊坠。它是一个99美元的圆形夹子,你可以把它戴在挂绳上,或者系在衣服或背包上。对我来说,它看起来像一个老式的橄榄球。

每当你激活吊坠时,它就开始录音。对于Limitless来说,希望是通过捕捉更多你说的话,你也会捕捉到更多其他东西。我认为。

特别是,这款吊坠对人际关系来说将是惊人的。你知道,当我第一次想到这个可以佩戴的东西,可以捕捉谈话的想法时,我甚至害怕向我的妻子提起它,因为我认为她会讨厌它。因为现在,Dan终于可以赢得一场争论了。

而事实恰恰相反。她说,太棒了。现在我们可以清楚地知道说了什么,没说什么。很多冲突都源于沟通不畅,误解和遗忘。

所以我真的认为,从单人视角,也许是两人视角,一对一关系,人际关系,实际上会更好,实际上听起来很不错。我有一些朋友这样做,当我描述我们的产品的功能时,他们提到,他们说,我认为很多人这样做。他们不想承认,因为这听起来像是他们所做的事情。

至少我知道我的两个朋友,当他们即将与伴侣发生争吵时,他们会说,好吧,让我们开始录音。他们拿出手机,开始用语音记录谈话,因为他们知道事情会变得一团糟。他们知道他们可能永远不会再回到过去。

这对于这段关系来说是一份礼物,而不是诅咒,拥有对所说内容的一种冲动记忆。我认为这些是人们想要的东西,他们觉得实际上更了解你,当你心里非常确定你是对的时候。比如,“不,你并没有告诉我买鸡蛋再去杂货店。”你根本没有,我只是……在我的脑海里,它创造了一种真实性、真实性和联系感,我认为今天,因为我们忘记了太多东西,我们不知道我们忘记了什么。我们不必要地发生冲突。

这是一个非常有趣的例子,我喜欢它,因为我的一部分人会立即排斥我的妻子说,“嘿,我开始问问题的时候就开始录音”的想法。

但我也完全能理解这一点,这回到了那个似乎有点不切实际的问题,我们应该记住多少,对吧?就像,如果我有一个吊坠,它会说,“是的,他没有告诉你买鸡蛋,但他实际上只是提醒我在外出时买鸡蛋”,我的生活会更容易。这就是我们要去的地方,对吧?这就是我们真正得到有用的东西的地方,我不会忘记鸡蛋。

顺便说一句,我认为这款产品可能更适合那些只想做得更好、变得更好的人。不是每个人都想要这样。有些人只是想看橄榄球。

他们想独处,你知道,他们没有这种想法,他们的生活可以更好。但我实际上认为地球上大多数人都在像僵尸一样生活。他们日复一日地重复着例行公事和习惯。

他们从未真正问过自己,为了自己、为了伴侣、为了家人、为了工作,他们可以做得更好。这是一个工具,可以让你以一种帮助你做得更好、变得更好、表现更好、做得更多的方式来了解你的过去。我认为有些人想要的就是这个,这没关系。

让我对其中一些人说得更可怕一些,我认为大多数人有时都处于这两种状态,对吧?我认为这类产品有趣的部分在于,我认为这与我对AR眼镜的看法相同,对吧?

有时非常有用,我想要更多信息出现在我面前,我想知道我去哪里,我想知道我周围所有咖啡馆的信息。有时这听起来很糟糕。而总是戴着某种东西在我脸上,向我展示这些东西,无论我喜欢与否,都是一个问题,即使有时它很有用。

我觉得像这样的东西,它了解我,监视我,记录一切,并反馈给我。有时我会想要它,并从中获得价值,并觉得它有用。有时这会让我觉得很烦人。

我想知道,对于你作为产品制造商,以及对于我们这些用户来说,这是否是一种我们最终会学会与它一直存在而忽略它,还是这些东西可以是临时的,我们可以将它们用作工具,而不是这种环境的、始终开启的、始终感知的工具?谢谢。是的,我认为人们……

会根据他们从中获得的价值来自己决定并选择这条道路。我会戴着这个吊坠,大部分时间我会戴着它,但有时我会把它摘下来,放在口袋里,这没关系。

我们决定这样做。你可以把它关掉,把它放在口袋里。我赢了,你知道的。

所以,我认为重要的是,你要让人们有控制权和选择权,他们会自己选择什么时候有价值,什么时候没有价值,并认识到有时你可能会认为它有价值。稍后,你会记住与朋友的谈话。

人类非常擅长遗忘。在本期The Vergecast节目中,我们与一位长期致力于解决这个问题的人进行了交谈:Limitless的首席执行官Dan Siroker。我们讨论了构建优秀的记忆辅助工具需要什么,我们将来如何使用它们,以及为什么这么难做到正确。我们还讨论了其中的人性方面——当我们不再遗忘事情时,它会如何改变我们的生活?当实际上是AI模型在记住时,记住朋友的生日会有所不同吗?这些工具真的能在工作之外发挥作用吗?像Limitless这样的工具发展迅速,改进也很快,我们将不得不弄清楚如何与它们共存。进一步阅读: 来自《纽约时报》:你无法在脑海中看到图像吗?你不是一个人。

召回是微软解锁PC未来的一把钥匙 微软无所不知的Recall AI功能被推迟 Pixel 9的“Google AI”类似于微软Recall,但没那么令人毛骨悚然 苹果宣布推出iOS 18,其中包含新的AI功能和更多可自定义的HomeScreen Notion AI可以自动为你撰写笔记、议程和博客文章 请发送电子邮件至[email protected]或致电866-VERGE11,我们很乐意收到您的来信。了解有关您的广告选择的更多信息。访问podcastchoices.com/adchoices</context> <raw_text>0 而且就像你一样,他们实际上会给我一些好的建议。如果你戴上这支笔,我就能捕捉到你。我真的很想用一句话记住你。

当然,这很好。任何这些东西都会随着时间的推移而缓慢变化,人们会改变他们的行为以及他们所做的权衡。我们并没有强迫任何人使用它,除非他们想使用它。

我认为能够使用和捕捉更多生活片段是一种选择。就像早上戴眼镜是一种选择。如果你想让一天过得更好,你可以。如果出于任何原因你不想看这个世界,你也不必。我认为大多数戴眼镜的人大部分时间都喜欢戴眼镜,他们意识到他们想做的是看到世界的本来面目,而不是因为镜片不够清晰而变得模糊不清的版本。

我相信你现在已经注意到了,但丹完全致力于这里的大型记忆AI理论。在过去几年,甚至在过去的几个月里,它开始看起来像科技行业的其他人一样。而且同样积极的是,地球上一些最大的公司现在正在开发听起来非常像倒带和Limitless的产品。

当我问到所有这些新发生的事情时,他说所有CEO都会说的话,我想这大概就是他们应该说的话。那就是,你知道的,拥有竞争对手是令人振奋的,他并不担心。Limitless拥有正确的商业模式,模仿是最高形式的奉承,所有这些好东西。但是,当我发现自己真正想知道所有这一切时,是微软在Recall方面的所有问题,具体来说,如果你不记得的话,那就是它基本上将你所有的数据都未经保护地保存在你的电脑上,这只是一个等待发生的可怕安全灾难,这是否会让人们更加警惕一款想要永远存储你所有数据的产品。他说他实际上认为这对Limitless来说是一件好事。

如果我们这样做,我必须花费同样多的时间或精力来宣传这个概念和这个问题,这样才能做到这一点并使用我的谈话要点,所有这些都是为了它。太好了。太好了。

我的免费营销。理想情况下,他们会这样做,然后他们会失败。然后人们会想,实际上,这是一个很酷的想法。

但我真的不喜欢他们实现这些的方式,他们在说其他一些事情。这只会为我创造更大的市场。所以说实话,我觉得自己得到了肯定。

我觉得自己被看到了。我觉得就像在沙漠里举行派对,现在我们种了一些树。很快,这将成为一个繁荣的绿洲。

埃德,我已经从丹和其他一些人那里听说过,可能会有很多价值数十亿美元的企业建立在AI记忆上,这些企业可以收集你生活中的所有相关数据,然后让你使用这些数据。我认为他可能是对的。我认为你会看到越来越多的公司试图说服你将关于你自己的所有信息存储在他们的世界中。

这会变得很奇怪,每个人都应该非常谨慎。但通过这一切,我仍然在考虑与妻子吵架,并在事情变得激烈时立即开始在手机上录音,或者与朋友一起吃午饭,并询问他们是否可以录音,以防他们说一些令人难忘的话。当然,这些事情可能会让以后更容易记住事情。

虽然我可以在用餐结束时做笔记或其他什么,但真正的价值可能确实来自于能够回忆起我认为不重要的事情。但突然之间,几天或一周后,我意识到它实际上很重要。但是记录这些事情会改变这些事情吗?如果知道我的午餐或与妻子的争吵会被永远保存下来,并且我可以访问它们来处理行动项目或其他任何事情,那么与朋友的午餐或与妻子的争吵会有所不同吗?

这是否改变了正在发生的事情?我认为确实如此,即使我无法总是准确地解释它是如何发生的。其他人是对的,几年或几十年后,它不会感觉不同,我们都会习惯它,就像我们习惯了手机摄像头一样。

但我禁不住觉得,拥有超能力可能会让我们在这个过程中变得不那么人性化。难道所有漫威电影实际上都是关于拥有超能力和以某种方式保持人性化的吗?对不起,那是另一个播客。我对Limitless和Recall这样的工具很着迷,我认为它们对很多人来说都非常有用。

坦白说,我会使用它们中的所有,但我对这些应用程序不太雄心勃勃的版本越来越兴奋,在这些版本中,你可以决定什么重要,但仍然让AI来理解它,就像我使用这个名为“我的想法”的应用程序一样,它基本上只是一个我喜欢的物品的存储库。这就是我使用它的方式,呃,播客剧集、电视节目、我发现的有趣的礼物、文章、照片。我喜欢任何东西,我都保存到我的想法中。

该应用程序会自动使用AI对其进行分类,这样我就可以搜索悲伤的电影或关于体育的文章或红色的东西,它会向我展示我喜欢的东西。我也非常喜欢iOS 17中的新照片应用程序,它真正突出了自动生成的个人或事件相册,或者你最近度过的特别有趣的日子。谷歌最近也宣布了一项我认为非常巧妙的功能,你只需创建一个巨大的屏幕截图存储库,谷歌AI会浏览并尝试为你理解它。

在所有这些情况下,你所要做的就是发出信号。这是我想记住的东西。这对我来说很重要。

然后AI模型会完成其余的工作。我觉得这对我的记忆来说将是一个巨大的胜利。我可能无法在脑海中看到图片,但至少我可以再次找到它们。

感觉足够接近了,对吧?这就是今天的Vergecast节目。感谢丹与我聊天,并感谢您一如既往地收听,直到下次再见。