您好,AI 工程师们。我们又带来了播客的另一个首秀,涵盖AI可穿戴设备。2024年对于AI硬件来说是极具挑战性的一年。继去年1月份CES展会的热潮之后,2024年标志着Rabbit和Humane等AI可穿戴设备公司的迅速崛起,以及更猛烈的衰落。
就连Friend.com,这家率先推出AI吊坠产品的公司,并促使Rewind AI更名为Limitless并效仿其脚步的公司,最终也推迟了其可穿戴设备的上市日期,并推出一个实验性的网站聊天机器人版本。我们一直对这一类别谨慎乐观,密切关注大多数顶级参与者,包括OMI和Compass。
然而,到目前为止,在AI可穿戴设备大战中仍然屹立不倒的最大赢家是BII,由今天的嘉宾Maria和Ethan创立。
Bee是一款始终开启的硬件设备,配备波束成形麦克风、7天电池续航时间和静音按钮,可以佩戴在手腕上或作为别针佩戴,它拥有令人难以置信的转录、分段和超长上下文记忆处理管道,可以帮助您记住一天的行程、待办事项,甚至通过操作虚拟云电话来执行操作。
这是我们见过的最先进、最成熟的个人AI代理之一。因此,我们很高兴成为他们第一次播客露面的嘉宾。我们在去年4月举办世界首个个人AI聚会时认识了Bee,您可以在Latent Space播客笔记中找到Ethan第一次与Latent Space社区交流的链接。
Maria和Ethan还将作为嘉宾参加2月21日在纽约市举行的AI工程师峰会上的Agents Engineering专场,该专场不幸已全部售罄。但是,您可以注册在线直播(链接在播客笔记中),或参加研讨会和领导力课程。下周见。注意安全,保重。
大家好,欢迎收听Latents-Based播客。我是Alessio,Decibel Partners的合伙人和首席技术官,我的联合主持人是Swyx,Small AI的创始人。你好,今天我们非常荣幸地邀请到Bee的Maria和Ethan来到演播室。欢迎。你好,谢谢你们的邀请。你们是……
我认为是我们播客中第一对硬件创始人,我一直想邀请一位硬件创始人,比如可穿戴硬件创始人,已经有一段时间了。我想今年我们会邀请两到三位。而你们是我每天都佩戴的产品的创始人。所以感谢你们创造了Bee。
感谢你们的反馈和使用。是的,我一直是你们的忠实粉丝。你们是工程世界博览会的演讲嘉宾。让我们从头开始吧。什么是B-Computer?B-Computer是一个个人AI系统。你可以把它想象成一个以第一人称视角与你一起生活的AI。它可以捕捉你现实生活中的上下文。
有了这种理解,它就能以多种方式帮助你。最明显的就是记忆,但这仅仅是基本用例。回忆和反思。我知道,Swyx,你喜欢写日记的想法,但你没有,但仍然有一些关于你现实生活中经历的反思性总结。但这不仅仅是关于拥有一个人的全部背景和理解。
也就是说,赋予机器理解你生活中正在发生的事情、你的态度、你的愿望、你的偏好细节的能力,这样它不仅可以帮助你回忆,而且在你需要它做任何事情时,它都已经知道,就像你想到你长期合作或生活在一起的人一样,他们只是知道,而无需询问你想要什么,很明显,这就是个人AI的未来,它只会变得非常……
有了个人背景,AI的价值就高得多。我想说的是,我们真正热衷的一件事就是真正理解这种个人背景,因为它会使AI更有用。想想你最好的朋友有多了解你。这是我们从用户那里看到的其中一件事。他们是从陪伴的角度或专业用例来使用它的。有很多方法可以使用B,但陪伴和专业是我们现在看到的更多的方法。是的。
谈论用例感觉很枯燥。是的,这就像投资者的提问一样。我们已经被训练得如此麻木。但我的意思是,就基本情况而言,就像,你难道不希望你的AI知道你所说的一切以及你所去过的地方吗?
你难道不想要吗?是的。而且不要总是重复,比如,“哦,这就是我喜欢的东西”。你已经知道了。你会根据我的喜好为我做事。我认为这真的很酷。很好。你想开始演示吗?你还有其他问题吗?我想也许可以先讲讲起源故事。是的。
你们俩是怎么认识的?这是你们开始做的第一个想法吗?之前还有什么其他的想法吗?我可以先说。我和Ethan认识六年了。他有一家名为Squad的公司。在此之前,它被称为Allabot。
并且是一个个人AI。是的,我应该……所以也许你应该先说这个。但是的,这就是我认识Ethan的方式。他正从个人AI转向Squad。并且有一个与朋友一起观看视频的产品。我有与TikTok和视频内容合作的经验。所以我进行了转型,我们推出了Squad,并且非常成功。最后,创始人决定将其出售给Twitter,现在的X。所以我们俩都加入了X。我们推出了Twitter Spaces。我们推出了许多其他产品。
是的,直到那时,我们基本上一直合作到B的启动。有趣的是,这并不是第一次尝试个人AI。2016年,当我创办我的第一家公司时,它最初是一家个人AI公司。这在Transformers之前,甚至连BERT都没有,只是RNNs。你根本无法进行任何令人信服的对话。我遇到了Esther,她是我之前的联合创始人。我们都非常感兴趣的想法是让机器对动态的人进行建模或理解。我们想制作个人AI。这更侧重于,因为我们显然工具有限,更侧重于年轻人。所以我不知道你是否记得2016年,当时有一阵短暂的聊天机器人热潮。
这还为时过早,但那是扎克伯格在F8上发布消息的时候,是的,M和类似的消息平台,人们喜欢,“哦,机器人将取代应用程序”。大约持续了六个月。然后每个人都意识到,“伙计,这些东西太糟糕了,它们不会取代应用程序”,但正是在那个时候,我们感到兴奋,我们想,“我们尝试制作这个,哦,教AI了解你”。所以它只是一个你可以与之聊天的应用程序,它会问你问题,然后……
给你一些反馈。Hugging Face的第一个版本也在同一时间发布。是的,我们也开始了。我们与Hugging Face在同一个办公室开始工作,因为Betaworks是我们的投资者。所以他们有一个名为Bot Camp的东西。Betaworks是一家非常酷的风投公司,因为他们投资于非常前沿的东西。他们比其他人领先很多。
就像那时一样,他们有一个名为Bot Camp的东西。他们选择了六家公司,其中包括我们和Hugging Face。然后我认为其他四家,我很确定,已经倒闭了,但Hugging Face是真正获得成功的那一家,你知道的。我的意思是,30%的成功率相当不错。是的。但是的,当我们……那时,它就像,它只是两位创始人。是的,他们一开始是一家AI公司。这是一个面向青少年的聊天应用程序。很多人不知道Hugging Face就像,“嘿,朋友,学校怎么样?让我们交换自拍吧”。是的。
但后来,你知道的,我相信他们构建了Transformers库来帮助他们改进他们的聊天应用程序。然后他们开源了它,它就像,它爆火了,他们就像,“哦,也许这是一个机会”。现在他们是Hugging Face。
但无论如何,我们当时都对此很着迷。但后来很明显,有些人真的很喜欢聊天和回答问题。但这就像很多工作一样,只是为了手动……
教AI了解你的一切。是的,有些人非常热情。例如,青少年,他们真的很喜欢,例如,谈论自己很多。所以他们会回答很多问题并谈论自己。
但大多数人并不想花时间说话。而且,你知道的,很难用它来真正带来价值。我们有句子相似性之类的东西,可以尝试去做,但这在当时的科技水平下还为时过早。所以我们进行了转型。我们去了YC,故事很长,但我们转向了消费者视频,这很快就变得非常流行,并迅速获得了大量用户。然后我们最终将其卖给了Twitter,在那里工作,并在埃隆之前离开,并且……
与埃隆无关,而是离开了Twitter。然后我应该提到,这是埃隆刚加入时著名的时刻,好吧,当……当埃隆刚加入时,Esther是著名的产品经理。我的前联合创始人,她……她是在你睡觉的地方睡觉的。是的。是的。她留下了,我们那时已经离开了。她确实留下了。她以留下而闻名。是的。是的。
但后来,后来离开了,或者我认为是被解雇了。被解雇了。是的,我认为整个产品团队都被解雇了。她是一名产品经理,主管。但是的,我们在那之前就离开了。然后我们想,“哦,我的天哪,现在情况不一样了”。是的。
你知道的,我认为这是……我们真的在ChatGPT发布之前就开始再次研究它了。但我们有一个应用程序版本,我们一直在尝试围绕它的不同事情。然后,你知道的,最终很明显,有一些限制。我们可以继续讨论,像对任何可穿戴设备公司提出的一个好问题是,“为什么这不是一个应用程序?”是的。因为……因为我们一开始就尝试过应用程序。是的。
是的。因为这个设备的传感器是麦克风,所以它可以捕捉和理解音频。我们实际上是用视觉组件一起启动了我们的第一个硬件,我们现在可以讨论为什么我们没有这样做。但是如果你想用你的手机持续理解音频,它会独占你的麦克风。它会被来电打断。是的。
而且你必须记住打开它。而这种小小的摩擦实际上是获得手机的一个很大的障碍。这就像它一直陪伴着你,并且与你一起生活的那种体验。所以我认为这就是它不是应用程序的关键原因。事实上,我们确实支持Apple Watch。所以任何拥有Apple Watch的人都可以立即使用它,而无需购买任何硬件,因为我们非常努力地为Apple Watch制作了一个可以在后台运行的版本,不会过度消耗电池电量。但即使使用Apple Watch,仍然存在摩擦,因为你必须记住打开它,而且如果有人打电话给你,它仍然会被打断。
而且你必须记住……我们会发送通知,但你仍然必须返回并打开它,因为这就是watchOS的工作方式。我们从Apple Watch用户那里看到的一件事是,我喜欢Apple Watch集成。我们看到的一件事是,人们从Apple Watch开始使用它,几天后他们会购买Bee,因为他们只是喜欢佩戴它。这是一件……他们正在学习的事情,而且真的很酷。是的。
我的意思是,我认为从根本上来说,我们喜欢认为个人AI是我们的使命,它更多的是关于理解和连接点,利用数据来提供一些价值。硬件就像AI的耳朵。它不像集成传入的传感器数据。这就是我们关注的重点。硬件就像,你知道的,如果我们能做好,并在Apple Watch上获得良好的体验,那就太好了。我的意思是,但有一些平台限制,现有的硬件使得难以提供这种体验。是的。
人们在两三天内做了什么让他们决定购买这款产品?他们购买了这款产品。这感觉像是一款产品,在你使用一段时间后,你会有足够的数据开始获得很多见解。但听起来好像也有一些短期……
对于Apple Watch用户来说,我相信是因为每次你接听电话后,他们都需要回到B并再次打开它。或者例如,每天他们都需要为Apple Watch充电,并提醒他们每天打开应用程序。他们觉得,“好吧,也许这工作量太大了。我只是想戴着B,一直保持打开状态,就是这样。我不需要考虑它。”我认为他们只是从手表上看到了它的潜力。因为即使你戴一天,我们也会在一天结束时发送一个总结通知,关于你当天发生的一些重要事情。而且我甚至没有想过……我不像写日记的人,或者……因为……哦,我只是过着我的生活,为什么我需要考虑它?但实际上……有时我很惊讶它对我来说有多有趣,只是为了……哦,是的,就是这样,以及它如何组合在一起。我认为这只是人们立即从手表上获得的东西。但他们想,“哦,我希望有一种更简单的方法。我希望有一种更好的方法来做到这一点。”
这令人惊讶,因为我只知道硬件。是的。但我使用手表作为没有硬件时的备用。我觉得因为你现在正在进行波束成形等等,所以这要好得多。是的,这是另一件事。我们对……Apple Watch有更多的控制权。你受到限制,比如……你无法设置增益。你无法更改采样率。你无法……
对于使用音频做任何事情,只有非常有限的框架支持,而如果你控制它,那么你可以根据你的用例进行优化。Apple Watch并非旨在进行这种录制。当我们谈到音频部分时,我们可以讨论为什么它如此困难。这就像……
最难的音频级别,因为你不知道。它必须在所有环境中都能工作,或者你尝试使其尽可能地工作。像这样的环境非常好。我们在录音棚里,但在后面的餐厅里吃饭时,这是一个完全不同的音频环境。这有很多挑战。拥有非常好的音频源会有所帮助,但还有很多……机器学习仍然需要完成,以尝试解释,因为……你可以为一个环境或另一个环境调整某些东西,但这会使一个好一个坏,并且制作足够灵活的东西非常具有挑战性。我们是否想做一个演示来设置场景,然后我们可以讨论一下。是的。
是的,我认为我们可以做一个产品演示。是的,当然。所以我想我们说我应该……对于听众来说,我们将切换到视频,这将叠加在……在这个视频上,如果你想看,请访问我们的YouTube频道,并一如既往地订阅。是的,并且购买Bee。是的,并且购买Bee,在你等待的时候……
也许你应该为听众提供一个折扣码。当然,如果你想提供,我会接受。是的,好的,折扣码是Swyx。哦,糟糕。好的,是的,就是这样。还有一件重要的事情需要提到,那就是硬件旨在与手机配合使用。我认为如果你看看Rabbit或Humane,他们正在尝试创建一个新的硬件平台。我们认为手机现在仍然占据主导地位。
而且在未来很长一段时间内都会如此,直到我们拥有下一代产品,这可能需要五年时间,也许是一些足够便宜且足够轻便的Orion型眼镜。在拥有手机之前,这需要很长时间,而不是试图取代它。所以在应用程序中,我们有你每天的总结,但在顶部,它是你现在正在做的事情。并且它会持续更新。所以是的。
现在它显示的是我正在讨论,你知道的,个人AI的开发。这只是持续的对话。然后我们会给你一个可读的形式,就像关于对话重要部分的小片段一样。
我们进行说话人识别,这非常重要,因为你不想让你的个人AI认为你说了一些话,并将其归咎于你,而实际上是对话中的其他人说的。所以你也可以教它其他人的声音。所以就像一些……你知道的,你身边的人,所以它可以更好地理解你的人际关系。
然后我们进行对话端点检测,这有点像以前根本不存在的任务,因为没有人需要这样做。但如果你有某人一整天的情况,你怎么把它分成逻辑片段呢?所以我们使用……
不仅仅是语音活动,还有其他信号来尝试分割,因为对话有点模糊。它们可以像……进入一个,可以开始下一个。所以也包括它的语义内容。当对话结束时,我们会将其通过更大的模型来尝试更好地理解,你知道的,实际所说的话,然后对其进行总结,提供要点。对话的总体氛围和语气以及可能由此产生的潜在行动项目。但随后在一天结束时,我们会给你一个你一天的总结以及你在哪里,以及你所做的事情的逐步演练以及要点是什么。这就像基本捕获层一样。所以如果你只想获得一种瞥见或回忆或反思,那就有了,但关键是……
所有这些现在都受到影响,以生成关于你的个人背景。所以我们生成一些已知关于你的事实,你可以……你知道的,有一个人工参与的方面,就像你可以……你可以看到它。你可以……你知道的,我有很多关于技术的事实,因为这基本上是我一直在谈论的。但我确实有一些爱好会显示出来,然后……你怎么利用这个背景?所以我现在有点像衡量我的一天,就像……我一天的令牌输出是多少?你知道的,就像……作为一个人,我产生了多少信息?它以令牌来衡量,结果大约是每天20万个左右。但所以在回忆的情况下,我们有一个聊天界面,但这里的关键在于回忆,就像……
你知道的,你怎么……你知道的,我可能有5000万个个人背景令牌,以及如何理解它,使其有用。所以我可以问一些简单的回忆问题,比如我最近去台湾的旅行的细节,我们和我们的制造商在一起,并且实时地……
它会……你知道的,它具有各种功能,例如搜索你的记忆,还可以搜索网络或查看我的日历。我们与Gmail和日历集成。所以就像连接现实生活和数字生活之间的点一样。而且,你知道的,我刚刚问它关于我的台湾之行的信息,它给了我细节的细分,发生了什么事情。
我们在某些制造问题上遇到的问题,它会返回并引用……
所以我可以看到来源。是的,不仅仅是对话,还有集成。所以我们也有Gmail和Google日历,所以如果那里有一些东西对获得更多上下文很有用,我们可以看到它。它可以……我从不用“代理”这个词,因为它很俗气。就像一个代理。它可以搜索……
你知道的,如果我正在集思广益一些跨越……像搜索我的对话、搜索电子邮件、查看日历,然后根据需要,然后综合……你知道的,所有这些背景。我喜欢你做了Spotify Wrapped。那真的很酷。是的,我做的一件事就是为我的2024年制作一个Spotify Wrapped,就像我的生活一样。你可以这样做吗?是的,你可以。等等。是的,我喜欢那些疯狂的东西。为我2024年的生活制作一个Spotify Wrapped。
是的。所以它非常令人惊讶。它就像……游戏指标一样。所以它就像你访问了三个国家,你运送了……你知道的,许多测试设备。这是一种更……它提供了很多个人见解和反思点。是的。这太吸引人了。所以这就是演示。好吧,我们有……我们可以展示一些测试版的内容。我不知道我们是否想这样做。我们是否想展示一些测试版的内容?去做吧,然后我们可以剪辑。是的。是的。
所以像……愿景也像……不仅仅是AI陪伴你,只是被动地通过你的生活体验来理解你,而且它还会主动向你建议事情,就像在适当的时候。所以不仅仅是池,而是……它可以介入并向你建议事情。所以是的。
你知道的,我们有一个与WhatsApp集成的测试版。所以我做的事情是,我只是通过WhatsApp向Ethan发送了一条消息,在他的个人手机上。所以基本上,Bee就像在查看我所有的传入通知一样。
如果它满足两个条件,比如,它是否足够重要,值得向用户提出建议?然后我是否可以提供潜在的帮助?所以这就是行动开始的地方。因为Maria是我的联合创始人,并且因为它是一个餐厅推荐,它可能可以提供帮助,所以它向我提出了建议。
然后我可以通过聊天,我们还有另一种推对讲式按钮。它实际上是一个多功能按钮,可以用来切换开关,但如果你按住不放,你也可以说话。所以我可以说,“是的,找到一个并通过WhatsApp发送给她”,这是一个Android云电话。所以它能够……你知道的,它可以访问我所有的帐户。所以我们将抽象掉这一点,执行环境并不重要,但我们可以从技术上讨论为什么Android现在实际上是一个非常好的选择。但是,你知道的,它正在搜索意大利餐厅,你知道的,我们不必观看这个。我可以……你知道的,戴着我的AirPods,放在口袋里,你知道的,它会去WhatsApp,找到Maria的对话,发送她的回复,然后……然后让我们知道。哦,我的天哪。
好吧,它会建议什么?我的意思是,一家意大利餐厅。是的。你选择了什么?意大利菜很难做。真正的意大利菜很难做。说得容易。我不知道。记录在案,因为你是意大利人,旧金山最好的意大利餐厅?哦,我的天哪。我看到Don Hevlon。什么?不。成功找到并分享。让我们看看AI会说什么。通过WhatsApp与Maria。
Bottega?你去过Bottega吗?我去过。你去过Bottega吗?怎么样?还不错。我认为它叫Norcina,我认为,而且很好。Bottega在瓦伦西亚街。还不错。披萨不好吃。不好吃?一些意大利面很好吃。你知道,人们说……
对不起,打断一下。对不起。但这里有一家叫Delfina的餐厅,每个人都喜欢,“哦,Pizzeria Delfina太棒了”。我想,“这并不是……”不。很好。这是一家北滩咖啡馆。上次你带我们和Michele去过的地方。哦,是的。
Vega的老板Giuseppe是意大利人。它在伯纳尔高地。他很好。他不友善。我不知道那个。那家店叫什么名字?Vega。Vega。但它不是Vega,它是意大利语。意大利语是什么意思?Vega Niente。对我来说没有任何意义。我最后要提到的还有一点,那就是你们也有弱词检测。是的。所以手机可以关掉,你只需要说……
说,“嘿,某事,我的Alfred”。所以我说是,“嘿,Alfred”,然后它就会做这件事。能够使用唤醒词可以实现一些即使ChatGPT也无法实现的语音代理功能,因为它们没有录制层。是的,我认为我们甚至还有超越唤醒词的想法,但我认为……
看到人们如何使用语音方面的内容很有趣。我认为……你知道的,我们将看到很多围绕硬件和软件的创新。但我认为真正的核心是能够利用个人背景做一些有用的事情,因为它就像……你总是能够捕捉一切,对吧?我们一直都有录音机、摄像机、随身摄像机之类的东西。但现在不同的是,我们实际上可以理解并找到所有这些背景中的重要部分。是的。
是的,然后还有一件事,我只是为了你做的,那就是你还有一个API,我认为我是第一个针对它进行开发的人。因为我不得不自己构建它。我们需要雇佣一名开发者布道者。或者只是雇佣AI工程师。是的。关键是你应该能够编程你自己的助手。嗯哼。
我尝试过OMI(前身是Friend,一款山寨产品),但真正的Friend和Limitless都没有API。我认为拥有自己的数据非常重要,这样才能重新处理音频(尽管默认情况下不存储音频),并进行任何更正。我的需求无法完全由你们满足,所以我认为API很重要。是的,我一直以来都是API的使用者,在我的所有产品中都是如此。所以我们是API爱好者。是的,是的,当你不得不去构建一个抓取工具时,这非常令人沮丧,
但是,这肯定很重要。是的。所以,你们拥有我的位置、日历和邀请函,对我来说,这是一种个人API。API只是写入还是让它对外部系统采取行动?是的,我们正在扩展它。目前它是只读的。将来,
很快,当操作更普遍可用时,它将完全支持API。很好,我会在节目结束后买一个。对我来说,API是最有趣的部分。我们确实有实时API,因此您可以连接套接字并将其连接到您希望其采取行动的任何内容。
是的,它对我来说太聪明了。是的,我认为当我查看这些应用程序时,我的意思是,有很多这样的产品。是的,我们推出了这些应用程序,我很高兴我可以使用这个应用程序来做事情,但是我的大部分工作和个人生活都在其他地方管理。是的,所以能够插入它,集成它,这很好。我还有更多可能更人性化的问题。当然,也许人们可能会有一个。
拥有任何争论的即时回放好吗?我可以想象与我的妻子争论某事。而且,你知道,现在有这些广告,基本上是两个人在争论,他们就像,他们可以在足球比赛中扔旗子,并对谈话进行即时回放。我觉得这很相似,因为
人们可能真的无法再争论或互相说谎了,因为在一个每个人都采用这个的世界里,我不知道你是否考虑过这个问题。还有谎言,我们都会说谎,对吧?你如何区分我什么时候会,有时会有相互矛盾的事情,因为我可能会公开说一些话,而我可能会想到一些我告诉别人的事情。当你考虑构建这样的产品时,你如何处理这个问题?
我会说我喜欢B是一个客观的观点。所以我并不太关心谎言,但我更关心它能帮助我理解发生了什么以及情感,以一种非常客观的方式,就像一种非常批判性和客观的方式。如果你考虑人类,他们有很多情绪。
有时发生在我身上的事情,比如,我不知道,我会感到非常沮丧或非常生气或非常情绪化。但是人工智能没有这些情绪。它可以阅读对话,理解发生了什么,并且客观。我认为支持水平是我真正更喜欢的。而不是像,哦,这个人骗了我吗?我觉得这并不完全像我发现有帮助的。
就机会而言,对我来说很好奇。蜜蜂会实时插话吗?假设我正在与某人争论,蜜蜂会说,嘿,看,不,你错了。那个人实际上说了。主动性是我们非常感兴趣的事情,也许不是为了像专门为了像销售论点,而是为了像,我认为这里的很多挑战是,你知道,你需要非常好的推理才能做到这一点,因为你不想让它不断地插话,因为那会非常烦人。是的。
而且你也不想让它错过它应该插话的事情。所以,这对于一个人来说也是一项艰巨的任务,就像,只是在适当的时候介入。就像,它会,你知道,有了个人背景,它会好得多,因为如果有人了解你,但即使如此,它也需要非常好的推理,才能不会太多或太少,而只是恰到好处。第二部分,
关于,好吧,就像有些事情,你知道,你对别人说了一些话,但后来我改变了主意,我发送了一些东西。就像我每次都有不同的对话和关于我的数据。我认为这是我发现非常有趣的事情之一。我们正在学习的一件事是,事实上,人类会随着时间的推移而发展。因此,对我们来说,挑战之一实际上是理解,这是否是一个真实的事实?
到目前为止,我们所做的是,我们给,你知道,我们让参与其中的人可以说,是的,这是真的,这是假的,或者他们可以编辑他们自己的事实。当然,将来,我们希望将所有这些自动化到产品中。但我的意思是,我认为你的问题有点触及到,我知道我们会谈论隐私,但也只是像,如果你有一些记忆,你想用别人来确认它,这是一回事,但是……
将来肯定是真的,甚至在不久的将来,这将变得司空见惯。我们现在正处于一个过渡时期。我认为这是我们必须应对的关键问题之一,并确保我们正在考虑所有后果,以及如何做出正确的选择,以设计一切的方式。所以,它比有害更有益。但是
对于你的AI来说,了解你太有价值了。所以,如果它是Meta Ray-Ban或谷歌,我认为人们会更习惯它。因此,人们的行为和期望将会改变,无论这是否会立即发生或在五年内发生。
这可能在这个范围内。所以,我认为我们一直在适应新技术。就像Ring摄像头问世时,这有点争议。就像,但现在人们只是明白很多人在他们的门上装有摄像头。所以我认为。是的,我们正处于一个过渡时期。我会谈谈隐私问题,因为这是每个人都在谈论的头等大事。
显然,我认为在硅谷,人们对技术更前卫、更实验性,无论如何。但你想进入主流市场。你想卖给消费者。我们必须担心这些事情。基本问题,最难的版本是法律。在单方同意州,这是完全合法的。然后是双方同意州,他们不是。如果你……
来回两天?是的。所以欧盟是一个完全不同的监管环境,但在美国,它基本上是州一级的问题,比如在内华达州,它是单方同意,在加利福尼亚州,它是双方同意,但这有点未经检验。你知道,不同的法律,无论是电话,还是面对面,在加利福尼亚州这样的州,只要你在公共场合,就没有同意的问题,因为隐私的预期是你处于公共场合。
但我们处理音频,没有任何内容被持久化。然后它用专注于用户的说话者识别进行总结。现在,它在法律上有点未经检验,我不是律师,但这是否构成与录音相同的含义?所以,你知道,这现在是一个灰色地带,而且法律上没有经过检验。
我认为更大的问题是,你知道,因为如果你戴着你的Ray-Ban并正在录音,那么你就有了一段发生的事情的视频。这与让AI给你一个专注于你的摘要不同,它并没有真正捕捉到任何人的声音。你知道,我认为更大的问题是,
无论法律地位如何,这方面的伦理状况是什么?因为即使在内华达州或其他许多允许你录制一切的美国州,你也不必获得同意,
这仍然是正确的事情吗?我们考虑这个问题的方式是,你知道,我们采取了很多预防措施,以避免捕捉周围人的个人信息,无论是通过说话者识别、管道,还是提示以及我们存储信息的方式,都是为了真正专注于用户。现在,我们知道这不会让很多人满意,但我认为如果你尝试一下并佩戴它,对我来说很难
看到任何东西,比如,如果有人在我周围戴着B,我会反对它捕捉到的关于我的信息,就像一个第三方。就像我说的,我们正处于这个过渡时期,人们的期望将变得更加规范化,就像AI一样。它没有捕捉到,你知道,你所说的完整音频录音。而且,它,
一切都是为了帮助人们了解自己的状态并为他们提供有价值的信息,而不是记录他们遇到的人的详细信息。你知道,我也对Zoom会议转录器有同样的疑问。我认为这有点像……
萤火虫的AI录音机带来的个人影响。我只是知道它正在被录制。这不像,我不知道我是否会说些什么不同的话,但从本质上来说,你会有这种感觉,因为它并不普遍。我很好奇,尤其是在你们的投资者会议上,人们的感觉是否不同?比如,你们有没有人要求你们关掉它,比如在商务会议上不录音?我很好奇你是否遇到过任何
这些行为?你知道什么有趣吗?在我这边,我一直戴着它。我带着它喝蓝瓶咖啡,或者我带着它工作。显然,我正在研究它,所以我一直戴着它。到目前为止,我认为没有人要求我关掉它。我不确定是因为他们对我非常友好,他们知道我正在研究它,但没有人真的在意。这是因为你住在旧金山。
实际上,我也去过意大利。在意大利,这是一个非常关注隐私的问题。欧洲非常关注隐私。而且,他们什么也没有。就像,我不知道。对我来说,这很有趣。我认为,是的,即使在我向他们展示完整的演示和披露后,也没有人要求我关掉它。我认为有些人说过,好吧,我的,你知道,在我的个人关系中,我的伴侣
最初对此感到有点不舒服。我们从一些用户那里听到了这一点,这更像是……这不像是一种个人关系的情况。另一个重要的问题是
人们会说,我喜欢它,但我不能在工作中戴它,因为我认为我会因为政策而惹上麻烦,或者,你知道,如果你戴着它在研究实验室里,或者你在处理一些敏感的事情,那么,你知道,所以我们正在添加一些功能,比如地理围栏,就像
在这个位置,它永远不会启动,甚至像概念围栏,所以你可以说,如果这些话题出现,那么就不要捕捉到它。我的意思是,我经常以另一种方式解释它,也许你只想要它在工作中,所以你永远不会把它从工作中拿走,它就像你的Zoom会议录音机一样,是你的工作设备。是的,专业人士一直是早期采用者的重要群体,你说在旧金山,但是我们有
每天超过100件的出货量。如果你查看地址,我认为德克萨斯州是我们最大的州,佛罗里达州也是最大的州之一,很多专业人士都在谈论,我们并没有打算为这个用例而构建它,但是我认为对那些以谈话为生的白领人士来说,需求很大。我认为,
我们才刚刚开始与他们交谈,我认为他们只是想能够提高他们在理解他们正在做什么方面的表现,以及如何改进。你如何看待Gong.io?例如,一些销售培训,你进行销售电话,然后它指导你。它们更垂直化,而不是更水平化。是的,我不太熟悉这个领域,因为就像我说的,这对我们来说有点意外,但我认为
这些很有趣。我已经看到现在有很多这样的东西了,对吧?因为它有点道理。我讨厌销售,所以我可能可以使用一个。但这根本不是我的工作。但是是的,我认为也许是……我们还听说过餐馆的人,如果他们能够理解,如果他们做得很好。是的,但总的来说,我认为……
很多人喜欢对自己的表现进行二次检查,或者你能建议我如何做得更好?我们有一个用户告诉我们,他用它来面试,求职面试。所以他使用了B,然后问B,哦,实际上,你认为我的面试怎么样?我应该做得更好吗?
我喜欢这样。就像,哦,这实际上就像一个私人教练一样。但我猜问题是,你想构建所有这些用例吗?或者你认为B更像是一个平台,有人会在上面构建,你知道,连接到B的销售教练,这样你就是它的数据馈送?我不认为这是一个数据馈送,更像是一个理解引擎。而且肯定在未来,让第三方使用API并为所有不同的用例构建是我们要做的事情。但是我们现在要做的初始案例是构建该层
让所有这些都能工作。而且,你知道,我们并没有试图构建所有这些垂直领域,因为没有一家初创公司能够做得很好。但我认为看到这一点真的很有趣,你知道,我已经做了很长时间的消费者了。消费者很难预测,就像,什么会是杀手级功能。所以,我的意思是,我们真的相信这是未来,但我们不知道,就像
究竟需要什么样的过程才能真正获得大规模采用。杀手级消费者功能就是尼基塔·比尔所做的任何事情。是的,青少年社交应用。是的,好吧,我喜欢尼基塔,但你知道,他擅长建立自举公司并使其病毒式传播。然后卖掉它们,然后它们就关闭了。好的,所以你刚从CES回来。是的,太疯狂了。这是我第一次去拉斯维加斯,也是第一次去CES。
两者都让人难以招架。首先,你是否觉得你必须这样做,因为你从事的是消费类硬件?然后我们决定去那里,并进行许多合作伙伴和媒体会议,但我们没有自己的展位。
所以我们决定跳过这个。但我们决定去那里,并在那里露面,即使只有我们自己,并与人们交谈。很难脱颖而出。是的,我认为,你知道,这取决于你有什么类型的展位。我认为,如果你能准备一个非常酷的展位。你去过CES吗?我认为这可能会很酷。它很大。在威尼斯人和会议中心,大约有8万到9万人。而且,对我来说,我一直想去的,就像……
很多时间。我认为这是你的主意。我一直想去的,就像一个粉丝……是的,你无论如何都想去的。从小到大,我认为CS达到顶峰有一段时间了,就像,哦,我想去那里。那里有所有很酷的小玩意,一切都在那里。是的,现在就像SmartBitch和吸尘器一样,可以捡起袜子。没错。有很多
很酷的吸尘器,哦,他们喜欢它,他们喜欢Roomba,可以捡起袜子,还有宠物科技,是的,还有狗的东西。是的,有很多机器人东西,新的电视,永远不会发货的新车。是的,我想去年这个时候,去年这个时候是Rabbit和Humane发布的时候,Rabbit赢得了CES
而今年,除了你们之外,没有可穿戴设备。这很有趣,因为它显然是AI的一切。是的,每一个产品。是的,带有AI的牙刷。是的,是的,我们喜欢吹头发,字面意思是带有AI的吹风机。我们看到了。是的,那很酷。但我认为,是的,我们没有,另一种不同之处,就像围绕着我们,就像我们不想做像Rabbit那样的大规模炒作承诺,因为我的意思是,他们确实做到了,向他们致敬,就像在
演示和一切上,显然。但是,你知道,我们想让产品自己说话,并把它推销出去。我认为我们非常高兴。我们从媒体和一些合作伙伴那里获得了非常好的兴趣。所以,就像,我认为这绝对值得一去。我会说,如果你从事硬件行业,这只是你如何利用它。我认为,像Rabbit那样的大规模展示,或者在那里进行大型展示,你需要提前六个月计划,你知道,
而且非常昂贵。但是如果你去那里,每个人都在那里。所有媒体都在那里。有很多预展活动,与人们交谈非常棒。该行业也是如此,所有制造商和供应商都在那里。所以我们了解到了一些我们可能喜欢的非常酷的东西。我们遇到了一些人。他们有热能捕捉。就像,哦,你可能不需要充电?因为他们有一个可以捕捉你体温的热能装置。很容易。
是的,他们在这里。他们实际上就在这里,在帕洛阿尔托,他们有一个Fitbit的东西,你不需要充电。从纸面上看,你可以从那里获得能量。这东西的功耗是多少?事实证明,它比你从体温中获得的能量要多。但它很小。
我不知道,技术上没有披露。但我认为太阳能仍然是,他们还有一个,就像这个东西可以像它的表面一样。它只是一个太阳能电池。就像这更现实。或者动能。动能,显然,我不是这方面的专家,但他们似乎认为这还不够。动能很小,我想,在捕捉方面。好吧,我的意思是,制表商长期以来一直使用动能供电。是的。我们不必谈论这个。我只是想了解一下CES,你会再去吗?
我绝对不会。好的,你只是CES的粉丝。从商业角度来看,没有意义。我碰巧在会议行业工作,对吧?所以我只是很好奇。是的,所以我会说,就像我们所做的那样,没有展位,只是已经计划好的非常直接的对话,三天,还可以。我认为还可以。但是如果你需要投资一个不好的展位……多少钱?我认为……10x10是5000美元。但除此之外,你需要……
10x10非常小。是的。有些公司有,我认为可能需要六位数才能获得。我的意思是,我认为,是的,这非常嘈杂。我们听说过,这非常非常嘈杂。显然,如果你,一切都在那里发布,就像,
从汽车到手机的一切都在那里发布。所以很难脱颖而出。但是,我认为,制定一个你想和谁交谈的计划,我觉得……这很值得。值得。我们从中获得了许多非常积极的媒体报道,我们也宣传了出去。所以,我认为我们完成了我们想做的事情。我的会议在某种程度上会成为……
无论AI变成什么,它的CES。是的,我认为……不要在拉斯维加斯举办。不要在拉斯维加斯举办。这是我唯一不喜欢的事情。旧金山,纽约。好的,太好了。太棒了。这些是我最喜欢的。你不能让9万人挤进旧金山。这真的很蠢。你需要多个地点,这样你就可以在Moscone中心举办,然后在……我的意思是,这就是Salesforce会议。那么GDC有多少人?可能会有5万人,对吧?是的。
好的,外形尺寸,对吧?我介绍这个想法的方式是,我在Solaris的发布会上,
旧名称是什么?牛顿。Tab。当Avi第一次发布它时,他说,我考虑了每一个外形尺寸,吊坠是最重要的。然后我们得到了这个原型的吊坠。第一个只是吊坠。我把它摘下来了,然后我忘记戴回去了。所以你经历了吊坠、别针、手镯,也许将来会有耳机。但是……
你的迭代是什么?是的,所以我们有,我相信现在有三个或四个迭代。我们学到的一件事是,人们确实不喜欢吊坠。特别是女性,你不想在胸前戴任何东西,因为你可能还有其他项链或其他东西。你只需要运送一个高级的金色吊坠。是的。我们正在与一些时尚品牌联系。一些大型时尚品牌。有一些东西在那里。这就是拥有意大利人团队成员的好处。有一些大型……
意大利奢侈品牌。我不能说任何事情。所以是的,手镯实际上来自社区,因为他们说,哦,我不想戴任何东西,比如项链或吊坠。就像,而且我们拥有的那个,我不知道你是否记得,就像一个圆圈,就像这样,而且非常笨重。人们不喜欢它。而且,我的意思是,我,
实际上,我不讨厌,就像我们当时进展很快一样。我们的想法是,我们想尽快发货。所以我们没有过度考虑外形尺寸或材料。我们只想发布。但在社区自发地之后,基本上所有的人都说,为什么你不做手镯呢?就像它好多了。我会戴着它,就是这样。所以这就是我们最终选择手镯的原因,但它仍然是模块化的。所以我还想玩弄它模块化的特点,你可以,你知道,把它取下来,作为夹子佩戴。或者将来,也许我们会把吊坠带回来。但我喜欢它有一些个性化的地方。现在我们有两种颜色,黄色和黑色。很快我们就会有其他的。所以,是的,我们可以玩很多东西。酷。
我认为外形尺寸,目标是它不会过于侵入性,对吧?而且很容易使用。所以我认为将来,更小、更薄,不像苹果那样痴迷于薄度,但这确实很重要,比如尺寸和重量。我们希望有更多的背景,因为这会有所帮助。但为了让它发挥作用,我认为它真的需要良好的功耗、良好的电池续航时间。而且
你知道,就像Humane交换电池一样。我有一个。我的意思是,我认为Humane非常棒,他们做了一些令人难以置信的工程设计,但是它并没有
针对解决问题。它只是太重了。可更换电池对人来说太多了。热量。热量,热量。太多了。轻型界面。是的,就像那样。那很酷。很酷。很酷,但如果你把手伸出来,你想用你的手机。就像它并没有真正解决问题,因为你知道如何使用你的手机。它有一个非常棒的显示屏。你必须学习如何使用这个低分辨率激光器进行手势操作。但激光器很酷,他们让它在这个东西里工作的事实,即使它确实过热了,
但太重了,太笨重了,多个电池太复杂了。所以一些节能的、有点薄的东西,无论是物理意义上还是边缘计算意义上,这样它就可以尽可能不显眼。是的。用户真的很喜欢,就像,我喜欢他们说,是的,我喜欢戴着它然后忘记它,因为我不需要每天都充电。在另一个版本中,我相信我们有大约35个小时,还可以。但是人们更喜欢七天的电池续航时间。哦,这是七天?是的。哦,我每三天充电一次。哦,不,你可以像这样保持它,是的,就像差不多七天。另一个让我想到的事情,也许有一个Apple Watch表带,这样我就不必戴两块手表了。是的,这是另一个,是的,我考虑过。我……
我还看到了那些可以把它放回手机上的东西。你知道,有很多。所以是的,有一个竞争对手叫做Plod。它并不是真正的竞争对手。他们只转录。是的,他们只转录。但他们做得非常好。不,他们很棒。他们的硬件也非常好。他们也刚刚推出了别针。
是的,我认为MagSafe这种外形尺寸有很多优点,但也有一些缺点。你可以肯定地在上面安装一块非常大的电池,你知道的,所以电池续航时间不是……功耗并不是什么大问题,但是,缺点是,手机就在你的口袋里,所以……
我认为外形尺寸会继续发展,但会有更多传感器,更不显眼。是的,我们将会有一个新版本。更容易使用。好的,期待着。是的,我们的意思是,无论何时发布这个,我们都会尝试展示任何东西,但我相信你会继续迭代。
硬件的最后一件事,然后我们将进入软件方面,因为我认为那是你们真正非常擅长的领域。视觉方面,你想谈谈为什么没有视觉吗?是的,我认为这归结为,当你是一个初创公司,尤其是在硬件方面时,你是在约束条件下工作的,对吧?所以视觉非常有用,非常有趣,在我们实际开始使用的产品中。有两个关于视觉的问题,使得它不像我们决定开始的地方。一个是功耗。所以……
你知道的,你必须权衡你的功耗预算,比如即使以低帧率捕获和传输无线电实际上是占用大部分功耗的事情。因此,你真的需要一个相当大的、不可接受的、又大又重的电池才能全天候连续使用它。
我认为,我们有一些新颖的替代方法可能允许我们做到这一点,我们也有一些原型。另一个问题是外形尺寸。所以,即使是广阔的视野,如果你在胸前佩戴东西,它会,你知道的,显然手腕并不是一个很好的选择。如果你把它戴在胸前,它通常会,可能不会捕捉到你感兴趣的东西的视野。所以这让你只剩下头部和脸部。
然后任何戴在脸上的东西都必须看起来很酷。就像,我不知道你是否记得Spectacles。它有点像第一个。是的。但它们有点,它们并不成功。我认为原因之一是它们看起来很奇怪。是的。摄像头在侧面很大。如果你看看Meta Ray-Ban,它们更成功,它们看起来几乎和Ray-Ban没有区别。他们在这方面投入了很多。他们与高通公司合作开发定制硅片。他们有,
现在在Luxottica的股份。所以他们从各个角度来看,就像制造眼镜一样,我认为,你知道的,我不知道你是否知道Brilliant Labs,他们是一家很酷的公司,他们制造镜框,这有点像很酷的可破解眼镜,而且它们真的很好,就像在硬件方面,它们真的很好。但即使你看镜框,我认为这是最先进的初创公司。我的意思是,有一个在CES上发布的,但还没有发货。就像你现在可以买到的一个。
它仍然不是你每天都会佩戴的东西,而且电池续航时间非常短。所以我认为,像一开始就正确地做视觉处理一样,需要更多的资源。所以音频是一个很好的切入点,也是音频的隐私问题。如果你有图像,那就是另一个巨大的挑战。是的。
所以我认为,理想情况下,个人AI应该拥有所有感官,你知道的,我们会到达那里的。好的。硬件的最后一件事。我必须问这个问题,然后我们将进入软件方面,因为我认为那是你们真正非常擅长的领域。你们两个是电子工程专业的吗?不,我是计算机科学专业的。所以我有一个,我上过一些电子工程课程,但我之前在做硬件之前,就像我做过一些嵌入式系统一样,很少有固件,但幸运的是,我们团队中有人拥有丰富的经验。是的,我只是想说,你知道的,就像你必须成为硬件人员一样。是的,是的,我的意思是,我学会了担心供应链、电力、无线电。有很多东西要学习。我会这样说硬件,就像,我知道之前有人说过,但是构建原型和学习电子设备的工作原理以及学习固件和开发,我认为这对许多工程师来说很有趣,而且这一切都是完全……
可以实现的,尤其是在现在,就像我们拥有的工具一样,就像你可能被吓倒的东西一样,比如我现在如何编写这个固件?使用Sonnet,你可以开始并快速看到结果。但我认为从原型到实际制造的东西是一个巨大的飞跃。这不仅仅是技术,还有供应链、采购、法规、成本、工具。我习惯的软件方面是,有趣的是,你可以一路更改并发布它。但是,当你必须为昂贵的机箱购买工具时。你购买自己的工具吗?你必须这样做。你不只是外包给某人吗?哦,不,我们制造工具吗?不,不,你必须拥有CNC和一堆机器。没有人制造自己的工具。但是,你必须设计工具
是的,只需设计并提交,然后他们会在四到六周后进行。是的。然后如果出现问题,那么你就不会制造任何机箱。所以你必须提前做好计划。我只是想给其他硬件创始人一些建议。比如,在你们的制造过程中,哪些资源或网站最有用?你知道的,我认为这取决于它,硬件如此专业化,以不同的方式。我会说,例如,我应该选择一家制造商公司。我和其他创始人谈过话,就像我们可以给你一些,你知道的,一些关于谁好谁不好的建议,或者像谁擅长某件事,而其他人则不擅长。是的,有些人擅长塑料。有些人擅长PCB。我认为对我们来说,一开始与其他人交谈并了解,好的,周围有哪些人,这真的很有帮助。我在深圳工作。
我在中国住了将近三年。我对不同的硬件制造商以及所有这些都有了解。我很快就会回到深圳去看看。所以我认为去现场检查也是一件好事。是的,你必须这样做。所以我们做了一些国内的事情,如果你们有这种能力,我说能力的原因是因为它非常昂贵。是的。
但是,比如要构建一些概念验证并进行现场测试,然后再将其交给制造商,尽管人们这么说,但对于少量产品来说,国内制造确实很好,价格非常高。所以我们在洛杉矶完成了我们的第一个PCB和组装。所以有很多好处,因为国防工业可以快速周转。所以就像,我们需要这个电路板。我们需要找出它是否有效。我们有这个截止日期,我们想开始,但你需要经历这个过程。就像,如果你想在一周内完成和制造它,他们可以以一个价格做到。但我认为,即使是原型设计,现在每个人都倾向于将其转移到海外,因为在中国,你可以进行原型设计并在几乎相同的时间内完成。但是,
制造的关键在于,去那里建立关系真的很有帮助。是的。我的第一家公司是一家硬件公司,我们在中国做了我们的PCB,花了很长时间。现在情况有所好转,但这已经是,是的,我不知道,10年前的事情了。我认为,就像,我也听说过这个,我们没有遇到这个问题,但是,
你知道的,如果是一些你没有关系的事情,他们没有看到你,他们不认识你,你知道的,你可能会被转包出去,或者他们没有注意。但是,如果你,你知道的,你有关系和优先级,是的,这真的很好。由于各种原因,我们最终在台湾完成了制造和组装。我认为你去了那里真的很有帮助。是的,我们对这个过程非常满意,
但我指的是整个过程,只是选择合适的人,而且只是采购物料清单以及所有这些东西。我想,如果你有时间,这还不错,但如果你想真正加快速度,那就会非常紧张。好的。我们必须转到软件。
是的,是的,是的。所以硬件,也许人们很难理解,但是软件人们可以理解的是,每天24小时实时运行转录和摘要以及所有这些事情,这并不容易。所以你提到了每天20万个token。你如何让它基本上免费为消费者运行所有这些?
好吧,我认为管道和推理,人们会考虑所有这些token,但正如你所知,token的价格正在急剧下降。你们可能在某个地方发布了一些图表。我们有。
如果你看到像25万个输入token的趋势,这并不是很多,对吧?就像输出一样——你做了几层。你做现场直播。是的。是的。所以语音转文本实际上是最具挑战性的部分,因为你知道的,它需要实时处理,然后像用更大的模型进行后期处理。一件相当明显的事情是,你不需要转录任何没有声音的东西。对吧。
对吧。所以良好的语音活动是关键。对吧。因为大多数人的一天中大部分时间都不是在进行语音活动。对吧。所以这是减少你必须执行的计算量的第一步。语音活动是一件相当便宜的事情。非常非常便宜的事情。需要总结的模型,你不需要十四行诗级别的模型来总结。你需要十四行诗级别的模型来执行像代理这样的事情,我们将为这样的功能提供订阅,因为……尽管现在有了R1,我们会看到。我们还没有评估它。深度搜索?是的。不是那个特定的,但是它们已经存在了,可以执行那个级别的操作。我本来想说六个月,但是是的。所以自托管
在你可以的地方提供帮助。所以你们正在自托管模型?是的。你们正在微调自己的ASR?是的。我会说,我看到未来一切都在下降,尽管我认为可能会有一个中间步骤,事情会变得昂贵,那就是我们非常感兴趣的,因为管道非常繁琐,而且有很多调整,这很残酷,因为……
这只是很多反复试验。而像,如果一个端到端模型可以做到这一切并学习它,那不是很棒吗?如果我们可以用LLM进行转录,那么这样做有很多优点,但这将是一个更大的模型,因此需要更多的计算优势。
你知道的,我们很乐观,也许我们可以提炼一些东西,就像我们不仅仅专注于降低现有管道的成本,或者尝试下一代,因为很明显,像所有ASR,所有语音转文本很快就会过时。所以投资这方面可能是一种死胡同,因为它只会过时。这很有趣。就像我认为当我最初投资Tab时,这表明我有多么错误。我当时想,哦,这是一种剃须刀刀片模型,你销售廉价的硬件,然后赚取订阅费,就像每月订阅一样。而现在我刚检查过,Friend是一次性销售,99美元。Limitless是一次性销售,99美元。这些人一次性销售,49美元。而推理是免费的?什么?什么?
好吧,我认为当你可能投资的时候,像当时一百万个输入token是多少?现在是多少?这是一个引人入胜的业务。而且,你知道的,这里有很多东西需要深入研究。但是仅仅让这种观点被人们知道,我认为这不是人们经常考虑的事情。而你显然已经考虑了很多。
记忆怎么样?我认为这是我们来回讨论记忆的事情,就像你只是记住事实,然后理解隐含的偏好并调整你认为关于一个人的事实。你从中学到了什么?我知道现在有很多开源框架可以做到这一点。你们是否在内部构建了所有自己的基础设施?
是的,我们做到了。我的意思是,我在其他项目中评估并使用了LOD。我认为有一些不同的任务或事情围绕着记忆,比如
一个是检索,显然,就像当你需要找到,即使你有一个大型语料库,你如何找到,所以……就像我认为现有的RAG管道也可能会被淘汰,我还没有找到一个框架,就像没有一种通用的方法可以做到RAG,它真的高度依赖于数据,所以就像如果你要
定制这么多东西。你只是从自己设计中获得更多好处。你知道的,很多这些框架非常适合快速上手。但我认为当你试图为一个人做记忆时,这真的很有趣,因为记忆会衰退,对吧?就像
我要去伦敦,你知道的,然后我回来,我不再去伦敦了。我们学到的是,像传统的嵌入和RAG一样,效果不佳。我们使用小型模型构建了自己的模型,以进行真正大规模并行的检索,我认为这在未来可能会更常见。然后像
如何代表一个人。我们仍然需要一些人工循环。我的意思是,这是一个正在进行的项目,你知道的,我们每天都在学习。就像,当模型对你的某些事情出错时,你如何纠正它?现在我们有一些东西,就像超级确认的东西,就像关于你的基本事实,因为人类接受了它。但理想情况下,这一步是不必要的。然后我们有一些比较模糊的东西,而且
我们知道的事情越多,当我们试图决定这是不是模糊的东西时,我们就越准确。因为它可能就像,如果你有上下文,它可能是不正确的。所以我认为最核心的挑战之一是如何处理检索和建模。尤其是在处理嘈杂的源数据时,因为即使在理想的世界中,即使你只有完美的数据,
转录,你正在使用它,这仍然不够信息。对吧。即使你有视觉信息,也仍然不够。就像仍然会有一些误解。所以如何不让它损害它的价值,并且像可恢复和可纠正一样。是的。我认为的一种方法是,如果我喜欢的话,我通常喜欢从同一家餐厅点同样的东西,但我没有大声说出来,因为
这有点像,这些类型的行为?就像当你问到最喜欢的餐厅时,我只想让它给我提供我去过的、我喜欢的餐厅。或者像,如果我说,嘿,从这个地方点些东西,它应该只重新点同样的东西,因为它知道我喜欢重新点同样的东西。但我感觉今天我看到人们发布的大多数代理记忆的东西,就像,你知道的,只是写下数据一样。是的,我的意思是,我认为这就是为什么推理,就像在……
在我们的例子中,比如让它有时间考虑它拥有的所有来源。所以,比如查看电子邮件,查看收据,然后查看对话,看看我提到了什么,然后能够花足够的时间搜索所有上下文并连接点。
我认为这真的很重要。而且,我不知道,像一些代理记忆的东西一样,它就像在RAG之上的关键价值一样,当你有像不断增长的语料库和像管理可能存在于源材料中的衰减和幻觉时,那里的结果就不够完整了。所以这就是人们通常引入知识图谱的地方?是的。你们这样做吗?
我们没有广泛使用知识图谱。这是一个,你知道的,我们也没有讨论潜在的未来社会方面。是的,好吧,我应该谈谈这个。但是我们发现知识图谱的问题是,
我不知道你是否能告诉我你的经验,但是它们非常适合表示数据,但是像在推理时使用它却很有挑战性。速度或其他问题?就像LLM理解一样,就像图,输入。是的,它肯定不在训练数据中。我认为图是存储数据的正确方式,但是然后你需要
进行正确的检索,然后以一种不会压倒或混淆你正在尝试做的事情的方式进行格式化。我们应该问一下社交吗?是的,我以为你会谈到这个。是的。就像不直接相关一样。不直接与图检索或图知识竞赛相关,但是像这个想法一样,如何
拥有你的个人上下文,但是其他人可以查询它,你知道的,它可以泄露一些你完全可以控制的事情,然后我和玛丽亚试图协商我们要去哪里吃饭,就像
我们确实做了这个实验。代理之间可以进行交换。所以我的代理如何与伊森的代理交谈。他们两个都知道我们的位置,我们喜欢什么,我们过去去过哪里。即使我们集成了日历,他们也知道我们什么时候有空。所以他们可以互相交流,进行对话,并为我们决定一个去处。我们做了这个。
对我来说,这真的很酷,因为他们向我们推荐了一家不错的法国餐厅,我们最后去了那里。你去过吗?我们没去过。但是我们两个都说我们喜欢法国菜。我们两个都在太平洋高地。
是的,这真的很琐碎。是的,这是一个琐碎的玩具用例。但是我想,就你已经使用了一段时间而言,如果我想给你买礼物。哦,我的上帝,现在我想起来你给我买了一堆蜡烛。这是一个用例。当我们测试代理时,亚马逊的一堆蜡烛出现在她家门口。是的,因为我喜欢蜡烛,但我没想到有20支。
是的,有很多实验。但是,就像如何管理它,就像你的B可以向谁泄露什么?就像你每次都应该收到授权请求吗?是的,是的,是的。对于缓慢的上下文。是的,是的,是的。所以,你知道的,你必须,人类必须签字。但我认为然后,然后我不必猜测。我可以直接……
是的。你知道的,有一种文化,就像对旧金山以外和旧金山Z世代泡沫以外的其他人来说非常陌生,那就是共享位置共享。我可以告诉我的密友他们现在在城市中的确切位置。而且它是可选的,而且,你知道的,而且它很正常,而且它吓坏了这里以外的每个人。是的。是的。所以也许我们可以分享偏好,比如我们喜欢谁。绝对。我真的很相信它,当然。我们会。或者甚至像
关于你一天的小更新。我的父母会喜欢这个,因为我不这样做。现在没有摩擦。它可以或多或少地自动进行。约会?我被训练成总是避免约会,作为一名初创公司创始人。每个人都讨厌它吗?我们考虑过。就像有时有些人会问我们,因为就像,哦,你对我了解这么多。就像,你能衡量与其他人的兼容性吗?是的。
是的,可能会有未来。也许有人应该构建它。我认为在我们这边,我们就像,不,这是……我会在你的API上构建。我的姐姐实际上是一位人格心理学教授,她研究人格。我们都在感恩节,因为我的父母戴了一个。我说,问它,比如,给我我的五大性格,这就像人格类型一样。它知道我的五大性格吗?只需要求它考虑一切并给出你的五大性格即可。好的。
我姐姐说这很……我不认同,因为它说我不合群。我同意这一点。她说它似乎很合群。你不同意你是不合群的吗?是的。你还需要什么证据?是的。我认为我非常合群。
但我认为我们确实得到了一些用户,他们说,“哦,如果我们是一对夫妇……”是的,我们确实有夫妇。他们一起购买了产品。他们都……夫妇,他们购买了硬件,所以这里面有一些东西。另一个测试是迈尔斯-布里格斯。我知道你不喜欢那个。不,海洋比迈尔斯-布里格斯更酷。每个人都停止使用我的MBTI,使用Ocean。是的,对我来说,它每次都很准确。
太棒了。我们没有涵盖的其他内容吗?任何很酷的被低估的东西吗?访问b.computer4999,你就可以购买设备了。这就是行动号召。你们正在招聘吗?我们正在招聘,当然。AI工程师。什么是AI工程师?是的。你学习过吗?一个勤奋并且愿意……与我们一起工作的人。我认为……
我认为你创造了这个词,对吧?所以你可以告诉我们。一个可以适应的人。这真的就像……它有抵抗力。人们有不同的观点,对你来说有用的东西与对我来说有用的东西不同。是的。所以无论如何,它非常有用。我认为……
始终在线的AI真的会爆炸。这将来自许多初创公司,但也来自现有公司。我们将学习各种新事物,了解它将如何改变我们所有人的生活。我认为这是我最确定的事情。成为AI。好吧,非常感谢。谢谢你们。谢谢。是的,我们会在发布时看到你,发布即将到来。是的,谢谢。谢谢。谢谢。