We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode #52 End of Smartphones? The Revolutionary Rabbit R1

#52 End of Smartphones? The Revolutionary Rabbit R1

2024/1/18
logo of podcast Future of UX | Your Design, Tech and User Experience Podcast | AI Design

Future of UX | Your Design, Tech and User Experience Podcast | AI Design

AI Deep Dive AI Chapters Transcript
People
P
Patricia Reines
Topics
Patricia Reines: Rabbit R1 是一款革命性的语音AI设备,它通过结合大型语言模型 (LLM) 和大型动作模型 (LAM) 来理解用户的自然语言指令并执行相应的任务。与传统的智能手机应用程式相比,Rabbit R1 提供了更简化、更直观的交互方式,用户无需在多个应用程式之间切换,只需用语音即可完成各种任务,例如预订机票和酒店。这标志着用户交互方式从基于任务转变为基于意图的模式。然而,Rabbit R1 也存在一些不足之处,例如用户界面设计不够完善,可读性和易用性有待提高;在某些需要快速安装应用程式或查看图像的任务中,Rabbit R1 也存在局限性,无法完全取代智能手机。总的来说,Rabbit R1 代表了未来科技发展的一个方向,它预示着未来智能手机可能将整合大型语言模型,并简化应用程式交互方式,最终可能淘汰传统的应用程式界面。对于 UX 设计师而言,Rabbit R1 的出现提醒我们,在设计 AI 产品时,应关注用户任务的完成,而非简单的 AI 功能集成,需要重新思考用户工作流程,并设计出更符合用户需求的 AI 增强型工作流程。

Deep Dive

Chapters
The Rabbit R1 is a device designed to simplify computer usage through natural language interaction, aiming to replace app-based systems with a more intuitive interface.

Shownotes Transcript

大家好,欢迎回到“未来用户体验”播客,这是关于未来、关于技术、关于设计行业任何重要更新的首要资源。我的名字是帕特里夏·雷内斯,我是这个播客的主持人,我在瑞士苏黎世担任创新设计师和用户体验设计师。我在那里经营着自己的公司。

在我们开始之前,先做一个简短的公告。就在昨天,我进行了关于如何在2024年利用Generate-A-Fay作为设计师的免费直播培训。它非常成功。你们都喜欢它。非常感谢你们的参与。我度过了一段美好的时光。

我决定再进行一次免费直播培训,同样是零欧元。所以你不需要为此支付任何费用。我将在下周三进行。这是它的第二部分。你不需要参加第一次。如果你错过了,可以直接参加下一次。不用担心。它将在下周三下午6点中欧时间(柏林时间)举行。

如果你想保存,你可以在你的描述框中找到它。所以请保存你的座位,希望下周三能见到你,一起讨论设计师与AI的协作。非常令人兴奋。在这个播客节目中,我想谈谈一款名为Rabbit R1的革命性、超级有趣的新设备。

这款设备对我们设计师来说非常有趣,我也将解释为什么它如此有趣,以及为什么它显示了未来的发展方向。所以我会说……

让我们直接深入,放松身心,享受关于Rabbit R1的这一集。首先,我将开始谈谈这款设备究竟是什么。之后,我将更深入地探讨对我们设计师来说有趣的话题,例如未来的交互方式,以及为什么它对我们如此有趣。

然后,我将谈谈这款设备的一些缺点。然后我们将展望未来。基本上总结我们学到的所有东西,所有的见解,然后思考未来可能是什么样子。首先,什么是Rabbit R1?

它是一个橙色的微型设备,也许你在社交媒体上见过它。它看起来有点像80年代Game Boy的炫酷现代设计版本,诸如此类。它非常有趣,因为它有一个屏幕和一些按钮。R1的目标是创造一种你可以想象的电脑,

你不需要学习如何使用它,并且真正摆脱任何基于应用程序的操作系统。他们通过使用自然语言来做到这一点,即自然语言方法。你与这个设备交谈,它理解你的需求,然后完成任务。目前,我们所有人,可能我们所有人,都在使用这些智能手机。我们如何……

通常与智能手机交互的方式是通过应用程序。任何东西都有一个应用程序。用于约会、预订Uber、购物、订购杂货。基本上你能想到的任何东西,都有一个应用程序。

当然,智能手机应该非常直观,应用程序只是某种附加组件。但是现在,一切都围绕着这些应用程序。在一天中,你会多次切换不同的应用程序。用户遇到问题、产生想法、想要解决的事情,直到真正到达应用程序内部的那一点,你知道的,例如打开手机、解锁它或拿起手机、解锁它,然后搜索应用程序,然后搜索他们想在应用程序中执行的特定操作。所以需要几秒钟甚至更长时间才能达到你想要的结果。

我们看到的另一个问题是,很多人,包括我自己,都花太多时间在手机上,真的在手机上消磨时间,分心。他们实际上只想快速查看他们的电子邮件,然后他们去Instagram,他们滚动浏览,他们去TikTok。他们只是分心了。苹果、亚马逊和谷歌非常了解这个问题,他们推出了智能音箱。Alexa、Siri,

还有谷歌音箱。但是这些音箱的问题是,它们几乎不知道你在说什么。所以即使在今天,当你对Siri或Alexa说话时,50%的时间它们都不知道你想要什么。实际上,我的整个家都几乎整合了智能家居。所以我们有很多智能家居灯泡等等。

昨天我只是想让Alexa把灯关掉。然后不知从哪里,她播放了一首关于灯的歌。哇。那一刻有点好笑,但我认为这确实总结了这些智能音箱目前的状态。它们大多真的不知道我们在说什么。

现在我们有了大型语言模型,它们知道你在说什么。它们理解你想要什么。当你与ChatGPT之类的工具交流时,感觉就像魔法一样,因为它们理解你。它们找到答案。它们找到解决方案。但是这些大型语言模型也有一些问题或挑战,因为你可以与它们交流,但它们不能真正完成事情。尽管ChatGPT引入了插件来帮助你交流

某种程度上使用后台的应用程序,例如,如果你想预订飞往巴黎的航班,你可以在ChatGPT中使用Expedia插件,ChatGPT或插件将搜索航班,然后你需要点击它,转到Expedia页面,付款并预订它。

所以你仍然不能在ChatGPT中完成所有事情。这是一个起点,但你仍然需要之后执行某些步骤。它们非常擅长理解你,为你准备内容,但在真正做事情或完成事情方面,它们并不那么擅长。因此,像ChatGPT这样的工具非常擅长理解你的意图。而且……

你还需要解释流程的每个步骤,对吧?所以你首先要求搜索航班,然后是下一步。这就是这些大型语言模型的工作方式。目前关于代理的研究很多。代理基本上会从头到尾执行一项任务。如果想查看,我还会在描述框中链接一些代理。非常有趣,非常引人入胜。

那么Rabbit R1有什么特别之处呢?它是基于研究的,他们研究人类如何与技术互动。他们的目标是这款设备可以完成iOS或Android或你的桌面电脑可以完成的任何事情,但无需必要的步骤。

因此,他们结合了大型语言模型来理解你想要什么。然后他们集成了大型动作模型(LAM)。这就是他们对它的称呼。我实际上不确定这只是一个营销术语,还是实际上是另一个大型语言模型。

但他们在演示中所说的是,他们结合了大型语言模型来理解用户想要什么,然后也采取行动,就像你使用应用程序一样。他们通过对人们如何浏览应用程序进行训练来做到这一点。这些模块执行任务,这些LAM,

基本上可以学习任何软件的任何界面,无论它们运行在哪个平台上。所以大型语言模型理解你说什么,但大型动作模型会完成事情。所以是从语言到行动。这确实意味着我们拥有一台电脑,除了理解你试图说的话之外,它实际上还能帮助你做事情或完成事情。你有一个触摸屏

它就像一个微型触摸屏。你有一个免提按钮。你有一个模拟滚动按钮。你有一个麦克风,你有一个扬声器,你还有一个360度摄像头。他们说它也比大多数其他语音AI项目快10倍。你不需要唤醒词。你只需点击按钮,就可以告知人们。

你的Rabbit R1上有哪些提供商和服务可用。例如,如果你使用Spotify,你可以通过你的电脑和R1连接你的Spotify帐户。所有这些都在你的电脑上通过某个应用程序或软件进行,你可以在其中进行所有这些连接。他们在演示中展示的一些例子非常有趣。例如第一个是

他们问,好吧,我想和我的家人去伦敦。我有两个年幼的孩子。我想从2月1日到5日去。是的,我们喜欢便宜但直达的航班和不错的酒店。

然后你可以看到R1是如何为你准备单个步骤的。你可以批准或迭代。然后R1实际上为你预订了所有东西。所以你不需要经历不同的步骤,不同的应用程序。所以整个工作流程基本上都在后台进行。

从基于任务到基于意图的交互,这非常有趣。作为用户体验设计师看到这一点,对我来说非常吸引人。R1并非旨在取代你的手机。他们也强调并提到了这一点。我也同意。你仍然需要你的手机。你仍然需要应用程序。但这确实是当前我们前进的一个有趣的方向。我认为这款设备确实让你感受到未来产品可能是什么样子。

使用自然语言。我还强烈建议查看他们的研究部分。当然,他们做了很多研究。

他们分享了他们如何训练模型的见解。你可以看到很多视频,人们浏览网页、预订Uber、订购杂货,他们用这些来训练模型。所以它基本上是在一堆不同的应用程序上进行训练的,然后用大型语言模型将其抽象出来,然后简化界面,使其只是一个语音界面。

非常有趣,我认为这某种程度上是一个中间步骤,因为这款设备确实展示了如何操作应用程序本身,或者应用程序如何自行操作,而你实际上不需要这样做。所以用户基本上不需要做任何事情,只需与它交流即可。下一步可能是完全移除应用程序。当这种情况发生时,将不再有应用程序。

非常有趣。对于我们用户体验设计师来说,它展示了一种与技术互动的新方式。当人们问我,我该如何设计AI产品时?正是这种心态。不要考虑如何将AI集成到一个微小功能的微小部分中,而是真正回顾一下,放大视野,考虑一下用户想要完成的任务是什么。

然后提出一个AI增强的流程。这是我们唯一可以做到并且真正重新思考某些模式的方法,对吧?但是也要考虑一些缺点或R1不太好的方面。首先,

我必须说,我认为界面首先非常小,你可以,它比没有好。它比AI针好,AI针没有界面,只有投射在你的手上。非常酷,科幻感十足,但拥有一个界面仍然非常好。

我必须说,界面看起来不太易于访问。他们选择的字体看起来很花哨,80年代风格,但我不会推荐给任何网页设备或数字界面设备。它不容易阅读。

此外,在一些演示中,你会看到字体被截断了。不太好。总的来说,我认为整个界面设计,他们是如何构建它的,看起来有点,我会说有点不专业,有点像你会给一个从未设计过屏幕的一年级设计师的东西。没有很多层次结构,很难理解。

快速查看它并了解哪些内容很重要。所以肯定有一个领域他们真的需要改进。此外,我的意思是,他们强调他们不是来取代手机的。但仍然,当你想到完美的场景时,你会同时拥有两者,对吧?因为有很多时刻,例如,就在昨天,我们在城市外的一个区域停了车,我们没有现金。所以我们想用一个应用程序付款,对吧?所以我们还没有安装该应用程序。所以我们需要安装它,然后用该应用程序支付停车费。如果你只随身携带你的Rabbit R1并且忘记了你的手机或类似的东西,

你实际上无法做到这一点,因为你可能还没有将应用程序与R1连接起来,或者你还没有安装它,所以你无法支付费用。所以这些小问题,你只需要快速安装一个应用程序,你只需要在你的手机上做一些事情。所以目前你需要同时携带这两样东西,例如在一个口袋里放iPhone,另一个口袋里放Rabbit R1。有时你想要可视图像。

只是浏览一下。例如,当你想通过Airbnb预订你的暑假时。我个人,我知道很多用户也是这样,真的想从图像中获得灵感。也许想要一个很棒的选择,因为像Airbnb这样的所有工具或应用程序都可能非常令人不知所措。但视觉部分非常重要。

当然,这是第一代设备。所以人们当然非常批判。有些人也很兴奋。我认为重要的是要看看两方面。绝对推荐查看一下。如果我有机会,我也会买一个。价格是199欧元。我认为对于这样的设备来说,价格相当实惠。非常高兴能在你的桌面上拥有它,并在日常生活中使用它。

我认为未来的发展方向就是这样,这只是我的想法。所以就像我的个人假设一样,我认为苹果,我的意思是,他们也公开表示他们正在这样做,苹果、谷歌、亚马逊,他们正在努力改进Siri,改进Alexa并将它们集成到他们的手机中。所以我非常确定在下一次主题演讲中,苹果将推出一个

Siri的全新定义版本,其工作方式非常相似。因为这对我们来说是理想的,对吧?如果我们在手机上拥有这个功能,我们可以选择,也许我们只想浏览应用程序,想从一些视觉效果中获得灵感,只想滚动浏览,分心。或者如果我们想快速完成事情,对吧?例如

例如,是的,自动化某些任务,对吧?我的意思是,当我度过一天时,我有很多看起来相同的工作流程。例如,首先,我浏览电子邮件。我检查一下,是否有任何客户给我写了电子邮件?然后我回复他们。

如果我可以添加一个自动化程序,它可以浏览我的电子邮件,已经标记出重要的电子邮件,将它们发送给我,甚至预先编写回复,以便我只需要检查一下,那就太棒了。所以所有这些自动化程序,对吧,这些有用的自动化程序也可以用R1来完成,基本上可以教你自己的自动化程序。我没有介绍过这一点。所以也许我会再做一个关于教学或创建自动化的节目。

但我认为总的来说,这可能是事情的发展方向。所以我非常确定我们的手机也在发生变化。

在某些时候,我确信我们不会再有这些应用程序,但应用程序将集成到基本上一个系统中,例如一个大型语言模型,它在后台使用信息。应用程序仍然存在,但不是作为用户的界面。我们还没有达到那个阶段。目前,我们正处于中间状态。所以这是一个非常令人兴奋的时代。

我还将一些资源链接放在了描述框中。如果你想查看,请这样做。我希望这对你有帮助并且很有趣。

我还想提到,我下周三将进行一次免费的网络研讨会。主题是如何与AI作为设计师进行协作。请随时报名参加。你不需要为此付费。不用花钱。你可以报名。我会把它添加到描述框中。然后希望下周三能见到你。非常感谢您的收听。再见。