We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode #71 Apple's WWDC Highlights and AI Innovations: Siri Actions

#71 Apple's WWDC Highlights and AI Innovations: Siri Actions

2024/6/13
logo of podcast Future of UX | Your Design, Tech and User Experience Podcast | AI Design

Future of UX | Your Design, Tech and User Experience Podcast | AI Design

AI Deep Dive AI Chapters Transcript
People
P
Patricia Reiners
Topics
Patricia Reiners: 苹果WWDC2024主要发布了软件更新,重点在于Siri的升级和AI功能的增强。Siri的更新使其能够跨应用执行操作,并集成了OpenAI的ChatGPT,提升了其功能和实用性。同时,苹果也注重个性化,允许用户自定义表情符号和调整应用程序图标位置,增强用户体验。这些更新代表着一种全新的交互方式,用户只需提出请求,Siri就能完成一系列操作。然而,个性化设置也可能导致应用程序的可发现性降低。此外,苹果还发布了其他操作系统的更新,例如macOS Sequoia、iOS 18、tvOS 18、HomePod软件18和Vision OS 2,这些更新都包含了AI增强功能。总的来说,苹果在WWDC2024上展示了其在人工智能和用户体验方面的最新进展,这些更新将对未来的用户交互方式产生深远影响。 Patricia Reiners: 本次WWDC没有发布新的硬件,而是专注于软件更新,特别是Siri的重大升级。Siri之前的功能较为局限,此次更新使其能够跨应用执行操作,并整合了大型语言模型技术,例如ChatGPT,极大提升了其处理复杂任务的能力。用户可以通过语音或文本与Siri互动,并实时更正指令。此外,苹果还强调了用户个性化体验,允许用户自定义应用程序图标和主屏幕布局,并创建个性化表情符号。这些改进旨在让用户更便捷地使用设备,并根据个人喜好定制界面。然而,这种高度的个性化也可能带来一些问题,例如应用程序的可发现性降低。总而言之,Siri的升级和个性化功能的增强是本次WWDC的亮点,预示着未来人机交互方式的变革。

Deep Dive

Chapters
The episode discusses the key highlights from Apple's WWDC 2024, focusing on software updates, AI advancements, and personalization features, particularly in Siri.

Shownotes Transcript

大家好,欢迎回到另一期激动人心的《未来用户体验》节目。我是你们的主人Patricia Reiners,我将带给你们用户体验设计、技术、人工智能及其他领域最新的见解和趋势。今天,我们将深入探讨苹果全球开发者大会的亮点,会上推出了突破性的软件更新,

占据了中心位置。他们讨论了很多有趣的更新。从人工智能的进步到个性化功能,以及Siri的全面改版。有很多内容需要解读。我们将探讨这些变化对用户体验设计师(也就是我们)意味着什么,

以及它们如何塑造我们数字互动的未来。敬请关注本期节目,内容丰富,充满创新和灵感,并对设计的未来有所展望。让我们开始吧。

所以WWDC在本周初,也就是星期一,苹果的全球开发者大会。他们总是分享一个主题演讲,展示最新的更新,有时是最新硬件。而这次他们只展示了软件。所以只介绍了新的软件,这很棒。

仍然非常有趣,因为有很多期待。人工智能目前无处不在,大型语言模型无处不在,每个人都在使用它们。当你将ChatGPT或Google Gemini与Siri进行比较时,就会很明显地发现Siri落后了。可能没有人使用Siri来设置计时器或将某些内容添加到日历中。

但Siri并没有真正发挥作用,我认为Siri需要更新。我们也看到,我们经常在播客中讨论的AI产品越来越多,例如AIPin或Rabbit R1(如果你记得的话)。他们专注于交互式AI。所以不是应用程序,只是AI。它们与苹果无关,完全无关。

但它们展示了一个非常有趣的方向,事情可能会朝着这个方向发展。所以使用大型语言模型,或者在Robert R1的情况下,你记得那个看起来像迷你Game Boy的小型橙色设备,它使用了一个大型动作模型。

这可能主要是营销,但其背后的理念非常出色。大型动作模型不仅仅是创建文本,还可以直接执行操作。不幸的是,ChatGPT无法做到这一点,因为ChatGPT无法访问我们的应用程序。它可以通过我们准备的GPT或我们与Zapier集成的某些自动化来访问,但它不能真正为我们预订Uber,也不能真正播放……

Spotify上的音乐,对吧?因为它就像没有连接,而且可能永远不会那样。所以有很多传闻说Siri有重大更新。所以Siri的水平不会达到R1或这些采用AI优先方法的AI设备的水平,但会有所更新。这可能也是原因之一,

为什么我刚才提到的AI产品AIPin和Rabbit R1提前发布,而且还不成熟。所以它们基本上只是被投放到市场上,尽管它们还没有准备好。

不幸的是,这导致了它们的失败。两者都需要更多的时间。但他们知道全球开发者大会即将到来,苹果将推出一些人工智能调整方面的变化。然后,是的,他们的AI产品可能不再需要了。

所以我说有一些关于重大AI更新的传闻,我必须说我个人非常兴奋,观看了整个主题演讲,就像,你知道的,拿了一些爆米花,在我的阳台上舒适地坐好,然后观看。顺便说一句,如果你想的话,你可以重新观看整个主题演讲。如果你只想重新观看或第一次观看,我会在描述框中链接主题演讲。

现在我想回顾一下更新,并谈谈对我们这些设计师来说重要的内容。我们需要知道什么?实际上引入了哪些更新?首先,我已经提到没有新的硬件。与去年不同,去年我们看到了新的硬件,如Apple Vision Pro耳机和新的Mac电脑,今年的活动完全是关于软件的。但有关于未来更新的猜测……

外围设备,可能还有新的Apple TV型号。

他们还推出了名为Sequoia的新macOS更新,其中包含许多与iOS 18相同的AI增强功能。你将在Apple Music、Notes和其他生产力应用程序中看到改进。此外,苹果还重新组织了系统设置,使其更易于使用。他们使用的系统有很多不同的更新。所以tvOS 18、HomePod、软件18。

他们还为Apple Vision Pro耳机推出了Vision OS 2。它们也有一些新功能,尽管具体细节仍在不断涌现。所以让我们看看最终是什么样子。期待已久的更新之一是为iPad推出了计算器应用程序。是的,所以……

我没有关注整个讨论,但我听说互联网上充斥着人们的抱怨,即使你已经在Apple Vision Pro上有了计算器应用程序,但在iPad上却没有。所以现在你可以在iPad上使用了,该应用程序将集成高级功能,如单位转换和历史视图,类似于其iPhone版本,但针对iPad更大的屏幕进行了调整。

我发现一个特别有趣的功能是,你有一个第三个笔记部分,你可以在其中绘制草图,甚至绘制或记下你进行的计算的笔记。然后它会自动计算计算结果。如果你对草图进行某些更改,你可能会用计算结果绘制草图,结果也会发生变化。所以非常有趣。

接下来我发现非常有趣的是对个性化的巨大关注。iOS 18将允许用户将应用程序图标和小部件放置在主屏幕上的任何位置,摆脱传统的网格布局。用户将能够重新着色应用程序图标。

这意味着现在应用程序图标基本上具有相同的颜色,具有其独特的颜色,例如,Apple TV应用程序是紫色的,然后你还有照片应用程序,它具有彩虹色,所以它们都有其特定的颜色,然后你将能够将它们全部着色为红色,例如。我认为从设计的角度来看,这是你能做的最糟糕的事情

所以我认为这个决定有点值得怀疑,因为突然所有应用程序图标看起来都非常相似,这使得很难找到应用程序,对吧?它们大小相同,颜色相同,上面形状不同,所以图标不同,但看起来仍然非常相似。

但最终,我很确定他们这样做有自己的理由。也许他们在研究中发现人们并没有真正使用他们的主屏幕,而是总是进行搜索,对吧?所以,例如,如果你正在寻找Instagram应用程序,你只需向下滑动,然后搜索栏就会出现,你输入Insta,然后Instagram应用程序。

应用程序就会出现在下方。所以这可能是他们在研究中发现的东西,这就是他们认为个性化主题比可发现性更重要的原因。关于个性化的另一个有趣的事情是,由于AI集成,你将能够根据描述创建自定义表情符号。所以目前你有一些你可以使用的表情符号,例如

百吉饼、羊角面包、心形表情符号,你知道的,就像我们知道的所有表情符号一样。但有了这个新的更新,你将能够创建你自己的表情符号。例如,我想要一个戴着眼镜的狗在便签上写东西的表情符号,那将是我的狗威尔玛在做便签工作,假装是一只用户体验设计师的狗。然后我就可以自己创建这个表情符号,然后在WhatsApp或iMessage中与我的朋友分享。

在我们进入AI主题和Siri更新之前,我只想说几句关于个性化的话。你可以看到个性化关注的强度有多大。让我的Apple设备真正成为我的设备,从标准品牌转向个性化设计和体验。你现在可以创建自定义表情符号,例如戴着便签和眼镜的狗。

我认为这绝对非常有趣和令人兴奋。将用户更多地融入创造者。我们迟早也会在界面中看到这一点。个性化将根据AI调整颜色、信息和设计以适应每个特定用户。AI学习模式,学习用户的知识,然后调整个性化界面。这只有通过AI才能实现,并且还会影响

我们在未来一年中的用户体验和UI设计师。目前还很难想象,但这就是即将发生的事情。顺便说一句,如果你喜欢这个播客,我真的很感激五星评价。这有助于我继续制作播客,研究令人兴奋的话题并邀请优秀的嘉宾。所以评分非常快。你知道的,只需要几秒钟,而且

我过去也不评价我喜欢并收听的播客。但现在我说,不,所有我喜欢的播客,我都想支持创作者。这样做很容易。只需给一个五星评价。你知道的,创作播客或免费资源总是需要付出很多爱和很多努力。作为听众,你可以很容易地帮助创作者。

只需评价播客甚至写评论。我真的很喜欢读评论。我会非常非常感激。非常感谢你们的支持。现在我们进入Siri更新和操作。

所以让我们切换到期待已久的Siri更新。之前的Siri实际上毫无用处。我不知道上次更新是什么时候,但我只用它来设置日历条目、计时器或闹钟。但Siri已经进行了全面升级。首先,

Siri获得了跨应用程序的操作。所以Siri可以在应用程序内部和跨应用程序执行操作。例如,你可以将文章从Apple News发送到消息中的群组线程。第三方应用程序也将受益于Siri的新增强功能。所以你不仅可以与Siri交谈,Siri还可以实际在你的应用程序中执行操作。

有点像我们在Rabbit R1中看到的那样,他们称之为大型动作模型。Siri的好处是它真正利用了更广泛的个人背景,允许它搜索你的整个设备。你可以要求它向我展示我上周发送给Todd的东西,或者浏览我的照片并找到我的护照照片。它会找到照片,然后向Todd发送包含护照照片的电子邮件,并在Todd回复时通知我。

你不需要通过语音命令来做到这一点。你也可以使用基于文本的交互,例如与ChatGPT一样。所以你可以通过文本与Siri互动,实时更正你的陈述,并在该操作系统中享受新的、更集成的外观。非常有趣的是,我认为我在大约两期之前谈到了这一点,当时我深入探讨了关于新升级的传闻。

JGPT已经集成。所以苹果宣布

Siri可以在需要时利用OpenAI的ChatGPT。他们实际上以一种非常有趣的方式解决了这个问题。所以ChatGPT不是Siri或该过程的一部分。但如果Siri可以回答某个问题,则可以选择切换到ChatGPT。然后你会被问到,我应该将此对话与ChatGPT共享吗?我应该共享此图像吗?所以ChatGPT无法访问你手机上的任何内容。

Siri只会在你的同意下提供你允许它提供的信息。我认为这从隐私的角度来看也非常重要。JGPT不会是唯一集成的大型语言模型。可能还会有其他一些,但是,他们还没有提到或命名任何具体内容。但这对用户体验意味着什么?这对用户体验意味着什么?这是最重要的问题。

Siri自主执行操作的能力可能会让你们中的一些人想起Rabbit R1和大型动作模型。从用户体验的角度来看,这很有趣。用户不必经历从问题到解决方案的每个步骤,例如打开应用程序、查找所需信息、单击按钮、共享信息,他们只需提出请求,Siri就会在各种应用程序中处理其余工作。这代表了一种全新的交互方式。

此外,应用程序现在可以为Siri预定义操作。作为用户体验设计师,我们在开发应用程序时需要关注这一点。顺便说一句,Jacob Nielsen写了几篇关于从基于命令的规范转向基于意图的结果规范的有趣文章。有点像大型动作模型正在做的事情,或者操作将要做的。我在描述框中链接了这篇文章。所以如果你想阅读它,请查看一下。

非常感谢您的收听。我希望您喜欢本期播客。请随时在Instagram @ux.patricia或LinkedIn上打招呼。我总是很乐意与大家联系。非常感谢您的收听。别忘了评价播客。这对我很重要,然后我们在未来再见。