We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode #69 Apple’s AI Journey: Challenges, Innovations, and Ethical Dilemmas

#69 Apple’s AI Journey: Challenges, Innovations, and Ethical Dilemmas

2024/5/30
logo of podcast Future of UX | Your Design, Tech and User Experience Podcast | AI Design

Future of UX | Your Design, Tech and User Experience Podcast | AI Design

AI Deep Dive AI Chapters Transcript
People
P
Patricia Reiners
Topics
Patricia Reiners: 苹果公司在AI领域虽然落后于谷歌和微软等竞争对手,但其庞大的用户基础使其仍有追赶机会。苹果即将在WWDC发布代号为“Grey Matter”的AI项目,该项目将把新的AI功能集成到Safari、照片和备忘录等日常应用中,专注于提升用户体验的实用性功能,例如改进通知、语音备忘录转录和更智能的照片编辑。然而,近期AI Pin和Rabbit R1等AI工具的失败案例表明,缺乏用户研究是导致产品失败的重要原因。这些工具虽然创新,但由于仓促上市,用户体验不佳,也暴露出苹果在AI大规模集成方面面临的挑战。Siri与ChatGPT相比存在显著差距,苹果改进Siri的步伐缓慢,这可能与其坚持更严格的道德准则,导致训练模型的难度和时间成本增加有关。苹果正在考虑与OpenAI或谷歌合作,以改进Siri并整合更先进的AI技术。OpenAI与Scarlett Johansson的纠纷也凸显了与AI公司合作的风险,苹果等公司需要谨慎。总而言之,苹果的AI战略需要在创新和用户体验之间取得平衡,并谨慎处理道德和合作风险。 Patricia Reiners: 苹果公司在AI领域面临的挑战与机遇并存。一方面,Siri与其他大型语言模型相比仍有差距,这与苹果公司在数据获取和模型训练上的严格道德准则有关,这使得其AI模型的训练过程更加耗时且成本更高。另一方面,苹果公司正在积极探索AI技术在日常应用中的集成,例如在iOS 18和macOS 15中推出新的AI功能,这些功能将专注于提升用户体验的实用性,例如改进通知、语音备忘录转录和更智能的照片编辑。此外,苹果公司也正在考虑与OpenAI或谷歌等公司合作,以获取更先进的AI技术,从而提升其AI产品和服务的竞争力。然而,与其他AI公司合作也存在风险,例如OpenAI与Scarlett Johansson的纠纷就凸显了数据隐私和知识产权等问题的重要性。因此,苹果公司需要在追求技术创新的同时,重视用户体验和道德规范,谨慎处理与其他AI公司的合作关系,才能在AI领域取得长远发展。

Deep Dive

Chapters
This chapter discusses Apple's AI strategy, focusing on their upcoming AI features in iOS 18 and macOS 15, under the initiative 'Project Grey Matter'.

Shownotes Transcript

大家好,欢迎回到“未来之卵”播客。本期播客是在意大利撒丁岛这个美丽的岛屿上录制的。我目前正在这里度假,或者说是“工作度假”,现在大家都这么称呼。所以,我基本上白天工作,下午和晚上再四处探索一下。

这里非常漂亮,我正在我们的面包车里录音,因为我们正在用我们新改装的面包车探索撒丁岛,是的,我正坐在海滩边上。面包车里很热,我需要打开窗户,所以如果你听到海浪声或鸟叫声,我希望这不会太打扰你,因为我真的很想

录制这期播客来谈谈公司的AI战略。我认为这非常重要,特别是对于我们UX设计师来说,了解战略,了解未来的发展趋势,谈谈几周后苹果开发者大会上即将发生的事情,以及

一些刚刚发布的工具,比如Rabbit R1或AI Pin。所以我想我们先从苹果开始,对吧?这就是目前苹果和AI的内幕。苹果通常以创造令人惊叹的用户体验而闻名。但说到AI,

是的,与拥有Google Gemini或微软OpenAI的谷歌相比,它们有点像弱者。尽管如此,苹果仍然押注其庞大的用户群来迎头赶上。有些人已经猜到了,也有一些泄露的消息。这些是泄露的消息。我们会谈谈一些预测。这些不是事实。

但在即将举行的全球开发者大会上,苹果可能会在iOS 18和Mac OS 15中推出新的AI功能。

他们将这项计划称为“灰质”项目。很酷的是:这些AI工具将内置在我们每天使用的应用程序中,例如Safari、照片和笔记。很多人已经猜到了。苹果公司专注于许多使我们生活更轻松的实用工具。例如更好的通知、语音备忘录转录和更智能的照片编辑。非常简单的事情,在后台发生的更透明的事情。

另一方面,我们有AI Pin或Rabbit R1之类的工具,我的意思是,这些工具带来了很多问题和失望。我个人曾经抱有很高的期望,我认为他们用这些产品所做的事情仍然非常具有革命性,但人们却非常失望。只是一个小小的

总结一下发生的事情。我们有两个超级鼓舞人心的AI工具基本上在上个月上市,都是上个月。让我们首先谈谈AI Pin,这是一个你可以别在衣服上的小型设备。你可以通过手势、语音、点击进行交互,界面基本上投射在你的手掌上。

你没有任何应用程序,你只需要支付订阅费用,

当然还有购买这个设备的价格。然后你就可以非常自然地与它互动。这一切听起来都非常具有革命性,但它也带来很多问题。发热问题,性能非常滞后,非常慢,磁性机制有点问题,投影功能听起来很吸引人,但基本上没有经过充分测试。它很创新,但却令人失望。所以投影的想法

信息基本上在你的手上听起来很棒,但在实践中却不太好,因为你的手有不同的尺寸,你使用手的角度也不同。它并不实用,对吧?就像人类不习惯那样把他们的手放在脸前。所以这是一个非常不自然的姿势。

还有户外可见性、尺寸限制和一般的可用性问题,例如每次都需要输入密码,当你想要把它从你的夹克换到你的套衫上,然后再换回你的夹克时,这很痛苦。隐私问题、穿着的灵活性,是的,用户并不真正喜欢它,他们觉得它很笨拙。

现在他们实际上正在试图出售整个公司,因为它并没有成功。这项技术仍然非常具有创新性和趣味性,但我看到的问题是缺乏用户研究,没有真正与客户交谈,观察用户和用户行为。而用户研究是任何设计过程中非常重要的一部分。我认为这是一个用户研究失败的好例子。

我们正在讨论的第二个超级有趣的AI设备是Rabbit R1。这款游戏机般的设备采用亮橙色,配有显示屏。我认为这更有前景。它更便宜,199欧元。顺便说一下,它的发货方式肯定是不成熟的。它缺少许多承诺的功能。它是由Teenage Engineering创建的。

它提供了许多学习能力,但也存在用户交互问题。尽管它有触摸屏,但你仍然需要使用滚轮来完成某些操作。诸如音量调节之类的常规问题。它还没有准备好进入市场。它还没有准备好供日常用户使用,所以人们非常失望。

同样是创新,但也仓促。超级令人兴奋的小工具,但正如我提到的,它似乎非常仓促。所以人们对这两项技术,基本上是对这两个设备感到非常失望。从用户体验的角度来看也是如此。

但我认为他们之所以这么仓促,是因为他们知道其他公司,如谷歌、微软或苹果,并没有在睡觉。他们也在开发自己的AI功能和AI集成,特别是考虑到你拥有……

Rabbit R1的功能在你的iPhone上,这在你的Android手机、你的谷歌手机上会方便得多,对吧?因为他们已经有他们的手机了。他们可以使用他们的手机作为默认模式,但他们也可以使用更像AI未来的方法,对吧?或者苹果目前正在做的是将其非常巧妙地集成到他们的设备中。我们将看看他们在开发者大会上会谈些什么。

但一些可能即将推出的、已被泄露的新功能包括:例如,一个稍微增强版的Siri。当然,Siri正在升级,以利用苹果最新的AI模型,听起来更自然,更有帮助。我们稍后会谈谈Siri目前的问题。

然后他们可能会将生成式AI集成到表情符号中。例如,根据你的文本即时创建自定义表情符号。听起来很有趣。然后是一个自由的iPhone主屏幕,你可以更改应用程序的颜色,可以随意放置它们。诸如此类。还有智能摘要,真正获取错过的通知、消息、网页等的摘要,这听起来非常非常方便。

所以Siri仍然存在问题,对吧?如果你使用ChatGPT或任何其他大型语言模型,你可能会注意到Siri和ChatGPT之间存在巨大差距,特别是与ChatGPT 4.0模型相比,对吧?你真的无法比较它们。苹果并不愚蠢。当然,他们知道这一点。但显然,他们目前似乎在改进Siri或多或少……

或集成类似于ChatGPT的功能方面存在问题。所以他们迟早会计划集成一个类似ChatGPT的聊天界面或ChatGPT替代品。但苹果还没有做到这一点,而且似乎需要相当长的时间,而竞争对手正在取得进展,而苹果并没有跟上。

你可能还会想知道为什么苹果改进Siri需要这么长时间?为什么Siri仍然不足?我认为可能的原因是:虽然OpenAI已经抓取了整个互联网,包括书籍、文章、数百万受版权保护的材料,但苹果正在使用或多或少的道德准则。

这使得想出可以用来训练模型的内容更具挑战性,也更费时。这类似于我们看到的Midjourney和Adobe Firefly。两者都是图像生成工具。我们使用提示作为输入,然后生成图像。Midjourney略微领先于Adobe Firefly,但它是使用来自设计师、艺术家、摄影师的受版权保护的图像进行训练的,并且

基本上没有进行太多过滤。因此,你可以创建许多实际上受版权保护的不同图像,对吧?例如米老鼠,你没有权利使用,或者其他公司。然而,Adobe采取了非常非常不同的方法,使用库存照片进行训练,并补偿艺术家和摄影师。

我认为这是一个非常非常不同的方法。这种方法自然地,当然更昂贵,因为你需要付钱给人们,而且需要花费更长的时间,因为你需要找到很多图像,这使得它在道德上是正确的训练这些模型的方法,对吧?就像我们人类如何想要使用这些工具,我们如何想要与AI互动一样。但当然,这需要更长的时间。

Adobe Firefly现在已经发布了Model 3。它已经得到了如此如此巨大的改进。我认为这令人印象深刻。结果很棒。但这个过程比那些你可以随意从网上窃取所有内容然后放入这个黑盒子的工具花费的时间要长一些。当然,那更快,对吧?所以最初需要更长的时间,但从长远来看,这是值得的。我假设苹果目前也面临类似的问题。

因此,苹果可能正在寻找替代方案,并且围绕与OpenAI合作将他们的聊天机器人集成到iOS 18中进行了一些讨论,因为苹果已经意识到他们自己的聊天机器人还没有准备好。因此,他们可能会与OpenAI合作寻求高级解决方案。

但他们也正在与谷歌洽谈,可能使用他们的Gemini聊天机器人。这是一个重大举动,表明苹果非常认真地想要获得市场上最好的AI技术。但我认为我们也应该对此持非常怀疑的态度,特别是考虑到OpenAI正在发生的事情。也许你们中的一些人已经听说过OpenAI的戏剧性事件。有点……我的意思是,“戏剧性”听起来太负面了。

因为它并没有太小,而是一个关于演员斯嘉丽·约翰逊的小问题。OpenAI几周前发布了新的模型GPT-4-0,顺便说一下,我制作了一个关于这个新模型的YouTube视频,我在其中展示了它的所有功能,所以一定要查看视频,看看所有新功能,以及一些如何使用这个新模型的示例。

你可以在描述框中找到链接。事情是这样的。OpenAI询问斯嘉丽·约翰逊是否可以使用她的声音用于新模型。为什么是斯嘉丽·约翰逊?很简单,因为她的声音被用于电脑“Her”或电影“Her”中。所以你们大多数人可能都看过这部电影。

一个男人爱上电脑声音的故事。然而,斯嘉丽·约翰逊拒绝了这个请求,她说她不想这样做。但有趣的是,新的声音Skye听起来仍然完全像斯嘉丽·约翰逊。所以,如果你们中的一些人注意到新的声音听起来像她,像电影“Her”中的电脑,

那就是原因。它确实听起来像斯嘉丽·约翰逊。她现在已经提起诉讼,并正在采取法律行动。作为局外人,我们当然没有掌握所有事实,但很明显,这个声音听起来就像她的声音。这个声音目前已下线,所以你不能再使用了。但很可能是在未经她同意的情况下使用了她的声音。

这给OpenAI蒙上了一层非常非常糟糕的阴影,并显示了他们的能力。而且不要忘记不久前的人事问题或人员问题。他们也引起了很多讨论。

我认为这确实突出了与OpenAI等公司合作的风险。苹果和其他公司真的必须非常小心这些合作关系,以及它们如何影响其品牌和用户信任。另一方面,创建与TechGPT目前所能做到的相当的AI模型非常困难。

现在让我们做一个简单的总结。这一切对用户体验意味着什么?这对我们来说很有趣。我们是用户体验设计师,在创新和设计领域工作的UX设计师。所以,这对我们意味着什么?首先,我认为这是一个提醒,尖端技术令人兴奋。我认为,对我们来说,关注AI Pin或Rabbit R1之类的工具非常有趣。

因为它并不总是意味着这些技术会获得超级成功,并且会真正成为创新者并彻底改变市场。但许多这些功能可能会集成到我们日常使用的工具中。它还表明,真正的挑战是真正确保我们满足用户的需求和期望。

将半成品的工具推向市场是一个大问题。因此,逐步集成对用户来说非常有帮助,也有助于他们适应。苹果的AI战略确实表明,周到、以用户为中心非常重要,但也表明这些公司在更大规模上集成AI方面也面临着挑战。我对几周后举行的世界开发者大会感到非常兴奋。

并且迫不及待地想看到更新,这是一个很好的提醒,提醒我们作为UX设计师需要紧跟AI的步伐,了解正在发生的事情,并成为这场革命的一部分,以了解我们如何设计工具,AI将集成到你能想到的每一个工具中,所以我们需要学习如何做到这一点,如果你想了解更多关于AI集成、AI模式、如何集成AI的信息

请随时注册我的免费UX新闻通讯,我将在其中分享关于UX模式、AI规则、资源的见解和技巧。每周注册,你就可以直接收到它。非常感谢您的收听,希望下周再见。未来再见。非常感谢,再见。