欢迎收听AI Unraveled带来的深度解读。
这是由Etienne Newman创作和制作的播客,他是一位资深软件工程师,也是一位来自加拿大的热衷足球的爸爸。没错。如果您觉得这些对人工智能的探索很有价值,请花一点时间在Apple上点赞和订阅播客。这真的很有帮助。确实如此。所以在深度解读中,我们试图做到的是,我们会消除所有噪音,你知道的,不断涌现的人工智能新闻。是的,太多了。我们从精选的来源中提取关键见解供您参考。
把它想象成理解真正重要事物的快速通道,了解正在塑造事物的发展,而不会完全不知所措。快速了解主题的好方法。没错。
所以今天我们关注的是2025年4月23日出现的一些非常有趣的人工智能创新。好的。我们有很多内容。从潜在的巨大科技收购开始。对。社交媒体的变化。对。人工智能辅助技术的进步,甚至还有一些来自你可能意想不到的地方的令人惊讶的强大新模型。是的,最后一个听起来很有趣。它只是一个单日快照,但是它……
它展示了人工智能目前令人难以置信的速度。确实如此。让我感到惊讶的是,有多少不同的领域受到了影响,科技、创意方面,
无处不在。是的,绝对的。好的,让我们直接进入潜在的大型收购。OpenAI可能会收购Chrome。哇,好的。这很重要。是的,它是在美国司法部对谷歌的反垄断诉讼中出现的。你知道,谷歌占据主导地位的那个大案子。对,搜索垄断论点。没错。所以显然OpenAI的产品负责人Nick Turley,他实际上作证说,
表示如果谷歌被迫出售Chrome,他们有兴趣收购。好的,理由是什么?嗯,这是有趣的部分。他谈到将ChatGPT深度集成到浏览器中,就像真正地将其编织进去,以实现更智能、更人工智能驱动的网络浏览方式。从他们的角度来看,这是有道理的。这是一个相当具有战略意义的举动,不是吗?司法部建议将Chrome剥离作为补救措施。创造了这个机会。好的。
OpenAI,嗯,他们之前曾试图与谷歌合作获取搜索数据,对,以改进他们自己的人工智能。对。谷歌拒绝了。所以OpenAI开始构建他们自己的搜索引擎。是的。但这比他们想象的要慢。是的。所以现在抓住Chrome,这将使他们一夜之间在浏览器市场获得巨大的立足点。想象一下影响。没错。感觉非常大胆,就像彻底改变我们对日常使用网络的看法一样,也许,随着ChatGPT的改变。
但影响是巨大的。就像你说的,OpenAI获得了庞大的用户群。当然。但是浏览器竞争和数据隐私呢?如果一家人工智能公司控制着我们这么多在线活动,那将是另一个问题。绝对的。这确实让你对互联网的整体架构产生了疑问,如果一家人工智能公司是守门人,监管机构会像鹰一样密切关注,你必须这样假设。当然。好的,让我们稍微换个话题。从大型科技公司的策略转向社交媒体。
Instagram。他们刚刚发布了一个新的独立视频编辑应用程序。它叫做Edits。Edits。好的。是吗?听起来它针对的是TikTok的CapCut。哦,绝对的。这是一个直接的竞争对手。定位非常明确。说得通。短视频就是……
那么Edits有什么特别之处呢?嗯,它有一些非常先进的功能,甚至在主要的Instagram应用程序中都没有。比如什么?比如AI生成的动画、绿屏效果、隔离视频中主题的工具等等。真正针对的是想要更多功能的创作者。好的。所以他们超越了基本的滤镜和剪辑。是的。是的。
Instagram甚至承认,你知道,与CapCut有重叠之处,但他们说,看,我们专注于创作者,我们承诺会有更多更新。什么样的更新?比如用于精确控制的关键帧。
未来会有更多的人工智能功能,甚至可以进行协作视频工作。多人一起编辑。有趣。所以策略似乎很明确。赋能创作者,给他们更好的工具。并让他们继续为Instagram创作内容,或者至少与之紧密联系。是的。对。这是在短视频战场上竞争。防止人们完全转向TikTok或其他平台只是为了编辑工具。说得通。现在让我们谈谈我们许多人每天都在使用或争论的东西。
Siri。苹果公司为Siri团队任命了一位新的负责人,Mike Rockwell。
听起来他正在进行相当大的改革。Brockwell。他不是深度参与了Vision Pro吗?没错。他正在将Vision Pro项目的关键人员调到Siri团队来改造Siri。哇。好的。这很重要。从这样一个尖端项目中调动人才。是的。他们专门改组了专注于语音、理解性能和用户体验的团队。所以是核心组件。对。显然,这包括更换之前的经理。
所以这不仅仅是改组。听起来像是为了重大改进而做出的真正努力。嗯,这表明了强烈的承诺,不是吗?苹果公司必须认识到,Siri需要大幅提升才能有效竞争。绝对是这样。我们都听过抱怨或体验过其局限性。这听起来像是直接尝试解决这个问题。并且从Vision Pro调来人员,他们可能对界面、交互,甚至更好地理解上下文有新的想法。这些都是Siri落后的领域。
希望如此。是的。好的。现在,对于一些我发现真正令人惊讶并且非常酷的事情,一家韩国初创公司Nari Labs,由两位本科生创立。两名学生。他们开发了一个开源文本转语音模型。它叫做DIA。D-I-A。DIA。而且,听着。
据报道,它比Eleven Labs和Sesame等行业领导者更好。等等,真的吗?比Eleven Labs更好?由两位本科生开发。这就是报道。关键是,他们没有外部资金就做到了。哇。好的,这……
这太不可思议了。它确实表明人工智能开发正变得多么容易获得。似乎是这样。而且它是开源的这一事实也很重要。绝对的。那么DIA实际上能做什么呢?是什么让它更好呢?嗯,听起来非常先进。它处理细微的情感语调,支持在一个音频文件中使用多个说话者标签。所以它可以区分声音。是的。它甚至可以处理非语言内容。笑声、咳嗽、尖叫,显然。好的,这很复杂。这是一个16亿参数的模型。他们受到了谷歌Notebook LM的启发。
他们实际上使用了谷歌的TPU Research Cloud程序来获得计算能力。啊,所以他们利用了现有的基础设施,很聪明,还有比较。并排测试据称表明,在时间、声音表达方式以及处理脚本中的非语言提示方面,它击败了11 Lab Studio和Sesame的模型。这真是太令人印象深刻了。
它确实强调了,重大突破不再仅仅来自大型实验室。对。小型团队、好主意、访问计算能力。他们真的可以改变现状。他们为此制定了计划。是的。他们想基于它构建一个面向消费者的应用程序,专注于社交内容创作、音频混音等等。非常酷。好的。回到人工智能与既定机构的交叉点。
媒体界。是的。华盛顿邮报。他们与OpenAI建立了战略合作伙伴关系。嗯。另一家大型出版商签约。交易涉及什么?所以ChatGPT现在可以提供摘要。
提取相关的引言,并提供指向华盛顿邮报文章的直接链接在其答案中。对。所以通过聊天使邮报内容更容易访问,廉价电视,基本上可以吸引流量。这似乎是目标。在这些人工智能平台中增强对高质量新闻的访问。他们不是第一个,对吧?OpenAI现在已经与相当多的出版商达成了协议。显然超过20家主要出版商。
但这很有趣,因为这发生在OpenAI也正在与其他出版商(如纽约时报)就培训数据和版权问题进行诉讼的同时。对。这是一个复杂的局面。绝对的。邮报已经自己尝试过人工智能,使用了像Ask the Post AI这样的工具。
所以他们可能更愿意接受这种整合。它确实显示了媒体行业的裂痕,不是吗?一些人正在与人工智能作斗争,担心版权和就业岗位流失,而另一些人,比如这里的邮报,则试图找到与之合作、利用其影响力的方法。这绝对是一种平衡行为,每个人都在努力弄清楚。如何在不失去控制或收入的情况下适应?没错。好的,这里快速暂停一下。如果您发现这些见解有用,并且……
也许您想提升自己在快速发展的科技世界中的技能。正如我们所看到的,每天都在变化。对。一定要查看Etienne的人工智能驱动的Jamgat Tech应用程序。它旨在帮助您掌握并实际通过50多种热门认证。哇。50种。在哪些领域?涵盖很多。云计算、金融、网络安全、医疗保健、商业,各种各样的东西。这是全面的。是的。
所以如果这听起来很有趣,Jamgat Tech应用程序链接就在节目说明中。很高兴知道。好的,回到人工智能应用程序。销售等业务职能呢?啊,是的。这也是很有趣的。人工智能开始真正改变销售推广、个性化电子邮件。对。我看到了一些关于这方面的讨论。提到了像Autobound.ai这样的平台。是的,这是一个例子。他们使用有关潜在客户的实时数据来生成销售。
比如高度个性化的电子邮件。所以分析有关个人或公司的信息。对。以制作感觉真正量身定制的消息,而不仅仅是一般的垃圾邮件。其想法是为销售团队节省大量时间。并且希望获得更好的参与率,因为它实际上是相关的。没错。大纲甚至提到了使用NE8NRN等工具进行自动化、Google Sheets……
和人工智能代理、Gmail。是的。你可以看到它是如何简化的。是的。从大规模发送转向真正有针对性、几乎是定制的规模化沟通。这是一个潜在的优势。绝对是客户关系管理的转变。好的。下一个,有点令人费解。继续。Anthropic的CSO Jason Clinton。他预测。人工智能员工。
就像拥有自己数字身份的虚拟员工一样。虚拟员工,就像在公司网络中工作的人工智能代理一样。是的。集成到公司网络中,最早可能在明年。他谈到他们拥有自己的帐户、密码,甚至任务和交互的记忆。哇。好的。这是超越仅仅使用人工智能工具的一大步。这是赋予人工智能在系统内的代理权。没错。Clinton立即指出了网络安全挑战。我敢打赌。你如何管理人工智能的权限?你如何监控它?
如果自主人工智能做错了事,谁负责?对。巨大的问题。他称虚拟员工安全为下一个AI创新热点。基本上,保护这些东西将与构建它们一样重要。说得通。
而Anthropic作为一家主要的人工智能公司,他们会认真考虑保护他们自己的模型并防范滥用。当然。所以最大的收获似乎是,如果我们要走向自主数字员工,我们需要彻底重新思考安全和身份管理。绝对的。旧规则可能不适用。我们需要新的框架,新的协议。这不仅仅是技术发展。这是围绕它的整个基础设施。好的。稍微轻松一点的话题。
奥斯卡。啊,好莱坞与人工智能相遇。是的。学院证实,使用人工智能生成内容的电影有资格获得奥斯卡奖。只要它们符合现有标准。对。讲故事、创造力、人为贡献仍然是关键。没错。所以他们并没有禁止它,但他们强调人为因素必须很重要。
而且关于人工智能使用的透明度可能也很重要。但这打开了大门,承认人工智能正成为电影制作中的工具,就像CGI一样。是的,看到电影制作人如何实际使用它以及标准如何随着时间的推移而发展将会非常有趣。当涉及人工智能时,这确实引发了关于创造力和作者身份的问题。你从哪里划清界限?真的。说到创意领域,时尚。
标志性设计师Norma Kamali。好的。她正在积极地在她设计过程中使用生成式人工智能工具。真的吗?如何?探索新的材料、不同的轮廓,甚至将其用于个性化造型理念。嗯。
所以人工智能作为时尚设计中的合作者。是的,她显然认为它正在将时尚重新定义为艺术和技术的融合,简化工作流程,也许还能实现更可持续或个性化的时尚。有趣。人工智能重塑创意行业的另一个例子。让我们快速回顾一下那个文本转语音模型,Daya。对,那个来自两位本科生的模型。是的。是的。
值得再次强调的是,一个高质量的开源替代方案,如11 Labs的出现,是多么重要。而且它已经被独立开发者采用了吗?是的。那么未来这到底意味着什么呢?嗯,我认为这意味着民主化,对吧?开放访问使竞争环境公平。它使小型开发者、研究人员……
任何人都可以真正地基于最先进的语音技术进行构建。所以语音助手、辅助工具等方面可能会更快地创新。没错。更多的草根创新,因为核心技术是可用的。酷。好的。最后,让我们谈谈人工智能。
医疗保健中的人工智能,这总是很有影响力的。绝对的。Biostate AI正在与Weill Cornell Medicine合作。好的。他们正在创建专门用于白血病治疗的人工智能模型。这些模型是如何工作的?他们使用基因组数据、电子健康记录,
分析所有这些复杂的信息,以帮助指导针对血液癌患者更精确的个性化治疗策略。哇。所以使用人工智能根据个体患者数据定制护理,这就是精准医疗的承诺。没错。目标是早期干预、更有效的治疗,真正强大的潜力。对肿瘤学来说具有真正革命性的潜力。是的。
而且2025年4月23日还有一些其他的快速消息。苹果公司不得不调整其Apple Intelligence的营销。删除了一些“现已可用”的说法。啊,所以也许有些功能还没有准备好投入使用。复杂的科技推出总是会发生这种情况。似乎是这样。Character AI推出了名为Avatar FX的东西。
用于创建长篇对话头像。嗯。更逼真的数字角色。符合趋势。IBM和欧洲航天局发布了用于实时气候监测的TerraMind。这太重要了。使用人工智能更快地处理气候数据至关重要
GoHear的首席执行官加入了电动汽车公司Rivian的董事会。汽车行业中更多的人工智能整合?说得通。摩托罗拉推出了SVX,这是一种用于紧急救援人员的人工智能设备。人工智能帮助急救人员,更好的信息,更快的响应。可以挽救生命。所以回顾一下这一天,2025年4月23日。哇。主题很明确,不是吗?是的。令人难以置信的快速进步,而且无处不在。消费科技、媒体、科学、创意领域无处不在。
时尚、电影。而且不仅仅是巨头。那些Nari Lab的学生和Daya,小型团队,开源,他们也正在产生真正的影响。绝对的。这是融合,不是吗?所有这些线索汇集在一起,显示人工智能正在更深入地融入我们所做的一切。它确实促使你重新思考事物在许多领域的运作方式。是的,绝对的。所以这里有一个想法留给你。
考虑到事情发展得多么快,并且看到像DIA这样强大但易于访问的模型出现,这可能会如何从根本上重塑基本的沟通方式?
我们如何创作东西,我们如何在网上互动,也许比我们想象的要快。嗯。这是一个很大的问题。工具变得既强大又广泛可用。是的,这可能会极大地加速变化。值得思考的事情。嘿,别忘了,如果你想加深自己在人工智能领域的专业知识,请查看JamGatak应用程序。节目说明中提供了这些认证的链接。很好的提醒。感谢您今天与我们一起进行深度解读。总是引人入胜的。