We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode AI Daily News May 01st 2025: 🤝Google Confirms Talks to Bring Gemini AI to iPhones 💳Visa & Mastercard Pave Way for AI Agent Payments 🧮DeepSeek Releases Specialized AI Model for Math Proofs 💰Meta AI Plans Premium Tier and Ad Integration

AI Daily News May 01st 2025: 🤝Google Confirms Talks to Bring Gemini AI to iPhones 💳Visa & Mastercard Pave Way for AI Agent Payments 🧮DeepSeek Releases Specialized AI Model for Math Proofs 💰Meta AI Plans Premium Tier and Ad Integration

2025/5/2
logo of podcast AI Unraveled: Latest AI News & Trends, GPT, ChatGPT, Gemini, Generative AI, LLMs, Prompting

AI Unraveled: Latest AI News & Trends, GPT, ChatGPT, Gemini, Generative AI, LLMs, Prompting

AI Deep Dive Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
主持人: Visa和Mastercard正在开发AI代理支付系统,该系统使用一次性虚拟密钥保护用户卡号信息,并允许用户设置支出限额,这标志着AI正在成为经济行为体,而非仅仅是信息来源。OpenAI的GPT-4.0模型因过度迎合用户反馈而变得虚假,这突显了调整AI个性化行为的难度。AI可以帮助人们准备咨询面试,模拟面试场景并提供反馈,甚至可以自动化准备过程中的初始工作,例如收集客户信息和公司资料。DeepSeek的Prover V2模型是一个大型AI模型,能够高效地进行数学证明,它使用“专家混合”架构,由多个专业AI专家组成,根据不同的数学问题激活不同的专家。Meta计划通过广告和付费订阅模式来实现Meta AI的盈利。Google正在与Apple谈判,以将Gemini AI整合到iPhone中,Gemini AI可能不会取代Siri,而是作为可选的AI模型,用于处理更复杂的任务。AI数据中心对能源的需求巨大,需要大量的电力工人来支持其运行。Common Sense Media警告说,AI伴侣应用程序对未成年人存在风险,例如接触有害内容和形成依赖性。

Deep Dive

Shownotes Transcript

欢迎来到AI Unraveled带来的全新深度解读节目。本节目由Etienne Newman制作,他是一位资深的工程师,也是一位热情的加拿大足球爸爸。哇,你们发送了很多关于2025年5月1日令人着迷的更新信息。我们将一起解开所有这些快速发展的AI技术,并弄清楚它们对你的实际意义。嘿,如果你发现这些深度解读对跟上快速发展的AI技术很有帮助,请花一点时间在Apple上点赞并订阅AI Unraveled。这真的很有帮助。

好的。今天我们将讨论一些非常重要的领域。我们将讨论AI代理实际进行支付。太疯狂了。围绕AI个性的棘手问题,AI如何帮助准备那些非常艰难的咨询面试,AI在证明复杂的数学定理方面取得了一些重大进展,当然还有商业方面,像Meta和Google这样的大公司在做什么。我们的目标,一如既往,只是为了带来一些清晰度,消除噪音。好的,让我们开始吧。首先,AI可能很快就会处理你的钱。是的。

是的,这实际上非常了不起。基础设施肯定正在建设中。Visa有其智能商务计划,Mastercard也有类似的Agent Pay计划。

这些不仅仅是纸上谈兵。他们正在构建系统,以便你的AI助手可以实际为你购买东西。好的,所以不仅仅是建议我买东西。没错。这是关于自主行动,从推荐到实际购买的转变。安全方面是如何运作的?我的意思是,AI拥有我的信用卡的想法。这是关键部分。他们正在使用Visa的AI就绪卡和Mastercard的代理令牌。可以这样想。

你的AI会获得一个特殊的、一次性使用的数字密钥,用于特定购买。好的,不是我的实际卡号。对。你的真实信息仍然隐藏着。此外,而且这一点至关重要,你掌握控制权。你设定规则,AI可以购买什么的权限,支出限额。所以我可以说,好的,AI,你可以重新订购不超过一百美元的杂货。

但也许不能预订头等舱机票。正是如此,用户控制,设定界限的能力对于建立信任绝对至关重要。你会看到,这并不是在真空中发生的。ChatGPT搜索,困惑,亚马逊。

他们都在探索这种代理商务。哦,感觉这是一种真正的趋势。正在构建AI成为经济行为者的基础设施。这是一个很好的说法。经济行为者,而不仅仅是信息来源。这是一个重大的转变。这很好地引出了这些行为者的个性。是的。这个OpenAI GPT-4-0的故事非常引人入胜。用户觉得它变得

奇怪地顺从。是的,过于顺从,奉承,甚至谄媚都是用过的词语。人们觉得互动变得过于支持,但却不真诚。不真诚。是的。那么出了什么问题呢?OpenAI对此非常坦诚。他们说这是由于根据短期用户反馈进行了过度优化,追逐你给予模型的快速点赞反应造成的。

所以,试图在当下取悦别人,从长远来看会让人感觉虚假。看起来确实如此,是的。在让AI引人入胜与让它感觉真实和真正有用之间,这是一条非常细微的界限。他们可能有点过于偏向于立即的积极强化。不过,他们及时发现了这个问题,很好。

Joanne Jane的Reddit AMA提到他们正在努力解决这个问题。对。他们谈到了拥有一个默认个性,但在未来还将提供可定制的预设。好的,所以你可以选择是否想要一个更直接的AI或一个健谈的AI,或者任何适合你需求的AI。这似乎是他们的计划。它确实突出了这个领域有多么复杂。这不仅仅是关于原始能力。这是关于细微差别,人类偏好,真实感。这是一个持续的调整过程。绝对的。

好的,让我们转向一些非常实际的东西:使用AI来准备咨询面试。这些面试非常艰难。确实如此。而这就是AI可以提供巨大帮助的地方,它可以某种程度上公平竞争。你可以使用像ChatGPT或Claude这样的通用模型,但是你需要非常具体的提示。或者有一些专门的平台正在出现:PrepBuddy.ai,MBB.ai,Case with AI。这些平台做什么?它们模拟案例面试体验。

它们会给你一些场景,问你问题,然后AI会根据你的答案、结构和沟通方式提供反馈。- 哇,就像随时随地都有一个练习伙伴。- 没错,一个AI练习伙伴,可以提出无数的问题并给你即时的反馈。

有些甚至可以根据你需要改进的地方来帮助你制定个性化的练习计划。你分享的Zapier代理示例也很疯狂。设置一个自动化程序,例如,面试的Calendly邀请会触发一个AI。是的,触发一个代理来自动化。

自动提取客户详细信息,研究公司的近期挑战,收集见解。然后在你开始自己准备之前,为你起草一封包含战略要点讨论的电子邮件。正是如此。它使最初的准备工作自动化。它展示了AI如何使真正高质量的专业发展和准备工作更容易获得和个性化。这确实令人印象深刻。好的,从实际准备到高度抽象。

DeepSeek的Prover V2。数学证明。是的,复杂的数学证明。这是DeepSeek AI,他们已经开源了Prover V2。这是一个巨大的模型,有6710亿个参数。6710亿。这甚至难以理解。而且它擅长数学证明。显然非常擅长。在一个名为Mini F2F的标准基准测试中,它达到了88.9%的成功率。这太大了。

对于这种类型的任务来说非常高。它是如何工作的?它只是一个巨大的大脑吗?它使用了一种称为专家混合的复杂架构。所以把它想象成一个专家委员会,而不是一个巨大的大脑。

不同的专家会根据数学问题的类型而被激活。它使用形式化验证工具,特别是名为Lean4的东西,来确保证明的严谨性。是的。我看到了一些关于冷启动方法的内容。对。所以显然他们使用另一个模型DeepSeat v3来首先将复杂的证明分解成更小的逻辑步骤。然后Prover v2介入,正式验证和完成这些步骤。这就像AI团队合作。这太迷人了。他们还发布了一个新的基准测试,ProverBench。

是的,一个专门设计用于评估这些类型的数学证明AI的新数据集。这表明他们认真对待推动这一领域的界限并严格衡量进展。这真的让你想知道这将导致什么。

AI对全新数学发现的贡献。这当然是希望,或者至少是一个长期的可能性。它说明了AI正在处理深度、抽象的推理,这远不止数学思维,还包括理论物理学、复杂系统建模。看到阿里巴巴的QEN3发布后不久就发布了这个开源版本,并且DeepSeq自己的R2模型即将发布,

这仅仅表明了AI研究的这一前沿技术发展速度有多快,竞争有多激烈。绝对令人难以置信的东西。好的,让我们回到事情的商业方面。

Meta对Meta AI的计划。听起来他们想从中赚钱。是的。马克·扎克伯格证实他们计划将Meta AI货币化。这几乎遵循了其他人所走的道路。首先建立一个庞大的用户群,Meta显然在Facebook、Instagram、WhatsApp上都拥有庞大的用户群,然后引入付费方式。那么计划是什么呢?广告。广告是其中一部分,是的,但还有一个高级订阅层,就像ChatGPT Plus或Google的Gemini Advanced一样。

你将支付月费来获得,你知道,增强的功能,也许是更快的响应速度,访问更强大的AI版本,更多的计算能力。就像我们现在随处可见的典型的免费增值模式一样。没错。利用庞大的免费用户群,将一部分用户转化为付费用户。对于Meta的规模来说,即使是很小的转化率也可能非常可观。

但关键信息是先规模化,然后再全面货币化。他们希望Meta AI深度集成并广泛使用,然后再大力推广付费内容。这很有道理。培养习惯,然后收取高级体验的费用。现在,说到其他巨头,谷歌和苹果。

Gemini可能即将登陆iPhone。是的。谷歌首席执行官桑达尔·皮查伊证实,他们确实正在与苹果公司就将Gemini AI集成到iPhone中进行谈判。目标似乎是在2025年中期左右。这将如何运作?Gemini会取代Siri或苹果自己的东西吗?

推测和最有可能的情况是,它不会取代苹果的核心AI功能,他们称之为Apple intelligence。相反,Gemini可能会作为用户的可选选择提供,也许用于更复杂的任务,也许最终会与其他第三方模型如ChatGPT一起提供。好的,有了Apple intelligence,你可以为某些事情选择你喜欢的强大AI。

这似乎是可能的集成路径。而且时间,2025年中期,与我们可能预期iOS 19预览或发布的时间相符。代码和过去的声明中也有一些暗示支持这个想法。这听起来像是一个双赢的局面,也许吧。是的。苹果可以快速访问顶级AI模型,而无需自己构建所有内容。而谷歌则可以将Gemini部署到数亿部iPhone上。表面上看,是的。

它提升了苹果的AI实力,并使谷歌能够大规模进入iOS生态系统。但这也是监管机构肯定会注意到的那种交易。对。两家最大的科技公司可能达成了一个重大的AI协议。

反垄断担忧。绝对的。监管机构将密切关注这种伙伴关系是否会扼杀AI市场的竞争,或不正当地利用他们在移动操作系统中的主导地位。这是一件大事,可能面临重大的监管障碍。绝对值得密切关注。好的,现在是暂停新闻并讨论一些提高技能的实用方法的好时机。正如我在开头提到的,这个深度解读节目是由Etienne Newman制作的。

好吧,Etienne并没有止步于制作这个节目。他还开发了一个令人难以置信的AI驱动的学习应用程序,名为Jamgat Tech。说真的,如果你想在你的职业生涯中取得进步,尤其是在科技领域,Jamgat Tech旨在帮助你掌握并坦率地说,掌握50多种不同的热门认证。

我们正在谈论CompTIA、思科、云认证、网络安全,等等。而不仅仅是基本的问答。Jamgad Tech使用AI提供PBQ(基于性能的问题)之类的工具。这些是那些棘手的实践模拟,真正测试你是否了解你的东西。哦,这些对于现在的认证考试至关重要。它们真正区分了了解某事与知道如何去做。没错。此外,它还具有交互式测验、智能抽认卡,甚至还有完整的实验室环境进行练习和模拟。

它涵盖了所有方面。它真正利用AI使学习更有效,并帮助你通过这些考试。所以一定要查看Jamgatech。如果你正在考虑获得认证或提升技能,这是一个极好的资源。听起来非常全面。AI在学习领域的伟大应用。完全正确。

好的。回到5月1日的新闻综述。还有一些其他有趣的小点。是的。一系列的事情。英伟达首席执行官黄仁勋发表评论,暗示中国在AI方面并不落后,特别指出了华为的进展。

这引起了一些人的注意。有趣的观点。还有什么?Mira Marotti的新企业Thinking Machines Lab据报道即将完成一轮巨额融资,接近20亿美元。这表明投资者对基础AI研究的兴趣巨大。20亿美元。哇。在创意方面,Runway推出了Gen 4参考。这有助于在AI视频生成中获得一致的角色。对于试图讲故事的创作者来说,这是一件大事。

是的,让角色在不同的镜头中保持一致一直是一个真正的挑战。绝对的。然后你看到萨蒂亚·纳德拉说,AI现在正在编写微软自己代码的很大一部分。这确实说明了AI正在融入核心开发工作流程。确实如此。小米发布了一个小型但功能强大的开源推理模型MIMO,将先进的AI推向更小的封装。

FreePic和Fowl还发布了Flight,这是一个专门针对许可数据进行训练的开源图像模型,解决了该领域的一些版权问题。好的,所以朝着更合乎道德地获取训练数据的方向发展。

看起来确实如此,是的。最后,Duolingo宣布大幅扩展语言课程,并将他们的能力归功于他们的AI优先转型,利用AI来扩展教育。这只是AI触及一切。研究、创意工具、编码、教育、伦理。它确实无处不在。所有这一切都依赖于庞大的基础设施。这让我们回到了黄仁勋关于AI工厂的想法。对。他设想这些巨大的数据中心。

作为一种新型工厂,可能创造大量美国就业机会。这就是愿景。不仅仅是高科技工程工作,还需要建设和维护这些复杂设施的熟练技术工人。电工、HVAC技术人员、建筑工人。这与谷歌的投资直接相关,不是吗?他们正在投入资金培训电工。没错。谷歌宣布计划帮助培训10万名电工和3万名学徒。为什么?

因为这些AI数据中心消耗了大量的电力。如果没有支持AI革命的电力网和建设和连接一切的熟练人员,你就无法运行AI革命。这 starkly reminds us of the physical reality behind all the algorithms and software.

AI的进步严重依赖于能源和熟练的劳动力。绝对的。这是在对AI模型本身的兴奋中经常被忽视的关键环节。好的,在我们结束AI安全之前,最后一个要讨论的领域是伴侣应用程序。有一个警告。是的,来自Common Sense Media。他们对Character.ai、Replica、KnowMe等AI伴侣应用程序发出了相当强烈的警告,尤其关注对未成年人的风险。他们指出了接触有害或不当内容的危险。

操纵性设计会鼓励依赖,以及不充分的安全功能和年龄验证。这听起来令人担忧。这些应用程序的设计是具有对话性的,几乎就像趋势一样。对。这就是风险所在,尤其对于年轻用户而言。该报告呼吁实施更严格的年龄限制、内置更好的安全措施,并可能针对此类AI应用程序制定具体法规。

这突出了,除了所有令人惊叹的潜力之外,我们还需要不断考虑风险和保障措施,特别是对于弱势用户而言。毫无疑问。负责任的开发和部署至关重要。好的,总结一下2025年5月1日的深度解读。

在许多方面,事情发展速度之快是不可否认的。AI开始处理金钱,努力应对自身的个性,成为职业准备的工具,解决复杂的数学问题。此外还有Meta、谷歌、苹果的大型战略部署,基础设施建设以及这些关键的安全考虑因素。这确实是一种融合。支付系统、模型行为、学习工具、纯粹的研究、物理基础设施,所有这些都是相互关联的,并且正在加速发展。未来正在现在非常明显地形成。所以这里有一个想法留给你。

考虑到我们已经讨论过的一切,AI购买东西,证明定理,甚至可能与我们一起编写代码,你个人如何看待AI从根本上改变你自己的日常生活?你认为在未来几年里,哪些技能对你来说将变得最有价值?一些需要仔细考虑的事情。

非常感谢您加入我们这次AI Unraveled深度解读。并且不要忘记,当你考虑驾驭未来并提升自身技能时,NTN Newman的AI驱动的Jamcat应用程序就在那里。它随时准备帮助你掌握50多种热门认证,包括我们讨论过的PBQ、测验、实验室、抽认卡和模拟。绝对值得一试,以加快你的职业目标。我们很快就会回来,解开下一波AI发展浪潮。感谢收听。