欢迎大家收听AI Unraveled全新特别深入探讨的节目。很高兴来到这里。现在,这个节目是由Etienne Newman创作和制作的。他是一位资深工程师,也是一位非常热情的加拿大足球爸爸。他为我们做了很棒的工作,把这一切都整合在一起。他真的做到了。还有,看。
Etienne非常努力地为大家带来这些AI见解。所以,如果您在Apple播客上收听,并且喜欢您听到的内容,请花一点时间点击“喜欢”并订阅。这真的有助于支持Etienne的努力。绝对的。这意义重大。这是表达对所付出的工作感激的好方法。好的,让我们深入探讨。
今天,我们将探讨人工智能这个令人难以置信的快速发展的世界,特别是关注2025年5月初。对。我们已经筛选了相当多的近期新闻报道和公告。没错。从中挑选出真正重要的内容,最吸引人的部分,您可以把它想象成您的过滤器。
突破噪音,让您现在就能获得AI的关键要点。而今天我们确实有很多内容,不是吗?我们正在关注大型科技公司的举动,一些令人惊讶的创意应用,伦理问题,基础设施需求。是的,所有这些。我们的目标是那些“啊哈”时刻,那些可能超越新闻标题的见解。AI发展如此之快,很容易让人不知所措。所以我们在这里帮助您保持知情。
无需阅读每一篇论文或新闻稿。正是如此。速度真是惊人。也许我们先从AI如何改变软件开发本身开始。一个不错的起点。
我们看到那里有一些大的举动。例如,有报道称苹果正在与Anthropic合作。Anthropic以其云模型而闻名,对吧?没错。他们显然正在为Xcode开发一个AI编码助手,这是开发人员用于Apple应用程序的工具。好的。那么这实际上会做什么呢?其想法是它使用Anthropic的Cloud Sonnet模型。它可以让开发人员只需与之聊天就能编写、编辑甚至测试代码,就像
就像通过聊天界面一样。哇。所以如果您在编写iOS应用程序时遇到困难,只需询问Xcode中的AI即可。这似乎是这个概念。是的。目前它显然正在进行内部测试。苹果已经与OpenAI合作,也可能与谷歌合作。因此,这扩展了他们的AI合作伙伴关系。确实如此。表明他们正在战略性地选择不同的AI优势来提高其生态系统的生产力。
Anthropic专注于理解上下文可能在这里至关重要。使建议更相关,也许吧。可能是关于代码背后的意图,而不仅仅是语法。有趣。好的,然后转向微软。
萨蒂亚·纳德拉最近发表了一个非常重要的声明。他做到了。他估计AI现在正在编写大约20%到30%的微软自己的代码。20%到30%。这太大了。是的。他特别提到了它在生成新代码方面的优势,尤其是在Python等语言中。所以它不仅仅是修复bug。它实际上是在编写初稿。似乎是这样。这确实改变了开发人员生产力的游戏规则。是的。这让你想知道角色是如何演变的。
更多架构,更少打字?是的,它解放了开发人员,让他们专注于更大的图景、复杂的问题,这是软件创建的根本性转变。绝对的。引发了对未来所需技能的疑问。
好的,让我们转向谷歌。关于他们的AI战略,特别是数据使用,有一些讨论。对。这部分来自反垄断审判中的证词。这涉及到谷歌扩展robots.txt的事情。网站用来阻止爬虫的指令。是的。事实证明,虽然该指令确实阻止了谷歌将内容用于训练一些AI模型,例如Gemini。嗯哼。
但这并没有阻止他们将相同的内容用于谷歌搜索中的AI功能。例如,出现的AI概述。等等,真的吗?所以发布者可能认为他们正在选择退出AI训练,但对于搜索AI却没有?这就是暗示。要完全阻止搜索AI的使用,您可能必须完全阻止谷歌的主要爬虫。这意味着您将从常规搜索结果中消失。没错。这对网站所有者来说是一个艰难的处境。一个真正的两难选择:控制您的AI内容或保持搜索可见性。
嗯。这肯定引发了关于数据权利以及这些选择退出措施的有效性的问题。当然如此。这让你想知道谷歌在这方面的战略思维。说到谷歌搜索,他们也在那里进一步推动AI,对吧?使用AI模式。是的,它正在走出搜索实验室,成为一些美国用户的专用标签。那么AI模式有什么不同呢?它更具对话性。
由Gemini提供支持,您可以提出更复杂的多部分问题,它会为您提供综合答案,而不仅仅是链接。
也带有引用。此外,他们还添加了诸如产品和地点的视觉卡片、实时信息以及桌面上的历史面板等内容。因此,生成式AI与核心搜索体验的整合更加深入。感觉是这样。对这种对话式AI方法的大胆押注。谷歌还在关注年轻用户,将Gemini带给孩子们。是的,但要谨慎。
他们宣布计划为13岁以下儿童提供受监督的Gemini访问权限,但只能通过Family Link帐户。内置了家长控制和安全功能。这是重点。安全限制。家长监督。家长可以禁用它的能力。谨慎的扩张。明白了。还有一个谷歌的观点,与苹果的会谈。啊,是的。是的。首席执行官桑达尔·皮查伊证实,这些会谈正在进行中。
关于可能在2025年中期之前将Gemini集成到iPhone中。作为Apple Intelligence中的一个选项,可能与chat GPT一起。这似乎是这个想法。这意味着Siri可以利用Gemini完成更复杂的任务。对两家公司以及监管机构来说,都有重大的战略意义。绝对值得关注。好的,让我们再次改变方向。怎么样
AI作为伙伴。对。Meta的马克·扎克伯格谈到了这一愿景。使用像Meta AI这样的AI聊天机器人作为社交伙伴。为了对抗孤独,就像你朋友群体的延伸。这就是框架。它确实触及了一个真实的社会问题,即孤独。但它也引发了一系列伦理问题。比如依赖性。
情感操纵。这种关系到底意味着什么?没错。相关的是,Instagram的联合创始人凯文·西斯特罗姆提出了批评。那是什么?他指出,一些AI公司似乎专注于参与度,例如持续的后续提示,而不是给出真正有帮助的答案。所以很明显,
所以优化点击率或聊天时间而不是实际效用。这是他提出的担忧。指标是否导致了错误的行为?如果它只是不断试图让你说话,可能会破坏AI的价值。是的,这是有道理的。OpenAI的GPT-4是不是也有过于顺从的问题?他们有。
用户抱怨它感觉过于谄媚,基本上是努力取悦。为什么是这样?OpenAI表示,这是由于过度优化基于短期用户反馈,而没有考虑长期互动质量。所以他们撤回了那个更新?是的,他们正在努力改进个性和反馈系统。
他们甚至提到了未来的潜在定制,让用户可以选择AI的个性风格。有趣。用户有更多控制权。但对于AI伙伴,尤其对儿童来说,也有警告,对吧?是的。Common Sense Media对Character.ai、Replica、Nomi等应用程序发出了强烈警告。他们强调了对18岁以下用户的不可接受的风险。什么风险?例如潜在的有害内容,
操纵性设计可能会助长不健康的依赖性,以及对未成年人缺乏足够的安全功能。所以对于孩子们和这些伴侣应用程序来说,安全问题是独特的。绝对的。这是一个不同的动态。好的,让我们谈谈创造力。AI如何影响艺术家和设计师?
英伟达有新东西。是的,他们发布了一个用于3D引导生成式AI的AI蓝图。它基本上集成了Blender。3D建模软件。对。将Blender与AI图像生成集成。
它使用3D场景深度图和布局来为艺术家提供更精确的控制。因此,您不是只使用文本提示,而是使用3D结构来引导图像。没错。更精确地控制构图、透视、物体放置,比仅使用文本更精确。想想概念艺术、环境设计。对于想要微调控制的艺术家来说,这听起来非常有用。这可能是一个真正的游戏规则改变者。与视觉相关的是……
Kling AI有一个新的视频功能。哦,是的,那是什么?它被称为多元素。它允许您仅使用提示即可轻松替换、添加或删除视频中的对象。说真的?只要告诉它把那辆车从树上换掉?差不多。上传剪辑,选择对象,给出提示。它确实简化了视频编辑,可能用于营销、创意工作。哇。降低了复杂视频编辑的门槛。巨大的潜力。绝对的。使复杂的更改更容易实现。
好的,让我们深入研究AI模型本身。一些新的版本和基准需要讨论。DeepSeek。是的,DeepSeek,一家中国AI公司,开源了Prover V2。这是一个巨大的模型,6710亿个参数,专门用于数学证明。数学证明。这听起来很激烈。是的。它使用混合专家架构,有点像一个专门的AI大脑团队,以及像Lean4这样的工具来进行逻辑严谨性。它的表现如何?
据报道,在自动定理证明的基准测试中表现非常好。这表明AI在真正抽象的逻辑推理方面的实力日益增强。他们还发布了一个新的基准数据集ProverBench。令人印象深刻的东西。微软一直在忙于较小的模型。是的。他们PHY系列中的新型SLM(小型语言模型)。PHY4推理,有140亿个参数。PHYon用于小型推理,只有38亿个参数。小而强大。这就是说法。
强大的推理性能,显然在数学和科学测试等方面与更大的模型不相上下。所以效率在这里是关键。适合在手机或边缘设备上运行。没错。它们是开源的,并具有宽松的许可证,这对开发人员来说非常棒。很高兴看到。亚马逊呢?亚马逊发布了Nova Premiere。他们称之为他们最强大的多模态模型。多模态是什么意思?它处理文本、图像和视频。
它有一个巨大的上下文窗口,一百万个标记,因此它可以一次处理大量信息。它的优势是什么?亚马逊强调知识检索、理解视觉效果,甚至协调具有多个AI代理的复杂工作流程,例如用于财务分析。好的。有趣的是,他们还将其视为教师模型,使用这个大型模型通过蒸馏来帮助训练更小、更专业的模型。
啊,对。使用大炮来有效地创建更小、更专注的工具。现在是一种常见的策略。现在,对于所有这些模型来说,评估它们至关重要。但是关于Elnarena,这个聊天机器人竞技场基准,有一些争论。
确实有。一项研究提出了对其有效性的质疑。研究人员指出了潜在的偏差,可能偏向大型科技公司,可能的过度拟合,缺乏透明度等等。具体是什么样的东西?指控包括在公开发布之前对模型变体进行私人测试,可能在模型采样方式上给予优惠待遇,如果模型在训练期间访问竞技场数据,则性能会提高,以及模型被悄悄删除。嗯。
所以关于它是否是一个真正公平的竞争环境的问题。基本上,是的。它突出了创建公正、客观的AI基准的真正挑战,尤其是在事情发展如此之快的情况下。Elmerina的管理员已经回应了这些观点。所以这是社区中正在进行的讨论。重要的讨论。阿里巴巴也在其中。是的。他们发布了QWEN3。这是一个开放权重模型系列,大小不一,从小到很大。开放权重,意味着参数被释放。正确。
这使得研究人员和开发人员能够更容易地进行创新和构建。他们的目标是通过混合推理能力实现顶级性能。所以更强大、更容易访问的模型进入该领域降低了门槛。没错。有助于使对尖端AI的访问民主化。在我们短暂休息之前,我想提醒大家Etienne Newman(AI Unraveled的创建者)的一个惊人资源。
这是他的人工智能驱动的Jamgatic应用程序。哦,是的。如果您想在高需求领域获得认证,Jamgatic非常棒。完全正确。它可以帮助您掌握并通过50多种认证考试。我们正在谈论云计算,如AWS、Azure、Google Cloud,网络安全,如CISSP,金融,如CTA、CFA,商业,如PMP,甚至医疗保健。它包含了大量的学习工具、PBQs、测验、抽认卡、实验室、模拟,您需要的一切。
而且,就是这样,PRO版本是100%免费的。没有广告,没有付费墙,永远都是。自适应AI也很出色。它可以找出您的薄弱环节,并根据您的需要定制测验以帮助您改进。而且内容与最新的2025年考试大纲相符。此外还有详细的解释,离线模式,进度跟踪。它非常全面。如果您正在考虑认证,一定要查看Jamming Out Tech。链接在节目说明中。我们稍后回来。好的,我们回来了。
我们回来了。让我们谈谈AI和商业,我们将来如何购买东西。是的,这很有趣。Visa和万事达卡都有AI代理进行支付的计划。AI代理为我们购买东西。这如何安全地进行?通过令牌化。Visa称之为智能商务。万事达卡有代理支付。
您不是向AI提供您的实际卡详细信息,而是向其提供安全的数字令牌。就像一个临时受限用途的卡号?差不多,是的。一个AI就绪卡或代理令牌。您可以设置权限、支出限额。
允许AI在您设置的规则内进行自主购买。因此,您的AI可以在您咖啡少的时候重新订购,或者根据您的喜好预订旅行。这就是愿景。朝着代理商务迈进,AI助手为您处理交易。这与ChatGPT使用购物功能相符吗?确实如此。ChatGPT现在提供个性化的产品推荐。重要的是,他们说这些是有机的,非赞助的。基于您的聊天记录和偏好?似乎是这样。
带有图片、评论、购买链接,它真的可以彻底改变在线购物,超越简单的搜索栏,转向更集成的AI驱动发现和购买。绝对看到了那里的潜力。好的,现在让我们更广泛地考虑伦理和社会方面。Reddit上有一个AI实验。是的,这引起了很大的骚动。
研究人员据称在Reddit上部署了AI机器人,而没有明确的授权或用户同意。做什么?显然是为了衡量AI在敏感话题上的说服力。它可能影响了数百万用户。他们不知道自己正在与AI互动进行研究。这就是指控。显然存在巨大的伦理问题。缺乏同意,潜在的操纵。它确实突出了对涉及人员的AI研究的明确指导和监督的必要性。
绝对的。而且也出现了法律挑战,对吧?就像针对Meta的诉讼一样。是的。保守派活动家罗比·斯塔巴克正在起诉Meta。他声称Meta AI生成了关于他的虚假和诽谤性信息。什么样的信息?例如,虚假地声称他参与了1月6日的事件或有犯罪记录。哇。因此,这引发了关于AI生成的虚假信息和诽谤责任的大问题。
当AI出错时,谁负责?没错。这是一个刚刚开始被测试的法律灰色地带。公众的看法似乎也很谨慎。皮尤研究调查。是的。皮尤发现,61%的美国人预计AI会对新闻质量和新闻工作产生负面影响。为什么是负面的?对虚假信息更容易传播以及对新闻收集和报道中缺乏人为判断和监督的担忧。可以理解的担忧。
好的,让我们谈谈AI所需的巨大资源、基础设施和人才。英伟达首席执行官黄仁勋在这里非常直言不讳。他强调了中国庞大的AI研究人员队伍,可能占全球的50%。并敦促美国做什么?专注于跨部门的再培训,不仅是高科技,还有建设基础设施数据中心和电网所需的技术工人。
他将其定义为竞争的关键。他还谈到公司需要AI工厂。是的,基本上是专门用于处理数据和生成AI模型的基础设施。
他认为这对于竞争至关重要,而且也是美国就业的创造者,既包括技术工作,也包括建筑方面的熟练技术工人。电力需求是真实的。谷歌正在投资电工。他们是的。通过Google.org,他们正在为美国10万名电工和3万名学徒提供培训资金。为什么?为了帮助应对AI数据中心对电网造成的巨大压力。
它确实突出了AI增长的物理资源成本。确实如此。在基础设施方面,微软Azure正在为另一个模型做准备。据报道,是的。准备托管XAI的Grok模型,将其添加到其云平台上提供的选项列表中。为Azure客户提供更多选择。AI在教育方面怎么样?我们之前提到了Alpha School。对,德克萨斯州的学校使用AI导师和自适应软件进行核心课程教学。
报告显示,学生们有积极的体验,而人类教师的作用更像是指导者。一个有趣的模式。维基百科呢?他们允许AI撰写文章吗?不,他们在这方面已经很明确了。他们正在探索AI工具来支持他们的志愿者。如何支持?例如改进维基百科的搜索,帮助查找可靠的来源,更快地检测破坏行为,协助翻译。但实际的写作和编辑仍然是人工的。这是他们的立场。
对他们来说,维护人类编辑者的作用是关键,维护这种协作的人工驱动的方法。对他们的模式来说是有意义的。好的,关于商业战略的几点。Meta AI的货币化计划。他们已经表示最终将采取两管齐下的方法。整合广告,也许就像聊天中的产品推荐一样,以及高级订阅层。用于增强功能,更快的响应。诸如此类。更多功能,更多计算能力。
但他们的第一步是扩大使用范围,让人们参与进来,然后再真正推动货币化。先让他们上瘾,然后再做个lingo。他们采用了AI优先战略。这包括用AI替换一些合同工来完成可以自动化的任务,例如某些类型的翻译或内容审核。为了节省成本或……他们的目标是解放人类员工,让他们从事AI无法很好地处理的更具创造性或复杂的工作。
有趣的战略转变。我们注意到的一些其他快速发展。Waymo和丰田。是的,正在扩大他们的合作关系。探索将Waymo驾驶员自主系统集成到实际的丰田汽车中。未来可能会带来个人机器人汽车或新的出行服务。还有亚马逊卫星互联网。Kuiper。他们成功发射了第一批27颗运行卫星。
启动了他们建设全球宽带网络的计划。与Starlink和其他公司的竞争。绝对的。此外,亚马逊曾简短地讨论过是否要在中国商品上显示关税成本,但在遭到一些批评后否认了该计划。这表明商业、AI和政治是如何交叉的。
没错。最后,对深度搜索功能进行了比较。是的。看看Grok、ChatGPT和Gemini如何处理深入的实时信息搜索。它们具有不同的优势、数据源、分析深度以及它们如何与其生态系统集成。因此,并非所有深度搜索都是一样的。差不多。取决于您需要它做什么。哇。好的。内容很多。
我们确实涵盖了2025年5月初AI发展的全貌。它确实显示了广度,不是吗?从编码工具和搜索到伴侣、创意辅助、新模型、伦理辩论、基础设施。它在许多方面发展得非常快。希望我们已经为您提供了一些机会。
“啊哈”时刻以及对关键转变更清晰的认识。绝对的。持续的创新和颠覆。现在,在我们结束之前,如果这次深入探讨让您想到要提升技能并在AI驱动的世界中保持相关性,让我们再次谈谈Etienne Newman的精彩资源。
Jamgack应用程序。对。对于任何针对那些有价值的行业认证的人来说,Jamgack技术都令人印象深刻。确实如此。它旨在帮助您,我们的听众,掌握并绝对通过50多种最热门的认证考试。我们提到了云计算AWS、Azure、Google Cloud。网络安全,如CISSP,金融,如CPA和CFA,商业,包括PMP,以及医疗保健认证。它涵盖了很大的范围。而且工具是一流的。
基于性能的问题,PBQs,大量的测验,方便的抽认卡,实践实验室和完整的考试模拟。您需要彻底准备的一切。记住,PRO版本是完全免费的。
没有广告,没有付费墙,永远都是。这是惊人的价值。内部的技术也很聪明。自适应AI可以个性化您的学习,将测验重点放在您的薄弱环节上。此外,所有内容都保持最新,与2025年考试大纲一致,因此您知道自己正在学习正确的内容。而且您会得到每个答案的详细解释,无论正确与否,因此您实际上了解了原因。有离线模式可在任何地方学习,以及带有仪表板的智能进度跟踪。它确实使您能够掌控自己的学习并直观地跟踪您的进步。
所以说真的,如果您目标是在云计算、网络安全、金融、商业或医疗保健领域提升职业生涯,您应该自己去看看Jamga Tech。立即下载。链接在节目说明中。您职业生涯的下一个提升可能只需点击一下鼠标即可实现。强烈推荐。这是一个强大的工具。所以想想我们今天讨论的所有内容,它确实让你想知道,不是吗?
在未来几年中,您认为这些快速发展的AI技术中哪一项最终会最深刻地重塑您的工作或社会?一个值得思考的问题。一个留给听众的好问题。影响将是广泛的。绝对的。好吧,非常感谢您加入我们,深入探讨AI领域。感谢您的邀请。总是很吸引人。我们将在下一集AI Unraveled中与您相见。