We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode AI Daily News June 27: 🚀Google’s Gemma 3n brings powerful AI to devices 🫂 Anthropic studies Claude’s emotional support 🔔Altman vs. NYT: Privacy Is the New PR Weapon  🤖YouTube adds AI summaries to Search Results 🥊 Meta poaching OpenAI researchers

AI Daily News June 27: 🚀Google’s Gemma 3n brings powerful AI to devices 🫂 Anthropic studies Claude’s emotional support 🔔Altman vs. NYT: Privacy Is the New PR Weapon 🤖YouTube adds AI summaries to Search Results 🥊 Meta poaching OpenAI researchers

2025/6/27
logo of podcast AI Unraveled: Latest AI News & Trends, GPT, ChatGPT, Gemini, Generative AI, LLMs, Prompting

AI Unraveled: Latest AI News & Trends, GPT, ChatGPT, Gemini, Generative AI, LLMs, Prompting

AI Deep Dive AI Chapters Transcript
People
S
Speaker 1
Engaging in everyday conversations, expressing honest feelings and opinions.
S
Speaker 2
Topics
Speaker 1: 我观察到Meta公司正在积极招募OpenAI的关键研究人员,包括Lucas Beyer、Alexander Kolesnikov、Zhao Weizhai等人,他们甚至挖走了OpenAI苏黎世运营的整个团队,以及对OpenAI的01推理模型做出基础性贡献的TrapAdvance。这表明Meta对超级智能领域的认真投入和战略布局,他们愿意投入大量资金,尤其是在Scale AI投资150亿美元之后,并任命Alexander Wang领导新的部门,Meta的超级智能团队正在迅速成型,吸引了大量顶尖人才,这让我对他们的未来发展充满期待。 Speaker 2: 我认为01模型是OpenAI训练其模型进行思考和逻辑推理的关键部分,它不仅仅是简单地返回学习到的事实,而是能够进行更深层次的分析和判断。Meta公司挖走相关研究人员,表明他们希望在模型训练和推理方面取得突破。

Deep Dive

Shownotes Transcript

- 您好,欢迎收听。这是AI Unraveled带来的全新深度解读。- 没错。- 这档播客由才华横溢的Etta Newman创作和制作,他是一位资深工程师,也是一位来自加拿大的热衷足球的爸爸。- 他制作的内容很棒。- 绝对的,如果您觉得这些深度解读很有价值,请记得点赞和订阅。这真的能帮助我们带来更多有见地的内容。- 这很重要。- 好吧,今天我们要深入探讨。

我们将为您呈现最重要的知识点,以及一些令人惊讶的事实。没错。关于AI的未来发展方向,也就是现在的情况。我们将参考2025年6月27日的《AI创新每日纪事》等来源,了解最近的发展动态。那天发生了很多事情。没错。无论您是想赶上进度,准备会议,还是仅仅出于好奇,我们的目标都很简单。捷径。捷径。

获得真正充分的信息,但不会感到不知所措。您将对最新的突破、新兴的实用技术以及一些道路上的障碍(挑战)有很好的了解。当然。好的,让我们开始吧。现在有两股强大的力量正在改变现状。

激烈的AI人才争夺战。哦,是的。以及将强大的AI应用到各个领域的持续努力,甚至包括我们最小的设备。对。关于第一个方面,人才争夺战。一个非常突出的例子是Meta的积极举动。他们挖走了四位OpenAI的核心研究人员。四位。哇。为他们的新型超级智能部门工作,对吧?我们说的是Lucas Beyer、Alexander Kolesnikov、Zhao Weizhai。

这些人实际上是建立OpenAI苏黎世办事处的成员。所以基本上是一个完整的团队。差不多。他们还获得了TrapAdvance all。

他是OpenAI 01推理模型的基础。好的,01模型。提醒我们一下这是什么。可以把它想象成OpenAI训练其模型进行思考和得出逻辑结论的关键部分,而不仅仅是重复它学到的事实。明白了。这绝对是Meta大胆的一步,特别是考虑到Sam Altman上周才说过OpenAI最优秀的人才不会接受其他公司的聘用。他确实说过。他还否认了那些高达1000亿美元的巨额奖金传闻。对。所以这些招聘……

似乎与这种说法完全相反,确实如此。我的意思是,尽管Altman公开声明,这些研究人员还是去了Meta,这仅仅表明Meta对这件事很认真,他们愿意花钱,愿意投资,尤其是在那150亿美元的巨额AI投资之后,对吧?并将他们的CEO带过来,没错,Alexander Wang领导这个新部门,这确实表明

Meta的超级智能团队正在迅速成型。大量顶尖人才涌入。这让人想知道他们的第一个发布会会是什么样子。绝对值得关注。所以,好的,这就是对人才的争夺,超级智能竞赛。但与此同时,还有一个并行的推动,对吧?让AI更易于访问。使其大众化,是的。而谷歌的新Gemma 3N模型似乎就是一个完美的例子。绝对的。

如果我们稍微放大一点,Gemma 3N,它有较小的20亿和40亿参数版本。这一切都是为了带来强大的多模态能力。多模态意味着图像、音频、文本,所有这些。没错。处理和理解各种信息,并将这些信息直接带到您的手机或其他日常边缘设备上。而且它很有效率,你提到了。非常高效。它可以在只有2GB RAM的硬件上运行。2GB。太小了。是的。所以想象一下。

您的Pixel手机上内置的视觉功能,以每秒60帧的速度分析视频,实时物体识别,理解您周围的环境。哇。此外,它还支持35种语言的音频功能以及语音转文本功能。这种设备上的效率水平,那是……

这真是太了不起了。但通常情况下会有权衡,对吧?效率与原始能力之间的权衡。GEMMA 3N的实际性能如何?这是一个合理的问题。GEMMA 3N的较大版本E4B,它实际上正在掀起一些波澜。它是第一个参数少于100亿且得分超过1300分的模型。

在Elmarina基准测试中。好的,Elmarina。这就像对这些大型模型的标准化测试。一个具有竞争力的基准测试。是的。这意味着AI不仅仅是缩小规模。它在缩小规模的同时仍然很强大。我们正在从需要云计算来处理一切转向拥有真正个性化、始终在线的智能。因此,您的手机不仅仅是运行应用程序。它正在

实时地理解您的世界。都在它自己的能力范围内。是的。这就是这里正在发生的悄无声息的革命。在您的设备上实现无限的智能功能的潜力。我的天,这一切的速度。人才流动,新模型层出不穷。这确实突显了在AI领域保持领先地位的重要性。没错。而且

如果您想提升您的职业生涯,也许获得AI认证。Etienne Newman有一些很棒的资源。哦,是的。他的准备书籍。没错。书名包括Azure AI工程师助理、Google Cloud生成式AI领导者认证、AWS认证AI从业者学习指南、Azure AI基础知识、Google机器学习认证。哇。涵盖了重要的内容。完全正确。它们都可以在djamget.com上找到。

当然,我们还会在我们的节目说明中为您提供直接链接。这使得查找变得容易。如果您认真考虑提升自己,绝对值得一看。好的,让我们从这些大型科技公司的竞争中转移到其他方面,AI也在……

悄无声息地,有时也并非悄无声息地改变着我们日常生活的方方面面。我们的学习方式、购物方式,甚至是我们查找旧照片的方式。对。让我们从学习开始。你在谷歌Gemini中发现了一些有趣的东西。是的,这非常巧妙。一个教程展示了如何使用Gemini将讲座视频转换成非常详细的学习资料。这是如何运作的?这很简单。您只需将讲座视频上传到Gemini应用程序。

然后你提示它,你让它分析这个讲座视频,并提供详细的大纲、完整的笔记,好的,任何提到的公式或例子,甚至每个主题在视频中讨论的时间戳,仅此一项就听起来对学生来说非常有用,比如分解冗长的讲座,完全正确,但它会变得更好,您可以继续要求它根据内容创建测验,比如练习题、综合测验,是的,以及答案键和解释

它甚至可以为您编写一个小的互动测验,如果您遇到困难,还可以添加提示按钮。哇。好的。这里真正的强大之处在于将所有生成的材料(笔记、测验)保存到一个文档中。然后你对下一个讲座,再下一个讲座重复这个过程。因此,您正在为整个课程构建自己的自定义学习库。没错。它利用AI真正地个性化和增强您的学习过程。

使其效率更高,更具针对性。这是一个极好的实际应用。说到实用,谷歌还在测试这款新的虚拟试穿应用程序Doppel。是的,Doppel。其理念是,您提供一张自己的全身照片,然后只需截取一张您在网上看到的任何服装的截图。然后它会做什么,把衣服穿在你身上?有点像。它会生成一段你穿着那套衣服的AI剪辑。这绝对是一瞥在线购物的未来发展方向。

但我听说有一些缺点。哦,当然。它确实引发了关于当前限制的问题。该工具有时在渲染裤子时会遇到很大的困难。困难?嗯,有时它显然会创建假脚,就像把它们粘贴上去一样。哈哈。假脚。好的。是的。据报道,它甚至会让镜子自拍中的人看起来比实际瘦得多。嗯。不太理想。确实不理想。所以,虽然它可以处理来自任何地方的衣服,这很酷……

但这些故障表明,AI在处理细微的视觉细节方面还有很长的路要走。

理解人体,尤其是情感,是棘手的,是的,很明显,好的,日常媒体呢?YouTube现在正在做AI摘要,是的,他们正在测试它,为一些查询的搜索结果添加AI摘要,这是一个可选的实验,目前仅限于高级订阅用户,这对于快速了解视频要点非常方便,当然,对用户来说很方便,但潜在的缺点是,如果人们只阅读这个摘要,他们可能不会点击视频,啊,对,这可能会损害

频道、他们的观看次数、他们的收入。没错。值得关注的事情。与此同时,谷歌的“Ask Photos”,他们用于照片库的AI搜索功能又回来了,而且速度更快了。他们更新了背后的Gemini模型。是的。增强的功能。它正在更多地发展成为一种个人记忆助手,并且

真正改变了您挖掘自己视觉历史、数字生活的方式。就像您照片的AI策展人。差不多。使庞大的图书馆真正可搜索,并且,嗯,易于理解。

您知道,所有这些实际用途可能会让人们思考,嘿,也许我可以使用AI构建一些东西。它激发了想象力,对吧?绝对的。如果您有兴趣使用AI实际构建东西,您绝对必须查看Etienne Newman的另一个资源,AI Unraveled Builder's Toolkit。啊,是的,工具包。它很棒。它包括一系列AI教程、PDF、音频、视频格式,无论哪种方式适合您。

此外,还有AI和机器学习认证指南。所有这些都是为了帮助您开始构建自己的AI项目。大量的实践操作。没错。链接,同样,就在节目说明中。如果您想从仅仅了解AI转向实际操作AI,这非常有价值。好。

好东西。好的,让我们稍微转变一下视角。考虑一下更大的图景,企业中的AI,以及对一些炒作、社会影响叙事的现实检验。对。在企业方面,Salesforce提供了一个相当大的数据点。

他们的首席执行官Marc Benioff透露,生成式AI现在处理了高达50%的工作。50%,一半。是的,一半。是的,他们内部工作流程的一半,从销售运营到服务运营,所有的一切。哇,这可不是小事。一点也不。这非常清楚地表明,一家主要的企业软件公司正在积极地重新定义员工的工作效率。

这表明AI对白领工作的影响不再仅仅是理论上的了。它已经被部署了。它正在发生。没错。在一间大型公司内部。如果这还不够具有变革性的话,那么有一个AI驱动的创业工作室的目标是,听着,每年推出10万家公司。吹口哨,每年10万家。嗯,他们计划使用AI代理来构思商业创意、验证它们,然后将它们部署为数字业务。哇。好的。将其与更大的图景联系起来。

这可能会对创业产生巨大的影响,不是吗?怎么会这样?嗯,你正在摆脱传统的模式,即创始人有一个想法并慢慢地构建它。这更像是AI驱动的公司工厂。公司工厂。它从根本上改变了进入壁垒,创造的规模。也许它甚至以一种全新的方式使创业民主化。

或者集中化,这取决于你的看法。有趣。有很多东西需要展开讨论,但是好的。在所有这些之中,巨大的创新和这些巨大的说法,

有时你需要一些现实的剂量,对吧?我们最好脚踏实地。Anthropic发表了一些关于人们如何实际使用他们的AI Claude进行情感支持的研究。对。这项研究很重要,因为它反驳了一些常见的媒体说法。它发现,将Claude用于情感支持或他们所谓的有效对话,实际上远不如你从新闻中读到的那样常见。真的吗?少多少?他们查看了450万次Claude对话。

陪伴、角色扮演。这些内容只占互动总数的不到0.5%。好的,Tenny,那么人们在情感支持方面使用它来做什么呢?主要是实际问题,例如关于职业变化或处理人际关系问题的建议,诸如此类的事情。更像是一个针对特定问题的讨论对象

没错。重要的是,这项研究发现,在聊天过程中,用户的感受往往会变得更加积极。它并没有,你知道,放大消极的思维模式,这在其他地方一直是一个令人担忧的问题。很高兴听到这个消息。是的。现在,值得记住的是,Claude通常比ChatGPT或Character AI等专业平台更侧重于开发者。啊,所以也许其他平台会看到不同的使用模式。有可能,是的。

但至少对于Claude来说,这项研究直接反驳了一些关于AI浪漫和深度依赖的极端说法。这提醒我们,有时数据会比标题讲述更细致入微的故事。绝对的。检查数据。好的。因此,随着AI变得越来越复杂,它不可避免地会开始触及更棘手的领域:边缘情况、可靠性问题、隐私问题。当然。在医疗保健领域,我们看到了这枚硬币的两面。

一方面,您有阿里巴巴的新AI模型Grape。Grape。是的,Grape。它分析3D CT扫描以检测胃癌。《自然医学》杂志上的一篇论文报道称,在研究中,Grape在识别疾病方面明显优于人类放射科医生。优于放射科医生。哇。也可能更早地发现它。这对挽救生命具有巨大的潜力。一项重大的AI突破。令人难以置信的潜力。但是然后

有另一面。对。然后你看到,例如,一项希腊研究发现,即使是最好的最先进的AI模型也会被一些简单的事情所迷惑,例如医学考试问题中的俚语或错别字。俚语和错别字,就像人类很容易处理的东西一样。没错。这突出了一个非常关键的点。如果AI难以处理这些缺陷,它就会削弱其可靠性,尤其是在考试或诊断等高风险领域。因此,训练数据需要反映现实世界的瑕疵。完全正确。

完全正确。如果医疗AI要在医院或教室中成为真正安全可靠的工具,它必须接受现实世界中语言实际使用方式的混乱现实的训练。它只是提醒我们,你知道,AI不是魔法。还不是。它不是灵丹妙药。明白了。然后是始终存在的隐私争议。Sam Altman最近对《纽约时报》进行了公开批评,不是吗?他确实这样做了。就他们对OpenAI的诉讼而言。

具体来说,他批评《纽约时报》要求OpenAI即使在用户明确选择私密模式时也应保留用户聊天记录。Altman的观点是什么?他基本上说,这不是隐私,这是对监控的伪装。非常强烈的措辞。是的,没错。对监控的伪装。那么,对于用户,对于正在收听的您来说,更大的图景是什么呢?嗯,其含义非常重要。如果《纽约时报》得到它所要求的,那么这种隐私

您在AI工具中点击的私密模式根本就不是私密的。这感觉像是对信任的重大破坏。这是一场潜在的信任危机。

想想那些试图在金融或医疗保健等受监管领域使用AI的公司。这将成为合规性噩梦。因此,关键的要点是?对您的关键要点是,在2025年,隐私政策不再仅仅是法律文件了。它们是核心产品功能。像OpenAI这样的公司正在下注。押注什么?他们押注的是,您,用户,最终会选择真正尊重您选择的品牌。当您要求它删除时,它会真正删除的那个。

这是关于赢得和保持信任的问题。隐私作为一项功能,而不仅仅是一项政策。说得通。好的,在我们结束对27日的深度解读之前,快速回顾一下其他值得注意的事情。当然。我们看到Black Forest Labs发布了FLUX.1 Context。这看起来是AI图像编辑的新一步。DeepSeq的R2模型由于NVIDIA芯片短缺而显然遇到了一些障碍。啊,硬件瓶颈仍在继续。是的。OpenAI还在其0304小型模型中通过其API和网络搜索发布了深度研究。

Hagen推出了Hagen Agent,用于更轻松地创建视频。越来越多的AI工具出现,总是如此。Meta在一项AI训练数据案例中赢得了合理使用裁决,这在法律上具有重要意义。Suno这家音乐AI公司收购了WavTool,另一个音乐创作平台。扩展他们的工具包?哇。好的。

在AI领域,那确实是很忙碌的一天。从不乏味。所以让我们尝试将所有这些整合在一起。这一切意味着什么?今天,我们真正经历了大量的AI创新。从人才争夺战到小型设备。对。激烈的竞争,令人难以置信的进步,使AI变得个性化。我们研究了它如何改变学习、购物,甚至企业运营方式。改变工作流程,是的。但我们也触及了关键问题,不是吗?

关于可靠性,关于实际的社会影响与炒作,以及持续的隐私争议。绝对的。从宏观角度来看,我认为大方向很明确。AI在许多方面都在快速发展,但它也在努力应对这些复杂细致的人为因素。例如语言的怪癖或隐私对人们的实际意义。没错。我认为这为正在收听的每一个人提出了一个重要的问题,因为AI正越来越深入地融入我们的生活。

我们如何取得平衡?平衡什么之间的平衡?在AI提供的令人难以置信的承诺、惊人的能力与绝对必要的道德使用、透明度以及透明度之间。

至关重要的是尊重我们的个人界限。这是一个大问题,不是吗?找到这种平衡。好吧,我们希望这次深度解读能为您提供更清晰、更明智的视角,了解AI目前的现状,也就是最前沿的技术。希望它对您有所帮助。请记住,如果您感觉受到启发,想要提升自己的AI技能,也许获得认证。Etienne Newman的AI认证预备书籍和AI Unraveled Builder's Toolkit都是非常棒的资源。强烈推荐。

您可以在dgemgate.com上找到所有需要的链接。就像我们所说的那样,它们就在我们的节目说明中。很容易找到。查看一下。好吧,非常感谢您加入我们这次深度解读。保持好奇心,继续学习。我们下次再见。