We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode AI Daily News May 28 2025: 🗣️Anthropic Rolls Out New Voice Mode for Claude AI 🌍Synthesia Co-Founder Launches 'SpAItial' to Create AI-Generated 3D Worlds 💡Study: User Self-Confidence Influences Critical Thinking with AI and more

AI Daily News May 28 2025: 🗣️Anthropic Rolls Out New Voice Mode for Claude AI 🌍Synthesia Co-Founder Launches 'SpAItial' to Create AI-Generated 3D Worlds 💡Study: User Self-Confidence Influences Critical Thinking with AI and more

2025/5/29
logo of podcast AI Unraveled: Latest AI News & Trends, GPT, ChatGPT, Gemini, Generative AI, LLMs, Prompting

AI Unraveled: Latest AI News & Trends, GPT, ChatGPT, Gemini, Generative AI, LLMs, Prompting

AI Deep Dive AI Chapters Transcript
People
E
Etienne Newman
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
主持人: 作为Claude的用户,我很高兴看到Anthropic推出了新的语音模式,这使得与AI的交互变得更加自然和便捷。我特别喜欢它支持真正的语音对话,这让我在做其他事情的时候也能与AI进行交流。此外,免费用户可以体验到这项功能,而付费用户则能享受到与Google Calendar和Gmail的集成,这大大提高了我的工作效率。最重要的是,现在所有用户都可以免费使用网络搜索功能,这让Claude能够提供更准确和及时的信息,这对于我来说非常实用。

Deep Dive

Shownotes Transcript

这是AI Unraveled带来的全新深入探讨,由加拿大高级工程师兼热衷足球的父亲Etienne Newman创作并制作。记得点赞和订阅。以下是深入探讨。

我们收集了2025年5月28日的数据来源,所有这些数据都充满了最新的AI发展信息。我们关注的是AI辅助技术的重大更新、一些有趣的新兴公司,是的,它们正在突破界限。平台集成也是如此,甚至还有一些关于我们如何实际使用这些技术的研究。对。

我们今天的目标是,你知道的,要消除噪音。我们将分解这些更新,找到真正重要的部分。金块。是的,金块。并帮助你弄清楚这一切对AI的演变以及最终对你的意义。好的,让我们开始吧。首先,AI助手似乎在谈话方面变得越来越好。

Anthropic对Claude做了一些改进。他们当然做了。一个重要的改进是这种新的语音模式。它处于测试阶段,但正在iOS和Android的移动应用程序上推出。它不仅仅是朗读文本。它被设计用于适当的口语对话,完整的来回对话。完整的对话。免提。这感觉像是一个真正有用的步骤,不是吗?确实如此。我听说过可以选择不同的声音,比如五种。

没错。五种选择。最初,只有英语,它由他们的CloudSonic 4模型提供支持。明白了。比较巧妙的是这个应用程序。在您聊天时,它会在屏幕上显示要点。哦,很有趣。是的,所以你可以跟着看。之后,你还会得到一份成绩单和摘要,这非常方便。对。如果你,我不知道,正在做饭或者问它一个问题,你可以低头看看要点。聪明。

每个人都能获得这个语音功能吗?免费用户可以获得,但有每日限制。所以你绝对可以尝试一下。好的。但真正的性能提升是针对付费用户。他们正在与Google日历和Gmail集成。啊,好的。

想象一下,只需告诉Claude总结你的新邮件,或者检查你的日程安排。无需点击。好的。这听起来确实像一些可以改变你管理一天的方式的东西,特别是如果你很忙的话。还有一个更新,对吧?人人都有。是的。这是一个重要的更新。所有用户现在都可以免费使用集成的网络搜索。啊。

所以Claude现在实际上可以实时检查互联网。没错。这对于时事或信息快速变化的任何事情都大有裨益,更高的准确性,更及时的答案。所以把这两者结合起来,语音聊天和免费网络访问。是的。这是什么样的

这里更大的见解是什么?我认为,见解是Anthropic不仅仅是在添加随机功能。他们正在做出有意的转变。好的。Claude变得更容易访问,更实时,更像一个会话代理。将流畅的语音模式与免费网络搜索相结合,使他们与ChatGPT和Gemini直接竞争。对。大型玩家。是的,特别是对于你现在需要的东西或你想免提完成的事情。

这是关于更自然地将Claude融入你的生活中,就像一个你可以交谈的助手。说得通。好的,让我们稍微换个话题。虽然AI在谈话方面越来越好,但AI作为创造者、建设者也存在巨大的推动力,尤其是在数字世界中。告诉我们关于Spatial的信息。对,Spatial。这是一家刚刚走出隐身模式的新兴公司。好的。

联合创始人之一是Matthias Niesner。你可能认识他,他是AI视频化身公司Synthesia的创始人。对,Synthesia,是的。Spatial总部位于慕尼黑,他们获得了相当可观的资金,种子轮融资1300万美元。种子轮融资1300万美元。他们的重点是……

Spatial基础模型。这到底是什么意思?这非常前沿。它暗示了生成式AI接下来可能的发展方向。他们的目标基本上是从非常简单的输入(例如文本提示或单个图像)生成交互式、非常逼真的3D环境。哇。所以我可以输入像“创建一个霓虹灯照亮的赛博朋克小巷,带有水坑”这样的内容。是的。它会构建它。

在3D中。这就是梦想,是的。他们想要构建真正理解3D空间几何、物理、光线工作方式、材料的AI。不仅仅是将图片粘贴到盒子上面。是的,没错。创造感觉真实、可以交互的世界。如果他们真的能做到这一点,应用似乎是无限的。

完全正确。我的意思是,想想游戏、电影、建筑、CAD工程,甚至是机器人模拟。任何需要逼真3D内容的地方。团队成员来自Google AI、Meta AI,都是认真的研究人员。所以这里的见解似乎是,他们试图打破一个主要的瓶颈,对吧?是的。

使3D世界创建速度更快,甚至更容易。正是如此。艺术家不必手工构建每一件东西。这需要很长时间。对。AI可以生成基础,也许人类可以对其进行改进。它将事情从纯手工工作转变为AI辅助生成。可以真正打开

为VR AR游戏创建内容。说得通。扩展3D内容。没错。使这些沉浸式世界更容易访问。但这不仅仅是这些专门的新兴公司,对吧?甚至网络浏览器也变得雄心勃勃。Opera宣布了一些东西。Opera Neon。是的。Opera Neon。这是一个非常大胆的概念。他们称之为代理浏览器。代理意味着它会采取行动。是的。使用AI代理构建。

深度集成。这些代理不仅仅是为你查找信息。它们旨在实际执行操作、执行任务,甚至为你创建浏览器内的内容。好的,等等。代理浏览器听起来远远超出了仅仅显示网站的范围,什么样的任务,什么样的创作。嗯,报告中提到了一些非常雄心勃勃的目标,例如使用AI根据你提供的文本提示来编写整个网站或简单的游戏。嗯,浏览器编写了一个网站。

仅仅基于我输入的内容。这……

这太疯狂了。是的。这是对浏览器功能的完全不同的想法。它现在位于候补名单后面,听起来它将成为高级订阅服务。他们谈到了不同的模式。聊天、执行和制作。制作是创作部分,要求AI生成网站、代码等。Opera声称它使用云工作流程,因此它甚至可以在你离线后完成生成内容。这部分仍然有点模糊。是的,离线部分听起来很复杂。那执行模式呢?执行使用他们的……

浏览器操作员,AI代理。它应该能够自动化更常规的网站任务,填写表格,也许帮助预订旅行等,所有这些都在浏览器内完成。所以Opera Neon的见解。嗯哼。

他们试图从根本上改变浏览器的功能,不是吗?绝对正确。从仅仅是一个查看内容的窗口到一个创建和自动化的主动助手。对。如果它有效,它可以完全改变我们在线交互的方式。模糊浏览器、操作系统应用程序之间的界限。

这是一个非常雄心勃勃的尝试,使浏览器本身成为一种生产力中心。没错。好的,说到集成,让我们谈谈AI如何将自身嵌入到我们经常使用的平台中。关于OpenAI探索使用ChatGPT登录的消息。是的,这非常有趣。他们说,这还处于早期阶段,只是探索阶段。但他们基本上发布了一个表格,询问开发人员,嘿,你想让用户使用他们的ChatGPT帐户登录你的应用程序吗?

哦,就像你使用你的Google或Apple ID登录其他服务一样。就是这样。将ChatGPT定位为这些通用登录选项之一。显然,他们已经使用命令行工具Codex CLI秘密测试了这一点。他们甚至发放了API积分来让人们链接帐户。鉴于有多少人使用ChatGPT,

每月活跃用户有多少?大约有这么多。是的,数量巨大。所以这可能是他们的一项重大举措。这绝对是一个战略举措,它利用了庞大的用户群,而不仅仅是聊天机器人。对。这里的见解是OpenAI试图将自己编织到基本的数字基础设施中,成为一个身份提供商。使帐户更具粘性。没错。并使他们在身份验证领域与Google、Apple竞争中占据一席之地。

他们显然正在考虑2025年发布,但显然还需要很多关于安全、数据共享的细节。当然,当然。这将是关键。在平台集成方面,Telegram和XAI之间的传闻交易受到了很多关注。哦,这是一个重要的交易。报告称,他们已原则上同意了一项为期一年的协议。好的。价值3亿美元的报告。

在Telegram上集成Elon Musk的AI Grok。哇,3亿美元。这是大笔资金。除了拥有Grok之外,Telegram还有什么好处?嗯,

据Telegram首席执行官Pavel Durov称,XAI提供了3亿美元的现金和股权组合。对。Telegram从通过Telegram销售的任何XAI订阅中获得50%的收入。啊,收入分成。好的。这实际上什么时候会发生?用户什么时候会在Telegram上看到Grok?

他们的目标是今年夏天。其想法是将Grok的功能(总结聊天、编辑文本,甚至审核群组)带给Telegram庞大的用户群,超过10亿用户。超过10亿,是的。所以你可能会看到它出现在聊天中,或者可能出现在搜索栏中。

这样的事情似乎很可能发生。Elon Musk确实发推文说,“还没有签署任何协议”。对,看到了。但Durov随后表示,“只是手续正在办理中。主要协议似乎基本上已经完成。”隐私角度,Telegram非常重视这一点。关键点。

Derov明确表示,不会为Grok训练提供任何Telegram数据。好的,这对用户来说很重要。所以这项潜在的巨额交易的核心见解。嗯,对于Grok来说,这显然是一个巨大的分销渠道,可以立即访问主要平台上潜在的10亿用户。覆盖范围巨大。对于Telegram来说,这是朝着成为一个AI驱动的超级应用程序迈出的巨大一步。

不仅仅是消息传递,还提供直接集成的有用AI工具,以及潜在的重大新的收入来源。对。所以他们自己并没有构建AI,而是集成了一个强大的AI来提升他们的平台。没错。战略性集成以增强核心服务并赚钱。

好的,在我们进入最后一部分之前,如果您想实际使用AI,这里有一个快速提示。我们刚刚推出了AI Unraveled,即构建者工具包。它基本上是一系列实用的AI教程,包含PDF指南、视频、音频片段,并且您可以终身访问我们添加的所有未来更新。这是一种将倾听转化为行动的好方法。没错。

将你听到的内容转化为你所做的事情的完美方法。而且,你知道的,这有助于使这项深入探讨每天都能进行。你可以在DJMGateTech.com(D-J-A-M-G-E-T-E-C-H点A-A-G)找到它,或者直接在节目说明中获取链接。好的,欢迎回来。所以我们已经讨论了AI变得更具会话性,更容易通过语音进行交谈。更易于访问。并且作为创建者,构建3D世界,甚至在浏览器内编写代码,功能也更加强大。

是的,突破创意界限。然后深深地融入我们每天使用的平台中。消息应用程序,甚至我们的登录信息。对。到处都是更深入的集成。而支撑所有这些技术进步的是人为因素。这项研究提醒我们,我们如何使用这些工具,我们的信心,我们的信任,确实会影响我们实际使用这些工具的效果。所以这对你们听众来说真正意味着

随着AI不断深入到你的数字生活中,你的手机、你的工作工具、你与人们联系的方式,了解它能做什么和不能做什么。以及你如何与它互动。是的。了解你自己的方法,记住这一点变得至关重要。保持知情不仅仅是了解新功能。而是弄清楚如何有效地驾驭这一点。这绝对是一个充满活力的环境。所以这里有一个最后的思考留给你。

随着AI可能成为我们的通用登录方式、我们的编码伙伴,嵌入到我们的聊天和浏览中,我们的责任是什么?我们如何保持自己的信心,自己的批判性判断,以确保这些极其强大的工具真正增强我们,而不仅仅是自动化我们自己的参与和批判性思维?