欢迎收听AI Unraveled带来的深度探讨。本节目由Etienne Newman创作和制作,他是一位资深软件工程师,我相信也是一位热情的加拿大足球爸爸。没错。嘿,如果您喜欢我们在这里所做的工作,探索AI,请花一点时间在Apple Podcasts上点赞和订阅。这真的对我们很有帮助。绝对的。所以今天我们将深入探讨一些
在2025年4月25日前后出现的一些非常有趣的重大AI事件。是的,那一天很忙碌,似乎是的。范围太大了,不是吗?我们看到的影响从基本的网络浏览一直到代码的编写方式。没错。我们已经筛选了那天的大量新闻和公告。
我们的使命实际上是从中提取关键发展,也就是您真正需要知道的事情,而不会让您陷入术语的海洋。让您快速了解情况,也许还能在过程中激发一些顿悟时刻。希望如此。好的,让我们直接进入主题。第一个主题,Perplexity。他们宣布他们正在构建自己的浏览器,名为Comet。
这,这可是一个大动作。确实如此。而占据头条新闻的是Comet计划监测用户活动,远远超出Perplexity应用程序本身。哦,超出应用程序?比如什么?比如您的常规浏览习惯、您在线购买的东西,甚至您的位置数据。哇。好的,不仅仅是搜索查询了。他们正在关注您在线行为的更广泛画面。差不多。而根据首席执行官Eravind Srinivas的说法,其既定目标是
提供在Perplexity表单中令人难以置信的个性化广告嗯,个性化,因为他认为用户会接受这种程度的跟踪,他似乎相信这一点。论点是,广告,尤其是在其发现Feed中的广告,将会更相关,以至于用户会接受这种权衡。这听起来很熟悉,不是吗?它与谷歌和Meta的策略相呼应,是的,严重依赖用户数据来获取广告收入,这是一个经典模式,是的,但是
但这确实再次引发了关于隐私的重大问题。作为听众的您,即使广告据称更好,您愿意分享多少?没错。Comet计划于2025年5月发布,所以很快。是的。这绝对是值得考虑的事情。绝对的。这是一个正在发展的故事。好的,继续。接下来,苹果。
有关于他们重组内部机器人团队的消息。啊,是的。这很有趣。他们显然正在将该部门从John Giandrea领导的主要AI部门下转移出来。并将其转移到硬件部门,对,在John Ternus领导下。没错。而且,您知道,结合最近围绕Siri的一些领导层变动,这暗示着苹果公司正在进行更大的战略调整,也许试图让硬件和AI在某些项目上更紧密地合作。而这个机器人小组。
一直保持得很低调,不是吗?但报告中提到了一些,嗯,他们一直在研究相当具有未来感的概念。比如什么?比如富有表现力的AI灯和一种带有机械臂和屏幕的桌面家用设备。哇。好的。这不仅仅是迭代更新。这是雄心勃勃的事情。绝对的。是的。而将它们转移到硬件部门则暗示着,也许这些不仅仅是实验室实验了,对吧?没错。
这就是暗示。是的。这可能意味着他们正在从纯粹的研究转向,您知道,实际的产品开发,认真考虑将某种类型的消费级机器人推向市场。苹果进军消费级机器人领域。这将是巨大的。会的。了解苹果公司,他们可能会专注于紧密的集成、用户体验,使复杂的机器人感觉,嗯,像苹果一样。此举可能是为了实现这种协同效应。引人入胜。
好的,让我们稍微改变一下方向,谈一些更哲学的东西。Anthropic正在启动他们所谓的AI福利研究项目。是的,这个项目真的很有前瞻性。Anthropic基本上正在建立一个项目来研究高级AI的伦理方面,特别是研究这些系统是否可能发展出意识或某种道德地位。AI福利,就像AI本身的福祉一样。这是
一个相当的概念。是的。他们想要开发出实际评估AI模型是否可能表现出痛苦迹象甚至拥有偏好的方法。他们甚至该如何做到这一点?嗯,这就是研究目标,不是吗?他们正在研究意识的标准,研究AI行为中的潜在指标,甚至考虑在需要时进行干预。它与整个AI安全和伦理讨论相关。他们为此专门聘请了某人,不是吗?
是的。Kyle Fish在2024年。他是他们的第一位福利研究员。有趣的是,他将当前模型已经具有意识的几率定为约15%。15%。哇。这不是零。他合著的一份最新报告表明,意识可能很快就会出现。没错。
虽然必须补充一点,Anthropic自己非常清楚。这是一个高度不确定的领域。关于AI意识,绝对没有科学共识。这仍然是非常推测性的。但这向您,听众,表明的是,领先的AI实验室正在开始主动应对这些非常深刻的问题。
构建越来越强大的AI所带来的伦理问题。我很高兴他们现在就开始考虑这个问题。好的,让我们谈谈创意工具。Adobe在伦敦Adobe Max上做了一些重大宣布。是的,尤其是在他们的Firefly AI方面。他们推出了Firefly Image Model 4以及Ultra版本。承诺,嗯,更好的图像生成、更高的真实感、更好的用户控制以及更高的分辨率支持,最高可达2K。更好的图像对创意人员来说总是好的。但是
但真正的大新闻似乎是关于将其他AI模型集成到Firefly中。这是一个重大举措。是的。他们正在开放Firefly以包含第三方模型。我们正在谈论OpenAI的GPT ImageGen、谷歌的Imogen3及其视频模型VO2。甚至Black Forest Labs Flex 1.1 Pro。Firefly变成了一个枢纽。
在一个地方访问许多不同的AI工具。没错。它让用户无需离开Adobe生态系统就能获得更广泛的AI功能。还有更多,对吧?视频功能、矢量图形。嗯哼。Firefly的文本转视频功能现在已正式退出测试版。文本转矢量模型也是如此。此外,他们还推出了Firefly Boards in Data,用于协作式AI情绪板,并且新的Firefly移动应用程序也即将推出。发生了很多事情。而Adobe的主要卖点通常是商业安全性,对吧?
绝对的。他们强调他们自己的Firefly模型是用商业安全的资料训练的,并且设计为对知识产权友好。他们还添加了这个新的内容真实性功能,因此您可以嵌入元数据来说明使用了AI。因此,对于正在收听的创意人员来说,这意味着更多
更强大、更通用的工具,可能更容易访问不同的AI引擎,以及一些关于商业用途输出的保证。这就是要点。对该领域来说相当重要的更新。现在,说到工具,让我们转向开发人员。有一个名为AIDR的新工具,这是一个在您的终端中运行的AI编码助手。是的,这对编码人员来说非常方便。它基于OpenAI的Codex CLI。
它可以让您基本上直接从命令行与AI关于您的代码进行聊天。因此,您可以使用自然语言键入命令,例如解释此代码或编写一个执行X的功能。没错。解释代码、修改代码、生成新内容。它的目标是让您感觉就像在您的终端窗口中拥有一个AI结对程序员。好的。您如何开始使用它?它复杂吗?
如果您习惯使用Node.js和NPM,这似乎相当标准,您需要安装它们,然后只需npm install -e @openai/codex即可。然后设置您的API密钥。导出openai密钥,您的密钥在此处。
之后,您可以键入codex以启动交互式会话或运行直接命令,例如codex重构此类。它会自动更改您的代码吗?它有不同的模式。它可以只建议更改,或者您可以让它自动编辑,甚至可以完全自动。所以您可以控制。对于正在收听的开发人员来说,这可以真正提高生产力,甚至可能提高代码质量。简化编码过程。
说得通。好的,AI和音乐怎么样?Google DeepMind更新了他们的Music AI Sandbox。对。这是他们为音乐家设计的实验工具套件。它旨在帮助处理诸如生成乐器即兴演奏、确定人声和声、探索新的音乐方向等方面的事情。那里有什么新东西?他们添加了名为创建
扩展和编辑的特定功能。因此,创建允许您根据文本提示生成音轨。扩展采用您现有的音乐理念并继续进行。编辑允许您使用文本描述转换音频剪辑。我假设它由一个新模型提供支持?是的,升级后的Lyria 2模型。他们说它提供了更高的保真度,某种专业级的音频。
他们还推出了名为Lyria Real Time的功能,用于,嗯,实时交互式音乐生成。听起来它对于克服创作障碍或只是进行实验可能非常棒。它广泛可用吗?他们正在扩大访问范围。现在,美国更多的音乐家、歌曲作者和制作人被邀请试用这个实验性沙盒。因此,测试范围更广。对那里的音乐创作者来说,有趣的事情。现在,这里有一个真正引人注目的统计数据。
谷歌超过30%的新代码现在是由AI工具生成的。是的,这是一个巨大的数字,超过30%。它不仅仅是辅助了。AI正在编写他们大量的新软件。这感觉像是大规模开发方式的重大转变。绝对的。它可能指向大幅加速的开发周期。但是,您知道,它也引发了新的问题。比如什么?质量控制。
监督。没错。当如此多的代码是由AI生成的时,您如何管理质量保证?长期的维护是什么样的?这对行业来说是一个需要消化的巨大变化。说到潜在的问题,有一份关于科学论文的报告。研究人员发现数百篇论文似乎使用了AI生成的文本,但没有说明。哎呀,是的。这绝对是在学术界敲响警钟。
透明度以及已发表研究的基本完整性正在受到质疑。所以主要观点是?我们迫切需要明确的规则、明确的指导方针,说明在科学出版物中何时以及如何需要披露AI的使用。这变得至关重要。说得通。好的。从更积极的方面来看,麻省理工学院的研究人员创造了他们称之为机器学习元素周期表的东西。啊。
我喜欢这个主意。很聪明。目标是以结构化的方式组织所有不同的机器学习技术,几乎就像化学元素一样。为了让科学家更容易找到适合自己工作的工具。正是如此。他们不必迷失在算法的海洋中,而是可以使用此表快速识别特定科学问题的有前景的AI方法。这实际上可以帮助使AI研究更直观,甚至可能加快发现速度。这可能非常有用。现在,下一个引起了轩然大波。
加州律师考试委员会承认使用AI来帮助起草律师考试的试题。对。争议来自他们事先没有告诉考生这一点。是的。在没有披露的情况下,将AI用于高风险的专业考试。这感觉有问题。它确实引发了关于透明度、公平性和认证的辩论。这对考试的有效性意味着什么?
AI生成的试题中是否可能存在隐藏的偏见?这确实表明AI正在渗透到这些非常关键的专业流程中。而我们还没有完全弄清楚伦理防护措施。这是一个很好的说法。披露、偏见、公平性,所有这些都是AI更深入地整合时需要关注的大问题。
好的,让我们再次看看硬件方面。来自亚马逊网络服务和英伟达的报告表明,对AI数据中心的需求仍在蓬勃发展。是的。尽管有一些关于AI投资泡沫或放缓的耳语,但大型云提供商和芯片制造商表示,不,对这种专门的AI基础设施的需求仍在迅速增长。是由公司实际采用AI驱动的,而不是炒作。
似乎如此。企业采用、云、AI服务,所有这些都在推动对更多AI重点数据中心的需求。所以技术经济的这一部分看起来
现在相当稳固。很高兴知道。基础仍然很强大。好的,来自同一天,4月25日,还有一些快速的消息。那天很忙。继续说。OpenAI似乎计划在今年夏天某个时候发布一个开源推理模型。好的,这可能意义重大。开源推理模型总是很有趣。Tavis发布了一个新的唇形同步模型,Hummingbird Zero 5。
声称取得了最先进的结果。唇形同步技术越来越好得令人害怕。美国总统唐纳德·特朗普还发布了一项行政命令,成立了一个AI教育工作组和一个总统AI挑战赛。政府参与正在加强。Lovable发布了其平台的2.0版本,其中包含多人工作区。
格莱美获奖者Imogen Heap在GenMusic平台上推出了AI风格过滤器。Hicksfield AI宣布了一个更快、更便宜的AI视频模型,名为Turbo。哇。只是一天的快照。看看广度。推理模型、唇形同步、政府倡议、创意工具、视频生成。它确实强调了这一点,不是吗?我们涵盖了从个性化广告和家用机器人到AI意识、创意套件、编码帮助等一切内容。
考试问题。变化的速度是无情的。AI几乎触及了你能想到的每个领域。它正在变得普遍。绝对的。而且,如果这次深度探讨让您更多地思考AI,也许您想提升自己的技能,也许在云计算、金融、网络安全、医疗保健或商业等领域获得认证,那么您绝对应该查看Etienne Neumann的AI Power Jam Get Tech应用程序。
它专门设计用于帮助人们使用AI学习工具掌握并通过50多个不同的专业认证。啊,利用AI进行学习。说得通。是的,没错。我们将把链接放在节目说明中,供您查看Jenga Tech应用程序。听起来很有用。因此,总结一下,考虑到我们刚刚讨论的所有内容,这种令人难以置信的变化速度。
它让我们产生了一个很大的想法,不是吗?那就是?对于您这些听众来说,您生活的哪些方面、您的工作、您的职业,您认为在未来几年中哪些方面将被AI最根本地重塑?这是一个沉重的问题,而且可能是一个我们将不断回归的问题。毫无疑问。事情发展得很快。