欢迎来到AI Unraveled的新深度探讨。这是由Etienne Newman创作和制作的播客。他是一位资深软件工程师,也是一位居住在加拿大的热衷足球的父亲。再次深入探讨真是太好了。是的,绝对的。嘿,如果您觉得这些深度探讨很有价值,请花一点时间在Apple Podcasts上点赞和订阅。这真的对我们很有帮助。当然。所以今天我们做一些不同的事情。我们将关注2025年4月11日这一天。
我们有这个引人入胜的编年史,记录了那天人工智能的创新。是的。我们的想法是利用这个快照来快速了解重大进展、出现的关键趋势。没错。让您对仅仅24小时内发生的事情有一个清晰、有见地的概述。想想看,这真是太神奇了。人工智能在短短一天内能发生什么变化?是不是啊?是的。
这份记录显示了从开发新模型(基础性工作)到人工智能出现在日常工具中的一切。以及一些挑战,快速发展带来的阵痛。好的,让我们来分解一下。首先是OpenAI。
听起来他们有很多事情要做。GPT-4.1似乎即将推出。是的,这是GPT-4.0的继任者。最重要的是增强的多模态能力,实时处理音频、视觉、文本,据说甚至更好。实时。哇。还有更小的版本。GPT-4.1 mini和nano。是的。转向整个模型系列的举动非常有趣。它
表明,你知道,将人工智能应用到更多设备上。比如手机或智能家居设备。正是如此。处理能力较低的设备。而多模态部分则为更直观的交互打开了大门。想想看,实时视频通话翻译实际上能够理解视觉环境。或者像了解您正在观看什么的博物馆导游。
是的,那种东西。无缝互动。在推理方面也有更多内容。名为03和04 Mini的新模型。对。它们显然在ChatGPT的网络版本中被发现。一些关于它们可能在下周甚至更早发布的讨论。这速度太快了。是的。它显示了这些开发周期正在变得多么迅速。在网络版本中看到它们就像窥探幕后一样,你知道。
他们的测试过程。但也有一些预警。Sam Altman最近提到了产能挑战。啊,是的。这是另一面。因此,当他们推出这些强大的新模型时,我们可能应该预期会出现一些服务中断、速度减慢之类的情况。知道了。这需要大量的资源,对吧?巨大的。在满足需求的同时管理基础设施,这对于这些大型人工智能实验室来说是一场
持续的权衡。好的,让我们完全改变方向。下一个故事真的让我眼前一亮。一个购物应用程序声称它是人工智能驱动的。哦,那个使用菲律宾人工的应用程序?并不是人工智能在做大量的工作。嗯,这就是故事。它引发了一些关于透明度、信任等等非常重要的问题。因此,该应用程序被宣传为这款通用购物车。
使用人工智能自动化在线购买。是的,这就是宣传。但似乎当人工智能实际上无法完成购买时(听起来这种情况经常发生),他们有一个隐藏的呼叫中心手动完成。哇。只是秘密地填补。差不多。而该公司Sanger现在正面临严重的法律麻烦。我看到了。
证券欺诈、电汇欺诈,每项可能判处20年。加上SEC也参与其中。是的,意义重大。这不仅仅是夸大其词。这是对其实际运作方式的根本性误导。它确实让你质疑那些人工智能驱动的标签,不是吗?绝对的。我们需要更批判性地思考。而且它模糊了界限。你知道,什么时候是技术辅助人类,什么时候是真正的人工智能驱动?这个标签现在到底意味着什么?嗯。
好的,转向一些绝对以人工智能为中心的内容,ChatGPT获得了一项新的记忆功能。啊,是的,这感觉像是相当合乎逻辑的一步,使互动感觉更连续、更有帮助。对,所以它可以记住过去对话中的内容。这是目标,更个性化的回应,因为它有上下文。它建立在早期的更新之上,试图使其更
自然。它首先向专业版和高级版订阅者推出。最初是的。有趣的是,它并没有立即在欧洲推出,可能是为了应对那里更严格的人工智能法规。隐私显然在这里是一件大事。巨大的。所以OpenAI正在赋予用户控制权,对吧?您可以将其关闭。是的,您可以在设置中禁用记忆功能或使用临时聊天,就像浏览器中的隐身模式一样,或者类似于Google Gemini的处理方式。
这些控制至关重要。绝对的。你需要感到舒适。对。因此,目标是创建一个更直观的助手,从你那里学习。但至关重要的是,你管理这个学习过程。好的,让我们谈谈苹果。
听起来他们在推动人工智能方面遇到了一些内部障碍。芯片预算分歧。是的,报告显示,在资源分配方面存在一些内部争论,特别是对于人工智能所需的芯片。但这突显了他们现在对生成式人工智能的重视程度。他们正在大力投资以迎头赶上。即使是苹果也面临着这种组织上的障碍,是吗?哦,绝对的。尤其是在这个快速发展的领域,这表明他们将人工智能视为多么重要的战略。Siri也出现了一些问题。
领导层冲突影响了新功能。显然如此。据报道,关键领导人Robbie Walker和Sebastian Maranomes之间的分歧导致项目被拆分。这导致了准确性问题,例如近三分之一的请求都存在问题。这就是报告,你知道,这相当重要。它强调了构建真正可靠的语音助手有多么困难。因此,软件主管Craig Federighi介入。
重新组织事情。正确。他将增强Siri推出的责任从负责AML的John Jane Andrea转移到负责ARVR的Mike Rockwell。这表明了这次真正决心让Siri做好。一次新的推动。对。好的。说得通。
她非常认真,即使遇到挫折。绝对致力于成为主要参与者,尽管早些时候遇到障碍。现在,曾经在主要参与者工作的人,Meera Muradi,前OpenAI首席技术官。她正在创办一家名为Thinking Machines Lab的创业公司。而融资目标是……哇。是这样的。
试图筹集超过20亿美元的种子资金。这令人震惊,不是吗?如果他们成功了,这将是有史以来最大的种子轮融资之一。也许是最大的。必须排在前面。与Ilya Sutskever的SSI融资相比,它确实让人眼前一亮。确实如此。鉴于她在ChatGPT等方面的工作背景,这充分说明了投资者对Marati的信心。而且她也在吸引人才。
John Schulman,他在OpenAI共同领导了ChatGPT的开发,他加入了她。对。因此,这是一个真正高素质的团队,即使我们还不知道他们究竟在构建什么。既定目标相当广泛。使人工智能更易于理解、定制和普遍适用。是的,仍然含糊不清。但是Marati、Schulman和那样的融资水平……
吸引了所有人的注意。它确实让你想知道,你知道,下一个重大突破将来自哪里。这些专注的初创公司还是老牌巨头。好问题。对于听众来说,这仅仅表明了强烈的兴奋感,目前涌入人工智能领域的巨额资金以及对像Marati这样的人的信任。好的。转向许多人每天都会使用的平台。
Canva,他们正在添加更多人工智能功能。是的,Canva一直在相当有效地集成人工智能。现在他们正在添加图像生成等功能,这似乎很自然。以及交互式编码,Canva代码。这听起来很有趣。
确实如此。显然是与Anthropic合作开发的。允许您使用提示创建小型交互式迷你应用程序,从而使这种创建民主化。加上人工智能照片编辑工具,甚至还有电子表格功能,Canva表格。对。有了名为Magic Insights和Magic Charts的功能,他们显然的目标是在整个套件中嵌入人工智能,使其更强大。以及与HubSpot、Google Analytics的集成。
感觉他们想成为一个更中心的枢纽。这似乎是他们的战略。使设计和内容创作更容易、更高效,由人工智能驱动,而无需用户拥有深厚的人工智能专业知识。
这表明人工智能正在融入现有工具的结构中。因此,如果您正在使用Canva进行工作或项目,这些都可能是非常有用的补充。这可能会真正提高生产力和创造力。是的。我们之前也谈到了ChatGPT的记忆功能,但4月11日关于其长期记忆功能的另一个更新也值得注意。啊,对。
这似乎是我们之前讨论的记忆功能的演变,超越了当前或最近的对话。因此,它可以回忆起所有过去对话中的信息。这是想法。创建一个真正个性化的助手,学习你的
你的偏好、兴趣、随着时间的推移,在所有聊天中自动满足你的需求。- 自动地。- 好的。- 这也首先向高级版和专业版用户推出。- 是的,最初。稍后计划面向团队、企业和教育账户。- 再一次,用户控制是关键。您可以管理它,告诉它忘记某些事情。- 绝对的。这似乎是不可谈判的。你需要这种控制能力,这种说“嘿,忘记那件事”的能力。对信任至关重要。- 因此,它的目标是更个性化,
从一切中学习,但你仍然掌握着缰绳。没错。一个更有帮助的助手,希望不会让人觉得唐突。好的。对于内容创作者来说,一些可能非常有用的东西。是的。用于将YouTube视频转换为博客文章的新人工智能工具。也是经过SEO优化的。是的。这可以节省大量时间,有效地重复使用内容。它通常是如何工作的?
嗯,这个过程涉及使用Notebook LM之类的工具来获取成绩单。然后你确定你的SEO关键词,为人工智能编写一个详细的提示。它会生成一篇博客文章草稿。
差不多。你仍然需要编辑它,添加视觉效果,确保它流畅,但它确实完成了转录和起草的初步工作。绝对有助于最大限度地提高视频内容的价值,充分利用它,提高知名度。对。它利用人工智能来简化工作流程。让你思考人工智能如何重塑整体内容策略。但并非人工智能在这一天都一帆风顺。一项研究表明,人工智能模型仍然难以处理复杂的软件调试。
啊,是的,这是一个重要的现实检验。尽管在代码生成方面取得了令人难以置信的进步,但修复真正棘手的错误对于人工智能来说仍然很困难。
微软测试了九个大型语言模型,包括CLAWD 3.7 Sonnet,对吧,针对数百个现实世界的错误。是的,来自名为SWE Benchlight的基准测试。即使是最好的一个,CLAWD 3.7 Sonnet,也只解决了大约多少,48.4%?不到一半。所以几乎有一半的时间它都失败了。为什么会这样?嗯,这项研究表明一个关键原因是训练数据。大型语言模型没有接受足够的顺序决策数据训练。
这意味着人类实际调试方式的记录。循序渐进的过程、反复试验、直觉。这种数据通常不会在标准代码数据集中捕获。这说得通。调试并不总是线性的。根本不是。它需要细致的推理、系统理解。
人工智能目前还无法做到的事情。因此,人类专业知识仍然至关重要。因此,人工智能是一种工具,也许是一个助手,但并没有取代人类调试人员来处理复杂的事情。目前还没有,当然。它强化了人类技能在软件开发中仍然至关重要的观点。从更大的社会影响来看。
对数千名研究人员进行了一项调查。他们对人工智能的期望是什么?实际上,这相当细致。对超过4000名受访研究人员进行的调查,发表在《自然》杂志上。他们看到了人工智能在医疗保健、教育、气候科学方面的巨大潜力。积极方面。对。但他们也有一些重大担忧。不平等、错误信息、伦理问题、工作岗位流失在概述中没有提及,但经常出现。所以基本上是一把双刃剑。是的,非常如此。
科学界似乎对巨大的机遇以及需要仔细治理和思考的严重风险达成了相当一致的看法。这并非全是炒作或全是厄运。一种平衡的观点,这可能是现实的。我们需要管理负面影响。没错。需要积极主动的解决方案。说到负面影响,或者至少是挑战,那就是能源消耗。
一份报告警告说,到2030年,人工智能数据中心的能源使用量可能会增加四倍。是的,这是一个严厉的警告。训练这些大型模型的需求以及随后用于推理的需求,都非常耗电。增加四倍是巨大的。是的。该报告呼吁各国真正规划基础设施需求和环境影响。
我们不能忽视足迹。因此,人工智能的可持续性正成为一个非常关键的问题。越来越如此。我们需要更高效的硬件、更智能的算法以及这些数据中心的可持续能源。这是长期的一个主要因素。好的,但从更积极的数据来看,麻省理工学院的研究人员开发了一种保护人工智能训练数据隐私的新方法。
是的。这确实很有前景。挑战在于在敏感数据(例如医疗记录、财务信息)上训练人工智能,而不会泄露这些私人信息。这对于在这些领域使用人工智能至关重要。绝对的。而这种麻省理工学院的技术显然可以在不增加太多计算开销的同时,显著降低泄漏风险。这就是最佳点。
因此,这可能会成为标准做法。有可能,是的。尤其是在医疗保健和金融等受监管行业,它可以安全地解锁更多人工智能应用程序。现在下一个听起来几乎像是科幻小说。
谷歌的AI共同科学家在48小时内解开了长达十年的超级细菌之谜。难以置信,对吧?伦敦帝国理工学院的研究人员一直在研究某些超级细菌的抗生素耐药性长达10年。10年的研究。而谷歌的人工智能工具(基于Gemini 2.0构建)显然复制了他们的主要假设,并在短短两天内提出了四个新的合理理论。它甚至是如何工作的,共同科学家?
它被描述为一个多智能体系统。因此,不同的AI智能体协同工作。有些生成假设,有些批判它们。他们进行比赛以挑选最佳想法。就像一个小型人工智能研究团队。有点像。然后一个专门的智能体完善获胜者,并且有一个元审查过程。这相当复杂。值得注意的是,它不依赖于通常的人工智能训练方法。
例如梯度下降或强化学习。在其当前设置中不是这样,根据报告。它似乎正在利用大型语言模型本身的核心推理和判断能力。他们根据其内部知识来评估和批判想法。因此,大型语言模型既充当头脑风暴者,又充当同行评审者。基本上是的。这个提出、辩论、改进的迭代过程,
它似乎对于加速发现非常有效。这是一个强大的例子,它表明人工智能不仅处理数据,而且产生真正新颖的科学见解。哇。这确实显示了加速突破的潜力。显著地加快了速度。是的。好的。总结当天的新闻。4月11日还发生了一些其他事情。快速过一遍。
开始吧。这是忙碌的一天。Ilya Sutskever的SSI与谷歌云合作开发TPU芯片。对,为了他们的超级智能目标。谷歌采用了Anthropic开放模型上下文协议。用于互操作性的礼物。Canva推出了Visual Suite 2.0,更多的人工智能。他们举办了Canva Create活动。他们不断更新。
OpenAI对埃隆·马斯克提起反诉。法律斗争仍在继续。OpenAI开源了一个名为BrowseComp的东西,这是一个用于人工智能网络浏览的基准。有助于衡量那方面的进展。字节跳动宣布SeedThinking v1.5。
一个大型2000亿参数推理模型。另一个强大的模型进入场景。XAI通过API提供Grok 3,并提供定价。使他们的模型易于访问。而一家名为Rider的公司推出了面向企业人工智能代理的AIHQ。专注于商业应用。当然。说真的,仅仅一天。它确实突显了这个领域发展速度之快。
有时令人眼花缭乱。基础研究、新产品、法律纠纷、伦理辩论、基础设施挑战,所有这些都同时发生。绝对的。这次深度探讨确实突显了这种速度。
让你想知道,4月11日播下的这些种子中,哪一颗会成长为最大的树,你知道。确实如此。我们肯定会继续跟踪所有这些。在我们结束之前,只是快速提醒一下Etienne Newman的人工智能驱动的Jamkek应用程序。如果您想在高需求领域获得认证。例如云计算、金融、网络安全、医疗保健、商业,涵盖许多领域。是的,该应用程序使用人工智能来帮助您掌握材料并通过这些认证考试,我认为超过50个。检查。
查看节目说明中的链接。这是一种真正实用的方法,可以将人工智能用于您自己的职业发展。走在时代前沿。绝对值得一看。所以我们今天的最后想法。随着人工智能如此快速地发展,我们对人工智能和人类智能的理解将在未来几年如何继续变化?一个需要仔细思考的大问题。一些需要思考的东西。感谢您加入我们的这次深度探讨。别忘了查看节目说明以获取Jamtech应用程序链接。