欢迎回到深度潜水。今天,我们做一些不同的事情。我们将放大,仔细观察人工智能发展的速度,重点关注2024年6月6日这一天。这样做真的令人难以置信,不是吗?是的。仅仅查看新闻、更新和来自单日24小时的公告。
它让你对这个不断变化的领域有一个生动的快照。我们基本上收集了一堆资料来源,我们称之为6月6日的“人工智能每日纪事”,我们将对其进行分解。是的。我们在这里的任务是解开所有这些更新,而不仅仅是列出它们,而是,你知道,提取重要的部分,真正的见解,并试图理解所有这些快速变化对你来说意味着什么,因为人工智能越来越多的与一切纠缠在一起。
我们所做的一切。没错。6月6日,它作为一个完美的缩影。它展示了人工智能目前发展方向的活力和多样性。它涉及从大型科技公司推出的真正大型基础模型到非常实际的事情,例如医疗保健、包裹递送,甚至历史和国际安全等各个方面。
我们今天要涵盖的范围非常广泛。我们将关注来自谷歌和Anthropic的一些关键更新。我们将深入了解一些真正令人惊讶的新应用,这些应用现在正在医疗保健和物流领域发生。我们将讨论围绕安全性的真正重要的讨论、推动一切向前发展的激烈竞争,甚至会看到人工智能开始解锁的全新领域的一些景象。
我们的目标是以一种感觉易于理解、引人入胜的方式引导你完成所有这些。我们希望能够连接这些点,让你体验那些“啊哈”时刻,让你看到不同的新闻片段是如何组合在一起的。
但不会让你沉浸在术语中,也不会让你感觉像是在阅读一份冗长的报告。好了,让我们开始吧。我们通常喜欢从源头开始,对吧?大型人工智能模型本身以及,嗯,构建它们的实验室之间的激烈竞争。6月6日的纪事以谷歌的一个相当重大的举动开始。确实如此。是的,谷歌宣布并实际上开始推出对其Gemini 2.5 Pro模型的重大升级。
他们并没有将此定位为一个小小的调整。感觉像是他们主要模型的重大进步。他们谈到的具体改进是在一些非常关键的领域,不是吗?绝对的。他们特别指出了多模态推理方面的改进。这就是人工智能的能力……
同时理解和处理不同类型的信息,例如查看图片和阅读相关文本并将其全部理解。他们还谈到了更好的编程准确性,这对于使用人工智能来帮助编写或理解代码的开发人员至关重要。还有更好的长上下文理解。
因此,在不丢失主线的情况下处理更大的文本块或更长的对话。对。性能指标是他们公告的重要组成部分。我们查看的资料来源提到了重大性能提升的报告,并特别指出Gemini 2.5 Pro在Elmarina和WebDev Arena等用户偏好排行榜上扩大了领先优势。是的。我认为这是一个非常有说服力的细节。
这些用户偏好排行榜不像你通常的学术基准那样,学术基准通常以受控的方式测试非常具体的事情。例如,Elm Arena汇集了大量真实用户使用不同模型和各种提示的数据。Web Dev Arena纯粹专注于编码任务。在这些排行榜上领先表明谷歌的改进
不仅仅是理论上的,它们实际上让模型感觉更好,对从事实际工作的人更有帮助,尤其是开发人员。这是一个强烈的迹象,表明其具有实际用途。他们还特别指出他们解决了用户反馈,这总是感觉很重要。
该报告提到他们修复了性能回归,基本上是用户之前注意到的非编码任务中的性能下降。给出的例子是创意写作改进。这确实突出了改进这些庞大而复杂的系统是多么棘手。有时,当你努力使人工智能在某一方面变得更好,例如编码时,你可能会意外地使它在其他方面变得更糟,例如,写一首诗。
因此,修复这些回归表明他们正在倾听用户的意见,并试图使模型保持全面。它强调了这样一个事实:构建一个能够创造一切、结构化逻辑和自由形式创造力的人工智能是一个持续的、非常艰难的平衡行为。你不能只关注一方面。并且提到了一个有趣的技术细节,即在API中引入了思考预算。这听起来像是开发人员和企业真正会关注的事情。哦,绝对的。思考预算。
如果你希望企业和开发人员认真使用你的AI,这是一个非常关键的概念。让我们简单地分解一下。当你向强大的AI模型(尤其是复杂的模型)发送请求时,计算机能力的数量
思考时间或处理时间实际上会根据请求而有很大差异。这种变化使得成本难以预测,也使得响应时间(延迟)难以预测。因此,预算基本上就像对AI为一个请求所做的思考量设置上限,以保持事情的可预测性。没错。它允许开发人员说,好吧,对于这种类型的请求,不要花费超过X数量的计算资源。
这提供了可预测性。企业需要大致了解每次AI交互的成本以及速度。思考预算提供了这种控制。它使在AI之上构建商业应用程序或内部工具在财务和运营方面风险更小。预览版即将正式发布,这表明谷歌知道这对获得更广泛的业务采用至关重要。升级后的模型实际上出现在哪里?对于开发人员和普通用户?
因此,升级后的预览版目前可供开发人员使用。通过Gemini API,你可以通过AI Studio和Vertex AI访问它。
但是,这一点很重要,谷歌还将这个改进的版本推向公众Gemini,这是一个数百万人在直接使用的聊天界面。这种双重推出感觉至关重要,同时面向构建者和用户。是的,它清楚地展示了他们的战略,对吧?改进核心技术,然后将其应用到各个地方。让开发人员构建很酷的新事物,并立即改善日常消费者的体验。好的,让我们把这个谷歌更新联系起来。回顾6月6日的人工智能大图景,
这次Gemini 2.5 Pro的推出真正告诉了我们什么?好吧,它证实了谷歌绝对锁定在与OpenAI的激烈竞争中,Anthropic处于模型开发的最前沿。推出这样的升级并在用户偏好分数中看到它的反映,这表明他们正在真正执行他们的技术计划和既定目标,即在企业和消费者应用程序中都争取主导地位。
这突出了他们的野心是多么广泛。为什么这种双重关注如此重要,即在商业用途和消费者用途上都争取主导地位?看,这从根本上来说是关于人工智能的长期领导地位。消费者方面让你获得巨大的规模,对吧?数十亿次互动和宝贵的反馈。它建立品牌认知度、用户习惯,让人们习惯使用你的AI。这种舒适感会反过来促进企业兴趣。但企业市场
这是大型合同所在的地方。深度集成到关键业务流程中。它证明你的技术对于真正苛刻的事情来说是强大而可靠的。此外,企业用途通常会产生独特的高价值数据和挑战,从而推动模型进一步发展。
在这两方面取得胜利会创造一个强大的反馈循环。一个领域的改进有助于另一个领域,使你的整个AI生态系统对于竞争对手(特别是那些可能只在一个领域强大的竞争对手)来说非常难以击败。好的,稍微转移一下,但仍然关注大型参与者。Anthropic也在6月6日发布了新闻,但这与其说是关于一般更新,不如说是关于其AI的非常具体、有针对性的版本。没错。Anthropic推出了名为ClaudeGov的东西。
它是其Claude AI模型的一个版本,专门为美国政府机构构建和发布。所以是的,与公共模型升级相比,这是一个非常不同的发布。ClaudeGov的主要区别是什么?是什么让它与众不同?关键在于它是从头开始设计的。
以满足你在联邦政府(尤其是在敏感领域)中发现的非常严格的合规规则、安全标准和运营需求。这不仅仅是将标准模型放在政府网络后面。这是关于深度定制。资料来源称它已经被使用,而不仅仅是宣布。正确。Anthropic很明确。这些模型已经部署,正在美国国家安全的最高级别使用。
这不是测试运行或将来可能发生的事情。这是处理机密信息的人员的实际使用。哇。在国家安全的最高级别部署AI,这向政府的信任和采用发出了一个非常强烈的信号,特别是对于被认为值得信赖和安全的AI,对吧?绝对如此。它告诉我们,美国政府将先进的人工智能视为现代国家安全和情报工作的必要工具,而不仅仅是令人感兴趣的技术。
将其交到处理机密数据的人手中,标志着通过非常严格的测试和特定定制所获得的深度信任。这表明政府正在快速地将人工智能纳入其核心职能,但非常重视值得信赖和安全的模型。
它是可操作的,而不是实验性的,这意味着人工智能被视为关键任务、分析和网络防御的必要条件。对于人工智能在不允许出现错误或安全漏洞的地方的采用来说,这是一个重大步骤。他们提到的针对政府需求的增强功能是相当具体的事情,例如降低对机密材料的拒绝率,更好地理解国防文件。是的,让我们稍微解释一下。标准AI由于安全培训,通常会拒绝讨论或处理敏感内容。
但是对于国家安全工作,你需要一个能够分析机密信息而不只是说“我不能谈论这个”的AI,同时仍然安全并防止滥用。因此,降低拒绝率意味着他们已经对其进行了调整,以便在安全的环境中适当地处理敏感数据。更好地理解国防和情报文件意味着对一般模型可能会遇到的所有特定术语、缩写和格式进行微调。
并且针对任务关键型需求指向对情报至关重要的事情,例如分析外国语言拦截或在海量数据集中发现网络安全威胁的细微模式。
这是为了给人类分析师提供强大的工具,以加快目前非常缓慢且劳动密集型的工作。有趣的是,他们如何为政府合同制定豁免,但仍然对明确禁止的使用保持限制。这确实突出了平衡行为,不是吗?你需要让人工智能为合法的政府工作做一些强大的事情,例如分析机密威胁。但你绝对必须阻止它被用于设计非法武器、对自己的盟友进行虚假信息宣传或进行流氓网络攻击等方面。
因此,Anthropic的方法似乎是
为政府的工作创建必要的权限,但同时对那些广泛有害的用途设置强大的防护措施。对于强大的AI来说,这是一个持续的伦理和技术上的走钢丝行为。因此,Anthropic推出ClaudeGov的最大收获是什么?我认为最明显的收获是具体的证据表明,美国政府正在迅速地将值得信赖的AI代理集成到运营中。这不再只是试用轮胎了。它标志着安全AI模型在高风险工作中的主流机构采用。
它还为Anthropic开辟了一个非常重要、专门的市场,并展示了如何在超级监管、高度敏感的领域采用AI的路径。
说到Anthropic和竞争,人工智能每日纪事还报道了一个真正强调Anthropic和OpenAI之间竞争有多激烈的故事。是的,这是一篇关于Anthropic联合创始人Jared Kaplan的公开声明的报道,该声明基本上说Anthropic不会向OpenAI许可或出售其云AI模型,一点也不。给出的理由是相当直接的竞争。
竞争和信任问题。没错。根据消息来源,促使这一声明的具体事情是Anthropic切断了对一家名为Windsurf的公司云AI的直接访问。对,因为OpenAI(Ampropit称其为最大的竞争对手)据报道正在收购Windsurf,这是一家AI编码助手公司。正是如此。因此,从Anthropic的角度来看,这是有道理的,对吧?为什么还要继续提供你宝贵的核心技术
给一家即将被你的主要竞争对手吞并的公司。Jared Kaplan关于直接向OpenAI出售Claude很奇怪的引言进一步强化了这条强硬的竞争线。他还提到了影响此类选择的另一个因素,即Anthropic受计算能力限制。这在实践中意味着什么?受计算能力限制对于这些大型AI实验室来说是一个非常基本的问题。构建和运行像Claude或GPT-4这样的海量模型需要访问
绝对大量的专用计算机硬件,主要是高端GPU(图形卡)。这些东西很贵,现在全球都在争夺它们。因此,即使是资金最雄厚、规模最大的实验室,在任何特定时间内也能获得的计算能力也是有限的。所以这就像对他们运营和发展的物理瓶颈。确实如此。当你面临这种限制时,你必须对使用你所拥有的计算能力的地方进行超级战略规划。
因此,当Kaplan说他们更愿意将容量留给持久的合作伙伴关系时,这是完全有道理的。如果你只有这么多的处理能力,你就会把它给那些你信任的、对你长期战略上很重要的合作伙伴,而不是通过另一家公司间接地帮助你的主要竞争对手。这种计算能力的限制迫使在这个竞争环境中做出一些非常艰难的战略决策。
整个情况确实只是突出了竞争的激烈程度。绝对如此。它表明这场人工智能军备竞赛,正如人们所说的那样,正在继续
碎片化生态系统。顶级实验室越来越保护它们的模型,保护它们的核心资源,如计算能力和数据。正如消息来源所指出的那样,这种情况正在发生,原因是竞争加剧和知识产权纠纷。没错。当你发生这种淘金热时,核心技术本身以及创造它的方法是最有价值的东西,这是一种很自然的结果。
公司正在激烈地保护它们的优势,这导致了这种情况,即访问被拒绝,合作伙伴关系根据竞争仔细选择。是的,这种资源的保护与模型和能力可能更公开地共享或许可的世界相比,肯定会导致更分散的人工智能世界。6月6日还有另一条新闻也围绕着保护宝贵的资源展开,但这次是关于技术的。
数据。前身为Twitter的X更新了其条款。是的,X对其开发者条款做出了相当重大的更改。主要变化是他们禁止使用X内容或其API来训练AI模型。正确。并且陈述的原因非常清楚。
他们想保护X的大量社交媒体数据免受竞争对手的侵害,几乎可以肯定是为了使Elon Musk自己的人工智能企业XAI受益。让我们再次提醒一下,为什么这些社交媒体数据对于训练AI模型如此宝贵。哦,这是一个金矿。像X这样的平台拥有这种海量、不断更新的真实人类对话流。它涵盖了各种各样的主题,风格不计其数,包括随意聊天、争论、新闻、笑话、官方声明,所有这些都是实时发生的。
在这些数据上训练AI可以教会它如何实际使用语言的细微之处、俚语、情感和讽刺。它帮助AI了解当前事件、趋势以及人们现在正在谈论的内容。它只是通往人类思想和互动的一个巨大窗口,对于构建任何需要理解或生成自然语言的AI来说都非常宝贵。因此,X的举动显然是为了将这种资源据为己有,阻止竞争对手使用其数据洪流来训练他们自己的模型。绝对的。这是一个战略策略
数据就是新石油的人工智能竞赛方面。控制独特、有价值的数据是另一个主要的竞争杠杆,与拥有最佳模型架构或最多计算能力并驾齐驱。它绝对强化了这样一个观点,即谁拥有和控制数据正在成为人工智能竞争中的一个中心战场。正是如此。这不仅仅是关于算法了。这非常关乎
使这些算法变得智能的燃料,即数据。好的,我们已经涵盖了核心模型发展和塑造它们的竞争动态方面。但人工智能不仅仅是在6月6日的实验室和会议室里发生。它也存在于现实世界中,做着事情,直接影响着人们。
让我们转向实际应用中的人工智能。是的。一个真正显示人工智能进入消费者领域的标题来自沃尔玛及其无人机送货工作。对。沃尔玛宣布对其无人机送货服务进行大规模扩张。我们这里说的不是小规模。他们明确表示,目标是覆盖全国数百万户家庭。这次扩张是沃尔玛和Wing(Alphabet的无人机送货公司)之间的合作。
没错。他们制定的计划是在未来一年内将无人机送货服务扩展到100多家美国商店,目标是让数百万家庭能够在30分钟内获得送货服务。在30分钟内。这个短语脱颖而出。这基本上是近乎即时的物流。
人工智能如何大规模地实现这样的目标?好吧,人工智能对于管理像这样的无人机网络的复杂性绝对至关重要。我的意思是,想想所有移动部件。你需要复杂的系统来管理空域,确保无人机不会相互碰撞或与其他东西碰撞,避免禁飞区。你需要动态路线规划,为每次送货找到最快、最安全的路径,不断根据天气或临时限制进行调整。
你需要在不同的发射点之间进行负载平衡,管理无人机的电池电量和维护时间表,与商店中的自动化拣选和包装系统协调,为客户提供实时跟踪。人工智能算法对于持续处理所有这些数据、做出瞬间决策以及安全有效地协调可能数百或数千次无人机飞行至关重要。这远不止简单的GPS。他们提到将这项翼状服务带到亚特兰大和休斯顿等主要新城市。
而这些公司声称这将创造美国最大的无人机送货网络。这一说法确实表明了他们的雄心,对吧?他们希望将无人机送货变成一件正常的事情,而不仅仅是在少数测试地点的一种噱头。
建立最大的网络是朝着将此扩展到可能广泛使用的一个主要步骤。但该报告确实提到了这些新领域的一些初始限制。是的,这是一个分阶段的推出,对于像这样复杂的事情来说是合理的。最初,这些新城市的客户可能只能订购有限数量的商品。通过翼状应用程序送货是免费的,但不会立即提供完整的沃尔玛产品目录。
这与达拉斯等地不同,达拉斯的服务运行时间更长,你可以获得更多东西。因此,这种分阶段的方法使他们能够在新环境中测试水域。没错。在不同的城市或郊区环境、不同的布局、不同的当地规则、不同的天气模式中测试技术、物流和程序,然后再全面推出产品。这只是扩展复杂事物的一种巧妙方法。因此,再次放大,沃尔玛的大规模无人机扩张真正意味着什么?
我认为它表明,人工智能驱动的物流正在快速地从一个很酷的未来想法转变为数百万人的日常生活。这是一个具体的例子,说明人工智能正在改变零售业、我们的购物方式以及我们对速度的期望,在30分钟内获得东西。这改变了期望。当然,它也严重加剧了与亚马逊在
关键的最后一英里送货领域展开的竞争,在这个领域,速度和效率至关重要。将其作为对消费者生活的切实影响来解释。未来可能有哪些连锁反应?对于消费者来说,最直接的事情就是某些商品的极度便利,几乎可以立即获得药品、一些杂货和必需品,长期来看。它可能会改变当地购物。
也许较小的当地商店可以利用这个网络。如果大量的短途汽车出行被无人机取代,它可能会影响交通。如果这种即时满足感成为更多事物的常态,它甚至可能会微妙地改变购买习惯。
这实际上是连接我们与物质事物之间的物流层面的根本性转变,所有这些都由人工智能协调。好的,让我们从信息访问转向一个完全不同的领域,医疗保健。
人工智能也在那里取得了一些非常强大的进展。纪事重点介绍了这款迷人的新型人工智能驱动的足部扫描仪。哦,是的。这是一个直接应用于诊断的人工智能的绝佳例子。这是一款新型人工智能驱动的足部扫描仪,在预测严重症状出现前几周的心力衰竭风险方面显示出真正的希望。用于心力衰竭的足部扫描仪。这是如何工作的?这种联系并不明显。它与恶化的心力衰竭中非常常见的一个问题有关,即体液潴留或水肿。
由于重力的作用,多余的液体往往会积聚在你的脚踝和脚部。这款人工智能扫描仪旨在检测这种液体积聚的非常细微的迹象以及由此引起的足部组织压力变化,通常在你或医生甚至看到明显的肿胀之前很久。而且这项技术听起来非常高端,每分钟可捕捉1800张图像。是的,这种高捕获率会生成大量数据。
这就是人工智能变得绝对必不可少的地方。没有人的眼睛能够实时处理如此多的图像,或者发现皮肤纹理、颜色或形状的细微变化,这些变化预示着液体积聚的最初迹象。人工智能算法经过训练,可以分析这种视觉数据的洪流,并找到与水肿相关的模式,这些模式对我们来说基本上是不可见的,从而可以对液体积聚进行定量测量。他们看到的准确性相当……
相当高。该报告提到,在进行早期预测方面的准确率可能高达80%,对于这样的诊断工具来说,这确实令人印象深刻。他们是否在临床试验中测试了这一点?他们做了。初步试验是在英国的五个NHS信托基金中进行的。它涉及相对较小的一组26名患者,他们最近都因心力衰竭而住院。这些初步试验发现了什么?关键结果是什么?最引人注目的发现是早期预警能力。
该系统成功地预测了这些患者中六分之五的住院情况。真正关键的部分
它提供的平均预警时间是在患者实际需要返回医院之前的13天。13天。这是一个相当长的提前期。这可能改变生命。对于管理慢性心力衰竭的人来说,提前近两周知道病情正在恶化,这为医生和患者提供了一个关键的干预窗口。也许可以调整药物、增加监测或安排检查。
在病情严重到需要紧急住院治疗之前,就要控制住体液积聚。这是一种真正的转变,转向由这种持续的细微监测驱动的主动预防性护理。而且听起来它设计得很容易让患者在家使用。绝对的。报告称,该设备自动运行,无需患者互动。你只需要使用它,它就会完成它的工作。
而且用户接受度很高,超过80%的试验参与者在研究结束后选择保留扫描仪。这说明了一些问题。如果您希望家庭健康技术真正被采用并持续使用,那么易用性和人们看到的价值至关重要。那么,这款人工智能足部扫描仪告诉我们关于人工智能在医疗保健领域更大图景的什么信息呢?我认为这真正说明的是,人工智能驱动的诊断技术如何使医疗保健可能更加精确,
预防性和易获得性。通过发现人类无法察觉的细微变化,
人工智能可以更早地发出慢性病的预警。这个具体的例子只是一个强有力的案例研究,说明人工智能如何开始彻底改变我们筛查和监测慢性病的方式,也许让我们从仅仅对危机做出反应转向实际预防危机。这是一个真正引人注目的例子,说明人工智能通过早期检测改善了健康结果。还有哪些类型的疾病可能会受益于类似的人工智能驱动的监测?哦,潜在地许多疾病,其中会发生细微的、逐渐的生理变化。
你可以想象一下,对于慢性肾脏病来说,体液平衡也是关键,情况也是类似的。或者也许监测足部的细微变化,以早期发现糖尿病性神经病变的迹象。甚至跟踪某人行走方式的细微变化,他们的步态,也可能对帕金森氏症等神经系统疾病发出早期预警。
实际上,任何疾病的进展都涉及人工智能可以随着时间推移而被训练来检测的可测量的、细微的物理迹象,都可以成为这种方法的候选对象。《纪事报》还提到了一些与放射学相关的进展,这也在一定程度上加强了这种人工智能诊断的趋势。是的。报告指出,放射学领域出现了一个突破性的人工智能系统,显然正在树立新的标准。
强调的主要优点是比传统方法更快、更准确地诊断复杂的放射学扫描,这大大缩短了放射科医生的审查时间。为什么加快对复杂扫描(如 MRI 或 CT)的审查如此重要?好吧,这些扫描包含大量信息,但解释它们需要大量时间和高度专业化的专业知识。
放射科医生必须仔细检查它们,发现异常情况,编写报告。而且进行的扫描数量一直在增加,这可能会导致积压。如果人工智能能够帮助准确地加快审查过程,这意味着患者可以更快地得到诊断,这对癌症、中风或外伤等疾病至关重要。它还有助于放射科部门更有效地处理工作量,并腾出放射科医生的时间,也许让他们能够专注于真正棘手的情况或与其他医生进行更多咨询。
因此,将这个放射学新闻与更大的图景联系起来。它所表明的是,人工智能辅助诊断变得越来越普遍的加速转变。它通常不是要取代人类专家,即放射科医生,而是要为他们提供更好的工具。它增强了早期检测能力。也许人工智能会发现疲惫的人类可能会错过的一些细微之处。
它通过处理一些大量分析来减少医生的负担。它是一种补充技术,可以使专家工作更快,并可能更一致。对。因此,足部扫描仪和放射学人工智能,两种截然不同的应用,但都显示了人工智能如何增强医学诊断。
一种通过新的围栏,另一种通过改进现有图像的分析。没错。它只是显示了人工智能在医学领域的潜在影响范围,创造了全新的诊断方法,并使既定的方法得到了改进。让我们来看一下人工智能进入物理系统的一个更具体的日常例子。沃尔沃报道的智能安全带。是的,这是一个巧妙的例子,说明人工智能增强了我们经常认为理所当然的安全技术。
沃尔沃显然正在推出一个新的安全带系统,该系统使用人工智能。人工智能安全带与我们现在都有的安全带有什么不同?好吧,标准安全带相当静态,对吧?它的设计主要是在汽车在碰撞中突然减速时锁定并固定你。人工智能安全带是动态的。它在碰撞过程中实时考虑多个因素,以定制其约束你的方式。它考虑了哪些因素?根据报告,
它查看乘客的估计大小和重量,以及他们当时的确切座位位置,例如,他们是否向前倾斜,是否完全直立坐着。它还考虑了车辆的速度以及撞击本身的方向和严重程度。
人工智能会立即分析所有这些信息,以确定针对该特定人员在该特定碰撞中的安全带的最佳时间和张力。因此,它正在转向基于当前情况的更个性化的安全响应。正是如此。人工智能的目标不是千篇一律的安全带反应,而是根据具体情况调整约束,从而可能为你在特定类型的碰撞中提供更安全、更有效的保护。
这是人工智能直接进入日常事物(如我们的汽车)中的关键物理安全系统的明确例子。它确实让人明白,人工智能集成不仅仅关乎屏幕和软件,还关乎使我们周围的物理物体更智能、更安全。没错。将智能嵌入物理世界以提高性能、效率和安全性
以真正实用的方式。——好的,我们已经研究了核心模型开发、竞争以及目前正在发生的一系列实际应用。现在让我们稍微拓宽一下视角,看看人工智能的更广泛影响,包括其黑暗面、滥用的可能性、关于如何治理它的持续辩论,以及它如何在科学甚至艺术等领域开辟全新的途径。
不幸的是,6月6日的一条非常重要的新闻突出了我们面临的最大挑战之一。OpenAI关于发现使用其工具进行秘密宣传活动的报告。是的,这份报告令人不寒而栗地清楚地表明,将人工智能用于虚假信息传播并非未来的假设威胁。它现在正在发生。这就是提出的严峻现实。
OpenAI 识别并实际上破坏了多个正在积极使用人工智能生成内容的协调影响行动。目标?
操纵不同平台上的在线公众舆论。而且这些不是随机行为者。它们与各国政府有关,消息来源特别指出了中国、俄罗斯和伊朗。是的。OpenAI 详细介绍了破坏 10 个滥用其人工智能的秘密行动。他们专门使用人工智能工具来创建在线宣传并促进社交媒体操纵。是什么使生成式人工智能成为这种强大的工具?
在这些类型的活动中,如此强大的工具?好吧,它大大降低了大规模创建有说服力的内容的门槛。想想看。这些行为者无需依靠团队的人类撰稿人、翻译人员,也许还有平面设计师来制作每一篇宣传作品,他们可以使用人工智能生成大量的文本,立即翻译,潜在地创建虚假图像或视频,甚至可以根据特定受众定制信息。
它使这些活动更便宜、更快、更容易扩展,并且可能更难以检测,因为输出可以多样化。它可以压倒传统的核实工作,并使普通人更难知道什么是真实的。OpenAI 给出的具体例子确实非常具有启发性。他们有一个与中国有关的组织,他们称之为“嘲笑评论”。是的,他们如何使用 ChatGPT 具有启发意义。当然,他们用它来为社交媒体生成评论。但消息来源还指出了这个奇怪的细节。
他们显然正在使用 ChatGPT 为他们自己的影响力活动运营商撰写内部绩效评估。这个细节很奇怪,但也很有说明意义。它显示了人工智能正变得多么深入,甚至在这些恶意行动的官僚部分也是如此。确实如此。它不仅仅关乎输出。它关乎使用人工智能来提高整个行动的效率。另一个例子,也与中国有关,涉及假扮记者的行为者。
他们使用 ChatGPT 发布社交媒体帖子,当然,也用于翻译,而且令人担忧的是,还用于分析美国参议员的信件。哇。使用人工智能分析参议员的邮件,这绝对进入了由人工智能工具促成的潜在间谍活动领域。绝对的。这些具体的例子表明,国家行为者已经以多种复杂的方式使用先进的人工智能。
它已经超越了仅仅生成假新闻文章。他们将其用于分析、运营效率,以及在这些恶意活动中进行情报收集。因此,OpenAI 揭露这一点不可避免的最大收获是什么。毫无疑问,这证实的是,将生成式人工智能武器化用于虚假信息传播不再是推测性的。
这不是假设,它绝对正在实时发生。这是一个正在进行的活跃威胁。这感觉像是人工智能带来的最紧迫的挑战之一。我们甚至如何开始建立对这种人工智能驱动的宣传的抵御能力?这必须是一项多方面的努力。从技术上讲,人工智能实验室和平台必须继续努力寻找检测人工智能生成内容的方法,也许是水印,识别协调的虚假账户,就像 OpenAI 在这里所做的那样。
社交媒体平台本身需要强有力的政策、关于人工智能使用的透明度以及有效的执行。但至关重要的是,还有人为因素。媒体素养比以往任何时候都更重要。我们都需要学习变得更加怀疑,检查来源,识别操纵策略,并理解现在可以轻松生成令人信服的虚假文本、图像甚至视频。这是滥用和防御之间持续的艰难竞争。好的。
从滥用转向我们如何管理所有这些的复杂问题,《纪事报》还触及了关于人工智能监管的持续辩论,特别提到了 Anthropic 首席执行官 Dario Amadei 的一篇评论文章。是的。Dario Amadei 于 6 月 6 日在《纽约时报》上发表了一篇评论文章。他的论点集中在一个已被提出的具体立法理念上。没错。
报告指出,他的文章反对归因于特朗普总统的一个特定提案,一个可能非常漂亮的法案,据报道该法案将禁止各州自行制定人工智能法规
10 年。在这里重要的是以中立的方式报告这一点,作为政策讨论的一部分。据报道,他的立场反对十年来阻止州一级规则的这一特定想法。这就是资料来源中描述的立场,反对长期联邦封锁州一级人工智能监管。这确实只是强调了,即使在构建人工智能的领导者中,对于如何治理人工智能也没有一个统一的观点。这是一场激烈的辩论。
绝对的。你应该将此作为一个例子,说明目前在人工智能公司领导者、政策制定者、研究人员、民间社会团体之间正在进行的非常活跃、往往非常激烈的讨论。每个人都在努力弄清楚如何规范这项极其强大、发展迅速的技术。不同的阵营提倡不同的模式,联邦与州,轻触与强力护栏。Amadei 的评论文章是一个在特定提案中发表意见的突出声音。
提出的方法。它只是强调了,目前还没有关于人工智能治理最佳前进道路的简单共识。现在转向人工智能帮助我们探索的一些全新领域。《纪事报》报道了人工智能被用来以一种新的方式理解古代历史。
这是一个非常引人入胜的方面。人工智能被用来分析死海古卷,这可以说是考古学上最重要的发现之一。人工智能如何分析古代卷轴?它实际上在看什么?好吧,在这个具体的例子中,人工智能被训练来分析笔迹风格中极其细微的模式,以及卷轴上使用的墨水的变化。你知道,这些古代文本通常会损坏、褪色。
对于人类专家来说,持续分析它们非常困难,尤其是在试图弄清楚不同的部分是否由同一个抄写员撰写或分析墨水成分的细微差异时。
人工智能通过处理高分辨率图像,可以发现笔划制作方式、使用的压力、墨水密度,甚至化学模式的微小变化。它提供了可以支持或挑战传统分析方法的客观数据点。人工智能分析对卷轴提出了什么建议?报告的发现是,根据这项分析,这些卷轴可能比学者们之前估计的要古老得多。
哇。使用人工智能来潜在地改写如此重要的历史文物的年表,这挑战了长期存在的信念。确实如此。这表明人工智能正在成为考古学和历史研究中真正重要的工具。通过处理对人类来说规模太大或太细微而无法有效分析的数据集,人工智能可以开始挑战历史假设,并潜在地揭示古代文明及其著作的新见解。将其定义为一个非常令人惊讶的应用。
人工智能不仅仅关乎未来。它正在帮助我们更清晰地看到我们的深远过去。
人工智能还可以解决哪些历史难题?哦,可能性巨大。想想未破译的古代语言。人工智能可以分析它们的统计模式,也许可以找到与已知语言的联系。它可以通过更客观地分析材料成分或风格细节来帮助鉴定文物。它可以筛选大量的考古挖掘数据,以发现定居点或贸易路线中的细微模式。它甚至可能有助于数字重建碎片化的文本或损坏的物体。
基本上,在任何你拥有大型、复杂或退化历史数据的地方,人工智能都提供了一个新的视角。从古代历史到现代环境挑战,人工智能还在材料科学突破中发挥着作用,特别是在一种新型塑料方面。鉴于塑料污染的噩梦,这可能是巨大的新闻。科学家们已经开发出一种具有革命性作用的新型塑料材料。
它在海水中完全分解,显然在几小时内。这来自日本的研究人员。是的,根据报告。关键在于它的工作原理。当它暴露在盐水中时,它会溶解回其原始成分。然后,这至关重要。海洋中的天然细菌实际上可以处理这些成分。因此,与许多可生物降解塑料不同,它不会仅仅碎裂成会永远存在的微小微塑料。它实际上安全地消失了。没错。
这就是强调的巨大的环境优势。它不会留下任何有害残留物或微塑料颗粒。它分解成无害的基本组成部分,可以重新进入自然循环。它解决了持久性海洋塑料的核心问题。他们在实验室里证明了这一点。是的,在东京实验室成功展示。报告还提到,基础材料本身无毒且耐火,这是不错的额外特性。在我们到处都能看到它之前,还有哪些障碍?哦,当然。
消息来源指出,基础材料目前需要某种涂层才能使其像普通塑料一样用于日常用途,团队仍在努力完善这一点。因此,核心科学是一项突破,但在其商业化和广泛使用之前,肯定还需要采取一些步骤。人工智能是如何帮助开发这样的东西的?它在材料科学中扮演什么角色?人工智能在发现新材料方面变得越来越重要。
寻找具有特定特性的材料,例如在盐水中降解但在其他方面耐用,这非常复杂。人工智能可以帮助研究人员比人类更快地探索大量的化学结构可能性。它可以根据材料的结构预测材料的行为方式,模拟相互作用,分析实验数据以优化配方。与实验室中传统的反复试验相比,它基本上可以加快整个发现和改进过程。
将此与人工智能辅助材料科学联系起来的消息来源强烈表明,人工智能在这里发挥了作用。这种可能溶解的塑料的更大图景是什么?我认为它表明,人工智能辅助材料科学确实为潜在的革命性环保技术打开了大门。
它提供了一种用全新的方法解决我们一些最大环境问题的方法。这感觉对气候和创新来说都是一个真正的胜利,它表明先进技术可以找到看似棘手的问题的解决方案。将其定义为希望的源泉,也许吧。使用先进技术来解决重大的环境问题。
将这种材料广泛使用的实际障碍是什么?好吧,除了完成研发,例如正确涂层之外,挑战相当大。你必须弄清楚如何大规模制造它,便宜到足以与现有塑料竞争。你需要确保制造过程本身是绿色的。你需要获得监管部门的批准。然后,你必须说服行业(包装、服装,等等)从他们使用了数十年的材料转向新的材料,即使它对地球更好。
从实验室发现到在商店货架上销售还有很长的路要走,但这里的潜在回报是巨大的。——好的,现在转向创造力的世界,正如关于人工智能用于互动艺术的报告所示,人工智能也在那里不断突破界限。——是的,《纪事报》提到一个艺术家团队使用谷歌的生成式人工智能工具创作了一个名为“反射点”的互动雕塑。——它是什么样的艺术品?——它被描述为一个沉浸式装置,它将数字元素与物理媒体融合在一起。
而真正关键的部分是它使用实时观众输入来实际塑造体验。那么在这种情况下,生成式人工智能在做什么?它是在自己创作艺术吗?它可能既充当工具,也可能充当艺术家的合作者。
因此,艺术家无需手工制作每一个视觉或声音,人工智能可能会即时生成元素,或者根据艺术家设置的规则和提示创建组件。例如,人工智能可以创建动态视觉或声音,这些视觉或声音会直接响应人们在空间中的移动方式、他们发出的声音,或者他们可能输入到界面中的内容。这种实时观众输入意味着艺术品会根据在场的人以及他们如何互动而不断变化和发展。
它不是静态的。这绝对与艺术是艺术家单独创作的固定物体的传统观念背道而驰。确实如此。这是一个很好的例子,说明人工智能正在成为艺术家强大的新媒介,使以前不可能实现的表达和互动类型成为可能。它允许这些动态的、响应式的艺术作品更直接地吸引观众。
这对人工智能与创造力之间的关系更广泛地意味着什么?我认为它表明艺术与人工智能之间的界限正在显著模糊。人工智能不仅仅是在自动化旧的创造性任务。它真正为表达、协作和体验设计开辟了新的可能性。它正在扩展我们可能认为是艺术的东西,它如何被制作以及我们如何体验它。
现在展望自动化的未来,《纪事报》注意到亚马逊内部一项平静但可能非常重要的新的举措。是的,亚马逊显然已经悄悄启动了一个新的研究小组,专门致力于开发代理人工智能系统和下一代机器人。这个新小组的目标是什么?其既定目标是自动化复杂的决策和体力劳动。现在,鉴于亚马逊在物流、电子商务、云计算方面的规模,
这项举措几乎肯定旨在构建高度自主的系统,可能首先用于他们自己庞大的运营,但最终也可能用于新的产品或服务。让我们重新审视代理人工智能。我们之前已经触及过它,但你能再次简单地解释一下吗?当然。这样想:大多数当前的人工智能在您提供提示时会执行特定任务。而代理人工智能的设计更具自主性。你给它一个更高级别的目标,人工智能会找出实现该目标所需的步骤。
它可以规划、通过与数字或物理环境互动来执行这些步骤、监控其执行情况并从结果中学习以变得更好。它关乎创建能够更独立、更智能地行动以实现复杂的多步骤目标的人工智能,就像一个有能力的人类代理一样。因此,这不仅仅是机器人一遍又一遍地做同样的事情。这是可以自己弄清楚如何完成某事的系统。没错。它超越了简单的自动化,走向更自主、更智能的行动。
亚马逊的这项举措表明,代理人工智能正在从理论转向实践,进入一家对运营效率毫不懈怠的公司。
我们应该肯定地期待从这种专注的研究中出现更智能、更自主的机器。这些类型的先进系统确实可以重塑行业,甚至可能重塑我们日常生活的一部分。绝对的。我们可能首先在哪里看到它们?可能是在像亚马逊自己的大型仓库或先进制造工厂这样非常复杂的环境中,优化整个工作流程。也许在物流方面,比今天更智能地管理车队或无人机。
最终,这方面的一些内容可能会渗透到消费类机器人或更智能的家庭系统中,让设备处理更复杂的家务,而无需不断地发出指令。潜在的好处是巨大的效率、生产力,
但当然,关于对就业的影响以及随着这些系统变得越来越自主,对安全性和可靠性的绝对需求,存在着重大问题。最后,6月6日的《纪事报》还包括了关于语音人工智能的更新,特别是来自 Eleven Labs 和 Bland TTS 的更新。是的,这些更新确实突出了人工智能生成的语音变得更好、更逼真、更具表现力、更灵活的速度有多快。Eleven Labs 的 Eleven V3 预览版有哪些
关键新功能。Eleven Labs 宣布了诸如情感音频标签之类的功能,让你可以为语音指定情感,例如快乐、悲伤、愤怒。他们添加了多说话者对话支持,因此人工智能可以在不同的声音之间生成对话。
他们还将语言支持扩展到 70 多种语言。这些功能(情感、多说话者)似乎对于使人工智能语音听起来像有声读物或播客那样真正自然至关重要。确实如此。添加情感范围和处理来回对话使人工智能语音更易于用于创建引人入胜的内容叙述、游戏角色、虚拟助手,而广泛的语言支持则打开了全球用途的大门。Bland TTS 也发布了新的语音人工智能版本。
是的。Bland 发布了一种新的语音人工智能,专注于提高真实感并赋予用户更多控制权。
他们特别提到了语音克隆、构建语音应用程序以及为人工智能客户支持提供支持等应用程序。语音克隆。这很强大,但肯定带有伦理标志,对吧?但更多控制对开发人员很有用。这就是双刃剑。语音克隆允许你复制特定人的声音,这对于辅助功能来说非常棒,例如让失去声音的人重新获得声音,以及用于娱乐。但滥用深度伪造、诈骗的可能性巨大且可怕。
然而,增强的控制允许开发人员根据特定需求微调节奏、强调、语气等方面。而且使人工智能语音更适合客户支持显然旨在使这些自动呼叫不那么痛苦,听起来更自然。因此,总的来说,来自 11 Labs 和 Bland TTS 的这些更新表明,人工智能语音正在迅速变得更像人类、更易于控制以及在各个方面更通用。确实如此。
以及在全球范围内影响内容制作方式、改进辅助功能工具、改变我们与自动化系统互动方式的含义。这是一个发展非常迅速的空间。哇。好的。这只是对 2024 年 6 月 6 日这一天的一次相当长的旅程。看看我们涵盖的内容范围之广,从大型模型升级和科技巨头之间的激烈竞争,到目前在医疗保健和物流领域发生的这些令人难以置信的、可能改变生活的应用,再到
以及应对像人工智能被滥用于宣传这样真正严重的挑战。它确实强调了核心要点,不是吗?人工智能不再是实验室里发生的一些抽象的事情了。它现在正在以多种不同的方式影响现实世界。重塑行业、我们如何获得医疗保健、我们如何购物,甚至信息如何在全球范围内流动。它
是具体的和有影响力的。看看像这样的一天,它就非常清楚地表明,跟上人工智能的步伐不仅仅是科技极客的事情。对于你现在正在收听的人来说,这至关重要。这些发展触及一切,你在线看到的新闻、你下一辆汽车中的安全系统、医生将来如何诊断你,甚至包裹到达你家门口的速度。
我们进行这项深入研究的目标真的是为了给你提供捷径,帮助你理解什么是重要的以及为什么它很重要,而无需你自己筛选所有这些内容。是的,希望来自 6 月 6 日人工智能每日纪事报的这份快照能让你获得一些有价值的视角,并可能引发一些新的问题。因此,也许在你思考这个发展极其迅速的领域时,这里有一个最终的想法可以思考。
考虑一下我们今天讨论的所有这些看似独立的更新,人工智能足部扫描仪可以提前几周预警心力衰竭,这种新型塑料在海洋中无害地溶解,沃尔玛的人工智能驱动无人机送货正在扩大规模,OpenAI 发现使用人工智能的复杂的国家支持的宣传活动,人工智能帮助我们重新确定古代历史的年代,亚马逊正在构建更自主的人工智能,
代理人工智能,它们并不是孤立的事件,对吧?它们都是相互关联的线索,编织成这幅极其复杂的人工智能成为我们社会一部分的图景,无论好坏。根据我们仅仅在一天内看到的轨迹,明天的 AI 每日纪事报可能会揭示什么内容,这些内容在今天听起来完全不可能,但实际上只是下一个合乎逻辑的、也许令人惊讶的步骤?继续关注。继续批判性地思考,因为人工智能融入其中的未来肯定比以往任何时候都快。