Even if AI development plateaued today, the current capabilities of Gen 2 and GPT-4 systems are already highly transformative. These systems can process and generate various media, write code, operate computers, and access the internet, leading to significant changes in work processes.
AI can monitor construction sites for safety issues, analyze work patterns, and generate detailed reports on observations. For instance, Claude 3.5 can analyze a construction site video, identify safety concerns, and create a prioritized punch list of issues to address.
AI can automate tasks like navigating websites, filling forms, and completing transactions. For example, an AI can test e-commerce websites, simulate user behavior, and generate detailed reports on the user experience.
AI monitoring could evolve from a mentorship and safety tool into a panopticon where everyone is constantly watched and judged by AI. The ethical implications and government regulations will determine whether AI is used to help or control individuals.
Virtual avatars, powered by AI, can conduct meetings and interact with users in a way that mirrors human behavior. While still imperfect, these avatars could soon fool many people, highlighting the need for policy and practice adjustments.
User experience (UX) is emerging as a critical factor in AI product competition. Improved UX can unlock deeper and more frequent usage of AI tools, making them more accessible and familiar to users.
Innovative uses of AI could extend beyond simple task replacements. For example, tools like Cursor and Devon could enable marketers to create custom software or games, transforming software into a new type of content.
Organizations should adopt a mindset of continual learning, core value understanding, and proactive implementation. Waiting for others to figure out AI solutions will leave organizations far behind in the AI-driven world.
受https://www.oneusefulthing.org/p/the-present-future-ais-impact-long启发的阅读和讨论
Vanta - 简化合规 - https://vanta.com/nlw AI每日简报帮助您了解AI领域最重要的新闻和讨论。 在您收听的任何地方订阅AI每日简报的播客版本:https://pod.link/1680633614 订阅时事通讯:https://aidailybrief.beehiiv.com/ 加入我们的Discord:https://bit.ly/aibreakdown
</context> <raw_text>0 今天的AI每日简报中,为什么AI的未来就在现在。AI每日简报是一个关于AI领域最重要新闻和讨论的每日播客和视频。要参与讨论,请在我们的节目说明中点击Discord链接。大家好,朋友们。在假期前的最后一集长篇阅读节目中,今天我们再次基于Ethan Malek教授的一篇文章进行讨论。这篇文章的标题是《现在的未来,AI在超智能之前的影响》。
这篇文章的TLDR是我们在这个节目中讨论过很多次的内容,即使我们目前面临生成AI性能的重大停滞,当前一批工具和能力的影响仍将对工作产生绝对的变革,使其几乎无法与今天的状态相提并论。让我们来读一下Ethan对此的看法,或者说把它交给一个11Labs版本的我来读Ethan的看法,然后我会回来进行一些讨论。
现在的未来,AI在超智能之前的影响。AI实验室对更大、更强大的AI模型即将到来充满信心,这些模型将使自主代理和系统比人类博士更聪明。你可以在两位领先AI实验室的首席执行官,OpenAI的Sam Altman和Anthropic的Dario Amadei的两篇独立文章中看到这种信心。
这些文章讨论了超智能机器的来临时代。但这些并不是没有争议的断言,我们不知道他们是否正确。然而,在许多方面,我们并不需要超级强大的AI来实现工作的转型。我们今天的第二代/GPT-4级系统中已经具备了比我们完全吸收的更多能力。即使今天AI的发展停止,我们仍将有数年的时间来将这些系统整合到我们的世界中。
今天的AI模型已经是多模态的,能够处理和生成文本、图像和声音等各种类型的媒体。它们可以编写代码、操作计算机、访问互联网等等。所有的要素都在这里,我们开始看到它们逐渐结合在一起。它们并不是完美无缺的,仍然不一致且容易出现幻觉。但在许多领域,AI的能力,尽管存在缺陷,已经是有用的。
在那些不期望完美准确的领域,或者在需要第二意见的地方,或者在没有人可以提供帮助的地方,或者在最佳可用人类表现不如最佳可用AI的地方。例如,考虑AI同时处理图像和推理的能力。
这意味着你可以通过将任何视频源交给AI来添加智能,这在以前是不可想象的。例如,我给Claude提供了一段建筑工地的YouTube视频,并提示道,你可以看到建筑工地的视频,请监控该工地并寻找安全问题、可以改进的地方以及指导的机会。这里没有特别的训练,只是Claude 3.5 Sonnet在计算机使用方面的原生能力,每隔几秒截取一次屏幕并进行研究。你可以在下面看到系统工作的加速视频。
在视频中,Claude分析了建筑工地的各个方面:工人的防护装备使用情况、材料的放置、工作模式和潜在危险。这些观察很有趣,但系统可以更进一步。我接着问:“你得出了什么结论?将你的观察写成一个待办事项清单。”AI在几秒钟内创建了一个总结它观察到的内容的电子表格。这是人类需要花费更长时间才能完成的任务。请注意,它将视频中发现的许多问题进行了优先级排序,并对如何解决这些问题进行了逻辑推理。
将它们按优先顺序分解,做出关于如何解决它们的逻辑推断等等。然后Claude问我一个问题:“你想创建一个完成验证的跟踪系统吗?”这似乎是个好主意。所以我同意了,它创建了一个,故意包括了虚假的名字作为我需要填写的数据示例。根据回顾视频的结果,结果似乎不错,但我不是专家,如果没有严重的幻觉混入其中,我会感到惊讶。
出于这个和许多其他原因,我绝对不希望这个系统被用来惩罚或奖励人们。然而,考虑一个可能没有人监控的潜在危险环境,或者缺乏指导或建议的地方。然后,一个能够提醒人类深入挖掘潜在问题或机会的AI可能是一个有用的资产。我用几个提示即兴创作了这个系统。通过更多的工作,AI监控的错误率和成本将下降,即使没有新模型发布。
这些系统会变得更好。组织将被诱惑在各处部署AI观察者。政府可能也会效仿。一个本可以成为导师和安全检查的角色,可能会变成一个全景监控,所有人都被AI监视和评判。公司做出的选择和政府制定的规则将决定AI是用来帮助我们还是监控我们。这是我们需要在充满AI的世界中进行的许多复杂调整之一。但观察只是AI已经显示出高水平能力的一个领域。
大多数知识工作所涉及的数字世界包括使用计算机、浏览网站、填写表格和完成交易。现代AI系统现在可以执行这些相同的任务,有效地自动化以前仅由人类完成的工作。这种能力不仅限于简单的自动化,还包括定性评估和问题识别。
在这里,我让Claude访问沃尔玛网页,并像一个天真的用户一样测试它,尝试购买某样东西,然后去亚马逊做同样的事情。将你的发现写成一份报告。在加速视频中,你可以看到AI访问每个网站并扮演一个用户搜索和购买产品。然后它写了两份报告,一份叙述和一份测试报告。我没有发现任何幻觉,虽然它们不是我见过的最有见地的报告,但相当扎实。
AI已经是一个合理的实习生,当被分配任务时,它迅速而出色地执行,利用判断力解决问题。随着模型的改进和这些系统的使用变得不那么复杂,可以想象管理者在不久的将来会使用AI代理团队进行分析和重复任务。我们看到多模态输入和工具使用如何改变AI与世界的互动,但当我们添加多模态输出时,情况变得更加奇怪。在这里,我邀请了Heijen制作的AI头像参加Zoom会议。
这个头像完全由AI驱动,从声音到图像再到行为。事实上,我提示这个头像以最刻板和企业化的方式进行Zoom会议。虽然那种我们从几乎但不完全是人类表现中感受到的不安感在略显不自然的声音和视觉故障(如变化的衬衫)中显而易见,但这种互动基本上反映了典型的Zoom通话。这是第一代工具,实际上是有效的。
我不会感到惊讶,如果在不久的将来,许多人会被虚拟头像所欺骗。这些能力需要立即关注政策和实践。即使它们不完美,当前的AI系统已经在重塑工作的基本方面,从我们如何监控安全到我们如何进行会议。
组织今天关于AI部署的选择将设定可能会回响很长时间的先例。AI驱动的监控将用于指导和保护工人,还是施加算法控制?AI的帮助是增强人类能力,还是逐渐取代人类判断?组织需要超越将AI部署视为纯技术挑战的观点。相反,他们必须考虑这些技术对人类的影响。
在AI达到人类水平表现之前,它们对工作和社会的影响将是深远而广泛的。我展示的例子,从建筑工地监控到虚拟头像,仅仅是个开始。
我们面前的紧迫任务是确保这些转型增强而不是削弱人类潜力,创造出技术服务于提升人类能力而不是取代它的工作场所。我们现在在AI整合的早期阶段所做的决策将塑造未来的工作,不仅是AI增强世界中人类代理的未来。今天的节目由Vanta提供支持。无论您是刚开始还是扩展公司的安全计划,展示一流的安全实践和建立信任比以往任何时候都重要。
Vanta自动化ISO 27001、SOC 2、GDPR和领先的AI框架(如ISO 42001和NIST AI风险管理框架)的合规性,为您节省时间和金钱,同时帮助您建立客户信任。此外,您可以通过自动化问卷和展示您的安全态势来简化安全审查,所有这些都由Vanta AI提供支持。全球超过8000家公司,如Langchain、Leela AI和Factory AI,使用Vanta来展示AI信任并实时证明安全性。
了解更多信息,请访问vanta.com/nlw。也就是vanta.com/nlw。如果2025年关于AI有一个明确的事情,那就是代理即将到来。按行业划分的垂直代理、按功能划分的横向代理平台。如果您经营一家大型企业,明年您将会尝试代理。考虑到这一点是多么新颖,我们所有人都将回到试点模式。
这就是为什么Superintelligent在今年初推出了一款新产品。它是一个代理准备和机会审计。在短短几周内,我们与您的团队深入探讨,了解哪些类型的代理适合您进行测试,您需要什么类型的基础设施支持以做好准备,并最终得出一套可操作的建议,帮助您准备好如何让代理改变您的业务。如果
如果您对代理准备和机会审计感兴趣,请直接联系我,[email protected]。请在主题行中写上“代理”,以便我知道您在谈论什么。让我们让您成为AI市场中最具活力部分的领导者。好吧,回到真正的NLW。Ethan在最后几段中总结得非常好。即使它们不完美,他写道,当前的AI系统已经在重塑工作的基本方面。而且...
组织需要超越将AI部署视为纯技术挑战的观点。相反,他们必须考虑这些技术对人类的影响。我想谈谈五个快速的事情,跟进这个问题。在与大型企业讨论这个特定问题时,这个想法是,即使事情现在停止,仍然会有大量的追赶和转型工作要做。
我想强调的第一件事是用例。我们仍在发现这些工具的用例的过程中。即使看似明显的一对一替代当前工作的事情,在实践中在许多情况下并不那么明显。
我认为一个很好的例子是会议记录者。当然,这些工具有无数个版本。如果你和我一样,任何给定的Zoom或Google Meet中,参与者中大约三分之一到一半都是这些记录者。但他们实际上有什么用呢?
我相信对于某些人来说,他们确实会回去参考他们的笔记,将其作为个人摘要,实际上类似于邓布利多的回忆盆。但我实际上认为这是回忆盆的另一种用例,即与人分享记忆,这些工具真正蓬勃发展。在Super Intelligent,我们所做的是设置某些关键会议,自动将这些笔记推送到未参加会议的人的Slack频道。
总结的真正价值并不在于参与者,而在于让未参加会议的人迅速了解情况,而不依赖于这些参与者重新讲述整个过程。这增加了集体知识,提高了我们的同步能力,并且以更低的时间成本实现。
关键是,我们花了几个月的时间使用这些工具,才真正确定这是对我们来说最好的用例。而我们是一家专注于AI并帮助企业弄清楚如何使用AI的公司。我的观点是,我认为我们仍然只是刚刚开始挖掘真正最有价值的用例,即使是使用今天的当前工具。
我想讨论的第二个主题是用户体验。直到今年下半年,我们才开始真正关注用户体验作为AI产品竞争的关键向量。在此之前,所有的关注点都在模型创新和谁拥有更强大的能力上。但随后你开始看到像Claude的伪影,突然间每个人都在思考这些工具的用户体验。
随着这种趋势的持续,将会开启大量新的使用场景,因为人们解锁了更熟悉或更好的用户体验,以便与生成AI进行更深入的互动。下一个主题是创新。在我们讨论用例时,我刚才说我们主要考虑的是用AI增强版的当前活动进行一对一替代。在营销中,我生产更多内容,并且生产得更快、更便宜,但我仍然在生产内容。
然而,我认为真正有趣的事情将发生在我们不仅仅是对当前活动进行一对一替代,而是实际上从根本上思考由于生成AI工具我们可以做些什么。以营销为例,如果像Cursor和Devon这样的工具变得足够可用,以至于非编码人员也能实际构建软件应用程序,那么软件突然间就成为了一种新的“内容”,营销人员可以创造。
当你考虑营销人员关心的内容时,眼球和印象、参与度和花费时间创建自定义软件或游戏,尤其是那些可以快速启动、通过社交媒体和其他渠道部署的东西,或许与文化时刻相结合,你就会有这一全新类别的事情,营销人员可以去做。当然,这只是一个例子。这些创新中的一些将来自增强的能力,但很多将来自人们弄清楚如何更好地使用当前的一批工具。
关于代理的主题,代理是最有可能从未来扩展能力中显著受益的事物之一。然而,我们现在看到的垂直代理是,有些应用程序和功能,即使在现在,代理也非常擅长。我认为,弄清楚如何将代理与AI增强的工人整合在一起,将成为一种全新且困难的学科,即使我们从现在的状态没有任何进展。
最后,第五个主题是心态。在AI转型方面,最成功的组织将是那些将拥抱特定心态的组织。他们将拥抱持续学习的心态,在这种心态下,没有一个完成的时刻,他们永远不会“完全转型”,而是始终关注下一步。