We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Anthropic Has (Maybe) Solved a Holy Grail of Business AI

Anthropic Has (Maybe) Solved a Holy Grail of Business AI

2024/11/28
logo of podcast The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

The AI Daily Brief (Formerly The AI Breakdown): Artificial Intelligence News and Analysis

AI Deep Dive AI Chapters Transcript
People
播音员
主持著名true crime播客《Crime Junkie》的播音员和创始人。
Topics
播音员介绍了人工智能在感恩节火鸡烹饪和商业写作中的应用案例。Butterball公司利用AI分析客户数据,改进火鸡烹饪方案和客户服务;Perplexity公司考虑开发AI硬件;Anthropic公司推出Claude AI的自定义写作风格功能,可以模仿个人或品牌特有的语气,这对于大规模内容创作具有重要意义。 David Singleton介绍了AI代理操作系统的概念,认为AI代理需要一个通用的技术框架来连接服务并相互通信,就像应用程序需要操作系统一样。他还提到构建AI代理需要新的用户界面模式、重新设计的隐私模型和简化的开发平台。 Matt对Anthropic公司新推出的自定义写作风格功能的评价褒贬不一,认为该功能在模仿个人写作风格方面效果不尽如人意,但其真正价值在于创建和使用预设的写作风格,而不是完美地复制个人风格。 David Singleton认为AI代理需要一个通用的技术框架来连接服务并相互通信,就像应用程序需要操作系统一样。他还强调,构建AI代理需要新的用户界面模式、重新设计的隐私模型和简化的开发平台,以方便开发者构建有用的代理,并最终帮助人们节省时间,专注于重要的事情。 Matt对Anthropic公司新推出的自定义写作风格功能的评价褒贬不一,他认为该功能在模仿个人写作风格方面效果不尽如人意,上传了90分钟的访谈记录,但生成的文本并不像他自己的写作风格。但他同时也指出,该功能的真正价值在于创建和使用预设的写作风格,而不是完美地复制个人风格,这对于大规模内容创作具有重要意义。

Deep Dive

Chapters
AI is being used by Butterball to analyze customer service data and optimize turkey preparation, making it easier for home cooks to handle frozen turkeys and ensuring perfect cooking instructions.
  • Butterball uses AI to analyze decades of customer service audio data.
  • AI helps identify common issues like dealing with frozen turkeys.
  • Butterball has developed a thawed turkey product with precise cooking instructions.

Shownotes Transcript

为了下载每日简报,Anthropic 的一个新功能承诺能够复制你自己的写作风格,在此之前,让我们看看新闻头条,AI 如何帮助解决感恩节最痛苦的部分之一。AI 每日简报是一个关于 AI 最重要新闻和讨论的每日播客和视频。要加入讨论,请关注我们节目说明中的 Discord 链接。

欢迎回到 AI 每日简报标题版。大约五分钟内了解您所需的所有每日 AI 新闻。感恩节就要到了。

事实上,当您收听本节目时,可能已经是感恩节了,事实证明,美国人在这天非常讨厌一种特定的体验。这并不是与奇怪的醉酒亲戚陷入谈话,而是与烹饪过程有关。50 多年来,Butterball 一直维持着火鸡热线,想想 911 用于火鸡相关的紧急情况。

这在《西翼》的一集中非常有名,总统巴特勒提到应该有一种特殊的服务来帮助人们处理他们的感恩节火鸡,结果发现确实存在这种服务。然后,他当然试图向经济学家解释如何做火鸡,但这与我们无关。关键是,Butterball 有数十年的客户音频数据,这些数据解释了他们在感恩节当天遇到的问题,通过将这些数据通过 AI 工具处理。

Butterball 得出了一个惊人的发现。人们每年都讨厌处理冷冻火鸡。感恩节厨师在意识到他们忘记解冻火鸡时惊慌失措地打电话。虽然这并不令人惊讶,但关键的见解是,近年来关于购买的投诉激增,Butterball 可能没有注意到这一点。

如果没有 AI 来总结数百万次客户服务互动,该公司现在已经进行了为期三年的流程修改和客户输入分析,现在很可能是世界上最先进的火鸡加工商。这就是他们所做的全部工作,每个感恩节都有 18 个月的准备工作,从采购到物流再到客户服务。AI 也在帮助完成这些任务,使公司能够更好地优化库存和交付。

然而,他们 AI 领域的巅峰之作是今年感恩节推出的即食火鸡。该产品涉及数小时的测试,火鸡科学家在机器学习的帮助下收集了数百个数据点。Butterball 相信他们已经设计出了完美的即食火鸡,他们将其与精确的烹饪说明配对,以确保每次都能正确烹制。

因此,如果您今年做的是即食火鸡,您可能正在享用您的第一顿 AI 增强型感恩节大餐。接下来,Perplexity 即将陷入任何初创公司都可能陷入的最大陷阱之一,那就是试图制造一种很酷的下一代硬件设备。本周早些时候,首席执行官丹·罗里诺写道,他正在考虑制造一种简单的低于 50 美元的硬件设备,该设备可以可靠地回答您的问题。

语音到语音,就这么做,但做得非常好。如果这篇文章获得超过 5000 个赞,我一定会做。当这篇文章确实获得了超过 5000 个赞时,他跟进评论道:“好吧,LFG!”AI 硬件在过去一年中一直是一个相当困难的领域。可以说是最成功的产品 Rabbit R1 推出时评价很低。

该公司声称已出货 13 万台,但它们在二手市场上以大幅折扣的价格很容易买到。其他产品,如 Humane AI Pin,评价不佳,销量低迷,并且召回事件迫使该公司寻找收购方。尽管如此,如果过去一年教会了我们什么,那就是不要低估 Perplexity。

据报道,该公司正在筹集 5 亿美元资金,并且已经持续出货数月。AI 硬件也是明年可能流行起来的主题。Myo 最近组建了一个哈佛团队,OpenAI 正在寻求开发由约翰·伊夫设计的设备。

并且快速代理升级显示出一些希望。尽管如此,以 50 美元的价位销售眼镜似乎相当困难,一些人试图说服我们做任何其他事情。

Sola 顶级层写道:“在我看来,不要这样做。它已经做过了,而且永远不会成功。我们不需要另一个 AI 设备。”

我们已经有智能手机了,只需加倍努力,使移动应用程序成为有史以来最好的应用程序,添加一个与 Google 图片强大的竞争对手,因为我经常使用它。但它应该与 AAM 风格的布局类似,不要为此而烦恼。我认为这是许多使用 Google 的人的看法。

最后,成为第一个有竞争力的公司,实际上有机会在 20 年内颠覆搜索,这似乎是一项足够大的任务。然而,其他人却兴奋地表示:“我已经用现成的 PC 和 ChatGPT 高级模式制作了一个 200 美元的设备。我正准备用树莓派制作一个大约 100 美元的设备。”

那么它真的会发生吗?我们只能拭目以待。在融资新闻方面,一群前 Google 和 Stripe 高管筹集了 5600 万美元,用于构建 AI 代理的操作系统,这家名为“Debt Slash Agencies”的初创公司由一群帮助构建 Android 平台的创始人领导。

他们现在正在将同样的策略应用于 AI 代理。关键的见解是,代理将需要一个通用的技术框架来连接到服务并相互通信,就像不同的应用程序在一个操作系统中一样,联合创始人兼首席执行官戴维·辛格尔顿说。“我们需要一个类似 Android 的时刻来实现 AI。”

我们可以看到 AI 代理的潜力,但对于开发人员来说,构建任何好东西都太难了。该公司创建了一个新的用户界面,允许与不同代理进行更自然的交互。有一点可以肯定的是,该团队绝对人才济济。该公司的首席产品官兼前 Android 产品管理副总裁说:“这是一个构建了前三代操作系统的团队。”

投资者当然很兴奋。独立合伙人娜奥米·戈德曼说:“如果你考虑这家公司的员工和创始人市场契合度,它与他们想要构建的目标再贴切不过了。”CapitalG 合伙人吉尔·蔡斯说:“这是一个千载难逢的机会。”

他们正在攻击,宣布公司并阐述其愿景。辛格尔顿说:“现代 AI 将从根本上改变人们在日常生活中使用软件的方式。代理应用程序可以首次使计算机能够像人与人互动一样与人一起工作。”

但这不会在没有消除大量障碍的情况下发生。我们需要新的 UI 模式,重新构想隐私模型,以及一个能够极大地简化构建有用代理的开发平台。这就是我们正在应对的挑战。

我们正在构建一个基于云的工具包,用于让可信代理能够跨所有设备与用户一起工作。我们希望帮助人们将时间花在他们关心的事情上。在另一条融资新闻中,Black Forest Labs 正在谈判在其首轮主要融资中筹集 2 亿美元。

这家德国初创公司只有几个月大,但因其 Flux 文本转图像模型而声名鹊起。该模型正在为 XAI 聊天机器人驱动图像生成,并且通常被认为处于最先进技术的顶端。该公司的创始团队包括几位参与创建 Stable Diffusion 的计算机科学家。

据传闻,新一轮融资对该公司的估值为 10 亿美元,将由 16z 领导。他们的种子轮融资于 8 月进行,从 Oculus 联合创始人帕尔默·拉奇和红杉资本合伙人加里·坦恩等投资者那里筹集了 3100 万美元。在产品新闻方面,据在德国发现的 Google Gemini 扩展程序显示,Google 正在将 Spotify 连接到 Gemini。

用户将能够使用 AI 来搜索和播放音乐,使用自然语言请求。目前,Gemini 无法让用户与平台上的广播电台互动。这是 Gemini 在 Google 应用之外的第二次集成,上个月与 WhatsApp 的兼容性实现了这一点。

问题是这是否揭示了 Google 未来战略的某些内容。他们的重点将是将代理式体验带到广泛的应用程序组合中吗?这当然与他们过去的做法相符。

上周,优步推出了一条新的业务线,该公司正在推出一个新的 AI 数据标注服务。这个名为“Scale Solutions”的新部门已经开始招聘合同工来完成数据标注任务。最初是基于内部团队来处理优步共享公司的大规模标注任务,但该部门现在将向外部客户提供其服务。

数据标注是 AI 行业中一个不起眼但快速增长的部分。提供类似服务的 AI 初创公司目前估值达 140 亿美元,是该领域顶级风险投资支持公司中的佼佼者。我们还看到高质量的数据标注成为一些模型构建者的超级强大工具。

上个月,来自中国实验室 MiniMax 的新视频模型以其前所未有的能力震惊了业界,一些人怀疑构建该高性能视频模型的秘诀是大量且准确的标记训练数据。关于这个新部门的计划,优步发言人说:“过去十年来,我们一直在大规模地执行这些任务,这是我们自身发展的一部分。我们深刻理解需要这些服务的公司。”他们补充说,招聘独立承包商符合“与我们作为世界上最大的灵活工作机会提供商之一的专业知识相符”。这可能不是来自前沿实验室的大新闻,但当我们进入这个假日周时,仍然有很多事情正在发生。

目前,AI 每日简报标题版的新闻就到这里。接下来是主要剧集,今天的剧集由 Plumb 提供。想要使用 AI 自动化您的工作,但不确定从哪里开始?AI 工作流程描述,无需编码或 API 密钥。

想象一下,输入“AI 分析我的 Zoom 会议并向我发送 Notion 中的见解”,然后看着它在您眼前实现,无论您是运营主管、营销人员还是非技术创始人,Plumb 都能为您提供 AI 的强大功能,而无需技术难题。获得对顶级模型的访问权限。

GPO、组装、AI,更多技术提供给您。查看 useplumb.com 以抢先体验未来工作自动化。今天的剧集由 Vanta 提供,无论您是启动还是扩展您的公司安全程序,展示一流的安全实践并建立信任比以往任何时候都更重要。

Vanta 自动执行 ISO 27001、SOC 2、GDPR 和领先的 AI 框架(如 ISO 42001 和 NIST AI 风险管理)的合规性,为您节省时间和金钱,同时帮助您建立客户信任。此外,您可以通过自动化问卷调查来简化安全审查,并使用面向客户的信任中心来展示您的安全态势。所有这些都由 Vanta 的 AI 提供支持,超过 8000 家全球公司(如 LangChain、Leia AI 和 Factorial AI)使用 Vanta 来展示 AI 可信度,并实时改进安全性。了解更多信息,请访问 vanta.com/nlw,即 vanta.com/nlw。

今天的剧集由 Superintelligence 提供。每个业务工作流程和功能都正在使用人工智能进行重塑和重新构想。然而,从 AI 的潜力到实际捕获价值之间存在巨大的挑战。

而这就是 Superintelligence 致力于填补的空白。Superintelligence 加速 AI 的采用和参与,帮助团队实际使用 AI 来提高生产力并推动业务价值。交互式 AI 使用案例注册表使您的公司能够全面了解人们现在如何使用人工智能,并将其与功能相结合,以闪卡、微型学习路径、主题和使用案例库的形式构建内容。

Superintelligence 帮助您公司内部的人员展示他们如何从 AI 中获得价值,同时为人们提供资源,将这些灵感付诸行动。前三个注册 100 个或更多席位的团队将获得免费的嵌入式咨询服务。

这是一个流程,我们的 Superintelligence 团队与您的组织一起,找出对您来说最重要的特定用例,并帮助确保实际支持这些用例的采用,以推动实际价值。访问 superintelligence.ai 了解更多信息。

AI 赋能网络。现在回到节目。欢迎回到每日简报。当人们开始与生成式 AI 交互时,存在一种非常常见的模式,基本上这种模式是这样的:起初,你会对它的能力感到非常震惊。

无论是像 Midjourney 这样的图像生成器、像 ElevenLabs 这样的语音合成器,还是像 ChatGPT 或 DALL-E 这样的图像实验室,AI 的功能会让你感觉像个巫师。然而,不可避免的是,你越深入,你就会发现更多不完全正确的事情,或者在你能走多远方面受到限制。图像生成领域的一个很好的例子是一致的角色。如果您只是想创建一幅图像,那么在您想要它看起来和感觉的样子方面,您可以获得令人难以置信的保真度和特异性。

但是,如果您试图在一系列图像中做到这一点,如果您试图为动画或漫画书创建基础,那么它就会变得困难得多。大型图像生成公司以及第三方都投入了大量精力来改进这一点。随着这种能力上线,关键在于它解锁了一整套原本被切断的用例。

其中一个圣杯,换句话说,一种能够解锁大量新用例或以根本性和显著的方式改进 AI 现有用途的更新类型,就是 AI 模仿特定写作风格的能力。人们很快发现 ChatGPT 和 Claude 的一些特点是,在大型语言模型中有一种特殊的风格。

生成的文字。有些词语AI用得比真人多得多,比如“深入研究”(delve)。总的来说,AI的风格很独特,很容易辨认。

现在,你总是可以使用提示来尝试解决这个问题,你可以指导AI以特定的方式写作,你可以提供参考。但人们最想要的功能之一就是能够上传自己的一套文档,让AI能够原生复制它们。事实上,我已经广泛尝试过这样做。

我构建了一个自定义GPT,正如你所看到的,它有大约十五个参考文档,从短文到长篇写作不等。简而言之,它只是还可以。它确实让ChatGPT听起来不像ChatGPT。

它肯定有一些模仿AI写作的模式,但它听起来也不像我,当然不够让我在短期内把重要的写作外包给它。其他公司最近也尝试制作这种风格的版本。例如,有一个来自Every的产品在这个领域做了一些事情。

他们的方法非常有趣。基本上,他们试图让你轻松地将一种类型的內容转换为另一种类型。所以我可以说我正在生成YouTube视频、播客和领英帖子,然后它会向你展示如何将我的源工作转换成许多其他帖子。

现在,这个过程的一部分是它试图在构建额外资产集时保留风格,它允许你使用历史示例来演示它能做什么。然而,人们真正想要的是将此功能原生构建到AI本身中,并使其变得更好。因此,当Anthropic昨天宣布这项新的风格功能时,内行人士都非常兴奋。

Matt,例如,Route,我觉得这是一个每个人都一直想要和等待的功能。不幸的是,这条新闻已经被Orca的发布(它已经被关闭)所掩盖。在我看来,这对Anthropic来说更重要,他们宣布了风格功能。

你现在可以自定义Claude的响应方式,从新的预设选项中选择。简洁、解释性或正式。所以这个功能实际上有两个部分。

首先,它只是一个内置的样式选择器,对于你提出的任何提示,你可以说,如果你想要它正常。Claude的默认响应可以是较短的响应和更多信息,解释性的教育性响应用于学习,或正式的、清晰的、结构良好的响应。这本身就是一个非常棒的功能,它使你无需在提示中明确说明你想要的风格。

它现在内置于UI中。然而,真正让人兴奋的是,你可以创建和编辑样式。你的操作是选择样式菜单,按下创建/编辑样式,然后创建自定义样式。

在这里,你可以添加一个写作示例,可以是一个文档,或者你可以复制粘贴文本,或者你可以简单地描述你想要达到的风格。我添加了我最近写的一篇Linton的帖子,它比较长,内容也更充实,更像一篇博客文章。我得到的结果是一种我称之为“技术翻译”的风格。

风格摘要是:通过对话式和权威的沟通方式传递分析性见解。所以现在当我回去,让我们写一篇关于企业中AI代理的简短博客文章,强调虽然它们可能还没有准备好投入生产,但2025年很可能是人们开始在其公司整合代理的一年,有远见的企业应该抢先一步。复制这个。

让我们先用“正常”模式试试。你会得到这篇文章:企业中的AI代理——为2025年的浪潮做准备。这是因为Claude听起来根本不像我。

它与我的写作方式毫无关系。举个例子,段落比我想要的风格更长。现在让我们用我创建的“技术翻译”风格试试。

对我来说,这当然并不完美。它比我想象的要更像推文。第一段是:让我们认真谈谈企业中的AI代理。

虽然每个人都在观看概念改进的演示视频,但大多数公司仍然在观望。老实说,直到现在,这是正确的做法,现在已经更接近我的写作风格了:简短、有力,试图吸引人们的注意。当然,在播客的背景下很难描述这是否更好。

但我的意思是,至少在我的初步测试中,这已经比我之前做的事情更接近原生了。尤其是在想象一个公司试图大规模生产内容的用例的情况下,这在提高Claude生成的写作的平均质量方面是一个巨大的突破。并非所有人都印象深刻。

Matt Wolf得到的风格摘要是:以热情、对话式的专业知识传递技术AI新闻,使复杂的话题引人入胜且易于理解。但他表示,不幸的是,我有点失望。我上传了90分钟的文字记录,我认为这根本不像我的写作风格。

幸运的是,我可以获得反馈并尝试使其更接近。我要指出的一点是,Matt上传的是YouTube文字记录,那是他在说话,这与写作不同,如果这项技术难以进行这种转换,我不会感到惊讶。但无论来源是什么,关键是要不要夸大其与个人风格的接近程度。

我认为真正的价值,以及许多人会兴奋的地方,不仅仅是复制他们自己的风格,还在于能够创建一个现有的风格预设库,这使得更快地获得任何特定用例所需的精确输出类型成为可能。对我来说,这完美地体现了我们目前在AI发展中所处的位置。它不仅仅是推动技术发展的前沿,还在于用户体验,以及让这些东西在个人和商业环境中真正发挥作用。考虑到这一点,我认为写作风格是一个巨大的改进,我很高兴能进一步尝试。现在,这就是今天的AI简报的全部内容,下次再见,和平。