We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Anthropic’s Mike Krieger wants to build AI products that are worth the hype

Anthropic’s Mike Krieger wants to build AI products that are worth the hype

2024/9/9
logo of podcast Decoder with Nilay Patel

Decoder with Nilay Patel

AI Deep Dive AI Chapters Transcript
People
M
Mike Krieger
Topics
Mike Krieger:Artifact 项目的关闭是经过深思熟虑的决定,团队在评估了产品发展和自身目标后,认为关闭项目是正确的选择。将 Artifact 卖给雅虎是正确的决定,因为这能让产品理念延续,并且团队能够继续探索新的方向。Artifact 的失败部分原因是其基于丰富的网络这一前提受到了挑战,因为越来越多的内容迁移到封闭平台。互联网正在变得越来越不富裕,内容越来越集中在封闭平台上,这使得依赖于开放网络的Artifact等产品面临挑战。Artifact 未实现的宏伟目标之一是构建一个强大的推荐系统,并将其应用于多个垂直领域。加入 Anthropic 的主要原因是希望能够在一家拥有优秀团队、给予足够自主权并致力于解决重大问题的公司工作,同时避免再次创业的压力。他对人工智能在创意领域的应用以及由此带来的伦理问题非常关注。他认为,人工智能产品能否克服争议,取决于其实用性和价值,目前许多产品还达不到这个标准。Anthropic 关注的是解决具体的实际问题,而不是试图解决所有问题,这有助于避免一些伦理困境。他认为,人工智能聊天机器人能否获得与TikTok类似的广泛接受,取决于其能否直接为内容创作者带来价值。Anthropic 公司的核心价值观是安全和负责任地发展人工智能技术。Anthropic 公司重视安全,在产品发布前会进行全面的安全评估。他对人工智能技术持乐观态度,相信人类能够应对信息过载和人工智能带来的挑战。Anthropic 意识到人工智能产品可能带来的负面影响,并致力于在产品设计中解决这些问题。他认为,大型语言模型目前还不能完全实现人们对人工智能的所有期望,但其潜力巨大。大型语言模型不仅能直接创造价值,还能帮助人们构建创造更大价值的产品。他认为可以通过技术手段和产品设计来控制大型语言模型,从而构建可靠且有价值的产品。Anthropic 将专注于改进 Claude 的企业应用和 API,并致力于提高模型处理数据的能力。

Deep Dive

Chapters
Mike Krieger discusses the decision to shut down Artifact and his reasons for joining Anthropic, focusing on the value of closing a chapter when it's the right time and the excitement of working on big problems at scale.
  • Artifact had a small but passionate user base, but growth and product direction were uncertain.
  • Krieger wanted to work on interesting problems at scale without starting a new company.
  • Anthropic offered a combination of a strong research team and product greenfield, aligning with Krieger's desire to be close to core tech and interesting problems.

Shownotes Transcript

对本播客的支持来自Stripe。Stripe是一个支付和账单平台,支持全球数百万家企业,包括Uber、宝马和DoorDash等公司。Stripe帮助无数初创公司和老牌公司实现其发展目标、推进其使命并覆盖更多全球客户。

该平台提供了一系列专门的功能和工具来加快增长,例如Stripe Billing,它使处理基于订阅的收费、发票和所有经常性收入管理需求变得容易。您可以在stripe.com了解Stripe如何帮助各种规模的公司取得进步。访问stripe.com了解更多信息,Stripe助您进步。

本集的支持来自The Current Report。从数据隐私到电视的未来、零售媒体及其他方面,数字营销世界不断变化,那么您如何跟上步伐呢?The Current Report每周都会为您提供帮助。

处于前沿的营销领导者会为您提供最新的见解。因此,如果它正在引起轰动,他们就会谈论它,所以请订阅The Current Report,无论您在哪里收听播客。您好,欢迎收听Decoder。

我是尼克·斯塔特,我是The Verge的编辑,Decoder是我的节目,主题是宏大的想法和棘手的问题。今天,我与Anthropic的新任首席产品官迈克·克里格交谈,Anthropic是业内最热门的人工智能公司之一。Anthropic成立于2021年,由前OpenAI高管和研究人员创立。

他们希望建立一家更注重安全的人工智能公司,我必须指出,这是离开OpenAI的人的一个共同主题。Anthropic的主要产品是Claude,它既是其行业领先的人工智能模型的名称,也是一个与ChatGPT竞争的聊天机器人。与其他主要人工智能公司一样,Anthropic获得了数十亿美元的资金,资金来自科技界的一些大腕,主要是亚马逊,但与此同时,Anthropic确实拥有独特的、强烈的安全文化。

该公司引人注目之处在于,它吸引了一批真正担心人工智能可能会毁灭人类的人。我想问问迈克,这种紧张关系如何在产品设计中体现出来。此外,迈克的历史非常引人注目。如果您是资深科技爱好者,您可能认识他,他是Instagram的联合创始人,他与凯文·斯特罗姆一起创立了这家公司,然后将其出售给了Facebook。

现在,迈克在2012年获得了数十亿美元的回报,这是一个令人瞠目结舌的数字。而这笔交易让迈克成为了创始人级别的富豪。基本上,一夜之间,迈克在2018年离开了Meta,几年后,他开始涉足人工智能领域,但这并不是我们一直谈论的那种人工智能。

不是Claude。相反,迈克和凯文推出了Artifact,一款人工智能驱动的新闻阅读器,它在推荐算法方面做了一些非常有趣的事情。我非常喜欢Artifact,但最终,它并没有像任何人希望的那样成功,迈克和凯文在今年早些时候将其关闭。我们将在这里讨论很多决策,在Decoder中。因此,我想了解更多关于关闭Artifact的决定以及将其出售给雅虎的决定的信息。当然,我还想知道为什么迈克决定加入Anthropic并从事人工智能行业——这是一个投资很多,但几乎没有消费者产品来证明其合理性的行业。

这一切都是为了什么?未来可能会出现哪些产品,让围绕人工智能的混乱局面变得有价值?他是如何考虑构建这些产品的?我一直喜欢谈论产品和市场,这次谈话有所不同,即使我仍然不确定任何人是否能描述未来会是什么样子。好的,Anthropic首席产品官迈克·克里格,我们开始吧?

迈克·克里格,您是Anthropic的新任首席产品官,非常感谢您抽出时间。

非常感谢您邀请我。很高兴见到您。

我也很高兴见到您。

我想要和您谈谈产品。我上次和您谈话只是想说服您来参加Code大会,我实际上并没有采访您。但我认为您想和一个应该负责监管的人谈谈产品。

是的,这就是我的产品,我向观众们解释。我们将稍后讨论一下人工智能监管。这肯定会发生。

这似乎是难题的一部分,但您正在构建实际的产品。我对这些产品可能是什么、现在是什么、以及它们将走向何方有很多疑问。但我希望从您职业生涯的开始谈起,也就是Artifact故事的结尾。

好的,人们都知道您创立了Instagram,您在Meta工作了一段时间,然后您和凯文·斯特罗姆创立了Artifact,这是一款非常有趣的新闻阅读器。它提出了一些关于如何呈现网络内容、评论等等的非常有趣的想法。然后您决定将其关闭。我认为如果这个节目是为建设者准备的,我们很少谈论关闭项目,请您向我介绍一下,因为这和启动项目一样重要。

有时确实如此。我们对Artifact关闭后收到的反馈褒贬不一,既有悲伤,也有对我们及时止损的赞扬。当您看到它时,我认为在某个时刻说“我们已经看到了足够多”也是有价值的。

我认为对我们来说,Artifact仍然是我热爱和怀念的产品,事实上,我会遇到一些人,他们会说:“我喜欢Instagram,我喜欢Anthropic,我喜欢Artifact”,这确实让Artifact拥有了一群忠实但规模很小、非常热情的用户。但我们已经开发了三年左右,产品已经上线一年了。我们观察指标,观察增长,观察我们所做的事情,并有了一个时刻。

我们说:“在我们决定放弃之前,有没有什么想法或产品方向是我们觉得不去尝试会很愚蠢的?”我们列出了这些方向,那是在去年年中,我们基本上花了一年的时间来处理这些问题,然后我们说:“是的,这些方向有所改进,但不足以让我们相信这真的会成为团队和我们愿意在未来几年投入大量时间的事情。”现在是暂停、退一步的时候了吗?答案是肯定的。实际上,如果您没有看到雅虎的做法,雅虎基本上收购了它,拿走了所有代码,现在雅虎新闻以Artifact的形式呈现,或者反过来,这很有趣,它几乎与Artifact完全一样,只是颜色略有不同,来源也略有不同,但是的,这绝对是正确的决定,而且,你知道,当你回过头来看时,这是一个正确的决定,你唯一后悔的是它没有成功,而不是你必须做出这个决定,或者你是在那个确切的时间做出了这个决定。

关于Artifact,有两件事我想问一下。我绝对想问一下出售自己训练有素的东西是什么感觉,这很不寻常,这并不是说这种事情经常发生……首先,Artifact的设计很大程度上是为了呈现网页。它基于一个非常丰富的网络。

如果说我对人工智能时代担心的一件事,那就是网络正在变得越来越贫瘠,对吧?越来越多的东西正在转向封闭的平台,越来越多的创作者想要开始新的东西,他们最终会出现在YouTube或TikTok上,我知道我的专用线程客户端还没有,但它们很常见。

而且,看起来这款产品是在追逐一个梦想,这个梦想可能正受到人工智能的压力,但也受到创作者平台兴起的广泛压力。这是一个真正的问题吗?还是仅仅是我……

我认为答案是,我会同意这种说法,但根本原因不同。但我们看到有些网站能够在订阅、谨慎的广告和优质内容之间取得平衡,我会将The Verge列在首位。

我这么说不是因为我在和你说话。我可以证明,每次我们在Artifact中链接到The Verge的文章时,都会有人点击,这是一种良好的体验,感觉各方面都平衡了。但在极端情况下,例如地方新闻,许多此类网站出于经济原因,在你阅读任何内容之前,就会出现一个无声的谷歌广告。

在你阅读任何内容之前,就会弹出一个新闻通讯注册窗口。我认为这可能是一个长期存在的经济问题,即如何支持地方新闻,可能比人工智能更重要,至少这种趋势已经持续了一段时间了。创作者方面也很有趣,如果你看看事情发生的地方,至少是新兴故事发生的地方。

它们通常是一个病毒式传播的揭露。我们经常在Artifact中得到的是对昨天发生的事情的反应的总结,如果你依赖于此,那么你已经有点落后了。因此,我认为当我观察事情发生的地方和对话发生的地方时,至少对于这种文化核心部分的对话而言,它通常不再发生在媒体流程中,而是从其他地方开始,然后在其他地方被聚合。

我认为这对Artifact这样的网站或产品以及您是否会随着时间的推移而觉得这是突发新闻有影响。我们转向更基于兴趣的内容,就像Instagram一样。它越来越少地关注突发新闻,而更多地关注基于兴趣的内容。但你能做一个只做这件事的产品吗?

我认为这就是挑战所在。您提到了媒体属性,但我知道有些媒体属性是应用程序,有些只是新闻通讯。但我认为我问的是网络。

这只是关于网络的医学治疗。但我担心的是网络,对吧?创作者不在网络上。

他们没有创建网站。Artifact的前提是存在一个丰富的网络。搜索产品通常的前提是存在一个丰富且可搜索的网络,它会提供良好的答案。在某种程度上,人工智能产品需要一个新的网络,因为这就是我们训练模型的地方。您是否看到,网络的这一承诺正在受到压力。如果所有新内容都在封闭平台上发布,就无法像TikTok或Nextdoor那样进行搜索,因此您无法索引,呈现旧推文并不是很好的用户体验。实际上,在网络上构建产品可能会变得越来越受限制,不再……

是一个好主意了。是的,即使是新闻通讯也是一个很好的例子,我读到的一些最好的内容有时会有一个等效的Substack网站,您可以去查看。有些新闻通讯纯粹是电子邮件,我甚至设置了一个电子邮件帐户,只接收新闻通讯,以尝试呈现它们,至少是来自它们的链接。而这种体验并不存在。

我认为我在开放网络上普遍注意到的事情,作为一个长期以来网络的粉丝,是以前非常在线的人。在线曾经是一件人们做的事情,当我回到巴西时,在很多方面,围绕着“好吧,你知道,如果一个食谱只是一个食谱,它就不会排名很高。让我们讲述一下导致这个食谱的生活故事”这样的激励措施已经建立起来了,我觉得这些趋势已经持续了一段时间了,并且已经导致最终消费者可能是一个用户。

但它已经被中间商处理过了,你知道,通过搜索引擎,并针对这种平板电脑进行了优化,或者针对什么会获得分享进行了优化,以及什么会获得最多的关注,以及这种流程。我的意思是,新闻通讯和播客是两种最成功地突破这一点的方式。我认为这是一个有趣的方向。

但总的来说,我觉得开放网络可能已经面临了十年的风险,就中间环节而言,例如,我试图讲述一个故事,我试图与某人交谈,而某人正在接收这个故事。而所有围绕着它的道路工程只会让它越来越痛苦。因此,毫不奇怪的是,“嘿,我可以打开我的电子邮件,我得到的内容在某些方面感觉更好”,尽管在其他方面也不太好。这就是我观察到的情况,我会称之为不健康的地方……是的,这就是现在的情况。

我们在Decoder中经常谈论的是,人们为分发而构建媒体产品。因此,Pocket以其开放的分发服务供稿而闻名。好吧,它像一个访问供稿,但中间有一个Spotify服务器,并且向每个获得任何广告的人提供服务。

但它仍然是其核心服务产品新闻通讯的核心。我将产品映射到开放的、协议化的产品。网络就像搜索分发,它被优化为一件事。

我再次询问的原因是,我想回到Artifact几次,我觉得Artifact试图构建一种新型的分发方式。但它试图分发的是网页,这些网页已经被过度优化用于其他用途。我认为这就是……

一个非常有趣的评估。看着雅虎版本的Artifact很有趣,因为他们已经达成了内容协议,以获得更精简的页面。他们有更少的内容还是更少的内容来源?我认为点击任何类型的新闻故事的体验要好得多,因为这些故事现在已经格式化,用于某种程度上与付费收购相关的分发,这与我们之前所做的不同,我们之前所做的是“这是开放的网络,直接提供给您”。但我认为你的评估是正确的。

所以,我想回到那个团队,我真的很想从Artifact开始。这样,因为我觉得你在采访的一个版本中可能承受着压力。我还想问一下关于Artifact的事情,你和你的联合创始人凯文曾经告诉我,你们有很大的想法,比如规模宏大的想法,而这些想法只是很大的想法。你没有告诉我是什么。

现在结束了,那是什么?我的意思是,有两件事让我仍然感到遗憾,那就是我们没有看到它们实现。一个是关于好的推荐系统支持多个产品垂直领域的想法,新闻故事只是其中之一。

但我相信,也许有人会建立它,如果你通过与新闻故事的互动方式、与内容的互动方式很好地了解自己,那么是否还有其他垂直领域会很有趣?是在购物方面吗?是在本地发现方面吗?是在人们发现所有这些不同的地方吗?

因为对于所有现在分开的承诺,也许机器学习在眼前。我意识到这是一个随着时间推移而变化的定义,为了我们谈话的目的,让我们称之为推荐系统,机器学习系统,尽管它们有其承诺,但我每天的工作实际上并没有太多这种产品的良好实例。所以,主要的竞争性想法是,我们能否将Instagram式的产品思维带入推荐系统,并将这两者结合起来,创造出超越你现有随机照片和摄影的新体验?

新闻是一个有趣的起点,你指出了关于内容的一些好问题,但吸引人的部分是,我们没有试图解决市场双方的所有问题。事实证明,一半的市场已经被搜索填满,并且有其自身的问题。

但至少还有另一面。另一部分,即使在新闻领域,也是真正思考如何最终开放订阅。

我认为Substack正在从一个非常不同的方向追求这一点,但开放订阅,这样创作者实际上可以在平台上原生创作内容并理解分发。我觉得每个平台最终都想做到这一点。当你观察中国最接近的类似用户,比如今日头条,他们一开始非常像爬取网络,然后最终发布你的文章。

现在它大概有80%到90%是一方内容。经济原因使得这很好。有些人靠撰写关于今日头条上本地新闻故事的文章为生,包括一些工程师,我认为,是他们的姐妹,近亲。但另一方面是,内容可以针对你实际所做的事情进行更好的优化。

我遇到了一位企业家,他正在创造一种新颖的媒体体验,这非常像如果故事遇到了新闻,遇到了移动设备,那对大多数新闻故事来说会是什么样子?我认为首先,为了成功,它还需要一种将这种原生分发类型作为其原生分发类型的分发。所以,针对一切的推荐系统,然后是一个主要基于推荐的一方内容创作平台,这两个想法,哦,我的上帝,对某人来说。

但最后关于Artifact的问题,你把它关闭了,然后就有了收购的兴趣。然后,是的,我认为你们公开说过,哦,我们可能会把它卖掉,然后是雅虎,告诉我关于这个过程的事情。

我认为我们想让一些事情保持一致。我认为我们在那个领域工作的时间足够长了,无论我们做什么,我们都想围绕它做一些事情,然后继续做下一个事情。这是一个方面。

另一个方面是,我想以某种方式看到这些想法继续存在。所以,有很多关于“好吧,在不同的情境下会发生什么”的讨论。雅虎的那个非常有趣,我承认我当时对他们在做什么并不太了解,除了我还在使用雅虎财经和我的幻想足球之外。

但除此之外,我并不熟悉他们正在做什么。他们说,“我们想收购它,我们认为在两个月内我们可以把它整合到雅虎新闻中。”谢谢。

这听起来很疯狂,对于一个基于我不熟悉的系统来说,这是一个非常短的时间线,他们可以访问我们,我们基本上是全职帮助他们,但这仍然很多,他们实际上花了十周而不是八周。但我认为他们有一种新的能量,就像,“好吧?我们想重建哪些属性,然后去做?”

所以我完全承认自己带着一些偏见进来了,就像“我不知道,雅虎还剩下什么?这里会发生什么?”然后技术团队就像张开嘴一样接受了它,这是一种成长的隐喻。但他们全力以赴,然后他们改变了方向。Oliver团队,Andy的团队,他现在在Anthropic,他实际上在我之前就来了,我会发现一些小细节,他说,“他们保留了……”

我花了很多时间在加载新文章时出现的三个旋转动画上,我不想在漂亮的反射镜面高光上花费太多时间。这可能是那一周的优先事项,但他们保留了它。但现在它看起来,是的,当你这样做的时候,它看起来很雅虎。

这是一次非常有价值的经历,现在它仍然存在,我认为它的未来可能与我们最初设想的非常不同。但我认为一些核心思想仍然存在,比如“你想尝试创建一个个性化的新闻系统吗?”这与任何现有的Facebook产品都不相关。你所看到的东西已经存在于Facebook中了。

但最痛苦的决定是,雅虎会将其部署给最多的人,规模最大,因为他们给我们提供了最多的钱。你是如何选择的?

这是一个优化函数吗?除了这三个变量之外,还有交易是否足够有吸引力。我们个人在过渡后的承诺相当有限,这我很喜欢。他们已经达到了数亿月度用户,他们仍然需要最终的承诺,但足够让我们觉得它可以成功,然后他们处于正确的领域,至少在出价规模上是这样。

这听起来像是一个梦想,你只是让某人离开。很多钱。好的。是的,有道理。我只是想知道,如果那里有其他选择,或者是不是钱没有那么多,但他们有更大的平台。因为雅虎仍然非常庞大。

是的,完全正确。非常庞大,我认为,在新的领导层下,并且有很多兴奋。对我来说,这真的改变了我的想法。这不是一个巨大的退出,或者说,这不是一个超级成功的结果。但事实上,我觉得这一章以一种很好的方式结束了,然后我们可以继续前进,而不用怀疑我们在结束时是否应该做一些不同的事情。因为这件事,我觉得今年第一季度好多了。

我们需要休息一下。

当你打包的时候。

认为扩展AI很难?再想想吧。借助Watsonx,您可以在任何环境中部署AI,无论是在云端,帮助飞行员导航航班;在本地,帮助员工自动化任务;还是在边缘,让远程银行出纳员能够协助客户。下一个无所不在的AI是什么?

所以你可以扩展。

AI无处不在?了解更多信息,请访问IBM.com/watsonx。让我们一起创造。

本节目的支持来自Refinery,一个多米诺项目。在为您的企业选择办公地点时,位置和氛围至关重要,而Refinery,一个多米诺项目,可以成为您的理想之选,特别是如果您是一位在纽约工作的企业领导者。Refinery,一个多米诺项目,是一个在纽约市天际线上占据一席之地的机会。

Refinery,一个多米诺项目,位于威廉斯堡,它提供了一座全新建筑的所有优势,同时也是一个地标性地址。它可以追溯到19世纪中期。

它有15层楼的现代化办公环境,位于原始的城市文物建筑内,为居民和更广泛的社区提供独特的体验。该建筑配备了沉浸式室内花园、一个玻璃封闭的休息室和一个世界级的健身中心。该建筑还设有一个最先进的等式x健身房,带游泳池,以及各种餐厅和精品店。

随着纽约人重返办公室,Refinery,一个多米诺项目,不仅仅是一个工作场所。它可以成为一个充满活力的中心,激发您的团队产生最佳创意。请访问Refinery.com进行参观。

此消息是与Apple Pay的付费合作。当您需要完成一份礼物清单时,您最不想做的事情就是排队等候。

而是使用Apple Pay以苹果的方式付款。您可以使用您正在使用的手机付款。

只需双击,对着Face ID微笑,轻触一下,就完成了。您身后的排队者会感谢您。Apple Pay是由Apple Payment Services, LC提供的服务,它是Apple Inc.的子公司。在Apple Pay中使用的任何卡均由发卡机构提供。

我们回到Anthropic的首席产品官……

迈克·克里格。

那一章结束了。下一章是您作为Anthropic的首席产品官。那样的对话是什么样的?因为就重大承诺、艰难的问题而言,我们是否会摧毁世界?也许这需要付出更多努力。您是如何决定加入Anthropic的?

但首先要做的决定是接下来做什么。我承认自己在那一年有点身份危机,我真正只知道如何创办公司,更具体地说,不是创办公司,而是创办一家非常成功的公司。我正在寻找我喜欢的那方面的哪些方面?我喜欢从第一天起就认识团队。

我喜欢拥有很大的自主权。我喜欢拥有我非常信任的合作伙伴。我喜欢在一个有很多开放空间的大问题上工作。与此同时,我现在不想再创办公司了,这三年来,结果还不错,但这不是我们想要的结果,所以我想在一个我参与创办的公司里处理有趣的大规模问题。

但我不想创办公司,所以我想,“接下来我该做什么?”我肯定知道我不想仅仅投资。投资本身并没有错,但这只是不同。我骨子里是一个建设者,你们都知道。所以我当时想,“这将非常困难。”

即使我花了一些时间,然后创办了一家公司,然后我通过一位设计师认识了Anthropic的人,他是我在大学里一起制作我的第一个iPhone的人,我们认识很久了。这是乔。我开始和他们交谈,我意识到这里的研究团队令人难以置信,但产品工作如此之少,以至于我不会自欺欺人。

我作为一名编码人员加入,已经在这里待了几年了,了解公司的价值观和工作方式,他们称自己为“蚂蚁”。也许我会为不同的员工昵称进行教育,但这没关系。那艘船已经起航了。

但我感觉这里有很多产品方面的空白领域,还有很多事情要做。所以,这就是它,这种组合是我能想象到的,如果我创办一家公司,我会想要组建的团队,还有很多事情要做。我喜欢,我喜欢每天醒来都对要做的事情感到兴奋和畏惧。

并且已经有了动力和规模,我觉得我可以立即开始做一些已经取得了一些成功的事情。我觉得Artifact有很多阻力,有些阻力是我们无法控制的。这就是这种组合。所以,首先是一个重大的决定。

就像,接下来我该做什么?第二个问题是,艺术是主题。IT 的正确位置有点像我与他们进行的每一次对话都可能回到,我认为这可能是 IT。就像我没有想过要把你公司已经疯狂写作的东西变成那样,但是,我想接近像科里·艾特克那样的技术,我想从事有趣的问题,我想进行构建,但我希望感觉尽可能接近联合创始人那种情况。我认为,丹尼尔,我在这里出现,也许是在试图说服我,她说,你感觉就像我们从未有过的第八位联合创始人,就像我们的产品联合创始人一样,这太棒了,他们有七个代码编写者,但没有一个是产品查找者。但无论 IT 是什么,它都打动了我,而且我将重新开始。

我很期待不可避免的披头士纪录片,讲述你如何成为第十五位。

然后我们可以争论,我希望是第二十位。

与我们的观众一起度过四个小时。这可能是一个深奥的论点,但我鼓励大家去搜索人们如此多的论点,让我问你两个大方向的问题,你正在从事的工作。总的来说,你创立了 Instagram。

你与创意人士关系密切。你为创意人士构建了一个平台。你显然关心设计以及那个社区。

人工智能是一个世界性的难题。人们对此感到不安。我相信他们甚至会因为我和你交谈而感到不安。我们必须克服障碍才能到达萤火虫,这是我们收到的最多电子邮件之一。

你是如何评估何时去从事这项技术工作的?这项技术是建立在训练和互联网上所有内容的基础上的,人们对此有着非常强烈的感情。我们将与损失作斗争。有损失,有复制损失。

你是怎么想的?我有这么多好朋友,是一位音乐家,你让他失望了,现在他来到酒吧,我和他进行了两个小时的深入交谈,让我们谈谈,你知道,我和音乐,以及这些东西是如何联系起来的,以及这些东西将走向何方?里面没有什么有趣的东西。

以及哪些部分、创作过程或哪些创作产出目前受到最大影响。然后你可以应用它们,看看这将如何改变。我认为这个问题很大程度上解释了我最终加入 Anthropic 的原因。如果我要成为一名人工智能专家。

我认为有几件事,很明显,书面文字非常重要,而且在出租车里发生了很多事情,绝对不意味着这会让德克萨斯州的声音比其他地方的创意少?但事实上,他们选择了一种八月式的方法,我们选择真正专注于文本和图像理解,并将 IT 保持在文本输出和文本输出上,这应该是针对你的,而不是我们正在制作已经存在的东西,我认为这大大减少了那个空间,你也不必尝试制作好莱坞类型的视频,或者你知道超高保真度的图像或声音和音乐。我认为其中一部分是研究重点,一部分是产品重点。但我认为棘手的问题仍然存在,但在这些领域之外或更纯粹地关注文本和代码等表达方式方面,也更加有限。所以这对我来说是一个强烈的因素,让我想要来这里而不是其他地方。

有很多争议。但训练数据来自哪里,Anthropic 的 Claude 训练数据来自哪里,是从网络上抓取的。

每个人都在抓取网络。我们尊重机器人协议文本和其他一些我们许可并与之合作的数据源。让我们说大部分 IT 是通过网络爬虫完成的。尊重我们的方式。

尊重机器人,在每个人意识到我们必须开始尊重机器人之前就开始了机器人税。

我们事先就尊重机器人税。然后,在某些情况下,由于某种原因,它没有被正确地抓取。我们也已经纠正了这一点。

YouTube、Instagram 呢?

是的。是的,不。你知道,我认为在这个领域中,有些时候我必须在内部表现得很好。我实际上不知道他们是否尝试过,如果他们正在谈论这个问题,但有很多好东西,他们和 YouTube 也是如此。我的意思是,就像 YouTube 那样,就像一个关于如何修理世界上任何洗碗机的集体知识的存储库,人们会问,所以我会每次都看到最终会发生什么。

看起来你没有获得 Meta 数据中心服务的公平密钥。当你想到这种普遍的动态时,有很多生物认为人工智能对工作构成风险,或者认为人工智能已经取得了巨大的成功。请问,那是什么?你反对的是什么,以及悲剧性的作者群体说 Claude 模型是非法地针对他们的书籍进行训练的。

你认为有一个产品答案吗?这有点像我的第二个问题。但我只是想广泛地问一下,你认为你能做出一个足够好的产品来克服这些异议吗?因为这正是我现在从业界听到的含糊不清的论点。

我们看到了一堆聊天机器人,你可以让聊天机器人发布一堆公司信息,但总会有一个转折点,因为产品会变得如此好,如此有用,以至于人们会认为它是值得的。我还没看到这一点。我认为这是人工智能的艺术。

版权诉讼的核心,不仅仅是它的法律部分,还在于这些工具不够有用。任何人都能看出交易是否值得。你认为。

会有一个产品,很明显交易是值得的。

我认为这非常依赖于用例,以及什么样的问题,我用它来让我们的 Instagram 团队抓狂,因为我们总是问他们,你解决什么问题,一般的文本框界面可以回答任何问题,这是一种技术,也是产品的开始,但它并不是你正在解决的精确问题。

我认为扎根于此可能会帮助你找到答案,那就是,如果你试图构建的东西,例如,我一直在使用 Claude 来进行良好的辅助,它正在解决一个直接的问题,那就是我试图在这里完成产品管理工作,并让我们的产品启动,并从事各种不同的工作。在我有时间处于纯粹的构建模式时,我希望在这方面非常高效,就像那个直接相关的问题一样,并且是彻底的改变游戏规则者。我只是把自己看作一个建设者,这很适合我。

也关注不同的部分,就像在这次通话之前,有人告诉我,他们现在大量使用 Claude 来润色或更改他们在发送之前在 Slack 上的冗长信息。所以,就像这种人工编辑器,这种和平解决了他们的问题。就像我刚才说的那种直接的问题。

这可能需要一段时间,但我认为再次将其扎根于用例,因为我试图真正关注我们在这里的产品。如果你试图煮沸海洋,我认为你最终会陷入困境,实际上会陷入你提出的这些伦理问题,那就是。如果你在任何框中,那么一切都会受到威胁,或者像杰森一样,或者是有问题的。我认为说,好吧,我们想让人们知道我们在哪些方面做得很好?以及你今天如何做到这一点,产品实际上确实很好地服务于其中一些,以至于我很高兴它的存在,我认为人们总体上也是如此。然后我认为随着时间的推移,如果你看看更广泛的写作辅助,例如小说长度的写作,我认为陪审团仍在对此进行裁决,我的妻子正在做一种部分类型的版本,我告诉其他人,不,我认为我们的瓶子相当不错,但它们不太擅长跟踪像书籍长度的作品中的字符,或者重现粒子,我认为是的,我会扎根于此,以及我现在擅长什么,然后随着我们进入新的用例,现在要仔细考虑这些用例,例如谁实际上正在使用它,以及它是否为正确的用户提供了价值。

让我将这个问题具体化,并举一个更具体的例子,以便向你提出一个更具体的问题,同时也为了让那些已经给我写愤怒邮件的人平静下来。TikTok 存在。TikTok 可能是世界上创造的最纯粹的创新版权侵权花园。

但我已经在 TikTok 上看过完整的电影了,这仅仅是因为人们找到了绕过其内容过滤器的办法。我没有像我可能那样对 TikTok 的版权侵权感到同样的愤怒。也许有人真的生气了。

我在 TikTok 账户上看过完整的 1980 年代的《老房子》剧集,这些账户的标签实际上是“老房子精华”。我不认为 PBS 会因此获得版税,但这似乎还不错。我们认为 TikTok 作为一个整体具有如此大的实用性,人们甚至认为观看所有《老房子》剧集的实用性。

在这个平台将充满其他人的作品,我们将重视它的实用性之间存在某种动态。这似乎在于,大多数人都在观看实际的作品。我没有看某个 15 秒的片段,也不是人工智能聊天机器人表达的《老房子》的衍生作品,而实际上是在观看 1980 年代版本的《老房子》。你认为人工智能聊天机器人能否达到这样的程度,即我实际上只是在观看作品,或者我正在将我的注意力、时间或金钱提供给创作底层作品的实际人员,而不是我们用公开互联网上的数据对其进行训练,现在我们正在收费 20 本书,而退后 15 步的人什么也没有?是的。

我认为,同样要承认 TikTok 的例子,我认为还有一个方面,那就是如果你想象 TikTok 的未来。大多数人可能会说,好吧,也许会有更多功能,我会。

甚至更多地使用它,或者甚至。

不知道平均透明度如何,以及如何构建 AGI,创造普遍繁荣,这样我们就可以花时间,这将不是我首选的未来,如果你想构建的话。但我认为未来在 TikTok 的用例中感觉更可知。

我认为在人工智能用例中,更像是,好吧,这会加速到哪里?这最终会在哪里补充我?它会在哪里取代我?我认为人工智能相关的焦虑有很多可以与这部分联系起来,例如三四年以前,这项技术正在逐渐发展,三四年以前,TikTok 已经存在,你已经在这个轨道上了。

即使它不存在,你也可以从 YouTube 和 Instagram 的战争中想象出来。如果他们有一个有趣的婴儿和 Vine,它可能会有资格成为 TikTok。所以我认为这部分是因为这个平台如此娱乐性。

我认为这是和平。我认为与现实人物的联系是一个有趣的问题。我很想花更多时间在这上面,这是一个有趣且重要的部分,属于人工智能生态系统的一部分。而这部分只是像我们不知道它会走向何方,这可能是它扎根的三个方面。

更多的话题始于最初的世界,放弃了 OpenAI 来创建一家更安全的人工智能公司。现在有很多这样的公司。我的朋友凯西,他每周都会开玩笑说有人辞职去创办另一家更安全的人工智能公司。

Levi 有一句很棒的话。这是一个通用的排序函数,我们不得不偷走它。另一方面是,这在公司中得到了表达,但那就是我们显然制定了大型审核政策,对此进行了大量思考。作为一个平台,作为一个公司,它并不完美,但它肯定位于平台的核心。Anthropic 的核心是否也以同样的方式存在,你会。

不会做的事情,是的,我对此思考得很深,而且我一周内也这么做了,所以我是一个以航运为导向的人,你知道,即使在 Instagram 的早期,我也想,让我们不要陷入困境,而是构建 50 个功能,而是做好两件事,并尽快发布。其中一些决定是在一周前发布,并且你知道,没有每一个未来。我认为我们实际上存在,这就是公司的标题。

所以我骨子里就有这种感觉。所以两周前,我们的研究团队发表了一篇关于我们模型解释的论文。而这篇论文中隐藏着一个想法,那就是他们发现模型内部的一个特性,如果放大,它会让 Claude 相信。

那就是金门大桥。不仅仅是那种相信我,嘿,你是金门大桥,而是像我五岁的孩子一样,会让一切与乌龟有关。就像我让一切与金门大桥有关,我今天关心你。

就像,我感觉很棒。我感觉像国际橙。而且,感觉像是身处迷雾之中。重点、范围和我们团队中有人说,嘿,我们是不是应该发布黄金门俱乐部?这几乎成了一个常见的评论,我们中的一些人表示,绝对是的。我认为这样做有两个原因。

首先,这实际上很有趣,但让大家实际接触一下参数经过调整的模型,其效果非常有价值。因此,从那个IRC消息到在网站上发布黄金门俱乐部,我想,基本上只用了24小时。在那段时间里,我们必须进行一些产品工程和模型工作,但我们还进行了一系列安全评估。

我认为这是一个有趣的案例,你可以快速行动,但并非每次都能在24小时内完成安全评估。其他类似的,比如针对新模型的评估,这个模型是衍生出来的,所以更容易。但事实上,这甚至不是一个问题,比如我们应该运行什么以及其他什么?

就像,不,绝对的。就像我们在发布模型之前所做的那样,我们确保它对我们已知的事情是安全的。让我们也模拟一下一些新的危害。例如,金门大桥与自杀事件不幸地联系在一起。让我们确保模型不会引导人们走向那个方向,如果它那样做了,就应该设置正确的安全措施。

这是一个比较简单的例子,因为它只是一个为期两天的复活节周末的额外工作,然后就结束了,但这在本质上非常重要,即使在我们准备模型发布时也是如此。再说一次,我有一种紧迫感,比如让我们把它发布出去,让人们使用它,然后你就会发现,好吧,从模型准备好到发布,我们想做一些事情来确保我们符合我们的负责任扩展策略。我欣赏产品和研究团队在这里所做的事情,这并没有被视为一种阻碍,而且我真的很感激,这就是这家公司存在的意义。

嗯,我不知道我是否应该分享这个,但我还是说了。就像在我来这里的第二次全体员工会议上,一位非常早期的员工站起来说,如果我们完成了我们的使命,但公司失败了,我会认为这是一个好结果。我认为你不会在Instagram听到这样的话,不是因为我们都是坏人,而是因为这与我们的目标不符,你知道的,像成功并帮助人们以更美丽的方式看待世界,但如果每个人都失败了,那将是超级糟糕的。

我认为这里很多人也会觉得非常糟糕。但这种精神是相当独特的。我认为这引出了……

解码器的提问。因为,因为你们被称为公共利益公司,所以这里面存在信任。你们是第一个拥有生产……

你将产品和研究团队描述为与众不同,这里有一种安全文化。这一切是如何运作的?Anthropic 的组织结构大致如何?

我们有研究团队。我们有一个最接近研究和产品的团队,这个团队负责推理和模型,交付实际服务这些模型所需的一切,因为在很多情况下,这最终是最复杂的部分。然后是我们有产品,我想说,如果你愿意,只是把产品切掉。

团队,它看起来类似于大多数科技公司中的产品团队,但有两个例外。一个是,我们有一个实验室团队,这个团队的目的是尽早地将他们纳入研究过程,与设计师和工程师一起开始原型设计,而不是等到研究完成。我认为他们可以解释为什么我认为这是一个好主意,这是一个在我加入后立即组建的团队。

然后我们还有另一个团队,我们的研究产品经理团队,因为最终,我们正在使用这些不同的服务交付模型,而模型的能力,比如它们擅长什么,你知道的,就多模态而言,或者它们理解哪种类型的文本,甚至理解它们需要擅长哪些语言,以及用户反馈,所有这些都反馈回研究,这非常重要。啊,它可以防止它变成这样,就像,我退休了,我们构建了这个模型,它有用吗?比如我们说,它擅长代码。

我们是否真的了解使用它进行代码编写的初创公司正在提供反馈?好的,它擅长这些用例。它不擅长这个,那很好,因为这会反馈回来。所以这些是不同的部分,不像在产品内部,你知道的,我想我现在深入讨论代码和团队结构。我们有应用程序,比如Claude for Work,我们有开发者,也就是API,然后我们有我们的Cookie实验室团队,以及……

所有这些都只是产品方面,研究是负责实际模型的……

是的,它负责实际模型。你知道,从研究模型架构,弄清楚这些模型如何扩展,到强大的红队、安全和对齐团队。这就像另一个深入研究的组成部分。我认为一些最好的研究人员都倾向于此,因为他们认为这是最重要的。

他们认为他们可以研究有多大……

并且尝试雇佣人员,上次统计大约有700多人,并且……

研究或功能与……

产品功能之间的关系是什么?产品方面,我认为可以说翻了一番,几乎翻了一番,产品方面刚刚超过100人。所以其余的都在两者之间,我们也有销售部门。但是研究,研究的发现,一部分是推理,然后是安全和扩展部分。

所以我们,我将此描述为在我加入时,就像那些有一只超级大钳子的螃蟹一样,我们非常重视研究人员和我的产品。这仍然是一个非常小的类别,或者另一个比喻是,你知道的,你的青少年,你的某些肢体比其他肢体长得快,有些还在赶上。有点像疯狂的赌注,我希望我们不必再将产品团队规模翻倍。

我希望我们能够找到利用Claude的方法,使我们在产品上的所有工作效率更高,这样我们就不用翻倍了,因为你知道,每个团队都会为此而挣扎。所以这不是一个新颖的观察。但我回顾了Instagram,当时我们只有5名工程师,我们比250名工程师更有生产力吗?几乎肯定不是。

我们会比125到250名工程师更有生产力吗?略微高一些。你知道,我曾经做过一次非常令人沮丧的面试,我试图招聘一位VP,我说,你怎么看待效率提升和团队增长?如果我招聘的每一个人至少都能净贡献一些东西,即使只是微不足道的数字,比如一对一的比例,那也令人沮丧。

就像,我认为你疯了,所有其他类似的,像在海上团队文化稀释一样。这正是我个人关注的事情。我们如何利用我们对这些模型如何工作的了解,实际上让团队规模保持更小……

嗯,更技术化。是的,托尼,他制作了iPod,他之前在创办The Verge时说过,他基本上说,你看,你会从15到20人发展到50或100人,然后一切都不一样了。我每天都在思考这个问题,因为我们总是处于这个临界点附近。

那么,临界点在哪里?在结构中,适度存在于何处?你提到了模型方面的安全问题,但你正在市场上构建产品。

你有一个听起来非常像金门大桥的东西。人们可以与之交谈,你在哪里进行测试?对不起,我的每一次谈话都会有一个笑话。

哦,亲爱的,模型在哪里,适度存在于哪里,对吧?在Instagram,有一个大型的中心化Meta信任和安全功能,在YouTube,它位于产品组织中,在中立……它对你们来说在哪里?

我可能会把它放在三个地方。一个是在实际的模型训练和微调中,我们在强化学习方面所做的一部分工作是说,我们想为Claude在世界上的行为方式找到一个准则。这会被融入模型本身,比如早期,比如在它之前,你知道的,在你点击系统提示之前,在人们与它互动之前,这会被编码到那个运行中。

比如,你应该如何,你知道的,我应该如何表现,我应该愿意回答并愿意继续下去,它不应该在哪里?我认为这与负责任的扩展密切相关。下一个是在实际的系统提示中。

所以我们实际上,本着透明的精神,刚刚开始发布我们的系统提示,人们总是会想出聪明的方法来尝试反向工程,而且,这会……为什么我们不把它当作变更日志来对待呢?所以要透明。

所以,上周的事情,你可以上网查看我们做了哪些更改,这是我们向模型提供关于如何行动的额外指导的另一个地方,当然,正如我之前提到的,人们总是会找到方法来规避它。但我们相当擅长防止爆发。然后最后一部分是我们信任和安全团队设置的,你知道的,信任和安全团队是最接近的团队。

在Instagram,我们曾经称之为信任和安全,或者在另一个时候称之为……但它是一种类似的最后一英里补救措施。我会把这项工作分成两部分,一部分是人们在用Claude做什么并发布到世界上?所以对于Artifact,这是第一个产品。

我们根本没有任何社交功能,你创建文章,每个分享实际上都会把它放到网上,这是一个非常重要的碳问题,而且有点像共享内容。我花了近十年的时间在Instagram上处理共享内容,然后我发现,等等,人们使用了他们的名字,他们是如何被举报的?他表示,我们因此推迟了发布。就像,但我们必须确保拥有正确的TNS。

围绕审核、举报线索的信任和安全部分,围绕将其删除,比如有限的发布,弄清楚这对团队成员意味着什么,为这些人制定计划。就像这些事情让我非常兴奋,让我们发布这个,比如分享Artifact,就像我们很清楚,好吧,现在我们可以发布了,但我们必须解决这些问题。它位于内容审核方面。

然后在响应方面,我们还有其他部分在那里,要么是围绕防止模型复制受版权保护的内容,这正是我们想要阻止的,要么是从完成中阻止其他危害,然后是其他危害,你知道的,与我们认为模型应该如何表现的方式相违背,并且应该早点被切断。但你知道,如果它们没有被切断,那么它们会在最后一英里被抓住。所以,我们的信任和安全主管上周与他交谈过,因为你们使用了瑞士奶酪方法,这就像没有一层可以捕捉到所有东西,但理想情况下,足够多的层叠加在一起会捕捉到很多东西,在……

它到达终点之前,啊,我认为你知道,我非常担心互联网上AI生成的虚假信息,今天早上我看到丹佛邮报的一篇文章,关于一起谋杀案的虚假新闻报道,人们正在打电话给丹佛邮报,想知道为什么他们没有报道此事。这本身就是正确的结果,对吧?就像他们听到一个假新闻,然后他们打电话给可信的来源。

与此同时,丹佛邮报不得不去调查这个虚假的谋杀案,真实的犯罪故事,因为一个AI刚刚生成它并把它放在YouTube上。所有这些在我看来都非常危险。照片的消亡。

我们一直在谈论它。我们不再相信我们所看到的东西了。你对此怎么看?Anthropic 对此有什么看法?安全是显而易见的,但我们正在生成可以以各种方式被滥用的内容……

是的,我,我可能会像,跳进去,然后跳出来。就像我刚刚在世界上看到的东西一样,比如两周前发布的岩石图像生成工具,非常吸引人,因为它几乎就像,你知道的,我认为也许他们已经引入了一些,但在发布时,我觉得几乎完全是免费的,比如,你想看看拿着机关枪的考拉吗?它就是这么好。

你知道,疯狂的东西。我一会儿相信,像,实际上拥有这样的例子实际上是有帮助的,几乎是无辜的,比如你认为理所当然的照片是什么,或者不是,你知道的,或者不是,我认为我们离那也很远,并且像,你知道的,也许是打电话给丹佛邮报这样的可信来源,或者也许是创建一个我们可以追溯的信任等级。我也不知道简单的答案,但我想说,这是一个行业问题,一个逐渐形成的社会问题。

为什么我认为我们也会为此付出代价,就像魔法图像和视频片段一样。然后在文本方面,我认为随着眼睛的变化,就像大规模生产一样。因此,我们关注的一件事是任何类型的协调努力。

我们也研究了这个问题。在 Instagram 上,在个人层面,可能很难抓住那个在 Facebook 群组中发表评论、试图挑起事端的人,因为这可能是人类的本能行为。但我们真正寻找的是协调活动的网络。

我们开始,不,我们一直在 Anthropic 方面做同样的事情,那就是观察,而这将会发生在 API 方面的事情上,如果它发生在云端而不是云端,那么添加这种更有效、更高效的方式来处理事情的规模。但是当我们看到活动激增时,我们就可以介入并说,好吧,这最终会是什么样子?让我们去了解更多关于这个的信息,特别是 PI 客户。

你是否与他们进行了交谈?他们到底在做什么?用例是什么?我认为重要的是,作为一个公司,要明确你认为哪些是错误,哪些是功能,你知道吗?如果被采用的模型被用于任何类型的 AA 协调虚假新闻和选举干预之类的事情,那将是一个糟糕的结果。因此,我们有团队成员积极致力于此。并且,如果我们发现任何此类情况,我们将结合额外的模型参数以及信任和安全措施来关闭它。

我们需要稍作休息一下。

本期节目的支持来自 AT&T。用 AT&T 的 Next Up Anytime 获取新的 iPhone 16 Pro 是什么感觉?就像你第一次拿起那些歌曲,现在你是那个跑酷女孩,这是无法形容的,就像你从未有过的感觉。

所有令人垂涎的新可能性的期待,无论是制作完美的芝士汉堡,还是用 AT&T 的 Next Up Anytime 款待你的朋友一个巨大的土豆,你都知道这将永远改变他们看待土豆的方式。你可以一次又一次地体验这种感觉,了解如何通过 AT&T 上的 Apple Intelligence 获取新的 iPhone 16 Pro,以及每年使用 AT&T Next Up Anytime 获取最新的 iPhone。AT&T 连接改变一切。

Apple Intelligence 将于 2024 年秋季推出,设备语言设置为美式英语。

部分功能和语言将在未来一年内推出。零美元优惠可能不适用于未来的 iPhone Next Up Anytime 功能。Next Up Anytime 功能可能会随时更改,如有更改,恕不另行通知。适用其他费用、条款和限制。

详情请参阅 AT&T 的网站。本播客的支持来自 Stripe。支付管理软件并不是你的客户所考虑的事情。

他们通常会看到你的产品。他们想买它,然后他们就买了。这大概就是它的复杂性。

但在这一过程的幕后,发生了许多非常复杂的事情,这些事情必须正确才能完成销售。Stripe 承担了金融基础设施的复杂性,为企业主及其客户提供无缝的体验。例如,Stripe 可以确保你的客户在购物时看到他们的货币和首选支付方式。

因此,结账永远不会让人觉得像是一件苦差事。Stripe 是一个支付和账单平台,支持全球数百万家企业,包括 Cooler、宝马和 DoorDash 等公司。Stripe 帮助无数初创企业和老牌公司实现增长目标、在使命上取得进展、接触更多全球客户。

该平台提供了一套专门的功能和工具,以支持各种规模的企业,例如 Stripe Billing,它可以轻松处理订阅收费、发票和经常性收入管理。了解 Stripe 如何帮助各种规模的公司取得进步,请访问 stripe.com,即 stripe.com,了解更多信息,Stripe 助力进步。本节目的支持来自 Alex Partners。

你已经知道人工智能将具有变革性。除此之外,随着人工智能的兴起,科技行业可能还存在一些谜团。Alex Partners 致力于确保你的企业了解在人工智能方面真正重要的事情,因为颠覆不仅带来了挑战,也带来了机遇。在这些关键时刻发生变化,Alex Partners 是首席执行官可以信赖的咨询公司,它能够提供清晰的方向,最重要的是,能够实施。

当果断的领导力至关重要时,Alex Partners 为你的业务需求提供稳定的支持。Alex Partners 与来自北美和欧洲的近 350 位科技高管进行了交谈,以更深入地了解科技公司如何应对这些不断变化的逆风。你可以查看结果,并了解如何通过阅读 Alex Partners 最新发布的科技行业见解将数字化颠覆转化为增长,这些见解可在 www.alexpartners.com/vox 获取。网址是 www.alexpartners.com/vox。面对颠覆,Alex Partners 是企业值得信赖的伙伴,能够抓住重点,并在真正重要的时候完成工作。

我们请回改进后的首席产品官 Mike Krieger 来讨论他认为生成式 AI 的下一步发展方向,以及它是否会走向危险的境地。向我在 Hard Fork 的朋友 Casey 和 Kevin 道歉,他们问每个人他们的“预言”是什么。有人问过你这个问题,但这个问题根植于 AGI。例如,我们认为我们变得自我意识并最终消灭我们所有人的可能性有多大?我们首先问你一个不同的问题,那就是,如果所有这些都只是自我毁灭,比如信息末日,我们只是在消灭自己,那么我们需要 AGI 来消灭我们所有人吗?或者我们真的首先走向信息末日?

是的,我认为信息方面,生活在一个拥有如此大量内部信息而不使用 AI 的社会中,我认为已经存在,就像你主要通过文本社交媒体看到的纹理一样。我认为 Instagram 上也发生了一些类似的事情。但当它只是一段文本时,更容易传播。在过去十年中,这已经有点像一场从内到外的旅程。

但我认为它会来来去去,我认为我们会经历这样的浪潮,哦,天哪,我们怎么能找到真相呢?然后,优秀的真相讲述者出现了。我认为人们会追随他们。

我认为一些传统的权威来源,其中一些只是人们信任的人。然后我们可以就牙医的验证和确认进行单独的讨论。但我认为,从一个乐观的人的角度来看,如果你能分辨出来的话。

我认为这部分是我的信念,从信息混乱或扩散的角度来看,我们学习、适应以及建立适当机制的能力。因此,我仍然乐观地认为,在这方面,我们将继续找到解决办法。我认为 AI 部分增加了音量。

你必须相信的一件事是,它也可能增加一些通过性。我想说的是,威廉姆斯几年前出版了一部新的史蒂文斯小说。我有点觉得有人是其中之一,他们中的两个人有这样的概念:在未来,你可能会有你自己的社交媒体编辑,它会被部署,你知道,作为一种在所有外部信息和你正在消费的信息之间起门控作用的功能。我喜欢其中一个吸引我的地方,那就是,如果要消费的数据量巨大,可能大部分都不会对你有用。

而且我甚至一直在努力减少我自己的信息摄入量。如果有些事情很有趣,你知道,我喜欢这样的想法:去读读这个东西。

就像,这是值得的。机器人算法、分类器、过滤器和社交媒体可以帮助你看到东西。你现在处于一边,因为你只是制造东西,你试图不制造坏东西。其他公司,谷歌和 Meta,则处于等式的两边,对吧?我们正在快速推进生成式 AI,我们正在快速推进 LLaMA,然后我们必须在另一边建立过滤系统来阻止坏东西。感觉这些公司与自身的目标背道而驰。

我认为问题是,我不知道这是否发生在我们身上,我自己也不知道他会说什么,比如多少百分比的内容应该不,是的,至少现在是从……

从你在 Anthropic 的位置,了解另一方的运作方式,你是否正在做任何事情来使过滤更容易,或者你是否正在做任何事情来使其更具语义性,让你更了解你正在查看的内容,以便系统对内容进行排序,从而更容易理解什么是真实的?

是的,在研究方面。现在这超出了我的专业知识,比如积极研究哪些技术可以使其更容易检测,标记的可能性。我认为这是一个悬而未决的问题。但它也是一个非常活跃的研究领域。

我认为其他部分,嗯,实际上是三件事,比如我们可以从检测、水印、模型决策方面做些什么,还可以更好地表达不确定性,更好地了解,你知道,关于这一点,不愿意推测,或者实际上不愿意帮助你过滤这些东西。所以我不知道我无法分辨哪些是真的。这也是一个开放的研究领域,一个非常有趣的研究领域。

然后最后一个是,如果你遇到了这种情况,如果你谷歌,那么最好的情况可能是,如果你主要提供的是你正在构建的模型生成的內容,那么你可能会有更好的睡眠。我不知道这是否会奏效,或者人们是否总是会追逐最有趣的图像生成模型,你知道,创建并发布它,然后让它大火。我不确定,我认为这个问题还有待观察,但我相信内置工具,在 Instagram 上,9% 以上的经过过滤的照片是在应用程序内部进行过滤的,因为这只是最方便的事情,并且通过这种方式,一个封闭的生态系统可能是至少获得一些生成内容可验证性的一种途径。

Instagram 过滤器在这里是一个有趣的比较。Instagram 最初是照片分享,发展迅速,如果他来到 Instagram,这将是我们文化中占主导地位的一部分。过滤器对人们的形象产生了真正的影响,产生了真正的负面影响,特别是对十几岁的女孩以及她们对自己的看法。

一些研究表明,由于她们认为 Instagram 糟糕,十几岁的男孩也开始出现越来越严重的自我形象问题和体型形象问题,对吧?在这种糟糕的等待与普遍的良好实例之间,更多的人可以表达自己,我们建立了不同类型的社区。你如何看待 Anthropic 产品的这些风险?

我合作过的教练总是会推动我,好吧,我想,我想从信心开始,尽可能多地产生影响,而不是说,好吧,没有宇宙账本能让你确切地知道你产生的影响,首先。

其次,积极或消极的等式是什么?我认为处理这些问题的正确方法是谦逊,然后是随着事情的发展而理解。但对我来说,我很兴奋,并且总体上对人工智能及其潜力非常乐观,如果我要积极参与其中。

我想去一个风险和缓解措施与创始故事一样重要、一样基础的地方。也许带你回到我为什么加入的原因。这就是我为自己平衡的方式,那就是,你需要有这样的内部运行循环。

这是否是正确的事情?我们应该发布这个吗?我们应该以某种方式改变它吗?我们应该添加一些约束吗?我们应该以某种方式解释它的局限性吗?

我认为我们必须认真对待这些问题,否则我认为你会陷入这样的境地,好吧,你知道,这显然是一股向善的力量。让我们把它放大,全力以赴。我觉得在 Instagram 上看到这一点后,我错过了这一点。你可以构建一个评论系统,但你也需要构建我们构建的欺凌过滤器。我认为这是……

第二个解码器问题。你如何使用这个框架做出决策?

实际上,也许我会先说一下,Anthropic 的文化非常注重思考和文档写作。因此,如果需要做出决定,通常会有一份文档来支持它。这表明,当我加入时,我很好奇,为什么我们选择这样做?人们说,哦,是的,为此有一份文档,每件事都有文档。

然后这帮助了我的祖父。但有时我想,为什么我们还没有构建这个?哦,是的,是的,我两个月前才读到关于这个的文档。

我们对此做了什么吗?因此,我的整个决策过程是,我希望我们更快地找到真相,我们个人都不知道什么是正确的,找到真相可能是……让我们从技术方面入手,如果是在产品方面,就构建一个技术原型。

让我们把它交给某人,比如 Figma 模型很棒。但是,你如何在屏幕上移动?因此,将迭代时间和假设检验时间最小化是我的基本决策理念。我试图在这里的产品方面安装更多这样的东西。

再说一次,这是一个经过深思熟虑的答案,因为我不想丢失大部分内容,但我确实希望能够加入更多假设、测试和验证的组成部分。我认为人们会觉得,哦,是的,我们已经研究这个有一段时间了,但是,我们实际上构建了它,结果证明我们是对的。实际上,还有第三个方向更正确。相反,我们经历了各种战略框架。最能引起我共鸣的一个是“玩转获胜”(Playing to Win)。

我经常回顾这一点,也在这里安装了一些,因为我们开始思考,你知道,比如最终目标是什么?然后我们要往哪里走?更具体地说,我们谈到了场景,甚至我们今天的谈话,比如我们在哪里竞争?因为,我们团队规模不是最大的,我们的聊天UI使用率也不是最大的,我们的模型也不是使用最多的。

在这个领域,我们有很多有趣的参与者。我们必须仔细考虑我们在哪里竞争以及我们在哪里投资。是的,然后今天早上在一个会议上,大家花了前三十分钟都在为战略而痛苦。

问题是,战略应该是痛苦的。你会忘记这句话的后半部分,那就是你会在战略上感到痛苦,比如做出一些权衡。但也要认识到,就像在Instagram,我们总是谈论少做一些事情,但把事情做好。这是公司的基础原则。

权衡是什么?痛苦是什么?

权衡是……陷入过多的技术细节,比如下一代模型的基本情况,比如我们正在进行哪些具体的优化,你知道的,准确地捕捉它们喜欢什么。它会让一件事做得非常好,而其他事情只是还可以或相当好。

我认为真正做得好的事情,我认为是一件大事,将会非常令人兴奋,是的,但是,你知道的,是的,但是,所以我实际上正在准备一份简短的文件,我们可以都签署,否则听起来像是作弊,或者说,我们正在进行这种权衡。这是含义。这就是我们如何避免犯错。以下是如何重新审视这个决定的方法。

我希望我们都能,至少在谷歌文档中注明,就像这是我们对这件事的承诺,否则你最终会在下周说,但是,你知道的,就像那次访问一样,即使是不同意也要承诺,要感受痛苦,要理解它,不要盲目地永远坚持下去,因为我坚信,当涉及到艰难的决定时,即使是那些感觉像是双向门的决定也是如此。双向门的问题在于人们会不断地在它们之间来回走动。所以,走到门前说,我愿意再往回走的最早时间是,你知道的,两个月后,或者有了这个特定的信息,并希望能够平息,即使是内部的批评声音,比如这是一个双向门,总是会回去的。

我认为这引出了一个我一直试图问的问题,神经模型,你在Anthropic工作,你正在构建产品并帮助这些模型。我还没有被说服,认为这项技术能够做到人们所说的所有事情。但我个人的悲观情绪是,我不知道你如何从这里到达那里。

我不知道你如何从语言模型到人工智能。我看到它擅长语言,我没有看到它擅长思考。你认为大型语言模型能够做到人们希望它们做到的一切吗?

我认为当前一代,在某些领域可以,在其他领域不行,我认为也许我们这里有一个有趣的产物,那就是我非常相信我们的研究人员。但关于默认值,你知道的,默认值信念是,生活中的一切都需要更长的时间,一般来说,在研究和工程中也是如此。我们认为它确实如此。

我喜欢做这种思维练习。团队,也就是如果我们的研究人员,比如,得了翅膀,都睡着了五年,我仍然认为我们有五年的产品路线图。

我们会说,我们在工作中表现很差。我们在工作中表现糟糕透顶。我们可以想到所有的事情,即使在我们目前的模型中,也可以在改进工作、加速编码、制作东西方面做到。这些是协调工作,甚至是在调解人与人之间的纠纷。

只是想想这是一个有趣的LLM用例,我们曾经见过,在联盟中出现,就像这两个人有这种信念,比如帮助我们甚至提出正确的问题来让我们到达那个地方,一个很好的发声板,还有很多东西嵌入在当前的模型中。我同意你的说法,对我来说,我认为最大的开放性问题,我认为基本上是四个更长期的任务。你能愿意给予模型的独立性范围是什么?我一直在使用的比喻是,现在,大型语言模型聊天非常像……

你必须来回互动,因为你必须纠正自己。你必须现在就纠正它。我的意思是这个。

对我来说,一个很好的极限测试是,我什么时候可以给Claude发邮件,并且通常期望一个小时后它不会给我与在聊天中给我的答案相同的答案,这将是一个失败,但它会做更有趣的事情,并找出一些事情并进行迭代,甚至进行自我批评,然后回应,而且我认为我们离某些领域还很远。我认为我们离其他领域还很远,特别是那些涉及到某种程度的长期规划或思考或研究的领域。但我用它作为我的能力衡量标准。

它不像,你知道的,参数大小。对我来说,它更像是一个特定的事件。它就像,再说一次,你正在解决什么问题?现在,就像我和我们的团队开玩笑一样,现在,与Claude交谈就像与一个非常聪明且容易相处的人交谈一样。

我喜欢每次我们开始新的对话时,就像,你又是谁?我在这里是为了什么?我们之前在做什么?它就像,好吧,我们可以保持连续性吗?我们可以,必须能够规划并在更长的时间内执行?你能开始信任它来做更多的事情吗?因为我每天都做一些事情,而且,你知道的,我花了一个小时做一些事情,我真的很希望我不必做这些事情,而且这很浪费我的时间。

但我认为Claude现在还不能做到这一点,因为它需要大量的支架,现在,也许有一种更简洁的方式来表达它,就像现在,执行更复杂任务所需的支架并不总是值得权衡的,因为你可能自己就能做到,我认为这是一个城市漫画,呃,花时间自动化某些事情与你实际节省的时间相比。像这样的权衡在AI曲线的不同点上是不同的,我认为这将是赌注,我们能否缩短这种价值实现时间,以便你可以信任它来做更多的事情?可能没有人真的会兴奋地把,你知道的,所有的规划文档、我的产品、正在进行的工作都放到一个文档中,对吧?主题叙事,然后分发给这三个人,而且我今天不想做这件事。我今天必须做,但我不想做。

但让我用更数字化的方式告诉你。我正在查看Anthropic的一些数字。去年70亿美元的融资,Anthropic去年获得了超过70亿美元的融资。

你是世界上为数不多的曾经构建过能够带来70亿美元融资回报的产品的人之一,而且规模很大。你可以真正想象一些可能带来投资回报的产品。今天的LLM可以构建这些产品吗?

我认为这是一个有趣的问题。我思考这个问题的方式是,今天的LLM确实提供了价值,但它们也提供了或帮助我们提供了构建能够提供这种价值的产品的能力。

实际上,问题是哪些产品能够提供这么多的价值?

但对我来说,它就像,现在Claude是一个助手。你知道,乐于助人的伙伴,我曾在某个时候在内部听到过,就像,在什么时候它会成为一个同事?因为即使在经济增长的情况下,借助助手能够完成的工作量,我认为是非常非常大的。

所以我经常考虑Claude用于工作,现在Claude用于工作是一种思考方式。你可以输入文档,你可以思考事情并进行对话。人们发现价值。

有人构建了小型视觉反应器,他们在推特上发布了。我当时想,这没有使用Claude,但我被告知是为它做的。所以,当它现在是一个你实际上信任的实体,能够在公司内部自主执行工作时,这听起来像是一个不切实际的想法。

我实际上认为产品的交付比人们想象的要少得多。这是关于权限管理,这是关于身份,这是关于协调,这是关于问题的补救。所有这些都是你在培训一个优秀的人,让他们胜任工作时所做的事情。就像那样。

对我来说,即使是在特定的学科内,比如一些编码任务,一些涉及信息选择或研究的特定任务,比如每一个都像是在你的团队中增加一个增量人员,即使他们不是这种情况,我也没关系,在这个时候,净生产力不是加一,而是2.5。但也许有一些,并且协调起来。我认为,我非常看好这方面的经济潜力。

那就是每月20美元的企业订阅产品。

我与某人就这个问题进行了辩论,比如,如果你提供这种价值,那么价格点要高得多。我和某人就雪花数据中断进行了辩论,这些数据显示了数据狗。另一个,比如基于用量的计费,就像,你知道的,新的热门事物,我们有订阅计费。

你喜欢基于用量的计费,而我希望我们能够做到的一件事,虽然现在很难量化,但那就是基于价值的计费。你用它实际完成了什么?我知道有些人会批评我们,因为一个常见的抱怨是人们有使用限制。

就像,我想要更多的Claude。我看到有人说,我有两个Claude。我有两个不同的浏览器窗口,我们必须在这里做得更好。但他们愿意这样做,他们写道,他们说,看,我正在为客户准备一份简报。

他们付给我X美元,我愿意很乐意再支付100美元来让我完成这些事情,以便按时交付并继续下一个项目,对我来说,这就像一个早期迹象,表明我们适合在哪里,我们可以在哪里提供超越20美元订阅的价值。但当我想到部署的Claude时,这是一种早期的产品思维,你知道的,但这是让我兴奋的事情,能够思考你正在提供的价值。随着时间的推移,我认为这只是创造了一种非常,你知道的,完全一致的激励机制,在交付该产品方面。所以我认为这是我们可以随着时间推移达到的一个领域。

有人把以下内容带了回来。我们从分销开始,以及思考是否如此量身定制的分销,以至于它们在其他环境中不起作用。我环顾四周,看到谷歌正在分发Gemini,以及它的产品。我看到苹果正在分发Apple Intelligence及其手机。

他们谈到可能在我们的可变性中加入一些模型,现在它是一个开放的习惯,也许Gemini会出现在那里,也许Bard会出现在那里,这感觉像是大型分销,他们只会采用它。除非他们向其他人支付其他货币单位,否则人们将拥有这些体验。在计算的历史上,通过现有系统免费提供的东西往往非常成功。

你是如何考虑这个问题的?因为如果你只是说,我不认为OpenAI会从Apple Intelligence中获得任何资金,我认为苹果只是认为有些人会为20美元订阅Apple,这将和……你是如何考虑这个问题的?你是如何考虑扩大这种区别,而不是为了……

其他人的想法而优化?是的。我喜欢这个问题,我经常被问到这个问题,即使是在内部,比如我们应该更努力地推动什么非凡的体验?我同意,很难超越那里的数十亿美元的模型提供商,你知道的,即使我们的模型可能更好。

我更兴奋的是将它作为一种实用工具。我们能否更好地贴近你的工作和工作产品,拥有比构建那种东西更好的历史,比如Pages附带的。很多人都在Pages上工作。

我在这里不知道,但仍然存在对Google Docs甚至Notion的真正价值,以及其他人,我可以深入研究特定类型的生产力。所以我认为这就是为什么LLM更能帮助人们完成工作。其中一些将是移动端的,但几乎可能作为伴侣提供并交付几乎不需要完全集成到分销渠道中的价值。

我认为,作为一个独立的公司,试图成为那种……那种第一通电话,那种理论,我听过初创公司的宣传,甚至冰箱里也有,就像我们要做到那样。我们将做得更好,新的操作按钮意味着您可以调出它,然后按向上键,哦,我的天哪,不。默认设置真的很重要。

他们就像Instagram从未试图取代相机一样。我们只是试图让您可以做的事情变得非常好,就像一旦您决定要做什么一样,而不是所有这些,用这张照片。然后,当然,人们在那里拍照。

但到了最后,当我们离开时,它就像85%的图库,50%的相机,对吧?就像这真正的价值,就像只需要一次点击的东西。所以这很有趣,因为我知道每次WWDC到来时,Instagram,我喜欢观看那些公告。

但他们宣布了什么?然后就像一些变化,或者他们宣布了什么,我意识到,他们将在某些方面做得非常好,在某些方面做得很好。苹果将在某些方面做得很好。你必须找到你可以在跨平台的方式中、在体验深度的方式中、在一种新颖的方式中进行区分的地方,或者愿意做一些公司不太愿意做的那种工作,因为也许一开始,它们看起来并不那么具有可扩展性。

其他消费者可扩展的,价值70亿美元的消费者产品并不依赖于内置到您的手机中。

我的意思是,我经常打开应用商店和ChatGPT。其次,我不知道他们的用户数量是多少。我认为现在还不错。但从长远来看,我认为……是的,实际上我乐观地认为是的,因为我认为他们甚至在一段时间内混淆了移动和消费者,这不是一个非常公平的混淆。但我将选择第一,第二,这仍然是我们生活中发生的大部分事情,无论是LM+推荐、LM+购物还是LM+约会,我都必须相信至少一个重要的组成部分可以是一个70亿美元的LM+业务,但不是一个试图有效地成为Siri++的业务。我认为这是一个很难待的地方,是的。

对此的开放式答案似乎是搜索,就像我需要披露一样,每家媒体公司都在拿钱。我没有什么要……人们知道,但我们拿了钱……感觉就像要去搜索,对吧?如果你能占据谷歌的某个百分比,如果你有一个不错的业务,那是因为……德拉告诉我,当他们推出聊天时,权力很大,就像谷歌的任何0.5%都是对业务的巨大提升。

你会构建一个搜索产品吗?我们谈了很多关于推荐的事情。是的,我的意思是推荐和搜索……

就在那里,是的,它不在我短期内考虑的任何事情中。我很想知道。我可能没有……出于充分的理由。所以虽然我知道……我们几乎不能。

所以我必须玩它,但就像那个空间,你知道困惑的弧线聊天搜索……他们实际上……我的意思是,回到我们谈话的开头,那就是世界上的搜索引擎总结和引用。但你知道,可能点击次数更少,那会是什么结果?你知道这一切是如何联系在一起的,以及它是如何连接的,它与我们试图做的事情的核心关系不大。

所以听起来现在要专注于工作,对吧?有很多工作产品你正在考虑,也许不是那么多消费者产品。我想说的是,在企业中,如果你的企业软件只是解决方案,那很糟糕,这可能和消费一样冒险,而且看起来那些人如果发送一些业务线索,因为软件产生了共鸣,他们可能会更倾向于看到你。

你能解决这个问题吗?很多人告诉我,LMS总是辛迪,我们只是在控制全局。我应该停止问那些可以停止污染的人。

因为这个问题毫无意义。你是这样想的吗?你能控制它,以便你能构建可靠且有价格的产品吗?

我认为我们有一个非常好的商店。最近出现这种情况的两个地方,一个是……我们当前的……Aleem经常会试图做坏事,因为它们实际上……鉴于架构,它们在数学方面令人印象深刻地好,但并非总是如此,尤其是在涉及选择更高层次的事情时,甚至是像计算字母和单词这样它们应该能够做到的事情。

所以,就像我们最近发布的一条推文帮助Claude一样,Claude在……识别它处于这种情况时并解释其缺点……它完美吗?不。但这在特定方面有了显著的改进,因为来自一家企业……一位企业客户说,嘿,我试图做一些CSV解析。

我宁愿你给我Python代码来分析CSV,也不要自己尝试,因为我不相信你会自己做对。所以我认为在数据分析代码解释方面,我认为这是一种结合了可用工具的方法,例如,人类很聪明。我仍然一直使用计算器。

事实上,随着时间的推移,我觉得我的心算能力越来越差,甚至更差。所以我认为有很多价值在于,嘿,提供工具给老师使用工具。很多研究团队专注于……然后真正强调时间工作,就像,是的,我知道如果你认为你可以做到这一点。我开的玩笑是,CSV版本就像……我可以……我可以调用NumPy函数并给你……我的平均值可能不会完全正确。所以我宁愿……知道平均函数……在数据方面,在引用方面,最近最能做到这一点的应用程序是……

除了……我们一直听她的育儿建议,就像贝基医生一样……有一个新的应用程序问世,我真的很喜欢玩ChatGPT,所以我真的试图推动他们……我非常努力地推动这个,围绕着……试图……你好,阿多尔……谈论……它不熟悉……我必须去和制造商谈谈,实际上在推特上感谢他们。他们做得很好,如果它对信息在其检索窗口中没有足够的信心,它就会拒绝回答,它不会编造,它不会去那里,我认为这是一个……答案也是如此。就像模型智能加上数据加上正确的提示和检索的组合一样,除非实际上在上下文窗口中有一些有根据的东西,否则你不想让它回答,这在说明方面有很大帮助。

可能不会。但我认为我们所有人都会犯错,希望这些错误是可以预测的。所以你可以说……危险区域,就像……超出我们的……我们的……我们的和平。

甚至像……甚至有一些……像语法高亮显示的想法,就像……这是从我的上下文中总结出来的。这是来自我的模型知识。这是超出分布的……危险,罗宾逊。

我不确定这是否正是我……我不确定我到底在说什么。也许那里有一些东西。

所有这些都加剧了我的感觉,即提示工程,然后像教一个模型如何控制自己一样,感觉是不确定的,并且……就像未来的计算一样。这就像行为不端的孩子,我们只需要控制它,然后他们就能像培养人一样折磨计算机,我们就能像培养人一样折磨自己。

这对我来说太疯狂了,即使你要发布系统提示,我也读过系统提示,我喜欢……如果我要像苹果系统流程一样做,不要胡闹,就像那样。这就是我们如何做到这一点。你感觉对吗?这感觉像是计算未来的稳定基础吗?

这是一个巨大的调整,我真的是一个工程师。我通常喜欢确定性。不,就像我们在Instagram上遇到一个疯狂的问题,我们最终追踪到使用非ECC内存。

而微小的宇宙射线正在翻转内存,就像……你得到了什么?就像潜水。我想依赖我的硬件。

这是……这是……这是行动时刻,也许在这个角色的四周后。好吧,我可以看到……危险和潜力。我们正在与客户合作构建一个系统。

我们谈论了工具。你开始说模型可以访问什么,在这种情况下,我们为模型提供了两个工具。一个是待办事项应用程序,我可以写入。

还有一个是……提醒,有点像短期或……时间类型的东西。待办事项系统宕机了。就像,哦,我的天哪,我试图使用待办事项……我做不到。

你知道我要做……我要设置一个计时器,提醒你这件事……如果是这样,我设置了第三次……48小时的时间……你永远不会在你的手机上这样做。那太荒谬了。但我向你展示了不确定性也会导致创造力。

而这种创造力,就像面对不确定性一样。最终我认为我们将能够解决这些更高阶、更有趣的问题。这就是……就像,它不是确定性的,但我爱你。

所以它不是确定性的,但我可以把它放在这些奇怪的情况下,它会尽力恢复……面对不确定性而行动。如果是我写的,我永远不会想到这种特殊的解决方法。但我认为……非常有创意的方式。所以我不能说它完全让我感到轻松,因为我仍然喜欢确定性和可预测性以及我们寻求的系统,在我们可以找到的地方寻求可预测性。但我认为我也看到了……在那种约束下,有了正确的工具和正确的基础设施,它如何能够更强大地应对现实世界中必要的混乱。

你正在构建产品基础设施,显然正在考虑大型产品以及你如何构建它们。人们应该从Anthropic期待什么?什么是……什么是我们应该关注的产品重点的危险点?

是的。在云方面,你知道,在……我们谈话的时候,我们在发布面向企业的Claude。所以这就像我们正在努力深入……表面上一些令人兴奋的缩写,例如SOO和SKIM,以及没有……没有经理的审计。

但重要的是,你开始深入到……真正深入的用例中,重建数据迁移……这也很有用。还有整个组件。在API方面,我不应该过多谈论API,尽管……我认为这和我们正在做的任何其他事情一样重要,大型推动,我们如何将大量数据输入模型?模型也是我。

它们很聪明,但我认为如果没有好的数据,它们就没那么有用,就像……用例,我们如何将大量数据输入其中并使其真正快速?所以我们上周推出了显式提示缓存,并带有风险。当你获取一个非常大的数据存储,将其放入上下文窗口,比以前快十倍地检索它,寻找模型可以更接近人们实际感兴趣的数据的那些方法。

再次,一如既往,回到我们的效果,并让你在那一刻以速度和低成本获得个性化的有用答案,就像整个推动一样。我经常考虑好的产品设计如何在某些方向上推动极端,就像……这是大量数据,但也推动极限,看看极端,看看当你结合这两个公理时会发生什么。这就是……能够……继续。

推动其余部分。是的,这太棒了。

我可以一直谈下去。

我想感谢迈克抽出时间参加解码器,并感谢您的收听,我们很享受它……让我们知道您对节目的想法,以及您希望我们涵盖的其他任何内容,请给我们发邮件,您可以发送电子邮件至[email protected],我们会阅读所有电子邮件,或者您可以在Threads上联系我,@reckless_travel。我们也有一个TikTok,它是@tiktok.verge。

这很有趣。解码你的朋友,并在你收听播客的地方订阅。解码器是The Verge制作的,是Vox Media Podcast Network的一部分。我们的制作人是凯特·考克斯和尼克·斯塔特。我们的编辑是卡莉·赖特。我们的主管制作人是利亚姆·詹姆斯。

解码器音乐由Breakmaster Cylinder创作。

本播客的支持来自Stripe。Stripe是一个支付和账单平台,支持全球数百万家企业,包括优步、宝马和DoorDash等公司。Stripe帮助无数初创企业和老牌公司实现其增长目标,在使命上取得进展,并在全球范围内接触更多客户。

该平台提供了一些专门的功能和工具来加快增长,例如Stripe Billing,它使处理基于订阅的收费、发票和经常性收入管理需求变得容易。您可以在stripe.com了解Stripe如何帮助各种规模的公司取得进展,即stripe.com。了解更多关于Stripe如何帮助您取得进展的信息。