We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Making Magic With Gen AI: Capital One’s Prem Natarajan

Making Magic With Gen AI: Capital One’s Prem Natarajan

2024/1/3
logo of podcast Me, Myself, and AI

Me, Myself, and AI

AI Deep Dive AI Chapters Transcript
People
P
Prem Natarajan
Topics
Prem Natarajan: 本人作为Capital One的首席科学家和企业AI负责人,致力于利用包括Transformer和生成式AI在内的新兴技术,为超过一亿客户提供更便捷、更具价值的服务。Capital One的技术前瞻性,例如全面采用单一公共云,为AI和机器学习的应用奠定了坚实基础。我将这些新技术融入业务,为客户创造更具价值的体验,例如在反欺诈平台的重建中,利用机器学习进行实时决策,处理海量数据,以毫秒级速度响应客户交易。 Sam Ransbotham & Shervin Kodubande: 与Prem Natarajan的讨论围绕生成式AI的变革性影响展开,特别是它对开发者体验的改变。讨论还涉及到AI团队构成变化的趋势,需要更多工程、提示工程、设计和以人为本的设计等方面的技能。此外,还探讨了产品愿景、科学创新和工程实施三者之间的平衡,以及如何将这三者结合起来才能成功实施AI项目。

Deep Dive

Chapters
Prem Natarajan discusses how Capital One is using AI to enhance customer experiences, leveraging the company's tech-forward legacy and early adoption of cloud technology.

Shownotes Transcript

今天,我们播放的是由我们的朋友 Modern CTO Podcast 制作的一期节目,他们最近很友好地邀请我作为嘉宾参加。我们讨论了生成式 AI 的兴起,技术成功的意义,以及领导者在指导技术实施工作时需要考虑的一些因素。您可以在 Apple Podcast、Spotify 或您收听播客的任何地方找到 Modern CTO Podcast。

生成式 AI 要求组织仔细平衡产品创新、科学和工程。在今天的节目中,一位金融服务行业的领导者分享了他应对这些挑战的经验。我是来自 Capital One 的 Prem Natarajan,您正在收听“我和 AI”。欢迎收听“我和 AI”,这是一个关于人工智能和商业的播客。在每一期节目中,我们都会向您介绍一位在 AI 领域进行创新的个人。

我是 Sam Ransbotham,波士顿学院分析学教授。我还是麻省理工学院斯隆管理评论的 AI 和商业战略客座编辑。

我是 Shervin Kodubande,BCG 的高级合伙人,也是我们 AI 业务的领导者之一。麻省理工学院 SMR 和 BCG 自 2017 年以来一直在研究和发表关于 AI 的文章,采访了数百名从业者,并对数千家公司进行了调查,了解构建、部署和扩展 AI 能力以及真正改变组织运营方式需要什么。

大家好。今天,Sam 和我正在与 Capital One 的首席科学家兼企业 AI 负责人 Prem Nararajan 谈话。Prem,感谢您今天加入我们的节目。让我们开始吧。很高兴来到这里,Sam 和 Sherwin。请描述一下您在 Capital One 的角色以及您是如何走到今天的。

我在 Capital One 的角色,如果我们只关注 AI 方面,就是要在 Capital One 作为一家非常注重技术的企业的基础上进行建设。它是第一家银行,我认为也是全球唯一一家完全采用单一公共云的主要企业。这种转型需要对技术的力量有深刻的信念,

以及愿意让整个企业围绕这种愿景动员起来。这需要愿景、执行意愿和活力。我认为,这为我们利用机器学习、人工智能以及所有这些技术奠定了良好的基础。Capital One 既整合技术,又将技术用作变革工具,还在机器学习方面有所应用。

因此,我现在的角色是加强这种历史,在早期采用许多技术的历史基础上进行建设。众所周知,我们在 AI 方面正处于这种历史性拐点,出现了转换器、生成式 AI 等等。我认为我的角色之一是利用所有这些新技术的力量为业务创造价值,创造价值

神奇的体验、有价值的体验、日常便利,为我们 1 亿多客户提供服务,帮助所有这些人。你提到了拐点,我同意我们正处于拐点。但是,你认为我们为什么处于拐点呢?我的意思是,这并不是……

第一个拐点,但在某种程度上,在我看来,它确实具有历史意义。在过去的几十年里,如果说成是 AI 历史的话,已经出现了一些这样的点。人们喜欢将它们视为 AI 春天、AI 冬天、AI 春天、AI 冬天。我觉得这些过渡点之间

这是一种拐点。最初,所有这些专家系统等等。然后我们说,哦,它们实际上并不具有可扩展性,因为它们需要如此多的手工输入。然后,整个概率集出现了,贝叶斯模型。后来,在某些情况下,它们变成了隐马尔可夫模型,用于语音和语言处理等等,

这些都是拐点,我们说,哦,这个东西。尽管有时人们觉得 AI 一直很有前景,但在我的脑海中,AI 历史上之前的拐点实际上已经商品化了,这是成功的真正标志。

就像 20、25 年前一样,在标准行业实践中使用语音识别,无论是用于交互式语音响应,似乎都是新颖的。现在我们所有人都在期待它出现。因此,一旦它一直存在,我们就不再将其视为 AI。老实说,就像我们说的那样,哦,那只是语音识别。但曾经有一段时间,它就像机器学习和 AI 的前沿。是的。

因此,现在这个新的拐点,如果我们将其视为一个堆栈,作为一个科学堆栈,一个能力堆栈,我们将能够将现象转换为某种表示,例如将语音信号转换为一系列单词。下一步是将一些这种转换解释成有意义的东西,例如某种程度的语义解释等等。我们不断向上移动这个堆栈。

现在,我们正处于这样一个位置:我们已经构建了所有这些系统。它们显示出适应新情况的巨大能力。但现在一件新事物是,它们正在展示它们并非一定经过明确训练或设计的行为。

如果你变得非常技术化,他们会称之为情境学习。在流行文献中,我们称之为,哦,他们响应提示。他们遵循指示。我认为,这部分在很大程度上降低了它们使用的门槛。你仍然必须以负责任的方式去做。你仍然必须以深思熟虑的方式去做。但这降低了它们使用的门槛,我们所有人

都可以开始将这些用于我们的个人项目和企业范围内的计划。这就是我看到的拐点。开发人员的体验发生了变化。当你提到这些时,你的意思是大型语言模型及其周围的整个堆栈。对吗?是的,是的。从技术角度来看,就其作为能力的体现而言,大型语言模型和生成式 AI,

我认为它有能力改变开发人员的体验。你的创造力是首要和中心的,你可以相对轻松地使用所有这些资源。Prem,你有一个非常有趣的背景。也许可以分享一下你如何开始接触技术和 AI,以及你走到今天的道路。

我很乐意,我应该说,这条道路的早期部分对于像我这样背景的人来说是相当典型的。我在印度长大,接受过大学教育。我在一个多语言的社区和社会中长大。

我在一个四种语言的环境中长大。我的家人是泰米尔人。在马哈拉施特拉邦长大,我很多直接的朋友都说马拉地语。印地语是我们班上的必修科目之一,我住的社区也相当国际化。所以有一些来自印度其他地区的人说印地语。然后英语是教学语言。所以,你知道……

因此,很难不发现语言中一些有趣的方面。因此,如果你只说印欧语系语言,你习惯于某些动词、主语、宾语的顺序。但是,如果你采用泰米尔语,它就不是印欧语系语言,而是达罗毗荼语系语言。因此,这些顺序是不同的。因此,即使在非常早的时候,

我们不明白实际上有一门叫做语言学的学科。我们只是说,我想知道为什么我们用这种语言说“过来”,用另一种语言说“过来”。并且在早期就产生了一些好奇的火花。同样,这对我来说并不一定很独特,但在我的情况下,它在后来引发了一些行动。

我在研究生院期间进行的暑期实习之一是从事离线手写识别工作。我认为这重新唤醒了我对语言及其某种形式的产生的兴趣。因此,我开始在一家名为 BBN Technologies 的公司工作。麻省理工学院的分支机构,ARPANET。那里有很多近代史。当时,它一直是语音和语言研究的先驱之地。

因此,接下来的几年对我来说是一次令人难以置信的学习经历。那是早期。然后我扩展了我感兴趣的事物范围。它导致了计算机视觉等领域。所有这些恰好对当今世界来说是一件好事,当我们谈论 AI 时。现在我们谈论它时,指的是多模态、推理等。我想也是……

希望不断解决新问题,同时仍然与旧问题保持联系,这使我能够扩大我的工作范围。然后我去了南加州,担任教职人员和管理人员。我是工程学院的副院长。我是计算机科学系的教员,但我也是信息科学研究所的负责人。然后我去了亚马逊,在那里领导了 Alexa AI 项目。

组织。在那里,这是一个极好的学习机会,可以学习如何进行大规模扩展。然后我想回到我的最初根源,在那里我也为最终用户和企业构建端到端解决方案。Capital One,现在回到技术前沿倾斜,大量投资,来自顶层的支持。

处于技术前沿,所有这些都感觉像是一个令人兴奋的地方,可以来这里建设。是的,这很棒。而且我意识到你可能没有自由谈论所有正在进行的神奇的事情,但是你是否看到了未来,做 AI 的团队的构成

正在改变和发展,也许正在从硬核数据科学转向其他技能,例如工程、提示工程、设计和以人为本的设计等等。我认为,对于每一波技术浪潮,无论是 AI 还是其他什么,它都更像是跨技能范围的资源重新平衡。

当出现新的东西时,你的企业需要新的技能。然后它可能会帮助提高某些其他事物的生产力。但是你也需要这些新事物。因此,基本上,整个企业通过这些事物的重新平衡来生产更多。因此,你知道,人们学习新事物等等。不过,回到你问题的重点,我们正在开启一系列全新的可能性,对吧?

就能够做什么而言,这些最流行的用途之一是这种检索增强生成式用途。如果你看看今天使用生成式 AI 的你最喜欢的搜索工具,它们都在使用某种形式的这种工具。这些东西使我们能够更快更好地完成我们可能经常做的事情,一些你可能不喜欢做的事情。

但是,当涉及到决策等某些事情时,我认为数据科学的这一端仍然存在,你将你的领域专业知识带入其中,利用这些技术在该领域创造更多价值。但我认为,这些技术更具可扩展性、更具适应性、更具学习能力、能够吸收大量上下文,这使得这项投资更有价值,因为你可以从中获得更多性能。

当你考虑某事物的成本时,如果它的成本是 A 加 B,而 A 部分的成本大幅下降,那么总成本 A 加 B 就会大幅下降,你可以做更多的事情。你能给我们举一些你在 Capital One 做的事情的例子吗?早些时候,你说过神奇。你有什么神奇的事情正在进行吗?

神奇的事情可能是那些能够预测我的需求的事情等等。但是,撇开那种具有推测性的未来不谈,我还想反思一下,是阿瑟·克拉克说过,任何足够先进的技术都像魔法一样吗?所以,我所说的“神奇”也是在这种技术科幻的背景下。但是回到你关于我们如何做到这一点的问题,我将给你举一个例子。

高级的抽象概念性事物,以及一些非常具体的事物。在抽象层面,我认为我们在这里看到了巨大的潜力,可以利用所有这些 AI 方面的进步,

为我们的客户提供更好的体验。我的意思是,Capital One 为客户提供了一整套产品。因此,我们看到了一个真正机会,可以为我们的客户持续提供更好的体验。从这个意义上说,我认为 AI 将越来越成为我们为客户创造价值、运营业务等等的核心。现在,举一个具体的例子,让我谈谈我们的反欺诈平台。

我们从头开始重建了这个反欺诈平台,基本上是在该企业的中心使用 ML,并使其高效,以便我们可以做出复杂的实时 ML 决策。消耗大量上下文,使用大量数据。为了使其对我们的客户真正有用,这些模型必须激发一种结果,

在我们客户刷信用卡所用的时间内。所以它既是一项科学壮举,也是一项更令人印象深刻的工程壮举。我喜欢反欺诈的例子,因为它我认为它将

所有我们需要带来的不同学科结合在一起,我认为这里最好的工作将存在于具有扎实产品愿景的人员(他们设想用例)、具有科学愿景的人员(将产品愿景转化为说明实现该愿景所需的创新)以及具有工程能力的人员(他们必须说,我可以做到这一切。我可以可靠地做到这一点。它将一次又一次地成功运行,并且将成功运行)的交叉点上。

实时地一直运行,你可以依靠它等等。所以它就像一些能够锻炼复杂多学科组织所有肌肉的东西。我喜欢这三个案例。我的意思是,如果你考虑这三个中的任何一个,如果你没有它,它就不值得做了。

你可以拥有伟大的科学和伟大的工程,但如果你有了错误的想法,你就不会走远。但是,正如你指出的那样,将这三者结合在一起,这很大一部分。挑战在哪里?这三者中哪一个是最难的?以上所有?以上所有,但在每个实例中比例并不相同。对吧?

如果你采用反欺诈这样的东西,它是一个非常发达的用例,从用例的角度或产品角度来看,我们对这个应用程序的整体形状有很好的了解。在那里,平衡可能在于科学和工程。就像你必须做的一样,我要做什么新的发明?

可能还有其他案例,正如你可能想象的那样,我们还没有准备好谈论。但是,在不存在事物的地方,在你设想未来的地方,这可能属于未来将会发生什么新魔法的范畴。在那里,我认为这三者都必须参与其中。但必须提前进行大量的产品思考。用例是什么?它将产生什么影响?

谁将从中受益?业务影响是什么?客户影响是什么?所有这些。随着时间的推移,它有助于整个企业开始拥有越来越多的产品思维,对吧?所以每个人都在这样思考。所以我说,Sam,这三者都是,但并非在每个实例中这三者的比例都相同。我将以反欺诈为例。如果你深入研究这件事,你知道,世界在不断变化,对吧?

因此,你构建了一些模拟欺诈等等的东西。但是,你知道,世界适应一切。这是人类的惊人之处。我们学习,我们说,哦,这些模式不再给我想要的结果了。我必须调整我的做事方式,这意味着模型也必须定期更新。当我们刚开始时,更新模型需要几个月的时间。

我们现在几天就能做到。当我们从产品的角度考虑时,有时是关于高级应用程序欺诈。但是,如果你真的深入思考并说,我的开发合作伙伴正在经历什么?他们每天都在经历哪些摩擦,这些摩擦可能会阻碍我作为一家公司获得最大收益?

从这项技术中获得。哦,看看更新这些模型需要多少努力。我可以弯曲那条曲线吗?好吧,事实证明,一些这些新技术也帮助我们弯曲了那条曲线,因为它们更容易更新等等,因为它们的学习效率更高。

这些都是魔法的成分,对吧?我的意思是,你正在谈论的事情。整个行业正在发生什么?你独特的语言背景是一条非常持久的线索。是的。然后,当然,理论和实践、创业以及那里的支持的结合。这听起来确实像魔法。所以我想问的问题是……

让我们一睹那些让它变得神奇的东西。你能给我们一些预告吗?

我可以尝试作为对这个问题的回答的引子。看,我认为这些仍然是非常早期的日子,对吧?因为生成式 AI,正如我所说,它已经显示出并非完全设计出来的特性。你给它一个指令,它就遵循它,对吧?诸如此类的事情。所以我认为我们应该负责任,尤其要负责任、深思熟虑,你知道,

在做这些事情时,因为一旦某些事情能够做你没有设计的事情,就像你真的想仔细考虑事情一样。所以想象一下你正在阅读,我不知道,你有一篇 30 页的论文要读,对吧?好吧,

如何做一些你所说的,你能否给我一个半页的要点总结?现在,一部分可能是半页的总结可能会错过一些关键内容。但作为一个想要了解很多事情的人,对吧?对我来说,这感觉就像一件非常神奇的事情。就像一个想要了解很多事情的人一样,下一步可能是,嘿,

这里有一组四篇我一直在看的论文。你能否总结一下这四篇论文之间的区别?哦,现在这变得非常令人兴奋了,对吧?因为深入阅读一篇论文并理解其中的内容是一回事。但我现在必须阅读四篇论文才能关注它们之间的区别。所以我认为……

在那些相对开放的用例中,是你可以为其他类型的应用程序所做的事情的种子,在这些应用程序中,这些类型的事情特别有价值,但它让你了解这项技术的强大功能。现在,

现在,为了正确地做到这一点,记住我怎么说,你能告诉我这些有什么不同吗?我可以给它四篇论文,并说,你能总结一下这四篇论文吗?它实际上可能只关注它们之间共同之处,因为它可能认为这才是重要的。或者它可能会进行统计推断。让我不要说“思考”。我不想过分拟人化它。但是如果我给它一个具体的,告诉我有什么不同。所以现在我必须发展某种程度的

理解如何指导这项技术来获得我想要的结果。这是可行的。这就是熟悉这些东西变得有用的地方。

这就是我想要从你那里引出的内容,因为我也觉得它是一种技术,但在许多方面它都不同。而如果我认为你谈到的那些 AI 模型,你知道,对于欺诈来说,AI 是一种工具,它将极大地提高预测的效率、速度和准确性。感觉在这里,

生成式 AI 不仅仅是一种工具。它可能是一个同事。你正在与它进行对话。就像一个新的同事一样,你正在训练它,你正在看到意想不到的后果,就像你会看到的那样。我知道你不想把它拟人化。但是,不,我认为这里有一些非常非常独特的东西。这是独特的东西。这是独特而令人兴奋的东西。是的。

让我们过渡一下。Prem,我们有一个环节,我们会问你一些快速的问题。所以只要告诉我们你脑海中首先想到的东西。人们现在对 AI 最大的误解是什么?AGI 即将来临的观念。我认为这是一种在两个层面上都有效的误解。一个是,人们相信对什么是 AGI 有着共同的理解。而且

围绕它的恐惧。我认为谨慎、担忧、深思熟虑地思考我们作为一个社会应该如何回应它等等是合适的。但我认为,作为人类,我们已经克服了很多事情。所以我只是觉得我们也会在这里取得成功。Prem 这里谈论的是人工通用智能,而不是我们在许多事情中所使用的 AI 的更狭义定义。你认为现在 AI 最大的机会是什么?

在我看来,AI 最大的机会是使整个社会范围内的许多服务、资源等等民主化。你想要的第一份职业是什么?

哦,我想要的第一份职业是什么?这很有趣,对吧?实际上是一名律师。这与语言一致。与语言一致。我还觉得,在我生命中那个阶段,我所看到的许多榜样,尤其是在我成长的印度语境中,在独立运动时期,其中不成比例的人是律师或教师。那么我们在哪里过度使用 AI?我们在哪里让这个锤子适合所有的螺丝?

我不知道有什么特别的模式让我印象深刻,但我要说的是。我认为当某些事情运行得非常好时,对吧?例如,我的水龙头,你知道,如果……

它终于运行得很好。然后我可以触摸一下。你知道,现在你有了这些触摸式水龙头。太棒了。我认为如果你到了说“水龙头,打开水龙头”的地步,这感觉就像,你知道,所以我说有些事情我认为作为人类,我们可以说,AI 是否正在改善、减少我生活中遇到的摩擦,使事情变得更容易?或者它只是感觉像,

你知道,奇怪的,所以。为了技术而技术。是的。那么你希望 AI 现在能够做到但做不到的一件事是什么?好吧,这很容易。我希望它能让我成为一个很棒的歌手。我喜欢唱歌。我喜欢音乐。我没有唱歌的声音。所以如果 AI 能

我认为它可以。是的,我认为我们可能已经到了。我希望在我身上安装一个 AI 附加装置,让我去卡拉 OK 唱歌,每个人都会说,伙计,这家伙正在放声高歌。

好。我真的很认为你提到的这个框架,关于产品与科学相结合、与工程相结合以及这些部分如何结合在一起并且是必要的,但在不同的情况下具有不同的平衡。仅此一项就可能会引起我们许多听众的共鸣。感谢您抽出时间与我们交谈。我们很高兴能邀请您。谢谢。谢谢。

感谢收听。在下一期节目中,也就是第八季的最后一期节目中,Shervin 和我将与 Mozilla 基金会的执行董事 Mark Sermon 聊天。我对这一期节目感到兴奋。请加入我们。

感谢收听“我和 AI”。我们相信,就像你一样,关于 AI 实施的对话不会从这个播客开始,也不会在这个播客结束。这就是为什么我们在 LinkedIn 上专门为像你这样的听众创建了一个小组。它被称为“AI for Leaders”。如果你加入我们,你可以与节目创建者和主持人聊天,提出你自己的问题,分享你的见解,并了解更多关于 AI 的信息。

并获得来自麻省理工学院 SMR 和 BCG 关于 AI 实施的有价值资源,你可以通过访问 mitsmr.com/AIforLeaders 来访问它。我们将把链接放在节目说明中,我们希望在那里见到你。