We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode From Data to Wisdom: Novo Nordisk’s Tonia Sideri

From Data to Wisdom: Novo Nordisk’s Tonia Sideri

2022/9/13
logo of podcast Me, Myself, and AI

Me, Myself, and AI

AI Deep Dive AI Chapters Transcript
People
T
Tonia Sideri
Topics
Tonia Sideri: Novo Nordisk 是一家全球性的制药公司,致力于研发治疗慢性疾病(如糖尿病、肥胖症、血友病和生长障碍)的药物。公司的AI卓越中心是一个由数据科学家、机器学习工程师和软件开发人员组成的团队,他们采用中心-辐射模型与公司其他部门合作,目标是将PB级数据转化为对公司和患者有用的信息。他们使用为期两周的“数据到智慧冲刺”来快速测试新产品创意的可行性,并根据结果决定是否继续项目。这种方法结合了敏捷教练和设计思维技术,有助于快速识别项目中的问题并及时终止不可行的项目,从而避免浪费资源。从“数据到智慧冲刺”中获得的益处不仅限于技术层面,还包括变更管理方面的经验,这有助于公司整体的改进。他们通过创建微服务来提供MLOps服务,从而减少将机器学习模型推向市场所需的时间。数据科学家的最重要技能是同理心,这有助于他们理解业务需求并有效沟通。Novo Nordisk越来越关注数据的质量和管理,将数据视为产品,以提高AI项目的效率。技术沉迷(过度关注技术本身而非业务价值)是AI项目中需要避免的风险。AI的一个主要风险是它可能复制和放大人类自身的偏见。她希望AI未来能够真正实现民主化,让每个人都能平等地访问和使用AI工具,并具备必要的知识和技能。 Sam Ransbotham: 主要关注AI项目中的流程改进和成熟度提升,以及如何避免AI项目中常见的低效问题,例如大量的POC和试点项目没有产生实际价值。 Sherwin Khodabandeh: 强调了在AI项目中结合设计思维和快速失败方法的重要性,以及如何通过系统化的流程改进和学习来提高效率,避免资源浪费。同时,也关注到AI项目中组织学习、与业务部门的互动以及流程变革的重要性。

Deep Dive

Chapters
Tonia Sideri discusses Novo Nordisk's AI Center of Excellence, its role in the company, and how they leverage data across various stages from molecule identification to product delivery.

Shownotes Transcript

今天,我们播放的是由我们的朋友 Modern CTO Podcast 制作的一期节目,他们最近很友好地邀请我作为嘉宾参加。我们讨论了生成式 AI 的兴起,在技术方面取得成功的意义,以及领导者在指导技术实施工作时需要考虑的一些因素。您可以在 Apple Podcast、Spotify 或您收听播客的任何地方找到 Modern CTO Podcast。

在谈论 AI 项目时,你可能不会经常听到“同理心”和“设计思维”这样的术语,但在今天的节目中,我们将了解一家制药公司的 AI 卓越中心是如何采取整体方法来开展技术项目的。我是诺和诺德的托妮娅·西德里,您正在收听《我和 AI》。欢迎收听《我和 AI》,这是一档关于人工智能和商业的播客。在每一期节目中,我们都会向您介绍一位在 AI 领域进行创新的个人。我是萨姆·兰斯博瑟姆,波士顿学院分析学教授。

我同时也是麻省理工学院斯隆管理评论的 AI 和商业战略客座编辑。

我是谢尔文·科多班德,BCG 的高级合伙人,我与人共同领导 BCG 在北美的 AI 业务。麻省理工学院斯隆管理评论和 BCG 合作研究和发表关于 AI 的文章已有六年时间,采访了数百名从业人员,并对数千家公司进行了调查,了解构建、部署和扩展 AI 能力以及真正改变组织运营方式需要什么。

今天,谢尔文和我邀请到了诺和诺德 AI 卓越中心负责人托妮娅·萨维里。托妮娅,感谢您的加入,欢迎。让我们开始吧。首先,也许您可以告诉我们诺和诺德是做什么的?我们是一家全球性的制药公司。我们的总部设在丹麦,我们专注于生产药物,为患有慢性疾病(如糖尿病、肥胖症、血友病和生长障碍)的患者提供支持。

我们是一家拥有百年历史的公司,但仍在蓬勃发展,但仍然非常致力于公司的原始价值观和我们的社会责任。超过 3400 万糖尿病患者正在使用我们的产品,我们生产了全球 50% 以上的胰岛素供应。目前,您领导着 AI 卓越中心。那么,什么是 AI 卓越中心?您在那里的角色是什么?这意味着什么?

在不同的公司中,AI 卓越中心可能会有不同的侧重点,但我们所做的是,我们是一个位于公司全球 IT 部门的核心团队。我们是由数据科学家、机器学习工程师和软件开发人员组成的一个团队,通过中心辐射模式在公司内部开展工作。

因此,我们希望通过跨职能团队、公司内部的产品团队来缩短我们与公司内部的专家、数据和领域专家的距离。我们还希望加快从机器学习模型的概念验证到生产的过程。这就是为什么我们……

拥有遍布公司各地的分析合作伙伴,并且还有一个 MLOps 产品团队专注于在整个机器学习模型生命周期中创建微服务。我们希望利用我们公司所消耗的全部 PB 级数据,从分子识别到临床试验,再到产品的商业执行和生产运输,并将这些数据从数据库、平面文件、云存储中提取出来,

并将它们转换成对公司最终有用的东西,并最终支持患者的生活。这就是我们存在的意义。我们希望让这些数据活起来。

我们团队成立大约一年半了,我们已经在公司内部开展了多个项目。例如,我们正在与我们的研发部门合作,利用知识图谱来识别胰岛素抵抗的分子。我们在不同的商业区域部署了不同的营销组合建模和销售提升推荐模型。

最后但并非最不重要的是,我们最近部署了一个深度学习机器学习模型,该模型在我们的检测线中使用视觉检测。这非常重要,因为它是对现有流程的优化。然而,它让我们掌握了如何在受严格监管的环境(即 GMP 环境,良好的生产规范)中拥有实时机器学习模型的技能。这是如何运作的?请详细告诉我们。这似乎很有趣。

过去 20 年来,我们一直在使用基于规则的方法进行视觉检测,并且我们已经对其进行了优化。

现在,我们使用了不同的深度学习模型来改进它们。当然,通过深度学习,我们提高了视觉检测过程的准确性和效率,从而提高了质量,并减少了由于颗粒被错误识别为缺陷而导致的优质产品浪费。因此,我们节省了产品,并以此方式优化了我们的产品。

以更有效的方式,我们也减少了优质产品的浪费。但最重要的是,我们从这个项目中获得了如何在受严格监管的空间(例如制造或制药)中进行机器学习的必要能力。托妮娅,您一直大力倡导在构建数据产品、AI 产品时采用设计思维。请告诉我们这其中的含义以及为什么它很重要。

是的,我认为首先,我曾经是一名数据科学家。所以很多时候我发现自己参与的项目本应该更早结束。因此,我对如何加快失败时间很感兴趣。这就是为什么当我们开始这个领域,也就是一年半前,我们

我们真正致力于通过我们所谓的“数据到智慧冲刺”来启动我们的项目。基本上,这是一个与我们的业务同事一起进行为期两周的编程马拉松,以真正尝试根据具体的假设从数据中找到什么。在这两周结束时,我们会问自己,噪音中是否有任何信号?数据是否足够好?我们是否有必要的技术来进一步扩展它?

这是否有任何商业价值?如果答案是肯定的,那么我们将进入下一步,进行概念验证,然后是实施阶段,当然还有运营。但如果答案是否定的,那么在两周内,我们将能够迅速终止项目。在这两周里,在敏捷教练的帮助下,我们也使用了相当多的设计思维技术。但对我来说,这是设计思维的结果。如何将设计思维作为一种跨职能工作的方式和快速失败的方式。

太好了。没有智慧,你就会被淘汰。有点像自然选择,对吧?玩笑归玩笑,我认为这是一个好主意,因为萨姆,就像我们在数据中看到多少次一样,

当我们调查这数千家公司或与高管交谈时,他们正在进行数百个概念验证和试点,但实际上没有任何价值。而且确实存在我所说的整个组织的 AI 疲劳,因为这就像整个组织都变成了一个研究生院

实验室,比如,让我们试试这个,让我们试试那个,让我们试试那个。所以我喜欢这个想法,就是淘汰那些不起作用的项目。这样你就可以专注于少数几个有价值的项目。

没错。对我来说,那些不起作用的项目我们也有很多收获,因为它们不起作用的原因通常与数据有关。所以至少我们根据我们想要实现的目标对数据进行了为期两周的压力测试。然后我们得到了一些经验教训。如果我们想在未来构建这个模型,我们需要修复数据中的哪些内容才能实现目标。哦,这太棒了,因为这实际上与你……

我的意思是,仅仅是终止一个项目并说,“好吧,如果它不起作用,我们就不会继续投入资金”,这是一回事。但如果你不断地这样启动项目,那么就需要学习哪些项目会失败,或者将来你可以做些什么来改进这些项目。我们在这里谈论的是什么样的数字?有多少智慧?有 2% 的智慧、20% 的智慧、97% 的智慧吗?

我认为量化这样的事情非常危险,对吧?但一个是数据智慧,另一个当然是变革管理智慧。

因为我们通过这个编程马拉松与我们的业务专家一起工作。因此,即使某些事情失败了,他们也会了解我们的工作方式。我们也能了解他们的现实情况,他们也能了解可能实现的目标。我认为这种智慧更难以量化,因为它将在未来对公司产生更大的波浪效应。如果你看看

与您谈论的内容完全相反的模式是构建这些庞大建筑物的旧式瀑布式方法。

技术组件,对吧?这就像 20 年前的技术开发一样,我记得我们做了一个项目,我们查看了 100 家公司构建这些大型技术产品的情况。我认为大约 80% 的公司正在构建没有人需要或

或无法与其余技术一起使用的功能,但他们直到开发开始 18 个月后才会发现这一点。我想这是一种全新的方式,但遗憾的是,仍然有很多组织仍在使用这种旧的模式,他们会在业务需求收集和规划等方面花费数月时间。我认为您所说的意思是,

让我们得到一个好主意。让我们开始测试。如果它有一些东西,那么我们就加倍努力,把它做大。但如果不是,那么我们就学到了一些东西。如果该项目、该想法很重要,那么我们就可以修复它。我也非常非常喜欢您关于这不仅仅是技术方面,还包括变革管理以及使其发挥作用所需的一切的观点。这真的非常好。

没错。通过提前说明这一点,我们就不会面临失败的风险,因为这就是我们的工作方式。我们有两周时间。因此,如果项目无法继续,我们的声誉就不会受到影响。即使在 MVP 阶段之后,也具有分阶段的步骤,以及在那里终止某些东西的能力。我认为这是

这也有帮助,还有预算。许多公司拥有这些长期项目的原因是他们为此分配了长期预算。但在我们的案例中,我们还会评估我们的业务方面是否有支付意愿。我们所做的事情是否有用,以至于我们的业务愿意投资于它?

萨姆,提前设定期望值。想象一下,你是,你知道,萨姆是一位大学教授。你的学生过来对你说,“教授,我提前警告你。我将在两周内失败。”不,不,实际上,谢尔伍德,恰恰相反。我会进去说,你们 90% 的人都会失败。我认为这不会得到很好的回应。托妮娅,您是如何转移这些经验教训的?

您提到您会这样做。是否有这样一个流程?您如何编纂?您如何将这些内容明确化,而不仅仅是传说?这是一个好问题。在我们成长的过程中,我们仍然需要找出什么是正确的量化水平,而不会产生官僚主义。但我们所做的是,首先,在这两周内,我们在整个组织中进行了两次演示,特别是与我们正在合作的业务部门一起进行。

所以至少从更广泛的角度来看,这是变革管理的一部分,而不仅仅是从参与产品团队的人员那里获得的。然后,关于数据改进或技术改进,我们将它们反馈给我们的数据治理部门、数据所有者或我们的技术组织。

好的,这说得通。您谈到的一件事,以及谢尔文和我认为总体上看到的一件事是,让我们说,我们看到成熟度的提高。我不知道,谢尔文,也许我对人们随口说的评论解读得太多了,但我只是看到围绕过去曾经是

非常临时的事情,现在正在制定更多的流程。也许您比这领先几步,您知道,查看您的一些构建块方法,以使不同的服务易于使用。您能否解释一下这是如何运作的,以及您是如何开发这些构建块的,以及其他人是如何使用它们的?

是的。因此,当然,提供 MLOps 服务或一般数据服务的构建块的想法很大程度上来自这种数据混乱方法。现在这是新的炒作。但特别是对于 MLOps,我可以谈论的是,基于我们对验证机器学习模型需要多长时间的经验教训。现在,我们正在创建微服务,包装现有的服务,无论是开源服务还是来自我们在线的云供应商。

从我们如何进行模型版本控制、模型监控、模型验证、基本事实、存储验证,然后将这些服务作为制药环境中的合格系统进行验证。

这样,我们就可以缩短需要验证 GXP 模型的时间。因为我们不希望组织中的任何数据科学家都构建自己的云解决方案,既要成为数据工程师、软件开发人员,又要成为验证专家才能将模型投入生产。因为通过使用这些预先合格的经过验证的服务,他们可以专注于数据科学并将它们用作组件。

我们只是根据从这个视觉检测模型中获得的经验教训来构建第一个服务。这是一个非常好的观点。如果您查看公司中典型的数 据科学家,他们花费在数据上的时间会有很大的差异。

您所说的提取智慧或模式或构建和测试模型,与所有其他准备工作、设置环境和特征工程等工作相比,这些工作是其他人已经完成的,但在组织的其他部门。托妮娅,我想问你一下人才方面的问题。我的意思是,您谈论的是一种由设计思维驱动的、快速失败的、与业务高度互联的工作方式,

在那种环境中,从数据科学家、工程的角度来看,什么样的技能组合才能取得成功?这是一个好问题。我认为技术技能当然应该具备。我还可以看到,随着时间的推移,市场越来越成熟。因此,很容易找到这些技能。

但更难的是其他软件技能,这些技能使您成为一个良好的价值转换者和合作者。对我来说,数据科学家最重要的技能实际上是同理心,这通常是我们对技术领域的人员不抱有的期望。

是能够进入业务人员的思维方式,并问自己,如果我是一名营销人员,如果我是一名生产操作员,我每天都必须做这项工作,并且我遇到了我遇到的问题,我将如何使用数据来做一些对我来说有用的事情?能够实现这种思维飞跃需要大量的理解挑战。

了解对方的现实情况以及沟通能力。因此,同理心当然是对机器学习模型及其应用以及其他人的好奇心。这些技能很难量化或面试。这更多的是一种文化现象。

或性格特征。谢尔文,这很有趣,我们正在看到这一点,也许这是第一个迹象,表明找到这些技术技能变得更容易了。我的意思是,我认为这是一个有趣的转变。是的,正如托妮娅所说,这已经成为入门所需的最低要求。但真正的价值在于软技能和同理心。萨姆,这与我们看到的也很好地结合在一起,那就是当我们查看

投资于 AI 的公司的发展时。我们看到技术和数据只能让他们走这么远,但巨大的飞跃完全围绕着组织学习、与

业务的互动、流程变更。至少公平地说,对于数据科学家来说,机器学习工程师或数据工程师或软件开发人员仍然非常短缺。但对于数据科学来说,因为它作为一个领域在技术上变得越来越成熟,所以所有其他技能都可以区分某个人。托妮娅,您接下来对什么感到兴奋?人工智能即将出现什么?我的意思是,我们专注于人工智能和机器学习。您对什么感到兴奋?接下来会发生什么?

我实际上对数据感到兴奋。我知道这与 AI 没有太大关系,但我认为这与现在基于数据的新趋势有关。例如,为了修复人工智能并对其进行优化,让我们首先优化我们的数据。

我们现在实际上也正在更多地投资于数据网格概念。例如,将数据视为产品,这意味着每次我们想要创建一个新的,比如说,营销组合模型时,我们不必经历整个 ETL 过程。是的,我知道这,我十年前做过一项研究,小组很小,也许只有一家公司里的几百人,但大约 80% 的数据科学家时间都花在了 ETL 上。然后他们还有一个数据工程团队。

具有讽刺意味的是,就像您谈论的营销组合优化一样。这实际上是针对营销部门的。您让数据科学家并排坐在两个隔间里工作,使用完全相同的数 据管道,但从头开始构建。他们俩甚至都不知道他们正在使用相同的基础特征。是的,这是一件大事。托妮娅,我知道您对此感到兴奋,因为您在谈论技术放纵时谈到了这一点。

这似乎与那里非常相关。也许是宜家效应?是的,技术放纵。是的,对我来说,这实际上是我们作为技术人员所犯的最糟糕的错误,因为宜家效应是能够,我认为,赋予自己构建的东西更高的价值。

有时我们会倾向于继续参与一个项目,因为我们自己构建了它,或者因为我们认为尝试新的机器学习算法非常酷。对我来说,这种技术放纵是您可能面临的最大危险。这就是为什么通过与业务更紧密地合作,以及从编程马拉松到运营产品团队,在这些产品团队中工作,来避免这种风险非常重要。我喜欢“技术放纵”这个词。是的。

- 托妮娅,您有一个环节会问一系列快速问答题。所以只需回答您脑海中首先想到的内容即可。您最引以为豪的人工智能时刻是什么?- 我认为是我们提到的这个视觉检测问题,

不仅是因为其业务影响,尤其是因为它为我们提供的能力,即如何在 GXP 环境中使用机器学习,以及我们与业务专家、制造专家一起工作以实现这一目标的速度之快,以及它实际上被验证的速度之快。我认为这可能是您的例子,因为当您谈论它时,您是多么的兴奋。我们可以在视频中看到这一点,但我认为它也可能体现在您的声音中。人工智能让您担心什么?

正如节目中的每个人所说,它如何被用作复制我们自身偏见的一种方式。但另一方面,我认为技术也有能力解码这些偏见,因为也许从技术中消除这些偏见比从人那里消除这些偏见更容易。所以这是一把双刃剑,但我担心我们会复制我们自己的偏见。

偏见是每个人的共同担忧。您最喜欢的与技术无关的活动是什么?阅读书籍,绝对是。我实际上试图甚至不为此使用我的 Kindle,而是使用物理 3D 书籍。我可以真正推荐,我刚刚读完了伊齐库罗关于克拉拉和太阳的书,实际上是关于一个生活在家庭中的 AI 机器人并开始对这个家庭产生感觉的书。我可以真正推荐这本书。这听起来很棒。实际上,我需要一本新书。

我喜欢这个。我 12 岁的儿子在 Kindle 和屏幕的时代长大,阅读书籍。所以当他第一次从图书馆拿到一本老式书时,他说,“爸爸,这些书闻起来真香。这是什么味道?”我说,“是的,这是一种令人惊叹的味道,即使是当今时代的儿童也能欣赏。”您小时候想从事的第一个职业是什么?您长大后想做什么?

这很奇怪,但我想成为一名垃圾收集员,让我的母亲感到惊讶。我也是,我也是。真的吗?找到一位志同道合的垃圾收集员爱好者真是太难得了。是的,志同道合的垃圾收集员爱好者。但我倾向于认为这在某种程度上是相关的,对吧?我的意思是,你拿走一些东西,然后把它转换成别的东西,我们收集数据,然后把它转换成别的东西。是的,我相信那里也有一些关于数据的垃圾类比。太完美了。是的。

您对未来人工智能的最大愿望是什么?

我会说要真正实现民主化,但我并不真正相信它会在短期内实现民主化,因为它需要如此多的概念理解才能真正实现民主化,我认为我们不会实现这一点。但这是我的真正愿望,每个人都拥有工具,但更重要的是知道如何使用它们。所以,通过民主化,您的意思是每个人都可以访问这些工具?是的,我认为现在已经有许多平台可以帮助实现这种低代码方法。

AI,但它更多的是可以访问该工具,也可以使用它们。因此,它具有足够的必要知识水平,能够使用它们并能够独立使用它们。我认为这需要很长时间,因为它不是工具问题。它更多的是,再次,变革管理和教育问题。托妮娅,很高兴见到你。我认为诺和诺德在

系统化和开发围绕机器学习和人工智能的流程方面所做的事情,是许多组织可以学习的。我们非常喜欢与您交谈。谢谢。是的,这确实是一种荣幸。谢谢。谢谢。请在下一次节目中加入我们,届时我们将与 ADP 的首席数据官杰克·伯科维茨进行交谈。

感谢收听《我和 AI》。我们相信,与您一样,关于 AI 实施的对话不会仅限于此播客。这就是为什么我们在 LinkedIn 上专门为像您这样的听众创建了一个小组。它被称为 AI for Leaders。如果您加入我们,您可以与节目创建者和主持人聊天,提出您自己的问题,分享您的见解,

并获得来自麻省理工学院斯隆管理评论和 BCG 关于 AI 实施的宝贵资源,您可以通过访问 mitsmr.com/AIforLeaders 来访问它。我们将把该链接放在节目说明中,我们希望在那里见到您。