We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 865: How to Grow (and Sell) a Data Science Consultancy, with Cal Al-Dhubaib

865: How to Grow (and Sell) a Data Science Consultancy, with Cal Al-Dhubaib

2025/2/25
logo of podcast Super Data Science: ML & AI Podcast with Jon Krohn

Super Data Science: ML & AI Podcast with Jon Krohn

AI Deep Dive AI Chapters Transcript
People
C
Cal Al-Dhubaib
Topics
Cal Al-Dhubaib: 我从计算神经科学专业毕业后,开始从事数据科学工作。我第一次创业失败了,但这次失败让我发现了未被满足的市场需求,并建立了蓬勃发展的Pandata数据科学咨询公司。Pandata 的成功秘诀在于专注于难以培养的领域,并随着市场变化而不断调整服务方向。起初,我专注于机器学习,后来转向在高度监管的环境中应用机器学习。通过专注于那些大型咨询公司不愿接手的项目,Pandata 找到了自己的利基市场。 在Pandata,我们强制客户进行前期投入(例如5万美元的发现和设计阶段),这有助于筛选掉不认真的客户,并吸引那些真正重视项目的客户。我们还建立了五个核心价值观:平易近人、共同获胜、培养信任、追求成长和驾驭不确定性。这些价值观指导我们的招聘和公司文化,帮助我们吸引和留住优秀人才。 此外,我们还注重提高客户的AI素养。在与一家医疗科技公司的合作中,我们发现,仅仅提高模型的准确性是不够的,还需要帮助客户理解和信任AI系统。通过教育和解释,我们成功地提高了模型的采用率。 在Pandata被Further收购的过程中,我们注重组织价值观、客户群体和创造价值愿景的良好匹配。这确保了Pandata的成功过渡和持续发展。 创业过程中最大的教训是:要勇于承认错误并寻求帮助,不要害怕展现脆弱的一面。 Jon Krohn: (This section would contain Jon Krohn's viewpoints and arguments, extracted from the transcript. Since the prompt requests a minimum of 200 Chinese characters per speaker, this section would need to be filled in with a summary of Jon Krohn's contributions to the conversation, including his questions and observations.)

Deep Dive

Chapters
Cal Al-Dhubaib shares his journey from a failed startup to founding Pandata, a thriving data science consultancy. He discusses his initial challenges, the discovery of an untapped market, and his unconventional strategies for attracting and securing loyal clients. The episode also touches upon Pandata's acquisition by Further.
  • Initial startup failure led to the discovery of a high-demand market for data science consulting.
  • Developed an unconventional strategy requiring substantial upfront client commitment, attracting serious clients and weeding out non-serious ones.
  • Focused on making data science accessible and 'boring' to clients, emphasizing clear ROI and building trust.

Shownotes Transcript

Jon Krohn 与 Cal Al-Dhubaib 讨论了 AI 和机器学习解决方案提供商 Pandata 的非凡成功,他为任何公司定义核心价值观的铁腕策略,以及如何吸引和留住忠诚的客户。Cal 认为技术专业人员在职业生涯中犯了两个关键错误:首先,他们经常喜欢充当工作的守门人,而不是向客户和同事解释项目的细节以及它如何使公司受益。其次,技术专业人员不表现出脆弱性,无论是表示自己不了解某个主题,还是不完全理解业务运作方式。Cal 说,这个问题可能决定了初创企业的成败。在本期《超级数据科学播客》中,了解科技初创企业如何为未来制定铁腕战略。本期节目由 ODSC(开放数据科学大会)赞助。有兴趣赞助超级数据科学播客节目?请发送电子邮件至 [email protected] 获取赞助信息。在本期节目中,您将了解: (09:32) 如何扩展成功的数据科学咨询公司 (22:25) Pandata 如何应对高度监管的环境 (27:59) 如何解决企业中的技术文盲问题 (36:32) Cal 在招聘新员工时寻找哪些技能 (35:56) 如何销售科技公司 其他资料:www.superdatascience.com/865</context> <raw_text>0 这是第 865 集,嘉宾是 Further 公司的 AI 和数据科学主管 Cal Aldubabe。本期节目由 ODSC(开放数据科学大会)赞助。

欢迎收听超级数据科学播客,这是数据科学行业收听率最高的播客。每周,我们都会为您带来有趣且鼓舞人心的人物和理念,探索机器学习、AI 和相关技术的尖端领域,这些技术正在使我们的世界变得更好。我是您的主持人 John Krohn。感谢您今天的收听。现在,让我们化繁为简。

欢迎回到超级数据科学播客。我很高兴今天邀请我的老朋友 Kal Aldubaib 作客节目,他是一位极具天赋的沟通者和数据科学企业家。

Cal 是 Further 的 AI 和数据科学主管,Further 是一家位于亚特兰大的数据和 AI 公司,拥有数百名员工。此前,他是 Pandata 的创始人兼首席执行官,Pandata 是一家位于俄亥俄州的 AI 和机器学习咨询公司,他经营了八年多,直到一年前被 Further 收购。他发表过精彩的演讲,如果您有机会,千万不要错过。他拥有克利夫兰凯斯西储大学的数据科学学位。

本期节目应该会吸引任何听众,特别是任何希望从数据科学或 AI 项目中获得收入和利润的人。在本期节目中,Cal 详细介绍了他的第一个初创公司为何失败,以及这段经历如何让他发现了未开发的市场并建立了蓬勃发展的数据科学咨询公司 Pandata。

他谈到了他非常规的策略,即要求客户做出相当大的预付款承诺,这最初吓跑了客户,但最终吸引了最好的客户。他谈到了受他的“锡罐去火星”思想实验启发的核心价值观如何塑造了他的招聘和公司文化。

以及如何使数据科学变得枯燥乏味,帮助他的客户信任 AI 系统,并获得明确的投资回报,这成为了他成功的秘诀。好了,准备好收听这集宝贵的节目了吗?让我们开始吧。Cal,欢迎来到超级数据科学播客。我们已经认识很久了,所以现在能邀请你来到节目中真是太好了。你好吗,伙计?你在哪里打电话?我很好。我今天在俄亥俄州克利夫兰的家中。很高兴来到这里。

对于观看我们 YouTube 版本的观众,你的办公室装饰得很漂亮。这是你自己做的吗?是的,是的。这是……

在大流行之前,我发现自己每周在家工作一天,这将是我对自己的奖励。我每周可以有一天在家工作,所以我想要一个美丽的空间来获得灵感。然后,在 COVID 期间,这里变成了我的“快乐监狱”。我开始用所有给我带来快乐的东西来布置它。这就是我现在身后景象的解释。

你还记得我们是怎么认识的吗?你还记得我们第一次见面的时候吗?是在开放数据科学大会上。我相信我们第一次在 ODSC 西部见面。是 2021 年吗?ODSC 西部,没错。是的,可能是 2021 年左右。我认为那是我参加的第一个疫情后会议。

我和你一起乘坐优步专车。你非常积极。我想,这个人是谁?他在吃什么药?他的情况怎么样?我只是很兴奋能来这里。我知道。然后我逐渐发现,你一直都是这样。这就是 Cal。这很符合你的品牌形象。这真的很酷。

你可能是数据科学界最积极、最快乐的人。这可以作为本期节目的标题。我很乐意将此作为我的品牌形象。我相信拥有这种态度对数据科学领域的企业家来说很有帮助。你有一个引人入胜的故事。我很想让你向我们的听众介绍你是如何从零开始创建数据科学咨询公司的,以及……

你知道,有信心这样做。这真的……我相信有很多听众想过,如果我离开雇主的舒适区,自己尝试做数据科学,会是什么样子。所以,是的,向我们介绍一下情况是如何发生的。

所以有很多有趣的故事转折,我们稍后可以深入探讨,但简而言之,我的故事是这样的:我当时在凯斯西储大学学习计算神经科学,我处理了很多数学和数据的应用,我在一个医疗系统实习,研究公共卫生数据,那是我第一次进入数据科学领域。

在一个研究展示会上展示了我的一些本科研究后,我受到鼓励考虑将其商业化。我不知道人们可以说“我想创业”。所以创业中心向我展示了如何注册有限责任公司。我毫不犹豫地迈出了这一步,什么也不懂。筹集了一些资金,加入了一个加速器。大约一年半后,这件事失败了。

我可以谈谈我学到的所有关于不以正确方式销售数据科学的教训。但有趣的结果是,我们与医院系统进行了一些研究试点。我试图让他们签署这些协议,承诺他们最终会购买这个软件。作为回报,我为他们做了免费的研究。

所以当第一个初创公司倒闭时,一些研究人员感到不安。他们说,我们依赖这项工作。这对我来说很有趣,因为我问了一个问题,我说,“等等,你会为此付费吗?”

事实证明,我一直免费提供的东西实际上是这种日益增长、需求旺盛的东西。所以,为了让你了解当时的状况,这是 2015 年底,2016 年初。这就是 Pandata 的诞生。在我所在的俄亥俄州东北部,当时的数据科学家还不到 150 人。大约三分之一的人在 IBM、克利夫兰诊所或 Progressive 保险公司工作,这些都是许多人耳熟能详的名字。

然后,这里的大型企业只有一两个。

所以我创建了 Pandata 来解决这种人才缺口。随着时间的推移,Pandata 通过专注于难以培养的东西而痛苦地实现了自举式增长。随着数据分析平台和商业智能变得越来越商品化,它变成了机器学习。随着机器学习开始商品化,它变成了在高度监管的环境中进行机器学习。最终,这就是我们找到自己利基市场的方式。

在经营这家公司并经历了大约八年的疫情后,完全依靠自举式发展,我们在一年前的这个月被一家名为 Further 的公司收购。我现在是他们的 AI 和数据科学主管。我很乐意告诉你所有这些,但这就是我的故事概要。是的,让我们更详细地探讨其中一些内容。这是一个非常好的总结。你如此简洁地表达了这一点,真是太棒了。就像,

你八年的人生浓缩成短短几分钟,这很好。这其中有一些道理。所以你谈到了这个整体,比如,为什么我一直这么积极?在某些事情上,我实际上是一个非常脾气暴躁的人。我会说,“不,我们不会那样分析数据。”但我在 Pandata 的早期发现,

当我销售数据科学时,大多数人都不知道数据科学是什么。它就像一个盐瓶。就像,“嘿,我们可以在上面撒些数据科学吗?”也许另一边会出来一些钱。这是一种新奇事物。大多数人都不理解这是什么东西。当时很多数据科学家都倾向于表现得很聪明,非常技术性地工作,研究他们认为是下一个最伟大的算法,他们实际上喜欢别人不理解他们在做什么。

另一方面,我真的很想找到让人们理解的方法,因为我发现,当他们理解时,他们就更有可能与我们合作,并与我们合作更长时间。这最终成为我建立 Pandata 的核心价值观之一,也是我招聘人员的类型。所以多年来我的座右铭演变成了“让它变得枯燥”。

如果我可以使用猫、狗、小狗和奇怪的小表情包来解释一个非常复杂的数学概念,我一定会这样做。人们喜欢它。这很有趣。这很容易。这很有趣。人们会说,“哇,这太容易了。”

所以这已经成为我做事的重要组成部分。我喜欢你同时将其描述为“让它变得枯燥”,同时又使用了猫的表情包。看起来你让它更有趣了,但我知道你的意思。你让它不那么技术化,不那么……数据科学家不会觉得,“哇,这是……”是的。

他们不会看到所有让他们兴奋的方程式。对于数据科学家来说,它是枯燥的;对于其他人来说,它是令人兴奋的。没错,没错。实际上,我最近在一个课堂上也有同样的反应。他们说,“这根本不枯燥。”我说,“但是你现在理解 AI 有多枯燥了。”他们说,“是的。”我说,“这就是重点。”很好。

那么,让我们谈谈使 Pandata 如此成功的事情。我们已经有了这个“让它变得枯燥”的想法,即让数据科学家觉得枯燥,让客户能够轻松理解你提供的数据科学。扩展成功的数据科学咨询公司的其他关键是什么?在我第一个初创公司中,我并没有完全掌握的一件事,那就是产品市场匹配的概念。

任何从事创业领域的人都会听到这个词。对于那些没有从事创业领域的人来说,这意味着你发现了一个痛点,有人愿意花钱来解决。并且有足够多的人,规模足够大。你知道如何接触他们。你可以持续地提供他们愿意为之付费的东西。并且……

客户用钱投票。我早期发现,因为我是自举式发展,这意味着我没有筹集任何资金。我唯一的增长来源是当客户愿意为此付费时。所以,当有人说,“这是一个好主意”时,是一回事;当他们愿意签署一张大支票让你解决这个问题时,又是另一回事。然后他们一次又一次地回到你这里来解决同样的问题或类似的问题。

所以产品市场匹配和倾听人们愿意为之付费的东西是 Pandata 的一个非常重要的部分。我的第一年,我只需要说,“嘿,我们可以做数据科学方面的事情。”我能够获得一些合同,但这是一个旋转窗口。我会与一家企业合作,然后他们就会离开。另一家企业会来。对于咨询公司来说,这是一个非常常见的故事。可能只有一两个客户留了下来,或者不断回到我们这里。

我还记得与那里的利益相关者进行过一次谈话。我终于鼓起勇气,我说,“我不是想让你质疑这种情况,但你为什么回来?”我当时真的想做一些市场调研,并了解情况。事实证明,他们真的很喜欢我们平易近人,对吧?这是我们的核心价值观之一,即避免使用术语,始终直截了当地说话。

然后,我们意外地做了一些程式化的事情。我们有一个名为“发现和设计”的过程,现在这是强制性要求。任何雇佣我们做任何工作的人,我都说你必须事先这样做,否则我不会与你合作。对于那些客户,我们意外地做到了。这就是我们花费仅仅

30 天、六周的时间来深入研究一个问题,试图找出可解决的问题在哪里,我们如何处理这个问题?未知的未知是什么,这是解决以前从未使用模式匹配算法解决的问题的一个非常重要的部分,只是为了简化它。并且

所以我试图重现这种神奇的效果。所以我们有一些属性变成了我们的核心价值观。我们有五个核心价值观,我稍后可以谈谈。然后还有一些流程。其中一个流程是发现和设计。现在,有趣的是,我决定,好吧,我现在不再与任何不想这样做的人合作了。我们将收取任意金额的费用。

当时的参与规模是 50,000 美元。当时只有区区的 12,000 美元。作为一个第一次创业的人,我真的很紧张,担心会把这笔钱花掉。但我当时说,“嘿,你知道吗?除非你愿意花这笔钱,否则我甚至不想和你合作。”这帮助我剔除了两件事。首先,不认真的客户,如果他们不愿意为此付费,他们肯定也不愿意为其余的参与付费。

其次,如果他们从哲学上不同意这一步骤的重要性,那么我知道他们很可能会对结果感到持续失望,因为他们并没有完全理解数据科学流程。所以我从花费大量时间与许多最初似乎对数据科学感兴趣的人交谈开始。然后我得到了“不,不,不,不”。我的渠道开始枯竭。

这是 Pandata 的银行账户余额少于一个月支出次数的三次之一。我想,这是结束。这可能是最愚蠢的主意。在同一时期,我获得了三个我曾经合作过的最大客户,其中两个客户一直是客户,直到 Pandata 退出。所以大约六年时间。

这个过程成为我们能够比大多数小型个体户咨询公司规模大得多的原因之一。对。所以关键是在尝试与某人进行咨询的开始阶段,进行为期 30 天的发现和设计初始参与。你会说,“你知道,要进行这项为期 30 天的初始参与,需要 50,000 美元的价位。”是的。

所以这最初似乎让你陷入困境,你的渠道枯竭了,每个人都说“不”,但最终它确实导致发现了可靠的长期客户,他们与你合作了六年以上。酷。好吧,所以我将使用这种策略,现在我使用这种策略来吓跑不认真的人。它实际上可以帮助我节省时间。它可以帮助我节省时间。然后我找到那些说,

“太棒了,我喜欢你这样想。”海里有许多鱼,这完全是关于这种匹配过程。我学到的一个违反直觉的教训是说不的艺术,或者通过对别人说不来排除别人。它真的可以让你在更重要的事情、更有价值的事情上花费更多的时间。这是我看到很多最成功的朋友常用的策略。

我很高兴地宣布,我的朋友们,第十届年度 ODSC 东部会议(开放数据科学大会东部会议),2025 年你不想错过的唯一一场会议,将于 5 月 13 日至 15 日返回波士顿。我将在那里主持关于自主 AI 的实践研讨会。

对,对,对,对。这很棘手。这很难。

是的。对规模较小或更具挑战性的项目说不,因为你还记得你银行账户里只剩下一个月支出的那些日子。哦,我的价值留在了你的银行账户里。你会想,“好吧,我想我最好对所有事情都说‘是’。”但这最终会减慢你的速度。你会有“死于一千刀”的经历,所有这些低价值的接触点。好吧,

好吧,当我们对这次收购进行尽职调查时,财务报表上有大约三个点被他们几乎圈了出来。他们说,“我们想谈谈这个、这个和这个。我们不喜欢这些。”我说,“我也不喜欢这些。这些对我来说也是非常糟糕的时刻。”对,对,对,对,对。好吧,那么让我们谈谈你称之为你的五个支柱、你的五个……核心价值观。核心价值观。所以……

在此期间,我成为一个名为企业家组织的组织的成员。这是一个拥有全球 16,000 名成员的全球网络。要获得资格,你必须拥有一家年收入超过 100 万美元的企业,你必须是创始人、大股东,并且……

他们有一个针对 25 万美元到 100 万美元之间企业的加速器计划。所以在我真正知道自己在做什么之前,我加入了这个加速器计划,它帮助我掌握了许多关于如何发展可扩展业务、如何将业务视为操作系统的心态。

其中一个概念是核心价值观,它不仅仅是写在墙上的东西,也不是我们所说的,“嘿,我们以信任和诚信做事”,这很好。我们希望每个人都以信任和诚信做事。这是一个理所当然的事情。核心价值观实际上是那些独特的属性,描述了个人在你的组织中表现出的那种性格,这些性格可以帮助你获得更大的成功。它们通常是根据创始人的优势模式化的。

所以这只是你发现这些核心价值观的方式,如果你认为你即将乘坐锡罐去火星,你会选择带哪五个人?你真的想在这次任务中带这五个人,是因为他们身上有什么?反过来,你绝对不想带哪五个人?是什么让你不想带他们?

而且,你知道,这真的是关于这些属性的事情。所以我发现 Pandata 有这五个价值观,我们多年来一直在不断完善它们,但它们是:平易近人、共同获胜、培养信任、追求增长和驾驭不确定性。

所以这些是与数据科学有些相关,但也与我们处理数据科学的方式有些相关的五个特征。所以。

对我来说,在数据科学家身上最难找到的是“平易近人”这个概念。事实上,在我们的面试过程中,我们有与每个核心价值观相关的面试问题。我们会特别寻找那些自然倾向于解释事情而不依赖术语的人。他们寻找帮助他人理解的方法。

“驾驭不确定性”也是另一个非常重要的数据科学指标。那些得到框架不佳的问题的人,没有很多假设,但自然会倾向于,“好吧,我要解开这个。我要列出我的假设。如果我不知道它们是什么,我会知道如何获得它们。”

“培养信任”是另一个非常重要的方面。因为多年来,机器学习和 AI 领域出现了一些意想不到的后果,所以我寻找那些不需要提醒就暂停并提出棘手问题的人。我会寻找那些即使不知道怎么做,也有能力去做,进行艰难对话的人。

有一段时间,人们并不广泛地知道机器学习算法会歧视有色人种,例如。

如果你甚至不愿意使用这些词来描述,那么这是一个非常难以进行的对话。这是一个有色人种。这是一个,是的。我还没有完全弄明白这个笑话,或者它将如何运作,但我喜欢你的一个价值观是“驾驭不确定性”。这让我想到数据科学中的偏差-不确定性权衡。然后你突然开始谈论偏差。这就是你要说的吗?是的。

是的。所以就像这一切,是的。所以就像这个,这个都形成了一个完整的循环。所以就像这个特性包,当你把它们放在一起时,帮助我找到那些在我的环境中会茁壮成长的人,因此会做那些让客户一次又一次地雇佣我们的事情。所以这些核心价值观与我们的流程相结合,是 Pandata 背后的秘诀。非常好。是的。所以五个价值观是,呃,平易近人、共同获胜、呃,

能够驾驭不确定性、追求增长和培养信任。所以这五个核心价值观与,是的,这些,这些大规模的初始参与,让人们做出承诺,你可以针对你发现的问题制定发现和设计解决方案,消除他们之间的隔阂,这些价值观与

以及那项大型初始参与,你能够在 Pandata 取得巨大的成功。谢谢。好吧,这太疯狂了,对吧?很多人认为核心价值观是这些软性事物或虚无缥缈的事物。但我希望这能为那些可能正在考虑创业的人提供一个例子,说明拥有这些真正独特的简化事物有多么强大。

它不一定是单个词。它可以是一个短语。它可以是一个座右铭。但这些是你团结一致的概念。如果你玩弄它,它真的会变成一个强大的过程。你可以在面试中使用它,在评估晋升和加薪时使用它。你可以在上下文中谈论它,“嘿,你在与这个客户的参与中真正行使了 ABC 核心价值观,或者你真的没有。让我们谈谈这个。”

是的。我喜欢你如何提出与它们相关的面试问题。我也喜欢你如何提出你的核心价值观。我们必须,每个人都需要唱一点大卫·鲍伊的歌。“我坐在锡罐里吗?”

世界上的乐趣,并考虑你与谁在一起,以及你想与谁在一起。我的意思是,当我与你交谈时,我看到你的脸亮了起来,你就像,“我知道你的五个,而且我知道你肯定知道你不想带的五个。”我想花一些时间考虑一下。我可能会在播客节目结束后花一些时间考虑一下。在我专注于你所说的话并使这次采访保持正轨的过程中,这有点困难。但是

是的,我绝对,我立刻想到了一些事情。有一种,有一种,我立刻想到了一个或两个人我绝对想和他们在一起,还有一个或两个人我绝对不想和他们在一起。太棒了。是的。

所以是的,我会在节目结束后详细阐述一下。个人而言,可能不会分享。我很想听听这些价值观是什么。我会在 LinkedIn 上标记它们。太棒了。我喜欢它。五个我绝对想和他们一起乘坐 10K 的人,五个我绝对不想和他们一起乘坐的人。在 LinkedIn 上标记它们。这将很有趣。标记所有十个人。没错,没错。

好吧,让我们继续前进。Pandata 最终专门从事的是高度监管的环境。所以在高度监管的环境中进行数据分析、构建机器学习、AI 系统。告诉我们 Pandata 最终是如何进入这些高度监管的环境的,这些环境是什么,以及你在这些环境中面临的特殊挑战。

所以我们最终与医院、生命科学公司、高等教育机构、能源和公用事业公司、一些轻微的国防工作以及金融服务公司合作。轻微的国防。轻微的国防。所以就像不是真正意义上的,你知道,所有很酷、令人兴奋的东西,但就像国防公司关注运营效率和类似的小型用例。但是是的,

但你仍然有这样的设置,你处理的代码可能存在于完全与互联网隔离的环境中。而且,呃,你通过 VPN 连接到超级安全的系统。这真是太酷了,呃,看到所有后勤工作。事实上,在我的团队中,呃,笑话是,如果你至少没有三台笔记本电脑,你就没有足够忙于客户工作。呃,所以我们经常会将超级安全的设备运送给,呃,我们的团队成员,并且,呃,

这真的很酷。这就是当我谈到高度监管的环境时我的意思。现在,我们是如何进入这个领域的,实际上可能有点不是愚蠢,而是开始时的天真。事实证明,如果你要服务这种类型的市场,你需要大量的保险资金。通常会处理这些参与的公司正在关注最低支出,即数百万美元。

我们走进来,我们会说,“好吧,小公司不知道如何做这件事,他们也不想与大公司合作。我认为这里有机会建立一些可扩展的东西。”我们,你知道,我在医疗保健研究和与医院合作方面有早期的背景,那是 PAM 数据的早期阶段。这有助于建立这样的记录,“嘿,我们以前处理过非常敏感的数据。”并且,嗯,

随着我们建立了这个投资组合,驾驭这项工作变得容易得多。当我们这样做时,我们必须更加谨慎地进行数据保护培训、数据隐私培训。这并不是说所有这些不同的数据隐私和数据保护法都是一样的,但你开始看到模式。你开始看到关于数据的普遍可接受的模式。

你如何考虑隐私,你如何停下来并提出一些问题,考虑意想不到的后果,变量如何无意中泄露信息等等。你还考虑你的义务,安全的密码。我们最终建立了流程,帮助我们在大型公司并不真正关心的这些中型项目中脱颖而出。感觉很棒。我们偶尔会从麦肯锡或中心窃取一个项目,

这让我很开心。但是随着我们开始建立这个投资组合,我们开始建立专业知识,我们如何处理这些棘手的情况?我们如何引导客户完成它?这最终成为 Further 想要收购 Pandunia 的一个重要原因。

非常好。是的,这是一个很棒的故事。我能看出这对那些正在考虑创业之旅以及他们可以在哪里开辟特定利基市场的人们会有多有帮助?他们可以在哪里找到产品市场契合点?你说的那个主意很棒,就是说,有很多数据科学项目,合同金额达六位数,麦肯锡和埃森哲都不愿意做。

而这对于刚开始从事数据科学咨询的人来说可能是一个相当不错的项目。这很有趣,因为这些项目正是他们的公司实际上想要降低风险的项目。即使他们有数据科学团队,他们实际上也希望有其他人从外部介入,在他们团队的工作之间设置一层保护。

以及当这个产品交付时。因此,随着时间的推移,我们建立了保险,建立了实践,建立了这些非常严密的流程,我们的安全性远远高于我们的任何客户。我们与一些大型企业合作过。这使我们能够在这些领域中游刃有余,收取高额费用,而这些相同的客户会一次又一次地与我们合作。非常酷。Pandata这个名字从何而来?我突然……

我很好奇。有趣的故事。我绞尽脑汁。我的第一个创业公司刚刚失败,我当时正在做这些数据科学教程,Pandas 进入了我的脑海。我想,你知道,这是一家数据科学公司。让我们用Pandas吧。

Pandata。然后我使用了非常早期的AI logo生成器。所以Pandata的logo实际上是由一个算法生成的,该算法使用了简单的A/B测试。就像这个或那个,这个或那个。最终它产生了一个字体,一个logo。这个品牌在2016年基本上是AI生成的。

哇,这太酷了。如果你不知道的话,这确实说得通,它包含了熊猫,非常流行的开源软件。如果你正在收听这个播客,我希望你知道pandas是什么,因为它是一部分数据科学的构建块和历史。可爱的熊。所以当你进入你正在合作的这些组织时,高等教育、国防,

这些组织中可能有很多不具备数据素养或AI素养的人。你是如何解决这个问题的?我认为,素养是AI采用的最大障碍之一。我喜欢用一个故事来分享这一点,这只是我最喜欢的例子之一,说明AI或缺乏AI素养是如何适得其反的。

我们当时与一家健康科技公司合作,他们与保险公司合作。他们试图做的是审核索赔。他们的数据库中大约有5000万患者的生命数据。他们试图根据最近的诊断和药物来确定哪些人可能有资格获得某些政府援助。这并不像听起来那么简单。社会保障局会发布一些指导方针。

他们采用了一种基于规则的方法,他们会逐一检查,试图确定本月我们要联系的约10000名会员。

并帮助他们完成这个过程。然后当他们获得报销时,我们的客户会因为帮助增加了保险而获得少量费用。这将是一封直邮信函,嘿,我们认为你符合条件,我们可以帮助你,我们将帮助你完成申请流程。所以机器学习在这里实际上是一种非常有用的方法。我们很早就与他们合作,我们建立了一个模型,这是一个集成模型。并且

我们证明了我们的模型实际上可以帮助识别比他们传统方法多30%的患者。这令人兴奋。多30%的收入很有意义。让我们试点一下。我们推出了它。如果他们的基线是接触100人,你知道,如果他们接触100人,他们会得到大约10个人会完成这个过程。

在我们的试点中,100人中只有2人完成了这个过程。这比人工方法更糟糕。我们差点被解雇。这真的是,真的是,非常糟糕的结果。我绞尽脑汁。我想,不,不,我们验证了这一点。统计数据非常好。我们对数字进行了二次运行。事实证明,负责发送

或选择邮寄池的团队的年终奖金取决于他们选择的质量。然后它也被标记为试点。他们不信任。他们不信任我们带来的这些新人,这些新的人员组合。并且

我们开始理解原因。我们的诊断组合略有不同。我们发现的患者最终会获得补贴,但他们具有不同的特征组合,而这组人以前从未见过。所以看起来很奇怪,他们不想冒他们的年终奖金的风险。上面写着AI试点,完全失败了。

所以我们又回到了原点,我们与这个团队一起工作,我们坐下来和他们一起,我们向他们展示了我们是如何训练模型的。我们是如何知道它有效的。我们提出了一些他们认为很奇怪的案例。我们

我们开始逐一解决这些问题。你为什么不相信这个?关于这一点你需要什么?所以我们最终进行了这次教育之旅,建立了他们对这个过程的信任。然后,我们建立了一个流程,我们可以使用可解释性。每当预测一个患者时,我们都可以显示促成该预测的最重要因素。这也增强了对该过程的信任。我们重新启动了模型,而模型没有任何变化。

我们能够帮助他们将覆盖范围扩大18%。所以我们真正改变的只是人类与模型的交互方式。这是我第一次开始看到培养AI素养的重要性。

而且有很多很棒的课程可以满足这一点。我喜欢用猫和狗做一些小工作坊,但我们有像吴恩达这样的人,他为每个人都做AI,现在是Gem AI for everybody。我们亲爱的朋友Cassie Kozarkov,她在决策智能方面做了令人惊叹的工作,并且以一种非常有趣和轻松的方式去做。所以我试图从这样的人那里引入材料和灵感

来帮助建立这种直觉,那么,AI是如何出错的?我们什么时候可以相信它?我发现,当你赋予组织这种技能时,他们能够利用他们已经拥有的工具做更多的事情。

人工智能正在改变我们做生意的方式。然而,我们需要的人工智能解决方案不仅要有雄心壮志,而且要实用和适应性强。这就是Domo的人工智能和数据产品平台的用武之地。有了Domo,你和你的团队可以将人工智能和数据转化为创新的用途,从而产生可衡量的影响。

虽然许多公司专注于狭窄的应用或单一模型解决方案,但Domo的一体化平台更加强大,具有值得信赖的人工智能结果,安全的AI代理可以连接、准备和自动化你的工作流程,帮助你和你的团队轻松地获得见解、接收警报并采取行动,通过针对你角色量身定制的引导应用程序。该平台提供灵活的选择,可以选择使用哪些AI模型。

Domo超越了生产力。它改变了你的流程,帮助你做出更明智、更快速的决策,并推动真正的增长。世界上最好的公司都依赖Domo来做出更明智的决策。了解如何利用Domo释放数据的全部潜力。要了解更多信息,请访问ai.domo.com。网址是ai.domo.com。说得很好。

而且那里有一个很棒的故事来生动地展现这一点。实际上,在整个剧集中,你如何引入具体的案例研究,使你所描述的原则易于理解,这一点非常棒。我怀疑你可能能够为咨询的另一个方面提供一个很好的类比,我想我们现在就会知道了,压力来了,那就是当你做咨询时,

你必须能够证明你正在为客户的投资带来回报。一些投资回报率。哦,我的天哪。是的,你如何在你的项目中做到这一点?这听起来可能非常明显,但最大的失误之一是在项目开始时没有正确的价值假设。我,我,

我经常在AI的背景下谈论这个问题,因为我们迷恋于模型本身。就像我刚才谈到的病人例子一样。我们迷恋于,它能否准确地预测谁有资格,而不是真正停下来思考我们正在影响哪些决策?

成功的决策是什么样的?在另一个例子中,我们与癌症再入院合作,我们与医疗系统合作,我们试图帮助他们建立可以帮助他们治疗实体瘤癌症患者的模型,这些患者在全国范围内的再入院率约为25%。这真的很糟糕。因此,如果你可以使用机器学习来识别哪些患者风险最高,你就可以制定更有效的干预措施。

在我们第一次迭代中,我们实际上取得了适度的成功。这是一个非常棘手的群体,因为患者的复杂性。但提供者会说,好吧,现在怎么办?这位病人有风险。你想让我做什么?

当你收到这个警报时,实际上并没有提供解决方案,这在认知上令人难以承受,而且没有帮助。所以我们实际上不得不回到可解释性上来思考什么是有用的信息。这位病人有风险是因为他们正在服用某种药物,还是因为他们有某种合并症,或者……

我们了解到的患者的一些社会属性。例如,他们来自一个交通可靠性低的邮政编码区域。所以这位病人实际上可能会再次入院,不是因为他们病得很重,而是因为他们可能会以不恰当的方式使用急诊室。所以让我们给他们一些社会援助。所以考虑一下这一点真的很有趣,就像当我们谈论模型时,我们作为数据科学家对模型的准确性感到非常兴奋,而我们并没有。

停下来思考一下,我们正在影响哪些杠杆,哪些决策?成功的干预措施的价值是什么?然后现实地,像我们正在做的任何工作都会影响多少次决策?所以我们现在与客户提前合作来尝试制定计划。我们试图挑战它。我们试图压力测试它。

在这个再入院的例子中,我们实际上会说,好吧,我们可以识别出80%的这些患者,我们认为实际上只有20%的干预率。因此,价值是基于此的。我们停下来,与客户核实,嘿,如果这是我们唯一获得的价值,那么为了弄清楚这个过程,是否仍然值得投资X?

然后你完成项目,随着你学习更多,随着你验证你的模型,你不断回到最初的假设。非常好。讲解得很好。再次,并举了一个例子,五星级。干得好,亚历克斯。我希望我能继续交付。我不知道。

好的。所以在所有这些年来你所做的所有这些项目中,你在Pandata的八年以及现在在Further继续做的咨询工作中,你多年来已经聘用了很多数据科学家。你在这集的早期已经暗示了你正在寻找的东西。例如,你围绕你的核心价值观有面试问题。但是,你今天在招聘数据科学家时,最关键的技能或属性是什么?

例如,人工智能工程技能最近似乎非常重要。哦,我的天哪。而且很难找到。今天数据科学最具挑战性和最令人沮丧的事情,实际上只是在过去十年中,数据科学家意味着什么。

十年前、五年前、三年前与今天大相径庭。因此,我们今天正在寻找的一些技术技能是那些在评估和质量控制方面非常强大的人,尤其是在处理多模态数据时。所以文本数据、图像数据,制定统计设计的能力,并说,好吧,我们正在处理

这个问题没有结构,我们需要想出一个方法来衡量我们的方法是否有效,并且以一种不会产生统计怪异性的方式来做,也就是说,我们基本上是在预测我们人为地放入数据中的东西。

所以我们真的在寻找拥有这项技能的人。我们也看到了机器学习工程师的兴起,特别是具有这种AI工程特色的工程师。现在,我们实际上正在寻找那些在部署语言模型方面拥有更多经验的人,并且

运行ML Ops或我们今天想称之为AI Ops的这些语言模型,以及我们如何诊断它们何时被提示、何时漂移、何时行为异常。但这些是我们寻找的一些技术技能。

至于软技能,我认为在Pandata对我很成功的核心价值观将是常青树。而我始终在个人身上寻找的特质,无论今天的技术技能有多重要,明天、五年后,我们总是会想要那些能够清楚地解释事情的人,那些自然地被驱使去学习下一件事的人,那些能够处理问题不明确的人。这些事情如果

你知道,你真的想成为一名杰出的数据科学家。值得培养。很好。感谢你提供的关于你从你所雇佣的数据科学家那里寻找什么的建议,包括硬技能和软技能。我很想了解更多关于很多我们今天讨论的事情的总结

很多我们今天讨论的事情。所以我们讨论了核心价值观,招聘优秀人才,显然是为客户带来投资回报。最终,这使你被一家规模更大的咨询公司Further收购。那么这个过程是怎样的呢?你是如何开始思考的,哇,你知道,我已经建立了这家公司八年了。我可能想把它卖掉。然后你找到一个卖方。我的意思是,这一切是如何运作的?

多年来,不同的人联系过我,他们会说,哦,我认为我们想要一家咨询公司,或者我们喜欢你正在做的事情。我们没有咨询公司,但我们需要一个数据科学团队。购买一个数据科学团队要容易得多。所以我对这个想法有点心动。建立一家企业的目标最终是你想要的。你确实想要退出。你想找到一个家。你想找到一个地方,你的企业可以在那里作为更大的一部分持续创造更多价值。

所以我一直对此持开放态度。一个有趣的故事是Further的首席执行官或总裁Mike Gustafson在Case校友中看到了Pandata的故事。所以我去了凯斯西储大学。他开始关注并思考Further的未来,当时它被称为Search Discovery。他们想真正进入云基础设施、云

人工智能和高级机器学习项目。他们在分析领域和绩效营销领域做了大量工作,这些领域的环境受到严格监管。因此,他们想要进入数据科学、机器学习是有意义的。他在LinkedIn上联系了我,我当时正处于会议季节。我完全错过了

他的信息。所以一些我认识的他的员工,他们在克利夫兰有一个办公室。所以我曾在当地的聚会上见过他们。他们说,你真的应该和迈克谈谈。我回复了他的信息。我们约定了一个见面时间。我去他的办公室。我们做了这些客套话,校友。然后在五分钟内,他说,我认为我们想买下Pandata。

我说,哦,好吧。尽管我很想说,太棒了,这是我最想要的东西。我不得不停下来,问了几个问题。其中一个问题是,告诉我你的核心价值观。这再次不是因为我要去这个整个像库姆拜亚、温暖、模糊的地方。实际上,我想了解一下,如果我要把我的东西卖给

这个组织,我的客户群的兼容性如何?他们会留下来吗?他们会有像今天照顾他们的人一样照顾他们的人吗?我的团队会蓬勃发展吗?他们能够顺利地转移到项目中吗?即使核心价值观的名字不同,也存在很多组织兼容性。我们有很多相同的问题需要解决,同样的态度,类似的薪酬等级。

所以当我看到我可以把我的引擎放到这台机器里,它会创造更大的价值时,这是一个双赢的局面。这是我与其他企业家谈论过的最重要的一课,那就是找到一个能够为他们和你最大化价值的家。并非每个组织都会是这样的。所以在Further的情况下,这是很有意义的。

我们以创纪录的速度完成了尽职调查。从“这很酷,让我们进一步探索一下”开始。对话在12月变得更深入了一些。然后在去年的1月到3月之间,我们做了大量的文书工作,这笔交易在大约三个月内就达成了。哇。那里真的有一个很棒的故事。我喜欢这个找到合适的家园的想法,这对双方来说都是双赢的,即被收购的一方和收购方。非常

绝对的。而且,你知道,我听到很多类似退出的恐怖故事,然后它没有成功。这是因为预先的配置匹配并没有真正发生。这很难。我们谈到过,很难对美好的事物说不。所以我看到很多企业家最终会追求它,因为理论上听起来很棒,但后来却失败了。所以在这种情况下,我不能在结束这集之前不为Further打个广告,并说我们喜欢我们的新家。

我们正在从事令人兴奋的事情,我们当时所拥有的许多愿景和兴奋都因为这个匹配过程而延续到了今天。

太棒了。太棒了,卡尔。祝贺你,Pantated团队和Further团队。听起来像是一场很棒的联姻。在我进入我总是在每集结束时都会问的问题之前,我还有一个问题要问你。所以我的最后一个问题是,所有这些年来,你知道,从你从凯斯西储大学毕业后筹集资金的创业公司到

创立Pandata到被Further收购,你学到了哪些最重要的教训?你最大的失败是什么?所以,当你第一次创业时,你的诱惑或你被诱惑去保守这个想法的秘密。我们对假定的知识产权或假定的有价值的东西感到非常自豪。

多年来,我发现一些最成功的人是最乐于分享他们的想法、最乐于奉献时间、最谦逊并愿意承认自己错误的人。我认为我以艰难的方式学到了这一点,但很多定义我如何与人交谈、与人互动的方式,

确实是由此塑造的。所以我的一个最重要的教训就是,要接受自己犯错,要接受寻求帮助。这真的很难做到,尤其是在你是一名数据科学家,并且接受过训练变得聪明的时候。你接受过训练,并被教导说你的聪明才智是你的区别所在。然后你试图成为一名企业家,你接受过训练,并被教导说你必须扩大规模或破产。相反的建议是,要接受自己的脆弱性。

你是否曾经感到孤立,周围的人都不分享你对数据科学和技术的热情?你是否希望与更多志同道合的人联系?别再犹豫了。Super Data Science社区是连接、互动和与600多名数据科学、机器学习和人工智能专业人士交流想法的理想场所。除了人际网络外,你还可以通过导师计划获得直接的职业支持,经验丰富的成员帮助初学者学习。

无论你是想学习、合作还是提升你的职业生涯,我们的社区都会帮助你取得成功。加入Kirill、Adelant和我以及数百名每天都联系的其他成员。立即开始你的免费14天试用期,网址是superdatascience.com,成为社区的一员。很好。这是一个很好的建议,卡尔。

我很喜欢这一点。真的很好地结束了这次采访。是的,我刚才提到的我对你有一些独特的问题。我确实像刚才提到的那样,有一些问题是我在每集结束时都会问的。所以我们需要你推荐一本书,卡尔。我有一本。所以

我花了很多时间在沟通上。我一直试图提高我的沟通能力。我最近读完的一本书是《超级沟通者》。它实际上就在我身后。作者是查尔斯·杜希格。它是该领域的一本经典著作,但它确实谈到了那些能够

也许他们看起来不是房间里最具魅力的人,但他们具有这种通过交谈让每个人都感到轻松自在,并更愿意

达成共识的自然能力。所以它深入探讨了人们如何做到这一点的科学,以及在实践中的故事和例子。作为一名不断努力改进沟通能力的人,我从中受益匪浅。所以强烈推荐给任何想要在仅仅是

与人进行更好对话方面变得更有效的人。是的。如果人们想在购买之前了解一下《超级沟通者》这本书的内容,你可以在这个播客的第805集查看查尔斯·杜希格来访时,我们只是谈论了《超级沟通者》。我喜欢这个。很好。

太棒了。然后在我让你走之前,最后一个问题是,在这集之后,人们如何关注你?好问题。我在LinkedIn上最活跃。如果这些观点中的任何一个引起你的共鸣,如果你正在考虑创办一家面向数据科学的企业,或者你对负责任的人工智能和严格监管的环境非常兴奋,请联系我。我很想听听。

太棒了,加尔。非常感谢你向我们的Super Data Science听众提供了这个慷慨的提议。非常感谢你再次参加节目。和你聊天真是太棒了。我的意思是,是的,我们已经成为朋友多年了,所以我总是很乐意和你聊天。而且,你知道,我并不惊讶你进行了一次精彩的采访,但这太棒了。做得很好。谢谢。我很荣幸最终能成为节目的一部分,约翰。再次感谢。

与卡尔·阿尔杜拜布一起度过了多么精彩的一集啊。在节目中,卡尔讲述了他如何通过专注于医疗保健、国防和教育等受监管行业的中型数据科学项目来建立Pandata,这些项目对于大型咨询公司来说太小了,但需要像他的公司那样的专业知识。

他谈到了他的公司成功是建立在两大支柱之上的。首先,强制性的30天发现和设计阶段,成本约为5万美元,以确保客户的承诺和项目的清晰度。其次,他的核心价值观是:平易近人、共同获胜、培养信任、追求增长和驾驭不确定性。

他还谈到了如何通过简单的解释和类比使复杂的数据科学概念易于理解和枯燥,这比强调技术复杂性更有效。他谈到了利益相关者之间的AI素养对于项目成功至关重要,在一个案例中,仅仅是帮助用户理解和信任系统,就将模型的采用率从2%提高到了18%。

他还谈到了Pandata最终被Further收购成功的原因,是因为在组织价值观、客户群和创造更大规模价值的愿景方面高度一致。与往常一样,你可以在superdatascience.com/865上获得所有节目笔记,包括本集的文字记录、视频录制、节目中提到的任何材料、卡尔的社交媒体资料的网址以及我自己的网址。

如果你想在现实生活中与我联系,而不是在线联系,我将在3月19日于弗吉尼亚州里士满举行的RVA Tech Data Plus AI峰会上发表开幕主题演讲。门票非常合理,而且有很多优秀的演讲者。所以这可能是一个值得关注的会议,尤其如果你住在里士满地区的话。在那里见到你真是太好了。

当然,感谢Super Data Science播客团队的每一个人,我们的播客经理Sonia Brayovich,媒体编辑Mario Pombo,我们的合作伙伴经理Natalie Zheisky,研究员Serge Massis,撰稿人Zahra Karche博士,当然还有我们的创始人Kirill Aramango。感谢他们为我们制作了另一集宝贵的节目,感谢超级团队为你们制作了这个免费播客。我们非常感谢我们的赞助商。你可以通过查看下面我们的赞助商的链接来支持节目。

这些链接在节目笔记中。如果你想赞助一集节目,你可以通过访问johnkrone.com/podcast来了解如何做到这一点。否则,请与那些会喜欢这个节目的人分享这个节目。在你最喜欢的播客应用程序或YouTube上评价这个节目。我最近收到了一个关于这个问题的问题,在像Apple Podcasts这样的平台上,

你只能评价整个播客,而不是单个剧集。这是一个限制。我听说Spotify很快就会允许你进行更复杂的评论。让我们拭目以待。但无论如何,是的,所以在任何你使用的播客应用程序或YouTube上评价这个剧集或整个播客。订阅,显然,如果你不是订阅者的话。随意将我们的视频编辑成你喜欢的短视频。

但最重要的是,我们只是希望你能继续收听。我很感激你的收听。我希望我能继续制作你多年来都会喜欢的剧集。直到下次,继续在那里摇滚吧。我很期待很快与你一起再次享受Super Data Science播客。