We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode How Databricks Revolutionize Intelligent Enterprise AI in ASEAN with Patrick Kelly

How Databricks Revolutionize Intelligent Enterprise AI in ASEAN with Patrick Kelly

2025/4/6
logo of podcast Analyse Asia with Bernard Leong

Analyse Asia with Bernard Leong

AI Deep Dive AI Chapters Transcript
People
P
Patrick Kelly
Topics
Patrick Kelly: 我参与了一项与《经济学人》合作的全球调查,其中包括欧洲和亚太地区。我们询问了这样一个问题:‘贵组织目前的架构是否能够满足 AI 工作负载的独特需求?’基本上,85% 的受访者回答‘否’。他们没有能够支持 AI 的架构,或者需要大量的修改。这表明许多人仍处于早期阶段,这也与以下数据点相呼应:85% 的生成式 AI(概念验证)尚未投入生产。另一个有趣的点是:‘您的架构是否将 AI 应用与相关的业务数据连接起来?’对我来说,这可能更为重要。结果仍然是 80% 左右的受访者表示‘没有’,因为业务数据散落在各处。没有干净的数据,就无法获得良好的 AI。 Databricks 的使命是使数据和 AI 民主化,帮助数据团队解决世界上最棘手的问题。数据是核心,没有数据就无法进行 AI。我们发明了 Spark,彻底改变了大规模数据处理的方式。我们率先推出了 Lakehouse 概念,它结合了数据湖和数据仓库的功能,降低了总拥有成本 (TCO) 并实现了自助式分析。我们现在专注于数据智能,即客户如何利用自然语言实现洞察力的民主化,并在其自己的私有企业数据之上构建 AI。我们始终强调不要将数据交给 Databricks,而应在数据之上驱动洞察力,从而真正区分您的业务。 Lakehouse 支撑着一切。所有数据都存储在低成本的云存储中,分析师和数据科学家可以使用相同的数据副本。有了这单个数据副本,就可以运行机器学习模型,并使用不同的数据集进行训练,而不会出现数据漂移问题。然后,可以在 Lakehouse 架构之上添加智能,我们称之为数据智能。生成式 AI 显然在 GPT 出现后风靡一时,但我们并没有忘记经典的 AI,例如预测客户流失、预测需求和优化客户体验等。生成式 AI 显然会生成内容,并提供智能顾问和金融服务中的机器人顾问。我认为我们应该从更广泛的意义上谈论 AI,既包括生成式 AI,也包括经典 AI。 在 ASEAN,我们拥有从高度管制的行业(如金融服务和电信)到 Grab 等大型数字原生客户的各种客户。Grab 使用 Databricks 多年来构建客户数据平台,管理数百万个数据点,构建以客户为中心的体验并个性化推荐。GetGo 使用 Databricks 提高了客户满意度和车队利用率,将洞察力交付速度提高了七倍,并将燃料盗窃减少了 50%。GovTech 使用 Databricks 实现了数据民主化,将仪表板创建速度提高了三倍,每年节省了 8000 个工时。暹罗商业银行 (SCB) 使用 Databricks 创建无缝且个性化的数字银行体验,并实现了即时贷款审批,将数字贷款产品的批准率提高了两倍。 客户是反馈的最终来源。我们根据客户的反馈改进产品功能。例如,Databricks Assistant(我们的 UI)包含编码部分和表格,其中许多都是来自我们社区和客户的反馈。 我们收购 Mosaic AI 是一个改变游戏规则的事件,它使我们能够深入研究企业级质量,即在安全性、治理和低成本服务方面具有鲁棒性。我们的立场是,您应该完全控制自己的数据和模型。我们提供生产质量规模,并支持本地支持。我们构建了一个端到端的生成式 AI 框架,希望抽象出许多技术细节,让客户能够专注于从数据中获得所需的内容。 我们看到生成式 AI 的主要趋势是代理,以及客户希望访问所有受管理的数据。治理和安全性至关重要,它不是附加组件,而应该从一开始就建立起来。在 ASEAN,我们看到不同阶段的采用情况。先进的数字原生企业正在挑战我们提供更好的性能、更好的性价比和更好的结果。企业客户正在寻求迁移到云端,构建云端的 Lakehouse。中小型企业正在寻找经济高效的商业智能解决方案,并能够进行自助式分析。我们正在提供 AI BI,它结合了商业智能和 AI,让用户能够通过自然语言提问并获得答案。 调查显示,大部分组织缺乏支持 AI 工作负载的架构,并且 AI 应用与业务数据未连接。ASEAN 国家认为生成式 AI 对长期战略目标至关重要。对于企业而言,应该从产品设计开始考虑 AI 应用,然后考虑底层技术。许多 POC 已经投入生产,尤其是在内部知识聊天机器人、客户服务辅助和内容创建方面。 我希望人们更多地询问我什么是数据智能。数据智能是使数据民主化以获得洞察力的过程,无论公司规模大小,都应该采用这种方法。对于 Databricks 在 ASEAN 的未来,我们认为这是一个改变人们工作、生活和彼此联系方式的千载难逢的机会。我们将继续投资于我们的员工、资源和技术,并与合作伙伴一起建立生态系统,培养数百万人才。

Deep Dive

Chapters
Patrick Kelly, Senior Director at Databricks, discusses the company's role in powering enterprise AI applications in ASEAN. He highlights the importance of data quality and the Lakehouse architecture, sharing customer success stories and insights into generative AI trends in the region.
  • Databricks pioneered the Lakehouse architecture, combining data lake and data warehouse capabilities.
  • 85% of organizations lack proper architecture to support AI workloads.
  • Clean data is foundational for effective AI implementation.

Shownotes Transcript

您是否在亚洲为分布式团队管理自己的 IT?并且您知道这有多痛苦。Ezevel 通过为您内部团队分担繁琐的任务并为他们提供有效管理 IT 的工具来提供帮助。

在亚太地区的八个国家/地区获得帮助,从入职和离职、采购设备到实时 IT 支持和设备管理。借助我们最先进的平台,在一个地方完全控制所有 IT 基础设施。我们的 IT 支持专业人员团队热衷于帮助您发展壮大。因此,请查看 ESEVEL.com 并立即获得演示。使用我们的推荐代码 ASIA 可享受三个月的免费试用。适用条款和条件。

我们与《经济学人》进行了一项全球调查,显然也包括欧洲和亚太地区。我们提出了一个问题,即我组织的当前架构是否支持 AI 工作负载的独特需求。基本上,85% 的人表示,不,我们没有支持它的架构。有些部分可以,但需要大量修改。因此,我们仍然感觉很多人仍处于早期阶段。而这种数据点又与 85% 的 Gen AI 尚未投入生产相关。

我认为另一个有趣的点是,您的架构是否将 AI 应用程序与相关的业务数据连接起来,这对我来说可能几乎更重要。同样,仍然约有 80% 的人表示,我们没有,因为业务数据到处都是。没有干净的数据,就无法获得良好的 AI。

欢迎收听 Analyze Asia,这是一个专门剖析亚洲商业技术和媒体脉搏的顶级播客。我是 Bernard Leong,我经常告知企业决策者数据对于人工智能的工作至关重要。我们如何确保企业 AI 应用程序为东南亚的企业提供动力?今天与我一起的是 Patrick Kelly,他是 Databricks 东南亚数字原生企业和商业销售高级总监,我们将讨论这个主题,

Patrick,欢迎来到节目。谢谢,Bernard。很高兴来到这里。很高兴再次和你交谈。我还应该告诉你,我们是前同事,当我第一次加入 AWS 时,你可能是我的导师和老板,并且真的指导我完成了启动过程。所以,非常感谢你,Patrick,与我一起做这件事。是的,那些都是美好的日子。我们今天肯定可以谈谈这个。当然,毫无疑问,我们总是从客人的起源故事开始。那么,你的起源故事呢,你是如何开始你的职业生涯的?

是的,实际上,令人惊讶的是,我现在已经从事销售很长时间了,但我确实是从技术方面开始的。我职业生涯刚开始时是一名网络工程师,从事大量企业网络工作,思科、瞻博网络,也做一些银行系统之类的工作。所以这很有趣。

我真的很喜欢这个。然后我转到电信行业。所以我加入了爱立信,这是一家大型瑞典电信设备供应商。那是,我是爱尔兰人,对吧?所以它位于爱尔兰。但后来我加入了专业服务团队,全球服务团队。所以我做了遍布世界各地的项目。太棒了。例如在巴西、约旦、澳大利亚,然后最终去了日本。正如我所说,我去了日本大约四周的任务,结果却待了五年。所以这非常非常有趣。

我认为日本很有趣,因为我从那时起就从工程转向咨询。所以网络咨询,就像为软银工作一样。那时,LTE 刚刚在 2009 年左右推出。软银拥有 iPhone 的独家权利。而 iPhone 在网络上是一个新的野兽,对吧?所有信号都在。我们不知道该如何处理,对吧?所以我们为软银做了很多咨询工作,如何在东京和人口高度密集的地区管理负载。那很酷。

从那里,然后我转到销售,例如销售服务、销售硬件、销售软件。然后从日本,这把我带到了新加坡,因为在电信行业,日本和韩国总是第一名。他们都是 5G 的第一名,所有新技术的首批用户。然后当我们开始对电信网络进行虚拟化时,我们将此带到了东南亚,例如新加坡电信和 TelcomSell,是的,也将其带到了整个地区。

从那里,大约九年后,我度过了美好的时光。然后我加入了创业公司。我加入了一家从事物联网的创业公司,当时是 Jasper。那是一个非常有趣的角色。然后这把我带到了 AWS,在那里我花了大约五年时间担任不同的角色。从物联网业务开始,

然后我们一起做了分析业务,机器学习业务,Bernard,然后承担了 ISV 业务,这是我们的 B2B 软件销售,就像在销售过程中一样。然后我们合作了很多。是的。很多。是的。我记得在马来西亚,我们为马来西亚做了很多好事,也做了很多案例研究。是的。然后最终,这个角色既是 ISV,也是数字原生。所以像 Grab 和 Traveloka 以及其他标志性的 B2C 东南亚客户。

然后这把我带到了 Databricks,在那里我担任类似的角色,在数字方面。但我也有更多所谓的商业,对吧?新兴企业。所以是传统的公司,但在整个东南亚都非常庞大,他们正在努力了解如何使用数据和 AI 来解决业务问题。那么你究竟是如何来到 Databricks 的这个职位的呢?

是的,我在这个过程中实际上一直在考虑这个问题。我回想起我们在 2019 年拥有 DNA 团队的日子,对吧?数据和机器学习,对吧?我们……

谈论这些问题,对吧,我们如何用数据解决问题,客户有很多数据,但其中很多数据都在数据湖和数据沼泽中,无法从中获得真正的见解,我们帮助了很多客户解决了这个问题,对吧,尤其是在我们的机器学习解决方案实验室中,通过数据科学解决了非常棘手的问题,对吧,当我在 Databricks 的过程中,我一直在考虑

我该如何回到真正具体的东西以及某个技术领域?亚马逊很棒。您拥有所有服务和所有技术,但您会变得非常广泛,对吧?因为您正在销售 200 种服务。但在 Databricks,重点非常明确,它是一个数据平台。我们正在构建顶部的智能。它也是 AI。这让我非常兴奋能够到达那里。而且还对再次组建团队和建立业务感到兴奋,因为您是

我认为数据和 AI 现在或去年可能处于与云计算六七年前在某些阶段相同的阶段。所以它正处于早期阶段

客户的思想份额和转型。我完全同意你的观点。我认为 AI 的重要部分实际上与数据有关。我发现,一旦客户真正了解其数据结构在哪里,我们在数据分析和机器学习之间(甚至在我们所说的生成式 AI 中)的工作集成现在往往可以相当无缝地集成。所以在进入今天谈话中最令人兴奋的部分之前,我绝对必须问你这个问题。

从职业生涯来看,您能与我的听众分享哪些经验教训?我一直认为,在任何事情中,个人胜于专业,对吧?所以没有人会记得你加班工作。当你退休时,没有人会记得你加班加点工作,对吧?所以个人目标非常重要,因为你的个人目标会推动你的职业目标,对吧?我认为这对您来说也很重要。我知道你对 NUS 和教育充满热情,对吧?这是其中很大一部分。

你生活的一部分,我认为是的,就像我与许多团队成员一起工作一样,我有一个收购团队,他们在职业生涯中比较新,职业生涯早期,我总是对他们说,你不需要着急,你的时间现在是正确的时间,不要看着别人,想着,你知道,我应该像那个人一样享受这一刻,它过得很快,对吧,然后专注于你的职业,对吧,如果你是一名工程师,如果你是一名数据科学家,你必须成为你所做工作的专家,你的编码技能需要练习,我认为有很多

关于 AI 会改变的噪音。就像你不再需要软件开发人员一样。我根本不相信这一点,对吧?软件开发是一种创建软件的方式的艺术。我认为 AI 无法这么快达到那个水平。在销售方面更是如此。销售是一种职业。你需要努力工作。你需要努力进行发现,了解客户的问题。

深入了解技术难题,转化业务目标,然后展示您的解决方案如何真正实现差异化并帮助他们解决这些问题。而你只有通过练习才能做到这一点,对吧?我认为交付成果非常重要。我们从亚马逊那里知道这一点,对吧?所以我们从客户痴迷开始,以交付成果结束,我们中间有所有领导力原则。但实际上,这是一个成功的滞后指标。它确实表明您制定的战略、您执行的策略都奏效了,对吧?然后你最终会得到结果。

最后,回到整个个人方面,做一个善良的人,对吧?因果报应会回来咬你。所以是的,做一个好人,我认为事情会发生。Patrick,你是我合作过的最好的人之一。我绝对是在公开场合这么说,因为我认为我真的很享受你如何指导我完成我们思考如何与 ISV 进行销售以及背后的思维模型的过程。有了这个,让我们进入今天的主题,我想谈谈数据中断

东盟以及数据和人工智能时代。也许首先,你能谈谈现在亚太地区甚至东南亚的数据和人工智能的总市场机会,特别是对于商业企业而言,以及为什么 Databricks 现在有望占据这个市场?是的。

我认为在我们查看数据之前,我想看看云市场,对吧?我认为在东南亚,与 Gartner、IDC 和其他人交谈,但大约是 200 亿美元,对吧?而大约 8% 到 10% 的 IT 支出都在云端,你知道,与超大规模公司、AWS、GCP、Azure、阿里巴巴等,对吧,中国云。

对于特定数据 AI 工作负载,我们认为东南亚的市场规模约为 10 亿美元。这还不包括计算和 GPU。在这里,我们谈论的是 SaaS 传递部分,对吧?分析软件角度。所以这是一个巨大的市场,对吧?而且发展非常迅速。例如,Databricks 在全球范围内增长了 70%。在该地区,我们的增长速度实际上比这更快。所以对我们来说,这就像超高速增长一样,对吧?Databricks 在全球范围内是增长最快的企业软件公司,对吧?我们仍在保持这种速度

上次全球运行速度为 24 亿,增长率超过 60%。Databricks 的使命实际上是使数据和 AI 民主化,帮助数据团队解决世界上最棘手的问题。你会注意到我提到了数据。数据是所有一切的核心,对吧?如果你没有数据,你就无法进行 AI,对吧?

Databricks 的起源是什么,对吧?我们发明了 Spark,很多人知道,对吧?这彻底改变了从 Hadoop 时代开始大规模数据处理的方式。我们率先提出了数据湖概念,这意味着您将数据湖和数据仓库结合在一起,从而降低 TCO 并实现自助式分析。因此,您可以从云成本存储中获得分析,对吧?来自 S3,您无需管理和部署昂贵的数据仓库。对。

然后最后,我认为现在最重要的是,我们正在谈论数据智能。所以我们正在谈论

客户如何使用自然语言使见解民主化并在其数据、他们自己的私有企业数据之上构建 AI。他们不会将数据交给任何人。我们总是说,不要将您的数据交给 Databricks。您的数据,在其之上驱动您的见解。这将真正使您的业务与众不同。为了帮助我的听众,TCO 只意味着总拥有成本。我认为 Databricks 收购 Mosaic 也是一个重要的里程碑

对于 AI 方面。所以也许我们应该为我们的听众奠定基础,因为他们来自非常不同的商业领域。您能否解释生成式 AI 和数据湖的概念,以及它们如何帮助商业企业实现其业务目标?我认为您已经提到的其中一件事是使用数据湖概念,这实际上降低了总拥有成本并加快了销售分析速度。是的。

因此,对于数据湖,所以在我们拥有云之前,我们有内部部署的数据系统,对吧?我们有一个仓库,对吧,在云端。但这只是结构化数据。列、表,想想 Excel,对吧?所以你可以问问题,好吧?你进去过滤,然后说,好吧,我 1 月份的销售报告是什么?它们很容易看到,对吧?那是仓库世界。随着互联网在世界范围内变得普遍,我们有了……

网站、图片、图像、视频和社交媒体以及所有这些数据,非结构化数据,对吧?云出现了,我们说,好吧,我们如何廉价地存储这些数据?那是亚马逊。第一项服务是 Amazon S3,简单存储,对吧?因此存储变得非常便宜,我们把所有东西都放在那里。

我们创建了数据湖。所以我们有一个数据湖,然后我们有一个内部部署的数据仓库。所以我们想,好吧,我认为我们可以将数据仓库放入云中。所以数据仓库进入了云端。我们有,你知道,亚马逊有 Redshift,谷歌有 BigQuery,Azure 有 Synapse。所以他们在云中构建了所有这些数据仓库来处理结构化数据。但我们仍然有同样的问题。我们仍然有数据孤岛。所以非结构化数据在您的湖中。

所有结构化数据都在您的仓库中,并且试图找到两者之间的共同点。工程团队、数据分析团队仍然需要做很多工作。他们仍在努力创建报告并进行大量手动工作。所以这是一个真正的问题陈述。而且两者的成本都在增加,您正在为

数据湖中的存储付费,您还在为数据仓库中的存储付费。我们想,好吧,一定有更好的方法来做到这一点。因此,Databricks 的创始人来自伯克利。他们撰写了一篇论文,一篇学术论文,定义了这种架构应该是什么样子,围绕它的关键原则是什么,以及它对客户意味着什么?这就是几年前数据湖概念的起源。

那么,Databricks 的战略如何,我们目前的架构是否依赖于这个湖概念,以及它如何发展到 AI 方面?

数据湖是所有一切的基础,对吧?所以您所有的数据都存储在低成本的云存储中,然后所有分析师和数据科学家都可以使用相同的数据副本进行工作。所以是一份数据副本,对吧?这是所有一切的基础。现在,正如您长期以来所知,您是 ML 世界的 OG,对吧,Bernard?当它被拼写为 ML 时,您就在谈论 AI。所以现在,有了这单个数据副本,现在您可以……

运行机器学习模型,您可以使用不同的数据集对其进行训练,但它不是坐在此环境中的数据集或此处具有数据漂移的另一个数据集,然后模型就像您在猜测模型一样,您说好吧,这是一个好的结果吗?因为我不确定数据是否干净,所以一旦有了它,您就可以在数据湖架构之上添加智能,我们称之为数据智能,所以 Jenny 我显然是

当 GPT 出现时,世界有点不一样了。我们并没有忘记经典的 AI,你知道,那些关于预测客户流失、预测需求、优化客户体验的伟大用例。这些对今天的公司来说都是巨大的好处,对吧?Gen AI 显然会生成内容,您将拥有智能顾问,并且在金融服务中,机器人顾问,这太棒了。但我认为我们应该从更广泛的意义上谈论 AI,即生成式 AI,以及经典 AI。

我认为这是一个很好的观点。我认为目前很多人只关注 Gen-AI,但他们忘记了实际上有很多非常经典的用例已经能够被您提到的基本 AI 应对。我可能非常好奇。我知道 Databricks 是一家由安德森·霍洛维茨资助的非常著名的公司。我听过您的首席执行官 Ali 做的一些小组讨论。Databricks 在东盟目前的业务足迹是什么?

是的,我将从 APJ 开始。因此,我们在该地区有五个明确的市场,从印度开始,然后我们有东盟、大中华区,我们在美国、日本、韩国,然后一直到 A 和 Z。

因此,对于东盟 GCR 或 APJ 而言,新加坡是其总部。所以去年当我们进行数据之夜世界巡回演出时,这是一个在新加坡举行的旗舰活动,我们宣布新加坡现在是 APJ 的区域中心。我们制定了所有计划来增加新加坡的劳动力,与新加坡经济发展局合作,在现场工程方面增加关键角色,以帮助客户解决问题,我们的专业服务、战略运营、学习支持等。所以我们正在建设

在所有不同职能部门建立一个完整的团队。在整个 APJ,我们拥有超过 800 名员工,其中约有 150 名员工在新加坡。而这项投资的一部分实际上是,我们真正致力于民主化,对吧?而这实际上意味着我们将提升超过,你知道,新加坡 10,000 多名数据和 AI 人才。这是与 IMDA、培训合作伙伴、NTUC 学习中心和 NUS 信息与通信技术学院的合作。

我认为您也与初创公司合作,特别是与 Gen EF 合作。你能谈谈这个吗?是的,我所做的事情中充满热情的一部分。所以是的,在去年的年中,我们一直在考虑,我们有一个面向初创公司的 Databricks 计划。你知道,我们,就像超大规模公司一样,我们投资于它们,我们为它们提供积分,我们为它们提供市场营销专业知识,并帮助它们,你知道,考虑如何在……

在 Databricks 上构建产品。随着东盟 Genii 基金的成立,专门投资于 Genii 初创公司,你知道,由前亚马逊员工成立,你知道,那里有 Dan、Laura 和 Kai。所以我们很了解他们。我们去年进行了一次六个城市的巡回演出。这很棒。这对我们来说很棒,因为我们发现有 500 家我们不认识的公司不在我们的视野范围内。所以这太棒了。

然后我们有很多像现在这样与我们一起建设的公司。我们正在投资它们。显然,Jenny,我们也在投资它们的股权。现在下周和接下来的两周,

4 月 10 日,我们将进行初创公司匹配。因此,我们将与企业确定为高优先级的初创公司。我们将在 4 月 10 日与新加坡经济发展局和谷歌一起进行这项工作。这将是一个很好的活动,可以看看这些公司如何发展壮大。是的,我还想强调一下,我认为 Databricks 现在实际上是多云的,对吧?它绝对不仅仅是与亚马逊网络服务合作,还有谷歌 GCP 甚至微软 Azure。正确。

是的。那么客户现在如何在东盟使用 Databricks?您能否分享一些非常有趣的案例研究?是的,当然。我认为这非常多样化,对吧?我们拥有从高度管制的行业(如金融服务和电信)到 Grab 等一些最大的数字原生客户,遍布整个地区。

我认为 Grab 是一个很好的例子,因为他们多年来一直与 Databricks 合作构建客户数据平台。您可以想象,他们拥有数百万个数据点,来自客户、打车服务、送餐服务以及其广告的所有不同信号。那么他们如何管理所有这些接触点并建立以客户为中心的体验,然后为我们数百万客户个性化推荐呢?

我认为这是一个很好的例子。我认为另一个例子是新加坡的 GetGo。我认为你可能以前用过。新加坡最大的汽车共享平台。这确实有助于提高客户满意度和车队利用率。因此,一些关键数据点,你知道,他们真的将洞察力的获取时间加快了 66%。现在他们可以将洞察力的交付速度提高七倍,从而做出,你知道,次日业务决策。而且他们……

想要真正弄清楚,好吧,客户实际上是如何使用汽车的?因此,通过分析预订行为、加油模式,他们实际上可以将偷油行为减少 50%。

这对他们及其业务来说确实非常有效,因为它最大限度地减少了食品卡的滥用,并真正增强了整体客户信任度。所以这就像,我认为这是两个更具数字类型的客户。然后我认为越来越多的受监管的机构,例如 GovTech,我认为您也与他们有很多合作,并且了解他们所有人。所以真正负责,你知道,公共部门的数字化转型,使用 Databricks 来增强销售服务分析,并通过我们的

数据安全和治理,因为所有不同的政府机构能够让所有机构都能访问他们需要的数据。他们真的实现了,你知道,仪表板可以创建速度提高三倍。他们可以使数据民主化,50% 的数据遍布各个公司部门,并且每年实际节省了 8,000 个工时,这对政府机构来说是巨大的。哇。所以他们实际上实际上是

因此,这就像为整个新加坡政府大规模采用 Databricks 一样。完全正确。生产力提升非常棒,因为您是,该平台消除了许多繁琐的手动工作。我经常听到关于像 Graph 这样的多区域公司以及新加坡的本地公司。你能谈谈,比如说,也许在其他地方的其他用例,我认为暹罗商业银行也是你们的客户之一,对吧?是的。是的。我认为暹罗商业银行是我们的一个很好的客户。

当然,在金融服务领域,你知道,作为一家大型银行并拥有大量数据资产和 IT 房地产。所以我们真正与他们合作的是,我们如何创建一个无缝且个性化的数字银行体验?但他们想要做的最重要的事情是如何创建一个由 AI 驱动的客户 360 度视图?

而这实际上意味着,好吧,您通过网站、移动应用程序或亲自与银行互动。所有这些数据点都绑定在一起。因此,如果您通过网络访问,则所有这些都会被记录并映射到您周围,并且您不会重复数据。从流程中删除了许多纸张。我认为对他们来说真正的改变者是他们如何进行即时贷款审批。你知道,即使在今天很多时候,

您提交贷款申请,填写文件,签署文件,您必须扫描它,然后发送它并等待两周,对吧?才能回来。但这现在就像一键式流程一样,因为 SCB 已经建立了您的个人资料,建立了风险个人资料,了解您的收入,了解您的支出,并且能够预测,根据预测分析,您是否符合条件?由此,它变成了,

客户体验非常棒,但他们的数字贷款产品的批准率提高了两倍。是的。所以我认为这种 AI 信用评分,我记得在 AWS 的那些日子里,我们谈论过它,但现在我认为看到它付诸实践是相当有趣的成果。那么,您从东盟的客户那里学到了哪些意想不到的见解或挑战呢?我认为客户是最终的反馈来源,对吧?所以他们真的,Databricks 的一个原则就是真正痴迷于客户,并且,

我们是由构建产品并担任科学家的学者创立的。因此,当我们构建产品时,我们确实会考虑现场的需求以及客户告诉我们的内容。我们将这些反馈重新融入产品功能和特性中。因此,我们获得了有关我们的流媒体服务、仓库和 UI 的反馈。

例如,Databricks 助手,这是我们的 UI,它将包含编码部分和表格,其中很多都是来自我们社区和客户的反馈。好的,这就是您获得反馈的方式。所以我要稍微改变一下话题,但是鉴于现在基础模型和 AI 代理激增,我想 Databricks 如何看待自己在市场中的地位?

是的,我认为收购 Mosaic AI 对我们来说是一个真正的改变者,它改变了我们对 AI 的看法,也改变了我们对,你知道,我们带入公司的那些人才的看法。Mosaic AI 拥有一个非常深厚且才华横溢的研究团队,他们正在真正解决我们大规模的问题,对吧?尤其是在科学方面,对吧?而这真正带给我们的就是深入思考企业质量,

当我说企业质量时,是指必须在安全性和治理方面非常强大的东西,并且能够以非常低的成本提供服务。

因此,我们的立场是,您应该完全控制您的数据和模型。你不应该把这些交给市场上任何低级的SaaS模型或模型,因为我们认为,如果您在零售行业,那么您用来训练其他人模型的数据,其他人可以使用该模型,并可能从您用来训练该模型的数据中获益。所以我们真的应该保持控制。这

接下来是真正意义上的大规模生产质量,对吧?所以企业规模意味着您需要具备这种能力,但您还需要管理质量、幻觉和毒性,对吧?这非常重要。很多情况下,这取决于企业内部的治理实践,这样您也可以控制它。成本我已经提到了,对吧?真的要控制住。

那样的成本。显然,我们是所有GPU供应商和英伟达的重要合作伙伴,所以我们也可以在这方面提供帮助,当然还有云提供商。然后是原生支持,我们已经构建了一个端到端的遗传框架。我们的想法是,就像技术中的所有事物一样,要抽象化很多技术。希望您不必考虑RAG和向量数据库、嵌入和权重。你可以去找一个人,我有一个业务问题。我正在尝试为我的HR开发一个

内部知识聊天机器人,我应该能够直接启动它,然后平台将在下面处理它。这就是我们正在构建的框架。所以在Databricks的观点中,这些层实际上是从客户那里提取出来的,这样他们基本上只需要关注从他们的数据中获得他们需要的东西。可能是见解,可能是对他们的

所有这些,而且我说的对吗?你们的大型语言模型db rx也正在Databricks架构上部署?是的,是的,我认为dbx是大约10天内性能最好的模型,直到下一个模型出现,不,它还会回来的,所以每隔一周我都会得到一个新的基础模型,这个模型的性能比另一个模型更好,所以我期待db rx在某个时候出现一个更好的模型

是的,是的。它的目的不是为了展示性能最好的模型,而是为了展示以经济有效的方式做到这一点。是的。阿里在发布时谈到过,我们从头开始训练该模型,并进行大量优化,尤其是在混合专家模型方面,尤其是在如何调用编码专家、英语专家或数学专家方面。是的。我们花了1000万美元完成了所有这些工作,这在当时非常惊人。

对于企业AI应用来说,这令人印象深刻。我和许多使用Databricks的企业谈过,我认为这很有趣,我认为这就是我所说的完全由企业驱动的AI模型。我认为很少有基础模型在考虑

因为我认为他们试图为所有人提供所有服务。那么,你对亚洲的Databricks了解的一件事是什么,而很少有人知道呢?我认为,技术方面是存在的,我们在活动中展示了我们的技术,我们显然也与客户和合作伙伴合作等等。但我认为有一点是

我们是一家极其多元化的公司,对吧?员工来自不同的文化背景。就我的团队而言,我显然有新加坡人、印度人、泰国人、越南人、印尼人、法国人、爱尔兰人,非常多元化的文化背景,我认为这对团队来说非常棒。

但从公司经验来看,我们聘用了来自各种背景的人才。当然,我们有超大规模企业,像我本人来自AWS,我们有来自GCP和微软的人。但我们也有很多人来自应用供应商,比如软件、Salesforce、Workday,

像New Relic这样的可观察性供应商。我们有来自系统集成商的人,他们展示了他们如何构建端到端的解决方案和实施计划。我认为这种多样性确实帮助我们互相学习,并更好地为客户服务。例如,很多人可能一直在销售CDP解决方案,并且对所有这些用例了如指掌。或者有人来自SI,并且实施了非常复杂的内部部署数据仓库迁移,我们也可以从中学习。所以这真的帮助我们

成为一个非常全面的团队,为客户提供数据智能平台。所以我想现在我有一个好奇的问题,那就是考虑生成式AI和数据的趋势。您在全球或本地看到的哪些趋势正变得对业务应用越来越重要,考虑到它们的企业AI部署?是的。我认为现在GenUI的主要问题是,当然,代理是一个新的流行词,对吧?这是一个新的流行词。这是一个新的流行词。

我们称之为流行词。是的。好吧,我们正在看到实际的部署,对吧?万事达卡刚刚为其数字支付评估部署了代理框架,此前进行了大约300次POC,他们公开谈论此事,因为这是过去18个月或几年的测试,看看什么有效,以及

就像我们与《经济学人》的最新报告一样,我们发现大约85%的Gen EI项目仍然是POC,并没有投入生产。但我认为我们现在正在看到实际生产的第一阶段,因为Agent是端到端的。Gen EI的起点非常明确,好吧,它是LLM,我只是在做这个。您需要拥有整个端到端框架。我认为我们看到的另一个趋势,实际上我昨天与一位大型GSIS谈到了这个问题,

许多客户希望访问他们管理下的所有数据。所以他们希望所有数据都在一个地方,对吧?他们的数据到处都是。它在数据湖中。它在数据仓库中。一些在SAP中。一些在Salesforce中。一些在不同的平台上,营销平台上。

他们希望所有数据都在一个地方,看看他们如何才能获得更好的见解。实际上,这是我们正在努力做的事情,这被称为Lakeflow Connect,我们连接到所有这些系统,只提取相关数据以获得业务想要的答案。它基本上是一个数据连接器层,非常类似于,我认为,Entropi现在称之为模型上下文协议,MCP或类似的东西。是的。然后超级重要的是治理和安全。就像,一切,你必须从……开始

这是关键。这是从一开始就有的。它不是附加组件。如果您没有设置好数据的治理来确定,好吧,谁可以查看什么,血统是什么,谁可以在什么时间访问什么,并能够追溯到您的系统,尤其是在企业和受监管的行业中,如果您有任何违规行为,您将陷入困境,对吧?所以我们认为

治理是如此重要的一个部分,这是不可谈判的。我们在AWS也总是这么说,安全是首要任务。是的,治理非常重要。绝对的。我认为很多高级管理人员在我AWS培训时都非常关注如何考虑数据的防护措施。我认为这可能是企业客户的主要担忧之一。我认为很多公司没有考虑,为这些客户服务的公司并没有真正考虑这个因素有多重要。但是本地情况呢?是

就生成式AI和数据的趋势线而言?是的,我认为采用阶段不同,对吧?我认为像真正先进的大型数字原生企业,对吧?他们多年来一直在构建数据平台,他们构建了AI堆栈,自行构建或与云提供商或Databricks一起构建的各种版本。所以他们真的帮助我们,真的挑战我们在提供更好的性能、更好的性价比、更好的成果、代理框架方面的挑战,这太棒了。再次,给我们提供关于我们产品的反馈。

我认为在企业方面,我认为他们很多人只是,他们真的受够了他们的遗留内部部署仓库。这对企业来说是一笔巨大的成本,获取数据非常费力。所以他们中的很多人都在寻求迁移到云端,在云端构建他们的湖仓,然后从中获得这些见解。我认为我们如何帮助客户的关键部分是,我们宣布收购BladeBridge。所以BladeBridge是一个数据仓库分析工具。分析您的内部部署数据仓库,并

查看,好吧,它会是什么样子,然后它将能够将代码转换为云代码。这是一种非常好的迁移到基于云的湖仓的方式。然后,我认为随着我们进入中端市场SMB,他们真的只想访问他们的数据来推动他们的业务,而无需大量的工作。所以他们正在寻找经济高效的BI解决方案。他们如何才能真正深入了解他们的数据,允许自助分析

提出问题。在那里,我们提供,我们有我们的genie助手,你知道,它会问一个自然语言问题。然后我们能够构建仪表板。我们称之为AI BI。所以我们正在重新思考BI的世界,它是仪表板。它应该是仪表板,并提出问题。你实际上应该能够绘制一个仪表板并提取你喜欢的数点。

对。所以基本上,这个AIBI是早期版本的融合,比如说,商业智能能够获得你的分析,但是现在有了AI来增强其上的见解。

我的理解正确吗?是的,正确。你可以输入一个提示,说,好吧,给我过去12个月的销售报告,并用条形图绘制出来,然后你就完成了。是的,那是你的所有数据,对吧?正确。我查看了一些来自那里的报告,我认为我看到其中一份是关于Databricks的。我认为你还谈到,我认为你还谈到

谈到有一些数据专门针对东盟目前的架构,以及东盟国家如何将Gen AI视为具有战略意义。你能详细说明一下吗?或者也许你能给我更多关于这件事的信息?我们对全球的《经济学人》进行了一项调查,显然也包括欧洲和亚太地区。我们提出了一个问题,我的组织的当前架构是否支持AI工作负载的独特需求。并且

基本上85%的人说不行。我们没有架构来支持它。有些像它部分可以,但需要大量修改。所以我们仍然觉得很多人还处于早期阶段。这种数据点与,是的,85%的Gen EI尚未投入生产相呼应。所以它有点总结了。

也与之相关。我认为另一个有趣的点是,你的架构是否将AI应用程序与你的相关业务数据连接起来,这对我来说可能几乎更重要。同样,仍然约有80%。我们没有这个,因为业务数据到处都是。就像我们一样

我们多年来一直在谈论这个问题。没有干净的数据,你就无法获得好的AI。所以我想基础设施问题还没有真正得到解决,基本上。我同意,是的。是的,我认为更多的企业主应该和你谈谈,他们应该和我谈谈,是的。那么东盟国家对Gen AI战略重要性的看法呢?是的,我认为这非常有趣。所以,

与英国和日本一样,东盟的比例在70%左右,高70%到80%。Gen EI对他们的长期战略目标至关重要,这非常有趣。而与韩国相比,韩国约为65%,这对我来说有点令人惊讶,因为韩国是一家非常高科技的公司。所以这确实表明,在东盟,许多公司都在考虑如何利用Gen EI来真正区分业务、发展业务,并真正推动增长

是的,它推动了我的公司的增长,但我认为它也推动了国家的大量增长。你知道,我们将推动GDP,我们将拥有初创企业,我们将拥有企业,我们将拥有培训。所以我认为社会影响将非常巨大。我认为,所以现在我们谈到了大型语言模型。我认为更多的是从现在哪个新模型出现等等的角度来看。但我稍微改变一下问题。从你的角度来看,

企业应该如何看待基础AI模型?例如,我们谈论Databricks,DBRX,以及他们如何实际考虑代理AI工作流程。因为我认为我们仍然需要帮助决策者考虑这些工作流程,还需要进行很多教育。总会有新的模型出现,对吧?我们推出了DBRX,我们所有的意图都可以展示。

一个领先的LLM可以像1000万美元一样进行训练和微调。是的。通过这种深度搜索,这有点震撼了世界,这太棒了,对吧?是的。展示了如何在技术限制下进行创新。然后我们有Manus,它展示了……

一个跨多个不同平台工作的代理,这也很酷。但我们相信,你应该拥有一个包含干净数据的平台。你应该能够访问我们提供的所有这些模型。所以我们有一个API网关,你可以决定,好吧,我的数据集在这里。我想……

运行一个GenAI应用程序。我应该使用GPT吗?我应该使用云吗?我应该使用DeepSeq吗?我们为您提供这种能力。我们认为您应该选择最适合该用例的模型。我们为您提供了使用它的机会。是的。我相信现在我们已经看到一切都会转向应用程序。所以我要问你这个问题,埃德。对于企业主来说,在考虑在其组织中实施AI应用程序时,你的建议是什么?

对于AI应用程序,这实际上取决于谁是

贵公司中的产品团队,对吧?我认为现在很多公司,如果你考虑数字原生公司,他们都有团队,对吧?他们开发产品。有一个首席产品官和产品经理。在企业中可能少一些,因为这可能位于IT团队或某些应用程序团队或客户服务团队之下。我认为他们需要真正考虑什么是产品以及它在做什么?有了产品设计,你就会开始考虑底层技术图谱。对。

所以这有点像你考虑过去两年有很多概念验证,对吧?实际上,有多少百分比是真正意义上的生产,我们如何才能将它们推向生产工作负载呢?

是的,我认为在过去,我认为这是从康拉德的报告中看到的85%。我也在现场看到了这一点。去年我们在内部知识、聊天机器人、外部、一些客户服务助手、内容创作方面做了很多,你知道,用于营销等等。很多内容实际上已经投入生产,这很有趣,因为它有点,显然是销售增强,你知道,准备销售外联和消息传递。

消息传递。很多工作都是由今天的AI完成的,因为我认为这非常有用。但我认为我们还没有看到真正面向外部的Gen AI用例大规模应用。但我认为它即将到来,因为我认为人们仍然担心,客户担心幻觉和提供错误信息。你知道,我们有加拿大航空公司和雪佛兰的案例,聊天机器人向客户提供错误信息。但我认为有了防护措施和安全措施,并能够

训练模型,但训练系统应该说什么,不应该说什么。同样,这都与您的企业治理和安全态势相关,对吧?我认为这就是我们可以帮助许多公司投入生产的地方。那么,你希望更多人问你关于Databricks的哪个问题呢?是的,我希望他们问我,什么是数据智能?好吧,那么什么是数据智能呢?人们总是问我什么是湖仓,但我们说湖仓是架构。但是对于数据智能,正如我之前所说,它就像使

访问您的数据以获得情报,因此您考虑一下这些数据,它是您的AI,因此使用数据智能,您拥有干净的数据,并且知道它在哪里,并且知道您可以对它做什么,但是您可以从中获得情报,因此您可以询问有关您的客户的问题,您可以询问有关您的运营的问题,很多都是非常自然的语言,并且能够立即获得答案,对我们来说,数据智能对于世界上最小的

公司到最大的企业,我们认为每个人都将采用这种方法。这太简洁明了了。我想我也会尝试使用这个标语。请这样做,请帮我推广它。所以我的传统结束问题是,从你的角度来看,Databricks在东盟取得成功是什么样的?是的,好问题。我认为我们一开始就暗示了这一点,我认为我们正处于一些特别的事情的开始,尤其是在AI方面。

这就像千载难逢的机会,可以改变人们的工作方式、生活方式以及人们通过数据智能的概念相互联系的方式,对吧?对于最小的公司、最大的企业、受监管的行业、政府来说,都是如此,真正解锁大量数据,并解决许多非常棘手的问题。就像我们真的在这里解决棘手的问题。然后对于人们来说,这一切都是为了创造一种职业生涯中具有决定性意义的体验,对吧?

我们是发展最快的软件公司。我们的增长率超过60%。我们正在大力投资于我们的人才。我们正在投资资源。我们正在投资技术,以真正实现数据智能战略。然后对我来说非常重要,尤其是在某些阶段,与我们的合作伙伴建立生态系统。你之前提到过,我们与所有云提供商合作。我们与系统集成商合作。我们与ISV合作。我们与国家协会合作,例如新加坡的IMDA、马来西亚的MDEC、越南的Venasa。我们如何真正……

推动生态系统升级。数百万的人?新加坡有1万人,但数百万,对吧?东南亚数百万的人。这对我们来说将是伟大的。哇。这是一个很好的总结方式。所以帕特里克,非常感谢你来到节目中。当然,如果你正在招聘,我强烈建议任何人加入你,因为当我与你一起工作时,帕特里克一直是一个非常公平而伟大的老板,并且教会了我很多东西。所以最后,我有两个快速的问题。最近有什么推荐激励了你吗?

是的,我一直在考虑这个问题。所以我在东盟各地旅行很多,对吧?你知道,新加坡,我们非常享受出入机场的方式,对吧?身份识别等等。通常在其他机场,我需要签证,因为我的护照是爱尔兰护照,我需要提前申请并盖章等等。但我两周前去了雅加达,我正在排队,对吧?我要去,那个人走过来,说,不用,自动门。我说,不可能吧,对吧?自动门给我。

他说,是的,上去。好的,我有我的签证,我的二维码。我扫描,面部识别我,我就通过了。这是我一生中最快的一次通过雅加达机场的时间。所有这些都是由AA支持的,对吧?你知道,面部识别,映射回我拥有二维码的那一天,映射到我的护照号码。所以这对我来说非常惊人。这就像一项创新,它将使印尼的旅游业疯狂增长。

是的,我最近在台北和吉隆坡也有同样的经历。也是一样,自动门,直接通过。你甚至不需要快速通道,一个特殊的折扣才能通过。所以我的最后一个问题是,我的听众如何找到你?是的,领英最好。你可以在领英上找到我,或者[email protected]。是的,欢迎。任何你进行的对话,任何你正在寻找的关于湖仓、数据智能的东西,是的,我很乐意谈谈。

所以你绝对可以在YouTube到Spotify的任何地方订阅我们。现在都是视频了。当然,与我们分享您的反馈,并且绝对给我们任何播客平台五星评价等等。帕特里克,非常感谢你来到节目中,我非常喜欢这次谈话。我希望你一切顺利,我们很快会再次交谈。是的。伯纳德,最后再宣传一下。Databricks的数据和AI峰会。

在旧金山,6月9日至12日。如果您有兴趣,请注册。这将非常棒。我们今年的目标是超过2万人。这是一个学习的好场所,很棒的体验,各种各样的客户、行业等等。所以是的,我们敦促您参加。绝对的。所以如果您有兴趣,请参加此活动。帕特里克,非常感谢。谢谢,伯纳德。