We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 891: Conversational AI is Overhauling Data Analytics, with Martin Brunthaler

891: Conversational AI is Overhauling Data Analytics, with Martin Brunthaler

2025/5/27
logo of podcast Super Data Science: ML & AI Podcast with Jon Krohn

Super Data Science: ML & AI Podcast with Jon Krohn

AI Deep Dive AI Chapters Transcript
People
M
Martin Brunthaler
Topics
Martin Brunthaler: 最初,我们Adverity的目标是简化广告公司为客户创建报告的工作流程,通过自动化报告流程,减少手动操作和数据整理的时间。随着发展,我们扩展了数据连接能力,支持各种广告系统和相关系统的集成,以提供全面的报告所需的数据。然而,传统的仪表盘存在更新不及时、无法深入挖掘数据等问题。因此,我们引入了生成式AI技术,允许人们使用自然语言提问,从而更好地理解数据,实现数据民主化。为了确保数据对话的有效性,数据质量至关重要,需要完整且与各种来源良好对齐的数据集。我们平台中的数据质量组件可以帮助监控数据中的各种问题,例如命名约定。通过这些努力,我们希望解放数据分析师、数据科学家和机器学习工程师,让他们能够解决更有趣的问题,专注于业务价值和战略,而不是忙于繁琐的数据整理工作。我坚信,未来的数据分析将更加注重战略和业务价值,而不是技术细节。

Deep Dive

Shownotes Transcript

Martin Brunthaler与Jon Krohn讨论了创立Adverity(一个用于营销的数据分析平台)的经历,该平台简化了来自多个来源的数据集成并将其转化为可操作的见解。了解Adverity如何成为服务于多个行业的强大的数据分析平台,以及Martin为何认为人工智能会增强而非减少数据科学家、数据分析师和机器学习工程师的就业市场。

(14:26) Adverity的功能 (39:24) 数据分析师、数据科学家和机器学习工程师是否应该担心Adverity会使他们的工作变得多余 (48:29) Martin对数据分析师和数据科学家的未来预测 (51:39) Martin作为CTO的成功秘诀 </context> <raw_text>0 这是第891集,嘉宾是Adverity的联合创始人兼CTO Martin Bruntaler。本期节目由AWS最新的AI芯片Tranium 2和戴尔与英伟达合作的Dell AI Factory赞助播出。

欢迎收听Super Data Science播客,这是数据科学行业收听率最高的播客。每周,我们都会为您带来有趣且鼓舞人心的人物和理念,探索机器学习、人工智能和相关技术的尖端领域,这些技术正在使我们的世界变得更好。我是您的主持人John Krohn。感谢您今天加入我。现在,让我们化繁为简。

欢迎回到Super Data Science播客。今天,我们将为您带来一个有趣的主题,关于生成式和自主式人工智能如何改变数据分析。本期节目的嘉宾是Martin Bruntaler,他是Adverity的CTO,这是一个他十年前共同创立的奥地利数据分析平台,此后已筹集到超过1.6亿美元的风险投资。

在创立Adverity之前,Martin是另外两家欧洲科技初创公司的联合创始人兼CTO,这使他在多个行业(包括电子商务、媒体和移动领域)的创业、扩展和退出公司方面拥有超过20年的综合经验。他拥有奥地利萨尔茨堡应用科学大学的工程学文凭。

本期节目应该对任何对本播客感兴趣的人都有意义,因为它涉及数据分析、利用现代人工智能能力改变用户体验以及发展科技企业。

在本期节目中,Martin详细介绍了他儿时对计算机编程的迷恋如何发展成为创立一个全球领先的营销数据分析平台,数据民主化真正的含义以及传统的基于仪表板的数据报告方法如何让企业失败,为什么数据分析师花费太多时间在繁琐的工作上而不是创造业务价值,对话式人工智能如何彻底改变数据从业人员和业务用户获取数据洞察的方式,以及数据分析

最后,他还提供了关于科技创业成功的务实建议。好了,准备好收听这期精彩的节目了吗?让我们开始吧。Martin,欢迎来到Super Data Science播客。很高兴邀请您参加节目。您今天从哪里加入我们的?- 非常荣幸见到你。我在奥地利的维也纳,位于欧洲阿尔卑斯山脉。- 如果我没记错的话,维也纳连续几年被《经济学人》杂志评为全球最宜居城市。是的,它确实是一个非常漂亮的地方。我必须同意。我个人来自农村地区,你知道,在2000年代初期,我很难搬到大城市,如果你愿意的话。我认为这在全世界都是一样的。过了一段时间后,我在这里真正安定下来了,我非常喜欢这里。

所以,我们在这里。还有一个奖项是“最脾气暴躁的人口或公民”,我认为维也纳也连续几次获得这个奖项。哦,真的吗?我记得一些事情,比如,我在新加坡住了12个月,我认为那是世界上最悲惨的国家。

是的,这很有趣。我想,期望管理。是的,完全正确。这可能也是很好的营销手段。最刻薄的城市?你知道,我认为从城市营销的角度来看,这可能是一项资产。我不是,你知道,人们也为此感到自豪。很好。所以,除了从农村搬到

维也纳,到大城市。Martin,跟我们讲讲你在科技领域的历程吧。你是如何开始从事科技行业的?是什么促使你共同创立了你的公司Adverity?当然。我是在很小的时候就开始接触计算机的,我想,八九岁的时候,我接触了一台Mica电脑。如果你愿意的话,这是一种。所以我年纪还不大,没有C64,但仍然是一台非常基本的电脑,在那里我熟悉了基本的编程,这是……

我很享受创造这些小型游戏并将内容从杂志输入电脑的乐趣。在学校里,我学习了很多网络知识,管理学校的网络。我们在那里对计算设备玩得很开心,进行了一些黑客活动并了解了这些东西的工作原理。当时的设备相当老旧。

而且没有互联网接入。所以我们不得不安排,你知道,有一些流行的计算杂志和书籍,我们不得不阅读并开始使用这些东西。然后在我上学期间和之后,我做了一些,你知道,集成系统编程。在学校里,这是一个电信学位,所以有很多信号和数学与之相关。但与此同时,我

加入了一家与移动网络运营商密切合作的公司。我们基本上是为移动网络运营商创建应用程序。过去有一种叫做WAP的技术,

这是一种可以通过短信发送的微型网站。而且,你知道,从那里开始创建相当大规模的消息系统。例如,我们创建了为美国偶像短信投票提供支持的软件。在奥地利,我们也为几家广播电台和电视台提供了我们的技术支持。而且,你知道,我们在2006年退出了这家公司,在一家更大的公司(一家美国公司)工作了一段时间。在那时,他们有很多,你知道,活动在

我认为当时的口号是参与每一笔交易,这很有趣,持续了两年。但尽管如此,我还是想做一些创造性的工作,这就是为什么我们创建了一家孵化型公司,尝试了一些东西,之后我创建了一个价格比较引擎,如果你愿意的话,整个浏览器附加组件

生态系统当时正在蓬勃发展。所以我们创建了一个扩展程序。你可以实时比较价格并建议替代方案。是的,所以我和我的联合创始人Alex和Andreas已经认识一段时间了,我们有一个有趣的问题需要解决,那就是关于电视广告的报告。对于一个不同的项目,我们很难获得关于电视广告成功指标的数据。

我们认为一定有比获取CSV文件、创建临时报告并将其放入PowerPoint演示文稿更好的方法,而我们是在广告播出六周后才收到这些演示文稿的,所以这就是我们开始自动化报告的原因……

在2015年,我们决定将其作为一个独立的公司注册,这就是今天的Adverity。所以它包含了广告,我想这反映了你的广告背景,对吧?

是的。然后是Adverity,这很有趣。我不知道这是否只是你选择的一个好听的名字,但它也是,这与拉丁语中“真理”的词根有关,对吧?是的,完全正确。所以这与之相关。至少这是背后的想法。它作为一个品牌发展壮大,但是,是的。是的。

即使在那时,.com域名也很少见。所以是的,我们不得不。这是一个不错的域名。是的,“真理”在数据背后,尤其是在广告数据背后,对我来说很有意义。你正要说什么,我刚刚打断了你。不,很好。这正是故事的简短总结。好的。

Martin,你的英语说得这么好?你的英语很棒。我很想知道这是怎么回事。就像,你知道,你描述的关于你故事的一切,你知道,你在德国乡村摆弄旧的网络组件。你是什么时候开始如此流利地使用英语进行技术性描述的?这是怎么回事?

说实话,我不知道……而且公平地说,我的英语培训并没有跟上进度,所以我在学习期间在英国待了半年,就像……我不确定这是否仍然可行,但在欧洲,你有一个项目,你可以参加

或加入国外的另一所大学。我们与英国斯塔福德郡大学有合作关系。我在那里待了一段时间。我倾向于阅读大量的英语资料,显然。我尽量观看原版电影。基本上……

我个人认为自己不是很流利,但这对我的日常工作有效。我会说你非常流利。这对许多北美人来说是多么尴尬。我们很多人都在这种单一文化中。我学习了12年的德语,每周六都学习

而且,就像,在我开始录音之前,我甚至感到尴尬,想尝试一下,你知道,我可以点一份炸肉排和啤酒,在旅行时乘坐火车到达目的地,你知道,当我在德语国家旅行时。但是,是的,

能够描述你刚才所做的事情的1%,包括你的职业生涯和你公司的工作。如果我尝试用德语来做这件事,那是不可能的。谢谢。是的,一个有趣的事实是,我的德语口音很重。所以有些同事,当我讲德语时,我必须说得慢一点。是的。

哦,所以你的英语比德语更容易理解。可能吧,至少在我们公司是这样。这很有趣。这与你来自的地方的口音也有关系吗?是的,我认为是这样。而且,你知道,我从来没有,你知道,我从来没有照本宣科,如果你愿意的话,就像那种

就像“高级德语”的概念,或者像正确的德语。Hochdeutsch。没错。是的。所以我不会那样做,我也不会对我们的孩子那样做。所以,这也有助于他们理解我的德语。对。所以这有点像,在英国,他们会称之为“女王英语”。

是的,完全正确。这与之类似。尽管奥地利,我们不要说得太多。奥地利和德国人所说的德语类型之间存在冲突。哈布斯堡王朝,奥斯曼帝国。我不知道我是否在编造东西。我不知道。我只是在抛出一些我所知道的与奥地利历史相关的随机名词。好的,很好。让我们回到Adverity的业务上来。所以,

所以在2015年你创立Adverity时,目的是在分析电视广告数据方面有更多技巧,让某些东西更接近实时,比CSV文件更先进。但是现在,在过去的十年里,恭喜你,这是你们的十周年纪念日。谢谢。它已经发展成为一个领先的数据分析平台。

那么,最初的使命是如何随着时间的推移发展成为你们今天提供的更广泛的产品的呢?我们有……

在接下来的谈话中,我想你现在可以稍微谈谈这个,但我们将重点关注生成式人工智能和自主式系统,以及它们如何融入Adverity这样的平台。Adverity目前正在推出其Data Conversations产品,该产品允许用户使用自然语言查询数据,甚至可以获得主动推荐。在我看来,

使用自然语言进行对话,这利用了我们在工具中越来越期待的GPT驱动的体验。

然后是主动推荐,这在我看来就像一个自主式系统。你想谈谈这些特定功能以及你在Adverity如何看待生成式和自主式人工智能吗?我认为,当你看到我们即将推出的Data Conversations的命题时,就会有……

一个总体的主题,那就是数据民主化。过去,这并不是一个新术语或新话题,但过去数据目录、BI工具和仪表板被认为可以以某种方式实现数据访问的民主化。

事实证明,这些仪表板大多是,你知道,创建一次,没有审查,没有更新,总是受到用户的质疑,而且也没有提供深入挖掘和提出更多问题以了解正在发生的事情的能力……所以通常

你会看到人们查看仪表板,弄清楚这意味着什么,在他们的脑海中将其与昨天的数据进行比较,质疑它,回到源数据系统并查看,这是否实际上是他们可以信任的数据,以及所有这些问题。所以我认为这里正在发生一个进化步骤,使用像生成式人工智能这样的技术,允许你实际使用人类语言来询问有关数据的问题。

为了达到这个目标,你需要在之前做好很多事情。但是一旦你有了这个,你知道,创建了一个坚实的数据基础,你就可以将其用于我们迄今为止已经完成的相当可靠的用例。

我认为我们的优势之一是对数据血统、数据来源和数据含义的深刻理解。我们管理一个数据目录。我们称之为数据字典,它与源数据有明确的联系,并且对正在发生的事情有深入的描述,例如,给定属性背后的含义是什么。

这有助于我们更好地对系统进行定位,以提供倾向性。很好。是的。那么让我们谈谈这个。如果我们的听众在家,我们的许多听众要么是实际操作的数据科学从业人员,例如机器学习工程师、人工智能工程师、数据科学家本身,要么是对构建利用

生成式人工智能的产品或公司的感兴趣的人,你在Adverity实施像Data Conversations这样的产品中学到了哪些经验教训?你需要做什么?在引入大型语言模型并使对话能够有效地与数据交互之前,你需要做好哪些准备?你刚才谈到了

如果没有这种对话,你通常会看到的问题,人们有一个仪表板,它不是你需要的准确信息,它的输出过于固定,因此人们最终会深入到原始源数据中去尝试真正找到答案,这会给数据分析团队增加压力。所以我明白了能够与你的数据分析师进行对话的所有优势

但是,你们Adverity,以及我们的听众,如果他们想进行类似的转变,他们需要做些什么才能使这种对话方面奏效?我认为一个非常关键的部分是底层数据的质量。所以每个来源,以及数据质量的许多方面,如果你愿意的话。从学术角度来看,你也可以列出这些方面。但从更实际的角度来看,

你需要一个完整的数据集,并且与你拥有的所有各种来源非常吻合。所以协调在这个过程中也起着作用。我们实际上在我们的平台中构建了一个数据质量组件,它可以帮助你监控你数据中可能出现的所有问题。有针对营销数据质量的特定监控器。例如,有一个名为命名约定的概念,用于活动名称。

我们可以以智能的方式监控和处理这些问题。但也有一些简单的事情,例如,如果你从数据库或REST API引入通用来源,你需要对齐所有数据类型,你知道,需要对齐数据格式。例如,你希望所有数据都与UTC协调一致。你需要清理一些东西。这也是为什么通常会进行一些转换,方法是拆分、组合各种来源以及所有这些事情。

但我认为让质量正确非常关键。你需要收到警报。如果出现问题,你想防止出现脏数据,或者说是有问题的,数据集进入你的生产环境。我认为我们在这个领域可以提供很大的帮助。你可以在这个领域提供帮助,例如通过将这些数据质量报告

内置到平台中。是的,还有多层方法。所以我们总是保留一个原始数据集,然后可以将其用作迭代转换的起点,例如。你总是可以回到之前的状态并改进你的转换。今天也有一个AI系统可以帮助你编写这些转换。但是如果你,这对于那些类型的通用来源来说总是非常有用,但是你可以,你知道,

这是一种简化的数据整理练习,如果你愿意的话。然后,一旦你对结果满意,就会有一个组件帮助你监控数据在系统中流动的质量。有异常检测以及所有你想要监控的东西。对,对,对。是的,内置的异常检测将是关键。当你考虑的时候,

你可以从对话界面获得大量的功能。当你设计一个对话产品时,你如何……

你如何弄清楚,好的,这是我们将支持或不支持的功能范围,然后你如何为决定支持的功能范围选择正确的大型语言模型?是的,让我们从这里开始。我还有更多后续问题,但我感觉这是一个很好的起点。是的,我认为这很有用。

也许可以补充一下上一个问题,关于质量,就像我之前说的,数据字典、描述、血统理解也至关重要。这也会影响我们对话界面的设计以及人们如何与之交互。我们迭代速度很快。所以我们正在经历

我认为是一个相当快节奏的开发周期,每周都会添加功能。我们有一个专门的团队负责基准测试和分析响应质量。所以我们正在使用一个

框架来监控这一点。数据科学团队正在对……进行持续测试,我们有一组预定义的响应,我们期望从我们的问题中得到这些响应,我们可以监控这些响应并改进和测试模型。公平地说,目前的计划是,我们致力于一个模型,但也有计划对我们能力的不同方面使用不同的模型。

例如,我们可以使用不同的模型来编译我们的SQL查询,使用不同的模型来进行问题的预检资格认证,使用不同的模型来进行实际对话。所以,是的,这也是可能的。很好,很好。所以我认为像,你知道……

我问你的问题有点棘手,因为我试图弄清楚人们需要做些什么才能像你一样构建这些类型的对话界面,但显然其中涉及专有内容。是的,我认为在构建方面没有商业秘密,如果你愿意的话,很多……

他们提供的API类型在功能方面是相似的。你会看到所有模型都达到相同的功能。而且,你知道,基本上排行榜每隔几个月就会改变,你会看到另一个领导者,但每个人都在赶上相同的质量水平,如果你愿意的话。

我认为最终取决于你如何将这些组件组合在一起,从而在它的基础上创建一个引人入胜和令人兴奋的用例。我认为从技术的角度来看,它的工作原理非常简单。你可以将用户输入限定为一种问题类型,选择你想要使用的模型。

基本上用系统提示和有关模型的其他信息来提供信息,这对于获得正确的答案至关重要。我用它来创建一个SQL查询,验证它实际上是一个可以执行的有效查询。

执行查询,使用数据运行一些基本分析,并为用户创建一个体面、不错的答案。对我们来说,用例然后围绕我们从这种响应中生成的表展开。因为我们对这种方法的看法是,首先,就民主化而言,我们的目标是业务的两个方面,一个是IT,另一个是业务用户。

两者都需要访问数据。因此,与其通过各种团队的完整链条,你知道,过去你必须创建一个工单才能访问数据集。然后,数据集将在两周内准备完毕,并放入,我不知道,Snowflake表或其他什么地方。今天,Snowflake表,过去它完全不同。是的。

有了这个,你实际上可以运行查询,创建一个近乎实时的表,可用于你的进一步分析。这对我们来说是令人兴奋的。

或者他们是一个可能没有编写代码经验的业务用户,无论哪种情况,这种数据对话都能为该用户提供服务

但你刚才说的一件有趣的事情是它生成结果表的想法。所以这很有趣。那么我们实际上,我可能应该从一开始就问的一个问题是,当用户进行这种数据对话时,用户的体验是什么样的?所以也许给我们讲讲你的体验是什么样的

在Data Conversations之前以及之后,在Adverity平台上访问数据。我认为,老实说,我不能谈论所有用例,但主要用例是从来源提取数据。例如,你想在Google、Facebook上运行营销报告。

你随便说吧。所以基本上你从这些源系统中提取数据,以对报告有用的方式准备数据,并将其放入表中。这里有一些区别需要说明,例如,有些人将其放入各种表或许多表中,有些人已经采用了一个大表方案。

所以你最终得到一个数据库、大型查询、Snowflake,你随便说吧。所以我们支持各种数据库,并在你的数据库中拥有源数据的完整快照。我认为大多数人会

将其与dbt模型连接起来以进行进一步的转换,可能为不同类型的报告创建数据集。我不能谈论模型本身,所以这取决于客户。然后反过来,这通常与BI系统连接。所以大多数情况下,你知道,行业标准是许多组织的Power BI。仍然有Looker、Looker Studio、Tableau,仅举几例。

而这基本上就是用户今天访问数据的地方。就像最终消费者会查看 BI 工具来运行查询以创建仪表板或查看团队中其他人创建的预先制作的仪表板一样。我可以问一个澄清的问题吗?所以所有这些你刚才提到的技术,比如你的数据来源是谷歌或Facebook的营销数据,

从客户那里获取所有来自这些不同来源的数据,将其放入 Google BigQuery 中,以便您可以快速对这些海量数据进行类似 SQL 的查询。您也可以选择使用 Snowflake 来实现这一点。然后你提到了下游的 dbt 用于数据转换。最后,

某种工具,例如 Power BI、Looker 或 Tableau,以便能够查看、可视化数据,并能够获得看起来不错的汇总指标。所有这些都在 Adverity 中发生。所以所有这些

这对我来说非常有趣。所以确认情况就是这样,对吧?不,我只是提到了其中一种情况。在这里变得有趣,因为您会从现代数据堆栈的角度来看待它,显然。

就像一个高度可组合或非常模块化的组件堆栈,可以为您创建数据解决方案一样。我认为您通过我们的解决方案获得的是,您不必使用这些工具。所以基本上……我明白了,我明白了,我明白了。所以你提供的是……这让我很困惑,因为我想,所以所有这些不同的技术都受 Adverity 的支持?所以你的意思是……

这是一个常见的流程。Google BigQuery、Snowflake、dbt 到 Power BI、本地 Tableau。这是您的客户在开始使用 Adverity 之前通常会执行的常见操作。但是使用 Adverity,您将获得一个平台

绝对的。所以有……

您不必与我们一起使用 dbt。我们也可以代表客户执行 dbt。因此,您不必管理协调器或运行其他复杂的机制来运行 dbt。我们也可以代表您做到这一点。但我认为一个关键点是我们已经为营销中的任何目的提供了和谐的、一致的和正确结构的数据集。

因此,如果您使用默认设置并创建一个接收我们数据的数据库,则它已准备好用于您的 BI 工具中的分析。因此,您不必执行所有中间工作。而且正如我最初所说的那样,我们的转换功能也相当强大。因此,如果需要在数据进入数据库之前更改数据的形状,这也是我们的客户可以选择的可能性。

所以我想,你知道,它节省了相当多的创建所需数据集的工作。而且它还可以与通过 OData 接口工作的任何 BI 解决方案原生集成或连接。我们有一个名为数据共享的概念,客户可以创建数据的子集,然后也可以与外部应用程序共享。

因此,我们所做的很多事情实际上是,我们内置了治理和企业功能,与您必须自己构建的内容相比,这使其非常强大。因为许多人没有看到的是,创建和维护一个完整的模块化现代数据堆栈实际上有很多工作要做。

可能还要回到人工智能的整个主题,我认为人们需要开始关注所有这些,如果你愿意的话,我并不是说魔法,而是你实际上不想用许多组件和大量 SaaS 工具来构建现代数据堆栈的惊人机制之上的业务价值和战略。我认为这肯定是我非常兴奋的事情。

本期 Super Data Science 节目由戴尔 AI 工厂与 NVIDIA 联合赞助播出,戴尔 AI 工厂与 NVIDIA 提供全面的 AI 技术组合、经过验证的交钥匙解决方案以及专家服务,帮助您更快地实现 AI 成果。通过戴尔广泛的 AI 基础设施和服务以及 NVIDIA 行业领先的加速计算,扩展您的企业规模的 AI 和生成式 AI。

对,没错。所以你的意思是,与其在你的组织中投资工程时间和金钱……

重建和维护这些相同的复杂数据堆栈交互

所有其他竞争对手都在做的事情,专注于寻找解决方案会更有意义。如果您使用的是营销数据,那么 Adverity 可能是您和您的数据的绝佳解决方案。然后,您的工程时间和精力就不需要再次在与所有竞争对手类似的数据堆栈上重新发明轮子了。

相反,您可以专注于说,好的,数据将正确流动。如果需要,我们可以将它们导出到各个地方,并在需要时在其他工具中使用它们。但我们现在可以专注于使用我们拥有的数据,从中获得一些可行的见解

并获得投资回报,获得我们工程团队投资的回报。是的,没错。也许营销生态系统中非常有趣的一点是,它非常动态。源端发生了很多变化。所以你不想跟上。如果您使用的是典型的水平 ETL 解决方案,

跟上源端的变化可能非常乏味且有问题的。因此,如果您有人可以依赖来获取这些数据而无需您自己处理,那么这肯定已经节省了不少钱。也许回到关于

数据集本身以及如何弥合与其他部门(例如财务部门)的差距,以及您组织中想要连接的任何其他数据集(就报告而言)。

我认为您可以将我们的解决方案视为营销数据集神奇地填充到您的数据仓库环境中。我们负责那里的所有事情。这是一个保存此数据的表。然后,您可以将其与组织内的其他来源连接起来,并根据需要保持其隔离。完美。现在我对工作流程有了更好的了解

对于试图使用营销数据、试图从营销数据中获得可行见解的人来说,无论他们是实践型数据从业者还是业务用户。借助 Adverity 现在发布的 Data Conversations 产品及其生成式体验,这会如何改变用户的体验?以前,

以前,Adverity 已经通过处理所有这些不同类型数据库、数据转换、输出之间的交互来简化生活,并且正如您刚才在播客中提到的那样,跟上 Google 和 Facebook 等数据提供商所做的所有更改。因此,在之前,Adverity 显然已经具有这种价值,

Data Conversations 的附加值和体验变化是什么?是的,我认为最显著的区别在于,与其寻找要查看的正确仪表板或正确的数据集,

您可以制定一个自然查询,我们将为您解决这个问题,而不是自己寻找特定数据集,或者真正要求不同的团队为您提供需要回答业务类型问题的数据。

我认为这是我们通过数据对话解决的第一个也是最基本的需求,即访问数据并将其充分利用,因为正如我所说,表格响应可以立即采取行动。

例如,继续在 Google Sheet 中使用它,或者将其具体化到 Snowflake 表或 BigQuery 表中。因此,一旦您对结果满意,就可以立即使用数据集。但除此之外,还有——

您可以询问有关数据集的业务分析问题。我们尽力做到最好以获得可靠的回应。因此,您可以要求查看表现最佳的活动,系统将弄清楚如何连接这些点并为此创建一个有用的响应。所以所有……

以及我们构建的所有营销类型专业或主题专业知识也内置在系统中,因此……这有助于您更快地获得响应,我认为第二个巨大的好处是您获得了一个可以深入探索的系统,我的意思是,已经有基本的,你知道……许多 BI 工具中的功能,您可以深入钻取数据集,并且,你知道……获得更详细的数据,但是

如果您想扩展到其他数据集并了解,例如,为什么趋势会以这种方式发生,您可以通过对话来做到这一点。您无法在 Looker 或 Adverity 等工具的探索功能中执行此操作。

非常好。所以基本上,您可以获得更深入的响应,您可以更深入地探索数据,并且对于任何类型的用户来说都更容易,我想说的是,对于业务用户来说尤其容易,但对于任何人都更容易用自然语言来撰写他们的问题,而不是 SQL 查询或类似的东西。是的,绝对的。再说一次,回到企业功能,我认为非常关键的一点是为 IT 提供

一种他们仍然可以审核管理的工具,而不是将各种 SaaS 工具连接在一起

嗯,这些工具不一定……为您提供满足当今许多法规要求所需的治理级别,是的,这是另一个方面,很好,所以对于我们……你知道……我们的核心受众,那些……那些数据分析师、数据科学家的人们

你认为他们应该担心像这样的工具会侵犯他们的角色吗?或者它实际上……

像这样围绕数据的自动化对话实际上是否解放了数据分析师、数据科学家、机器学习工程师,让他们能够处理更有趣的问题?我假设是后者。如果你回答其他任何方式,我会感到惊讶。不,绝对的。我有同样的理解。这将使许多分析师,还有数据工程师,能够专注于更具战略意义的事情。

对企业很重要的主题,并专注于您可以为公司创造什么样的价值,而不是不得不,不是玩,而是

这项技术可以让您少做一些繁琐的工作,如果您愿意的话。是的,您不会收到来自 Slack 消息、来自财务、人力资源、营销部门的电子邮件,他们会问您,哦,您能帮我快速提取一下这些数据吗?你会说,好吧,我的这一天就这样过去了。是的,当然,让我们这样做。与其这样,您可以将您的同事也指向该解决方案,该解决方案可以帮助您专注于真正重要的事情。我认为……

未来在这个角色中肯定很重要的一点是,关于如何管理这些工具并确保响应正确无误有很多内容。因此,拥有监控和监督业务中发生情况的工具至关重要。但是是的,我不认为……

任何工作都面临风险。相反,我认为配置文件将会改变,而且我看不出什么大问题。您显然必须以某种方式顺应潮流,但这始终如此。

我们现在已经相当多地讨论了生成式元素以及能够与您的数据进行自然语言对话如何让您更容易从数据中获得见解。您可以更深入地了解您的数据。

我想谈谈当今数据科学和人工智能中的另一个热门词,那就是自主人工智能。我不知道,你会不会将这个术语“自主人工智能”应用于 Adverity 产品中的一些功能,这些功能似乎是自动的,根据我对该产品的理解,

有一些流程是自动的,您之前谈到了数据质量,例如,进行异常检测。你会认为这种自动寻找问题、可能标记机会的流程是自主的吗?如果是这样,你会说 Adverity 平台内置了自主功能吗?我今天很难理解这个术语,因为它已经被

广泛使用。就像,你知道,当人工智能出现时,它基本上意味着像 JetGPT 这样的技术,但很快,许多公司将该术语用于非人工智能类型的问题,基本上是统计问题或机器学习类型的能力,但这些能力仍然没有或没有使用任何真实性。任何类型的数据模型。

是的,完全正确。同样的事情也发生在自主人工智能上。就像我认为很多人一样,肯定有一个共同点,但许多人会将其用作代理。

我对这方面的理解实际上是让 chat GPT 或生成式 AI 类型的能力能够以某种方式访问函数,以便它们能够代表用户采取行动。在未来的某个时候,并且存在与 AI 解决方案建立信任的概念。我认为我们还没有达到人们会

完全信任 AI 解决方案来代表他们做出决定的地步。因此,需要内置一定程度的控制和监控,但他们实际上可以调用 API、使用结果甚至触发某种类型的操作,而无需某种用户交互。这就是我目前的想法。某种自主性也可以融入其中。但对我来说,目前主要还是围绕信任。

行动,而且有趣的是,信息检索。很好。好的。所以这对我来说是一个更好的自主人工智能定义。我绝对是,我认为你可以要求任何个人来定义自主人工智能对他们的意义。我使用它的范围太广了,就像人们使用人工智能来描述任何类型的数据建模过程一样,其中

我在考虑,好的,如果有任何类型的自主系统,但我认为如果这是一个完全程序化的自主系统,我们可能不应该称之为自主人工智能。所以我喜欢你对它的定义,它可能涉及到,你可能在自主人工智能系统中混合使用了大型语言模型,理想情况下,就像你描述的那样,它可以访问工具,

这将……允许它采取各种行动,我认为这是关键部分,它基本上……也许我们可以定义它,我不知道你是否同意这一点,但一个可以采取行动的大型语言模型,是的,没错,所以我认为这是一个更现实的……定义,因为另一方面,如果你……如果你定义得太宽泛,人们对系统无法以他们预期的方式运行会有期望……

是的,我认为现在主要也是处于建立标准的阶段。就像几周前,你对 MCP 进行了大肆宣传一样。在不久的将来,很可能会对 A2A 进行大肆宣传。所以我认为我们正处于公司将制定标准的阶段,关于未来这可能是什么样子。因此,拥有像 MCP 这样的功能并拥有标准

许多 SaaS 产品,我们当然也会这样做,提供 MCP 功能来连接公司选择的工具,这可能是 Gemini 或 OpenAI 或公司将使用的任何代理。

进入您的环境,我认为这非常有价值,并且可能会真正帮助推出一些自主解决方案。很好,是的。所以你刚才随意提到了 MCP。我最近做了一期关于这个的节目,第 884 期,如果人们想要了解关于模型上下文协议 MCP 的七分钟详细信息。但这是一个来自 Anthropic 的开源框架

它提供了一种针对代理采取行动的标准化方法。听起来好像,也许再详细介绍一下,听起来你实际上正在将它集成到 Adverity 中。

是的,我们将提供连接它的功能。目前还处于早期阶段。您需要,知道,云桌面才能以适当的方式连接它。但这肯定会发展成为一个非常好的解决方案,您可以将您的聊天代理与服务连接起来并让他们采取行动。而且,你知道,就像我们之前讨论的那样,它不一定是 Cheney 类型的行动。它可以是从统计到数据的一切。

你知道,触发远程系统中的某种操作,甚至从该系统中获取信息,例如,在我们的例子中,获取已连接数据源的列表,并且,你知道,如果它们都……正确连接……创建链接以重新授权这些,就像以自然的方式与系统交互一样……这就是我们正在构建的东西

使用 Agency(A-G-N-T-C-Y)构建多代理软件的未来。Agency 是一个开源集体,正在构建代理互联网。这是一个协作层,AI 代理可以在其中发现、连接和跨框架工作。

对于开发人员来说,这意味着标准化的代理发现工具、无缝的代理间通信协议以及用于组合和扩展多代理工作流的模块化组件。加入 Crew.ai、LanqChain、Lama Index、Browserbase、Cisco 和数十家其他公司。Agency 正在发布代码、规范和服务,没有任何附加条件。与其他关心高质量多代理软件的工程师一起构建。

访问 agency.org 并添加您的支持。网址是 A-G-N-T-C-Y.O-R-G。非常好。

我喜欢这个。MCP 是我现在在任何会议上遇到的最热门话题之一,人们都在谈论它。很高兴你也在 Adverity 中集成它。当像 MCP 这样的东西突然出现并突然成为标准时,很难预测未来并做出预测。我们也可以预料到这种事情,以及人工智能的进步,大型语言模型继续,正如你所说,随着时间的推移在排行榜上不断提升,并且

人工智能能力前沿的所有主要参与者都拥有针对许多不同任务或多或少可互换的 API。我说这一切的重点是,很难预测未来,但鉴于你作为一家公司的 CTO 的角色,

将技术转化为更简化的用户体验,你对未来五年事物将如何继续发展有什么预测?无论他们是实践型数据分析师、数据科学家还是从公司提取数据的业务用户,

他们的系统,他们的提供商。与今天相比,五年后他们的体验可能会是什么样的?就像你说的那样,很难预测五年,在这个行业工作了一段时间,知道事情变化很快。但我认为总的来说,

很多重点将转移到战略上,而不是不得不做,我们快速谈到了或谈到了繁琐的工作,但是目前有很多工作流程需要某种手动交互,这些工作流程是可以完全自动化的。然后,人们将有机会专注于数据的业务和结果以及如何使用它,而不是其背后的机制。这肯定是一些会发生很大变化的事情。

我认为我们没有谈到这一点。我们非常关注人工智能,但我们的行业也出现了一个有趣的转变,作为

关于存储以及将计算与存储分离,这是我们今天所做工作的基础上正在发生的变化。展望未来,选择连接到数据的计算的移动性(如果这是有意义的话)肯定会改变系统,或者说改变我们今天工作的方式。因此,拥有一个位于可访问环境中的原始存储库

以标准化的方式进行对象存储环境,因为历史上这并没有标准化。今天,该行业已经确定 Iceberg 作为这种格式。并且能够根据目的将其与各种查询引擎连接起来,并且将来可能还会与生成式 AI 功能连接起来,我认为这对企业来说非常有价值,可以为正确的案例选择正确的解决方案。

这肯定也会发生变化。但是,你知道,五年是一个很长很长很长的时间框架。因为我们在这里谈论的可能是半年或一年的时间框架。但是是的,我认为主要是战略和关注

关于为什么而不是如何,这可能是未来五年中将会发生很大变化的事情。对,对,对。这与你之前在谈话中提到的观点相呼应,即像 Adverity 这样的工具可以让你的工程团队、你的 IT 团队更少地关注集成系统和保持一切最新

更多地关注实际提取业务价值。是的,我会这么说。更少繁琐的工作,更少的重复性任务,如果你愿意的话。更少的是,请快速帮我找到这些数据。很快,我现在需要它。没错。很好。所以我们现在已经对未来进行了一些展望,但另一个刚刚想到的问题是

鉴于你现在的经验,作为一个连续创业者,你已经在科技公司担任高级领导职务很长时间了,比如 CTO、CEO,

你从过去的经验中学到了哪些教训?关键的事情是什么,也许是发生过的错误,或者你根据这些经验现在避免的事情,以及我们的听众也可以避免的事情?这也是一个非常好的问题,因为它取决于情况。是的。

所以我认为一件关键的事情是不要想太多。如果你想构建一些东西并且心中有想法,那就去构建它。因为没有什么,你知道,考虑它会多么美好,并且,你知道,像过度思考架构一样。我认为我们也曾是受害者,或者曾经是受害者。但是

我认为你可以很快地开始行动。同样,今天借助基于人工智能的编码工具的功能。我不是说即兴编码。我的意思是,你知道,尝试各种解决方案,使用你所拥有的东西。我也属于使用无聊技术的阵营。

经过验证且有效的技术,并组成一个令人兴奋的用例,并继续与客户沟通,因为这是您最关键的影响或最关键的反馈。因此,从一开始,我们就非常以客户为中心,认真对待反馈并将此与我们的解决方案集成在一起。所以这可能是我总是会鼓励任何公司做的事情。明智的方法。是的。倾听你的客户,

不要即兴编码,但要利用大型语言模型进行代码生成,以便能够更快地建立概念验证,而不仅仅是在潜在产品或功能的规划阶段花费所有时间。是的,绝对的。酷,很好。今天的建议很棒,马丁。我真的很感激。很高兴听到你在 Verity 做的令人兴奋的事情。

在我让你走之前,我要求所有客人推荐一本书。好的,是的,当然。我最近读了一本关于维也纳如何影响现代世界思想的书。它叫做《维也纳:思想之城如何创造现代世界》。

这是一本令人兴奋的书,展示了建筑和许多不同领域的许多概念是如何在这个城市创造出来的。所以这是一次有趣的阅读,我也从这本书中学到了很多东西。太棒了。这正是我希望一直有时间阅读的那种读物,因为关于

我们在技术上、语言上、科学上都站在巨人的肩膀上,

而维也纳无疑在思想复兴中扮演着重要角色,这使得世界上许多人不必担心住所和营养、儿童死亡率和医疗保健,所有这些都是我们今天所享受的。维也纳在其中发挥了重要作用,我很想了解更多关于它的信息。是的,绝对的。很好的推荐。

很好。然后,马丁,对于那些想在今天节目结束后听取你想法的人,他们应该如何关注你或 Adverity?我没有社交资料。我在 LinkedIn 上有一个个人资料,但我不是……

我不在任何流行的空间闲逛。电子邮件总是受欢迎的。我会回复电子邮件。除此之外,LinkedIn 也肯定有效。在 Verity,请访问我们的主页以了解更多关于我们产品的信息。但就个人而言,是的,LinkedIn。LinkedIn,是的,用于与你联系。然后我想,如果人们想联系你,你的电子邮件是什么?这是一个非常慷慨的提议。

是的,是 [email protected]。就是这样。非常简单。很好。我们会在节目说明中添加这个。好的,马丁,非常感谢你今天参加节目。我希望你在维也纳度过愉快的一天。是的,也许我们将来会再次关注你和 Adverity 的旅程。感谢你今天提供的所有见解。好的。感谢你的邀请。干杯。

与这位超级成功但也很谦逊的马丁·布伦塔勒一起度过了精彩的一集。在本期节目中,马丁讲述了他从孩提时代在基本计算机上编程到共同创立 Adverity 的旅程,Adverity 是一个营销数据分析平台,它简化了来自多个来源的数据集成,然后从这些整合的数据中收集可行的见解。

特别是,他谈到了通过 Adverity 的新 Data Conversations 产品实现数据民主化的概念,允许用户使用自然语言查询数据,而不是依赖固定的仪表板或 SQL 专业知识。他谈到了数据质量、异常检测和有效 AI 驱动的对话数据描述的重要性。

生成式和自主式 AI 工具如何将数据专业人员从例行繁琐的工作中解放出来,专注于战略价值创造和分析。以及他对企业家的建议,包括不要过度思考解决方案、使用经过验证的技术、快速开始构建以及始终优先考虑客户反馈。

与往常一样,您可以在 superdatascience.com/891 获取所有节目说明,包括本期节目的文字记录、视频录制、节目中提到的任何材料、马丁的社交媒体资料的网址以及我自己的资料。

当然,感谢 Super Data Science 播客团队的所有成员,我们的播客经理 Sonia Breivich,媒体编辑 Mario Pombo,我们的合作伙伴团队(包括 Natalie Zheisky 和 Nathan Daly),我们的研究员 Serge Massis,我们的撰稿人 Zahra Karche 博士以及我们的创始人 Kirill Aramenko,他为这个节目幕后做了很多工作。感谢他们今天为我们制作了另一期有见地的节目。

Martin Brunthaler 与 Jon Krohn 讨论了创立 Adverity 的经历,Adverity 是一个面向营销的数据分析平台,它简化了来自多个来源的数据集成并将其转化为可操作的见解。了解 Adverity 如何成为服务于多个行业的强大的数据分析公司,以及 Martin 为什么认为 AI 将增强而不是减少数据科学家、数据分析师和机器学习工程师的就业市场。

(14:26) Adverity 的功能 (39:24) 数据分析师、数据科学家和机器学习工程师是否应该担心 Adverity 会让他们的工作变得多余 (48:29) Martin 对数据分析师和数据科学家的未来预测 (51:39) Martin 作为 CTO 的成功秘诀 </context> <raw_text>0 感谢这个超级团队为你们制作这个免费播客。我们非常感谢我们的赞助商。是的,您可以通过查看节目说明中的赞助商链接来支持本节目。如果您自己想赞助一期节目,您可以在 johnkrone.com/podcast 找到如何做到这一点。否则,请通过在社交媒体上分享、在您最喜欢的播客平台或 YouTube 上评价或订阅来支持本节目。如果您还不是订阅者,

但最重要的是,请继续收听。我很感激您的收听,我希望能够继续制作您喜爱的节目,年复一年。直到下次,继续努力吧,我期待着很快与您一起再次享受 Superdata Science 播客。