We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode EP56: 從機器學習到產品思維 | 數據科學家的自我成長之路

EP56: 從機器學習到產品思維 | 數據科學家的自我成長之路

2025/3/18
logo of podcast 數據女孩的中年危機|数据女孩的中年危机

數據女孩的中年危機|数据女孩的中年危机

AI Deep Dive Transcript
People
贾琳
Topics
贾琳:我的职业发展路径从Wayfair的机器学习模型开发,到Discord的增长数据分析,再到Statsig的客户数据科学家,展现了数据科学家在不同领域和公司规模中的多元化发展。在Wayfair,我构建了机器学习模型来预测销量和价格的关系,并通过因果推断方法优化定价策略。在Discord,我更关注增长黑客,需要快速迭代和数据驱动决策。在Statsig,我作为客户数据科学家,需要与客户紧密合作,解决他们使用数据产品的问题,并根据客户需求改进产品。总的来说,我的职业发展体现了数据科学家角色的两极化趋势,未来将有更多专业分工,要么成为技术专家,要么成为产品专家。 Amy:我同意贾琳的观点,数据科学家的职业发展越来越呈现两极化趋势。技术专家需要精通各种技术,而产品专家则需要深入了解业务和用户需求。 Stella:我也认为数据科学家的角色正在发生变化,需要更强的产品思维和商业思维,才能更好地将数据分析结果转化为实际的业务价值。

Deep Dive

Shownotes Transcript

Hello 大家好,欢迎收听新一期的数据女孩的庄宁维基,我是 Amy 大家好,我是 Sella 每周二我和 Amy 会与来自各行各业的有趣灵魂畅谈带你深入探讨科技、工作与生活的交汇点带来独特的洞见与思考

今天我们的嘉宾是贾琳贾琳现在在一家新创叫 Static 做 Customer Data Scientist 今天来跟我们聊聊天贾琳可以介绍一下自己吗哈喽

大家好我有点紧张我超级开心能够来这个艾米和 Stella 的频道然后跟大家聊天然后我叫贾琳和那个喜剧演员贾琳有点像但是她是那个后鼻音我是前鼻音但我很喜欢她所以就是叫回来也没事我念起来应该都一样

都可以然后我是现在一家西雅图的 startup 叫 Stasic 做 customer data scientist 然后呢我们公司是做一个 AB testing 的这种平台

在这个 Static 之前呢我是在湾区 Discord 也是做一个 Growth Data Science 的工作然后再之前我是在波士顿在 Wayfair 做那个可能当时跟 Pay Machine Learning 一些做定价相关的内容大概就是这样也是一条数据老狗了吧哈哈哈哈

贾琳在数据这个行业做了多少年了我是 18 年开始工作 7 年也蛮久了你在 WeFair 是你第一份做 Data Science 的工作吗对当时你说做的内容主要是 Machine Learning 具体是做的什么

当时其实蛮神奇的因为我在找工作的时候大家对数据科学家这个概念没有特别清晰的一个定义我当时可能也没有特别想清楚自己更适合哪一个方向所以就选择了一个像 generalist 的

Pricing model 是吗?

对的 Pricing model 好做吗我说实话我现在来看其实我不算是完全内行因为真正比如说内行是做微观经济学包括我有很多当时的同事也是做 Econ 的 PhD 毕业他们有很多量化的技术和经验来去建模我自己可能就是

尽量把这个问题能够数据化可能会更多的从收集数据以及我觉得可能最重要的是找一个合适的角度去考虑怎么去提升定价当时我的老板也是一个技术非常牛的一个人叫 Alex 我们做了一个 machine learning 的 model 去预测销量和价格和其他因素之间的关系

然后呢我们又把这个一对一的关系抽出来这样就相当于是我先有一个模型你可以把它想象成一个模拟的数据的一个环境然后呢我给它一个 input 就是我这个商品的价格它就会 output

出来一个未来的销售量然后呢我又通过一个 Consulting Inference 的方法把这个关系给提取出来这样的话呢我就知道我每一个点的价格点上我未来的销量都是预测的多少所以

所以就是先把一个定价的问题把它抽象成三部分一部分是预测问题通过价格来预测销量第二部分是因果推断把每一个价格点和销量的关系相当于划出来第三步就是优化因为我有了这个价格的曲线我就能找到那个能够最优化利润或者一些其他商业指标的一个价格 OK 这样的模型有什么

有趣的 feature 可以分享吗我自己觉得蛮有意思的有两个部分一个是因果推断那个部分我们相当于是读 paper 找到了一个方法能够解释一个 black box 的模型能够相当于把这种预测的模型给它一个可解释那个方法叫 partial dependency 这个方法其实本身是

不难的不过真正能发现它真正能够把一个复杂模型抽离出这个价格和销量这种二者之间的关系其实我当时刚毕业时间不久当时第一感觉就觉得好神奇就觉得一个看上去很简单的方法就可以把一个 Black Box 模型能够有一个解释这个是我自己印象比较深还有一个就是

在后来做那个优化的时候因为我们后来推导出的关系不是一个线线关系所以说当时也去做了很多数学上的这个探索去看怎么能解方成呵呵

就很有意思因为比如说我价格和销量的关系是一个曲线关系的话那我怎么样把这个曲线能够把它抽象成一个可以定量的方程然后能够解出那个最优的价格我觉得那个过程就是梦回高中就是想着天天在解方程然后也蛮好玩的对

在你们做这个模型之前 Wayfair 的这种定价和销量之间的预测是怎么做的呢 Wayfair 当时是有一个 e-con consulting 的 vendor

然后他们相当于做很多这种定量的因为他们都是一群非常厉害的这种 e-com PhD 他们都是学这个计量经济学的然后他们就现在建了一个很复杂的模型不过我们可能相当于是在他们这个大模型上一个比较有特点的补充

因为当时我们的模型不仅是考虑了自己价格和自己的销量也考虑了竞品的价格和销量所以相当于是通过一个非常可解释的点因为竞品是一个非常可解释的点然后能把这个点给出一个相当于量化的方式方法能够

选出一个更优的价格所以我并不是说从 scratch 做了这个 model 其实是前面已经有一个很好的 baseline 我们只是从一个新的角度去解释它 Wayfair 的 pricing model 用这种第三方的 consulting 我倒是没有想到对啊 Wayfair 不是请超多 data scientists 吗

现在也有转变成完全 E-house 做这个都是后来的这个故事我们第 37 集同事也是贾琳的好朋友她也是在 Uber 做 pricing 嘛

感觉是先会有一个 foundation model 就是真的一堆可能微观经济学的专家先做一个 foundation model 然后后面他会有一堆 data scientist 在那个基础上面在听起来是 try to squeeze out more margin 就是赚更多钱然后在那个基础定价上再做一些操作的感觉是有一定道理的其实当时我做的事情也是有一些相似

你们怎么去衡量这个模型的好或者不好呢哇这个问题简直太好了也太大了肯定有很多这个数据

数据科学上的方法了这个就不用赘述有很多 paper 有很多这个 case study 都有介绍我当时在 wayfair 做的时候就觉得很有意思的一个点是有很多 business evaluation 比如说每一个合作的产品组他们都会有自己的角度去

衡量一个模型是不是对的因为作为数据组嘛我们花了很长时间做出一个模型我们经过很多模型上面的

所谓测量吧或者说是这个校正那我们自己肯定对最后的结果很有信心不过作为一个非技术团队比如说他们要背负很多商务上的 KPI 他们要负责这一个品类明年的销量明年的利润对吧其实他们是没有办法去完全了解整个模型所有的细节

这个其实我也是在那份工作过程中花了很多时间去理解因为我可能一开始都会从自己的角度去讲这个模型的是怎么工作的对吧然后这个它为什么好它这个精度有小数点后几位等等的外面那么完全不买账但是他们的思维就是说我有自己的指标

你的模型如果能达到我的指标或者是我的直觉那你就是好的我就是 green light 如果说不行就不行你推荐 Wayfair 给想做数据科学的朋友吗

要看情况比如说我很推荐学伊康的同学去韦菲尔或者说去这一类电商公司因为真的有很多很有意思的问题去解决然后也包括亚麻也会有很多就是亚麻电商嘛有很多非常有意思的问题而且有很多数据也会有很多的 impact

就是影响力吧但如果说是想做其他的方面那可能就要再多了解一下你就是面试的组啊等等这个因为我也离职有一段时间具体有些情况也不是特别了解为什么

Wayfair 总体来讲算是一个 data culture 还不错的公司吗 data scientist 在 Wayfair 有话语权吗是可以影响产品的走向和决策的吗天哪我觉得你们每一个问题都问得好就好像明天要去上班了赶快问清楚哈哈哈哈

真的吗能不能去到底天哪我在的时候我觉得还是蛮有影响力的数据团队也是很受大家尊敬的然后也可以直接影响一些重大的决策所以我觉得这种

是从这点来说还是很不错的在 Wayfair 之后贾琳就去了 Discord 就是从 Boston 搬到了湾区对的当时是为什么会从 Wayfair 离开做得不开心吗是觉得工作太无聊了吗

会有点无聊但没有说不开心就觉得自己在东岸工作了挺长时间然后在同一家公司所以就很好奇这个硅谷是一个什么样的感觉宇宙中心弯曲真的

对的想看看宇宙中心是什么样子然后再加上也是蛮想去小一点的公司包括我现在来 Starsig 也是一直是秉承的这一个想法想去小一点的公司然后创业公司去感受一下

和一个小一些的团队一起工作这个产品还有很多才不断快速发展是一种什么感觉所以 Discord 就确实是你当时期待的样子吗一部分是你当时去的时候他们多少人啊

一千个人左右也不算很小了对其实是很大的独角兽了吧 Discord 蛮红的作为几年前我要是拿到 Discord offer 就毫不犹豫去弯曲我不知道是不是所有的听众朋友都很熟悉可不可以给大家介绍一下 Discord 是一个什么样的产品

Discord 是一家从游戏社群的聊天软件起家就是很多 gamer 他们在打游戏的时候需要一个软件来很清晰地沟通包括音频也包括视频然后

慢慢发展到其他的应用场景吧包括现在有很多中学生这个青少年拿 Discord 就当一个社交软件然后甚至有很多学校也用 Discord 布置作业据我所知

对对然后上面有很多很有影响力的社群比如说有些和 crypto 相关的有一些和那个 AI 最早就是在 Discord 上一个社群大概就是一个这种社交软件类的产品 Discord 的主要 competitors 都有哪些如果说对于聊天软件这个大类其实有很多啦像 messenger 啊 whatsapp 啊

如果说 social medium 也有很多比如说 X 或者是 ins 等等所以就要看怎么去定位它就是有一些开源项目也是在 discord 上面很 active 那 discord 的盈利方式是什么 subscription 然后我几年前可能比较多是通过订阅然后来赚钱然后

我离职之后据说有些做广告的尝试不过这个我就不是特别了解了你是在 Discord 做 growth 对的所以 Discord 的 growth 它具体的指标是 DAU 还是多少 subscription 你们 trying to grow 的是什么指标

我去在 Discord 做 Top of Funnel 所以主要就是 DAU 和经常使用用户这两个指标 Discord 的 Growth DS 是一个多大的组在你加入的时候没有特别大四五个人但是做用户相关的 DS 还是蛮大的有十几二十多人总共有多少 DS 呢我现在不太了解具体的数字了

我记得当时我在时候腰有 50 左右

做 GrowthDS 感觉应该和你在 Wayfair 做的 Data Science 工作应该还是挺不一样的非常不一样我当时印象可深了我为了入职做准备就读了一本书叫 Growth Hacking 然后是一本非常有名的书写得很好我还是很推荐的不过当时读着读着我就觉得我可能找错了工作哈哈哈哈

完全不懂怎么做然后也和之前做的没什么关系所以你当时在找西岸工作的时候是有一定的方向的吗当时主要倾向于小一点的公司然后呢是想做一个跟产品更近的领域

所以其实做增长也是很符合我的要求就是和产品特别近当时你看完那本书之后你觉得是一个和你之前的工作很不一样的工作机会但是你当时有觉得会是你喜欢的工作方向吗

我当时觉得会是而且我的个性是对于未知是那种很有兴趣兴致勃勃的去失败那种然后对我就是这样就是当碰到一个我没有做过的事情啊或者是觉得不是特别确定自己能不能做成的事我还蛮兴奋的就觉得那就去试一下但确实是有点诚惶诚恐因为就会觉得自己有很多

不了解的东西成黄成孔的部分是什么你觉得自己不知道的是在技术吗还是在 growth 这个领域的 context 自己比较欠缺更多是后者我觉得技术上至少我在入职之前觉得我之前做的更偏积极学习嘛

基础上当时没有特别多担心更多的是对产品思维啊以及做增长这个领域没有接触过贾琳在做 BrowseDS 的时候每天的具体的工作是什么样的当时

大概分成两部分吧一部分是我自己的个人 IC 的项目然后在这个过程中呢可能有很多和用户体验呀整个 UI 呀等等

包括做他 life cycle 的一些分析,这些是他用自己做 IC 去 drive 的一些项目,然后另外的时间我当然是做 manager,然后也有团队里的一些项目和一些事务性的工作。

当时好做嘛我会这样问的原因是因为我去想佳玲加入 Discord 的时间好像是无论如何用户都会一直爆增的时候所以觉得做出来的数字大家看了都很开心很爽对反而是相反我加入的时候是疫情的后半段快要结束了

对所以 Discord 刚刚经过了一个暴涨所以我进去之后可能很多方向反而是会觉得有点没有头绪就觉得很难维持这个高速增长的状态然后我也找不到下一个增长点会有一段这种时间这种找高速的增长点或者是增长的策略这种压力是怎么传导到 DS Manager 身上的呢

倒也不用什么传导可能就整个氛围就是一种大家都有很强的 ownership 都会希望让这个产品越来越好以及 Discord 真是一个非常有意思的产品

我之前听一个同事打了一个比方说 Discord 像什么说 Discord 就像一场混乱的 party 你推门进去的时候发现你一个人都不认识但是半小时之后你就会发现你才和一个陌生人聊得非常开心所以说 Discord 做一个产品是非常有意思的它有很多很多技术上很厉害的点也有很多在设计上很独到的地方

包括整个公司的文化都是有很强的那种 gamer 或者年轻人的氛围还是很快乐的一个工作环境贾琳作为 DS Manager 在 Discord 的时候和哪些部门合作的最多

产品是最多的没错工程和设计也都很多要看项目可能我自己做的 growth hacking 是和产品经理合作是非常非常多基本上天天都要 meet 天天都会聊

然后其他的项目呢可能会有些 UI 的 change 啊或者等等其他会有不同的维度这样嗯假设你们想要做一个 UI 的改变你想要测试这个执行的速度可以很快吗大概会是怎么样一个 cycle 也没有特别快因为呃首先它会有一个产品的 scoping 呃

然后呢接下来会从 UI 开始要取决于如果是一个很大的改变比如说整个的 UI revamp 这就是一个非常浩大的工程每一个产品的设计都要进行改变用户的路径啊整个不同的 categorization 都要重新改如果只是一个相对小比如说一个页面或者是一个

用户路径的改变会简单一些产品会有几版的新的设计然后就是由工程团队去执行因为一般的 Discord 我们都是从很早期这个团队开始有想法的时候就和产品经理一起

去影响很多决策然后也会根据我们一些通过历史数据的分析吧去影响这个设计师和产品经理的一些关键问题上的一个抉择然后在整个落地的过程中呢当然就是比如说要做 A-B testing 呀要 monitoring 呀等等这些工作

可以给我们举一个例子吗就是有什么有趣的 data science 影响了一个决策的故事这个还挺多的我自己印象很深的是当时我有机会和一个非常厉害的增长产品经理去合作他是一个连续创业者

他自己在 X 上也特别活跃是一个网红就觉得他真的有很多奇思妙想在这个过程中呢我们当时做的是 Turbo Funnel 是用户注册 onboarding 等的一些改进然后他当时是真的有很多很天马行空的想法比如说我们会给用户有很多渠道发那种 verification 或者是 outreach 嘛然后

说我们要不要在那个 message 里 email 或者是短信里设计一个巨大的 thumb up 的标志然后就是让这个用户不得不去打开出于就是他的好奇心也一定要点这个巨大的这个拇指代表的是什么意思就是会

但也可能是个 terrible idea 所以就是有很多类似这种天马行空的想法当时合作的工程设计团队都非常厉害他们能在特别短时间内把这样的想法落地然后我们就可以非常快地迭代在这个过程中真的是每天都有感受到 growth hacking 那种感觉

DS 在这个过程中是怎么影响决策的其实是从头到尾 DS 都是有比较深度的参与的从最开始产品经理有出设想的时候其实很多也是来源于 DS 和 PM 之间的聊天因为 DS 相当于有很多基于历史数据的一些观察或者一些思考吧

在这个讨论过程中就有些 A 型的想法就会出现然后在中期的过程中更多是和整个团队一起去不断精进这个产品设计的思路吧在整个的过程中 DS 其实在很多方面是去推动团队更定量的去思考而不是去定性的思考因为讲实话增长本身是一个

很依赖直觉或者很多人都会这么觉得也就是 growth hacking 它有点反直觉的一点我觉得我在这个项目上过程中我真正看到很多定量对做 growth 一种非常直接的影响然后可以帮助团队

而且是很快速的能够规避一些看上去正确实际没有那么正确的直觉我也做过一段时间的 growth DS 我觉得我对于这一个类型的 data science 工作的一个迷思就是在整个团队推出一个新的产品的时候我经常会有这种困惑就是历史数据到底能给我们多少的 insights

就像刚才说的就是大家都想做一个 go viral 的一个病毒式传播的东西但是病毒式传播的东西在历史数据里面必然是很少看到的或者就不存在

那这种时候 Data Science 在这个过程中能够在这个过程中 Data Science 提供的这种数据到底可以对决策提供多大的帮助这个是我一直都有疑问的一点跟你讲这个好有意思你能展开讲讲吗就是比如说你自己做增长的感受是怎么样的

我比较想用你刚才那个例子就是这个 thumb up 我不知道 Discord 最后有没有做这个 thumb up 的这个设计但这个就很好玩但是很有可能你们之前都从来没有做过这种类似的设计所以在产品或者是设计团队他们想做这样的一个尝试的时候他可能会去问数据团队我这样做好不好我这样做会给我带来多少的增长但是这种问题其实我会觉得是很难回的

你有遇到类似的状况吗有遇到过你讲的这个点我觉得特别我有共鸣就像你说 viral 一定不是一个能从经验里得到的我觉得 growth hacking 它很多时候是想通过不断的试错得到那个可能 go viral 的想法

想法所以 Rose Harkin 倒不是说是一条线它更多像是一张网它希望在这个网中捕捉特别大量的想法然后这些想法有的可能是好的大部分都是 garbage 然后它其实是通过一个框架来快速筛选哪些想法是好的哪些想法是应该落地的

所以你讲这个非常有道理 historical 的分析呢作用有限我觉得

我觉得它比较像是 benchmark 而已就是说上一次好或不好或者平均值大概是多少以此作为基准你才能知道你现在做的这个新的讲 treatment 或 feature 好了是真的有用的那 in general 要是 growth 好的时候就是反正只要线往上冲就是好的然后就我的经验来讲只有情况不好的时候大家才会反过来问我们来看看数据为什么现在

现在出了什么问题但是结果是好的时候没有人还是回去看数据就一直冲就好了天哪都是血泪我特别深有同感了

我是觉得在 Discord 这一份工作也是促使我加入 Static 的原因之一其实就像刚刚你们讲的做增长这个领域或者说在很多做产品迭代这个过程中它重要的倒不是说是某一个或者某几个想法而是一种 Data Driven Mindset 是要有一套在整个公司大家都普遍认可的做决策的方式

而如果说这个一个公司呢它没有这种思维模式它只是通过几个天才产品经理一拍脑袋这种顺势的想法那这个当然有很多是可以快速增长一个产品这个就是有这样的意思的但是这个模式呢其实是不太可持续的

再天才的产品经理也有 terrible idea 对吧所以当时也是在这个过程中让我自己会思考可能我更想去做这样一种所谓工具或者说建立这种思维模式让大家能做这种数据驱动的决策能够筛选出不同的想法而不是说只依靠那个很碰运气的一两个点子嗯

我特别喜欢你刚才说的就是撒一张网的这个说法迅速地去迭代去淘汰不那么好的想法保留下来可以真正提供增长的一些策略贾琳在 Discord 之后是去了 Statsig 可以再跟我们介绍一下 Statsig 这个公司具体是做什么的吗

好啊 Stasic 是一家 SaaS 公司我们现在规模不大 100 人左右贾琳的工作是从 1 万人到 1000 人然后现在 100 人她是每次是哦我都没有发现数量级的降低

好有意思对我们公司现在是 100 人左右不过我们正在快速招人可能 2022 年就会翻倍这样子我们公司呢是做几个大的产品线一个是做 AB testing 我自己也是很多血泪时有关系快速迭代这样一个过程还有呢我们也做这个 feature flag

像我们如果想逐渐 launch 一个新的功能然后还有我们也做 analytics 是我们的一个产品线目前就是这个公司的情况你从 discord 到 statsec 是你第二次换工作这一次换工作是特别有目标的吗就和第一次换工作有什么差别怎么说呢少了很多不切实际的幻想哈哈哈哈

对我是觉得目标肯定是更清晰了就是想去更早期一点的创业公司会更加看重团队就可能在上一次换工作的时候呢更多的是从产品的角度看我觉得这个产品是不是有意思有没有有意思的问题

但是也是慢慢自己体会到一个道理吧就其实产品瞬息万变的像同一个产品它也可能就会不断的转换赛道就有新的这个新的问题新的方向所以在第二次换工作的时候我就很希望找到一个团队是我自己觉得志同道合的

你在面试的时候和这个公司的团队聊的时候有哪些点让你觉得说就是这个团队了我就要到这里来工作

最开始是我先有联系到了我们公司的 head of data 他是我现在的老板我们跟他约了一次 meeting 之后我就觉得聊得特别开心我觉得他是一个非常有想法而且呢是很谦虚的一个人我觉得他很有人格魅力

但可惜的是当时他跟我讲说他算是没有招人的打算让我等三个月再去跟他这个 follow up 然后我当时呢其实并不确定他这个只是一个外交辞令还是他真的没有招人计划

就三个月之后确实真的是很喜欢这个产品很喜欢这个团队我就去找他非常幸运就是他当时又开始招人而且是招 Customer Data Scientist 相当于是第一个 Customer Data Scientist 是一个之前没有的职位然后我就觉得和我的兴趣其实特别契合你觉得这家公司特别契合是不是有一个原因是这家公司 Data Scientist 特别多

这是特好问题我们从数量上真没有特别多我刚刚讲了公司有一百人 Data Scientist 其实只有八个人目前就是 Head of Data 下面是八个人没错 没错当然我们要扩招我们也有一些比如说 Data Platform Engineer 绝对和 Data 相关所以从人数上并不是最多但是因为这是一个数据产品

所以其实 data 是充斥在公司的各个角落方方面面的你当时和 head of data 聊了什么

聊得特别开心我觉得就是聊这个产品其实花了很多时间去了解他们当时创立这个公司的一些想法因为 Static 的创始人和创始团队都是 Meta 的工程师或者 Data Scientist 然后呢我们这个产品的出现其实很大程度上借鉴的是 Meta 内部的一个做 A-B Testing 的平台

然后就是听他们讲当时有一个想法然后他们几个人一起出来搞了这个公司而且当时 Head of Data 是唯一创始人团队中的 Data Scientist 所以我会觉得哇这个是一个非常有目标而且行动力特别强的团队

再加上他们说的是一个数据产品我作为一个这个 data scientist 的这个血脉觉醒就觉得天哪这也太酷了对吧如果天天都做一个产品去服务其他的 data scientist 嗯

Customer Data Science 具体是做什么呢我的工作就是有一部分其实和 Data Science 是一样的做产品的提升开发新的功能然后 Customer TSC 它比较特别的方向是有很多见客户的 responsibility 然后这客户可能包括现在的客户

已经有的客户也包括潜在的客户所以在工作中有很多和销售团队的对接你们的客户是其他公司内部的数据部门吗有数据部门也有工程部门产品部门都会有

在你和客户的这个交流过程中你觉得 Static 最吸引客户的一点是什么或者 Static 这一类的产品它能给这些潜在客户带来的最大的价值是什么这个是太好的问题了你现在的语气有点像客户哈哈

是吧没有没有开玩笑你能给我带来什么价值对的对的我自己做一做就好了为什么我还要买这个东西我自己其实是对我们自己产品非常有信心我觉得这是一个非常好的产品里面有很多非常先进的功能吧然后这些功能可能在市面上其他的平台都是没办法提供的我觉得

我们整个团队的迭代速度非常快而且呢整个公司也是 customer focus 我举两个例子吧先讲这个迭代速度其实我们是非常经常去在和客户的会议中听到了一个他们有的需求但是我们现在产品没有办法满足然后我每一次把这个需求带回到我们产品团队或工程团队的时候

他们真正把这个需求落地的速度就快到让我难以想象我自己就亲眼看到很多类似的这种功能是通过这种形式落地的这个销售周期其实是蛮短的相对来讲对于产品研发周期但是很多需求真的能够被快速解决然后这个其实也是 Static 一个很大的优势

然后另外第二点呢就是我们是全公司的所有人无论是做什么职位是有在那个每一个客户的那个 channel 里面就是任何人只要他在这个 channel 里问了任何问题我们全公司都会收到一个通知然后这个是公司级别的一个 SLA 就是我们要在多少时间内去回答这个问题解决这个问题

这个是我在入职之前怎么说我其实都不敢想象的但是发现它真正这么被操作之后我其实会觉得会给客户提供很多安心的感觉吧就他们的问题是会比较快然后有真正做这个产品的人来解决的而不是说把这两者分离开对吧产品团队就是产品团队销售团队就是管客户其实不是这样的对

对我能想象作为客户应该非常喜欢这样的服务但是作为在 Static 的员工来说你会担心吗你会担心比如某一天这个公司的规模到了某一个程度如果还维持这样的额外

SLA 这样的服务的强度的话它会不会不 scalable 它会不会不可持续我觉得首先这是一个 happy problem 就是如果这个公司不断在增长一定是个很好的事然后其实我们现在也在面临这个问题因为我们去年增长的确实很好今年的目标也是非常的有野心这样子确实这是一个现实的问题不过我是觉得

我们其实有很多方法去解决这个问题而不是说是线性的去增加人力至于说到底怎么解决其实这个也是我现在每天在想的一个问题吧比如说有没有产品上的改进有没有我们流程上的改进等等你作为 Customer Data Science 你要回答的问题主要是什么呢因为对接的大部分的客户都是有数据团队或者是有数据背景的

他们真正遇到的问题呢有这么三大类吧我觉得一方面是对产品的一个熟悉要去帮助客户去懂得怎么使用这个产品这个是一类第二类呢是有一些客户和实验设计啊实验结果上的一些疑问所以在这个过程中呢我们可能会

扮演一种类似于咨询的这样一个角色这是第二类第三类呢就是客户有一个需求目前的产品不能解决那可能我们会扮演一个产品经理的角色去收集这个需求然后看如何去解决所以说其实是有不同类型的问题你们现在有几个 customer data scientist

两个包括你两个对我是第一个然后我们刚刚又招了另外一个 Customer Data Scientist 我们还在招人如果有人有兴趣可以来联系我你会如雪花般飞过来对我觉得应该会有很多人感兴趣好啊好啊大家可以在 LinkedIn 上加我然后我们不光是 Customer Data ScientistApplied Data ScientistGrowth Data Scientist 包括 Data Engineer 其实我们都在招人

我那时候跟佳玲聊的时候我就觉得很羡慕因为我觉得他们的客户他需要回答的问题都是比较 sophisticated 的因为像我做 customer data scientist 的角色的时候他要回答的问题都是找不到那个按钮在哪里然后

然后就在那里嘛很明显所以很羡慕你的 customer 都是 data scientist 所以你可以聊直接就跳入到技术问题对学术问题讨论上面不一定是比较细节的东西所以这也是我觉得 Static 比较特别的地方是一个比较成熟的数据产品所以他的客户需要探讨的问题是跟一般的 customer data scientist 可能很不一样的嗯

Stasic 的客户一般是多大规模的公司因为我想象很小的公司他可能没有这个需求太大的公司他可能想会自己做贾玲快炫耀一下你们的客户

会不会别人误以为我是来打广告的我们打算这集录完就写信给你老板说你看看应该赞助一下太逗了我们的客户从大公司到小公司都有大公司的话比如说有 OpenAI 然后像 Atlassian 然后很多大公司 NoSharing 他们都是我们的客户

也有很多中型的公司,然后我们还有一个 startup program,相当于很多功能都是免费开放给这些创业者们。我想要具体地问一下这个 AB testing 实验的这个平台,如果你们的客户一般遇到是已经做好了一个实验平台,

或者是有些公司他可能还犹豫我是不是自己做比较好你会怎么建议这个特别好的问题其实我们真的有挺多潜在这种客户的聊天过程中他们是

已经有了一个很成熟的内部的 AB Test 的平台我去年就有合作过这样一个客户我不说他的名字了但是呢他就是已经是一个挺大的公司也比较有名气然后他们内部的那个实验平台当给我们展示的时候其实我自己是非常有被震撼到因为我觉得他们有很多很好的设计然后有很多功能是很合理的

也是很先进的一些方法不过他们其实在真正决定是买 buy or build 这个过程中也是有蛮多不同的方面吧技术本身我是说实现什么功能本身肯定是一个方面另外成本也是一个很重要的方面另外维护的这个

这个其实都是有在这个过程中要考虑的也包括公司未来的发展方向在这方面他要投入多少接下来其实是一个挺复杂的一个决策的然后后来这个客户是决定

买了 Static 就是用 Static 来替代他们原来内部的这个平台我自己的想法是未来对于绝大部分公司买一个 SaaS 产品是更经济的一个选择无论是从付出的这个

钱上来讲还是从人力层的以及就是未来这个公司发展的这个灵活度上其实都是我自己认为是会变得越来越流行的一个选择

贾琳可以给我们一个比较定性的一个感觉吗就比如说有的公司它从内部工具迁移到 Static 之后它在人力成本上可以节省多少呢首先我想澄清的一个点是说并不是用 Static 来取代数据科学家的工作

这个肯定不是这样的反而相反我自己见到的或者说是我们见到更多的情况是数据科学家有时间做更有意思的工作更有价值的工作然后在这个过程中呢并没有出现任何因为买了一个外部的 vendor 导致比如说裁员或者说 reshift 反而是之前要花很多时间去

维护这个内部平台的这些 data scientist 其实很多工作都是 redundant

它要做很多重复性的工作比如说它要手动一个一个做分析一个一个做让它能够有一个 reliable 的结果同时呢它还有一些服务各种 stakeholder 的任务对吧还要保证这个平台能够运营等等其实这些工作在很多程度上是蛮枯燥的吧也并不是对于数据科学家实践最好的一个利用

其实包括这个客户也有其他的客户他们的数据科学家我们其实都是一直合作的就是一直从他们开始买 SASIC 之后就会看到他们可以花更多的时间去研究一些更复杂更有意思的问题而不是说把大部分的时间都花在维护一个内部的系统让它可以运行

所以说这个其实也是一个可能很多人都会有的一个偏见吧我觉得会很有意思要是可以有一天跟 Datic 的客户聊聊他们的产品迭代有没有变快用了这样的产品这个肯定是会有的

卖这种数据产品其实是需要很多教育的嘛就是客户来他可能根本就不是很清楚具体要怎么使用这样的产品或者是这种产品到底意义是什么然后我跟贾琳之前在聊的时候她说这种数据产品销售她形容叫润物系无神就是要

要慢慢慢慢的让对方感受到你这个产品的价值这个具体是怎么操作

这个可能对于销售本身我是拜好然后我并不知道要怎么去真正说服一个客户让他签合同这个不太了解不过我更多可能是有些卸身的感受可以比如跟客户去分享然后我也在工作中很多时候能特别体会到他们的那种心情吧或者说他们的那个需求

因为我自己之前也是在公司里做 data scientist 因为我知道因为工具的受限其实确实有很多很头痛的部分比如说这个实验就是要跑三个月没有 power 然后这个也是我们很常见的一个问题就对吧很多客户来找到我们就说我们这个实验就是没有 power 要跑三个月我又不想跑三个月怎么办有什么方式

然后可能还有客户就会说我可以一个季度跑 20 个实验但是我 20 个实验加起来最终的结果和我一个季度之后这个整个 business 的表现不能对齐这是为什么我怎么样能够让它对齐其实很多问题是我自己之前工作中真正遇到过的所以说

可能更多的是这种共鸣吧是我工作一个很大的动力是不是在帮以前的自己的感觉哦有你讲太好了在这个销售的过程当中 Customer Data Scientist 和 Sales 是怎么打配合啊还是卖完才会到你这边哦

不是就是签合同之前我们也会有很多合作又和一起去见到客户谈不上配合因为很多时候销售团队他们不是 data scientist 然后可能客户的问题他们是没办法在当下有一个很好的解决所以说如果说有懂行的人在和客户有交流很多问题就真正能够得到解决

我的角度会更加倾向于去怎么能够帮对方去解决问题然后如果说我们能够解决我们能够怎么样帮助他们使用这个产品如果说我们解决不了怎么能够迭代我们自己的产品能够解决到这个问题所以可能我很多的思维模式也会更多是从产品或者说技术的角度上去出发 Killer feature 或者是 Killer use case 是什么就有什么你们一拿出来然后客户说好我一定要买

首先我们在 Experimentation 这个大类上可以说是做得最好然后这个包括 Feature 的完整度包括灵活度也包括很多 Meta Analysis 很多就是宏观的一种分析的一种工具包括 SDK 的

稳定度啊等等其实我还是觉得这个是我自己很有信心的另外还有一个 Static 因为是有相当于我们有好几个产品嘛三四个所以说如果说一个平台很多时候是有价值的因为相当于说你的数据可以不只存在这个平台为了做实验另外一个平台为了做分析

对吧可以把它整合到一个平台上其实这个也是 StatsSig 一个比较有尼克的点

很多公司他一般会有那个把 data 放在那个 production DB 嘛然后那个一般是 support 产品的然后像我们这种 data scientist 要进去看东看西的就容易影响效能嘛所以之后最常出现的这个 practice 是说那我们就 production 有一个自己的数据库然后分析需要用的 data 你们需要什么就自己移到旁边自己一个这样 stack

Static 是把这个分析的数据库的这个工作也包了吗还是说公司一般还是有自己的分析数据库然后在 Static 这边再 set up 一个新的东西我们 Experimentation 的话可能还是不牵扯于分析的这一部分有一个 Analytics 的产品线它可能更多是想取代很多这种重复性的分析类的工作

我并不觉得我们的定位是要取代那些复杂的 strategical 的分析因为那些其实是一个真的需要 Data Scientist 放很多精力去设计的一个很有意思的问题这个我自己在做 DS 的时候我觉得这部分工作是最有意思的 strategical analysis 对吧就是你真正能够探索一种解谜的感觉

这部分依然会是 Diastasis 的工作甚至要花更多的时间来做不过如果一些比如说一个产品经理想来看看我们上个月这个 metric 表现怎么样然后他可以快速的看到同时他可以快速的 deep dive 然后可以看到这个柱状图可以看到用户的分布可以看到

user journey 这些相对比较简单的不是非常 technical 的分析的功能 Static 其实是有一个产品我们叫 analytics 是也可以做到的觉得聊 Static 的这一部分贾琳就是有一种

面对客户的感觉哇我们听众都是 potential 客户对对啊现在每个听完就回去跟老板说老板我们去买 Static 也没有也没有我其实就会觉得现在的工作是那种

会有很多很有意思的问题吧可能就是天天我就在想说这个要怎么解决或者那个要怎么解决有时候可能就这个状态的可能有时候周末或者晚上也会思考一下这样你现在的状态跟我有点像就是当你跟那个你在的那个心创合而为一的时候

对然后就人家怎么讲都觉得我的产品就能解决你的问题或者是我的产品如果怎么改能够解决你的问题就是你当你特别热情投入在一家公司或一个产品的时候是这个样子的贾琳的这个职业生涯算是蛮多 Della Science 很羡慕的因为你待过最大的

那种 hire 很多 DS 的公司像 Wayfair 这种然后也带过独角兽这种高速增长的很重视 growth data science 的公司然后现在在算是一个明星 startup 你可不可以给大家分析一下你的这个体验你觉得大公司独角兽还有正在增长的 startup 有什么对自己有什么好跟不好的

这是特好问题我自己会觉得各有各的好处大公司的优势在于你会有个很大的平台去学习

然后这个学习不仅仅是技术上的也包括认识的人这个角度我在 Wayfair 遇到了很厉害的就是 data scientist 也有是我一直包括离职了之后的 mentor 我觉得我在他们身上学到了很多那这个可能是在一个大公司就有更大的概率去遇到的一个点

另外呢就是因为当这个公司比较大了它解决问题一般来讲也会更大在这个过程中呢也会更复杂在这个过程中有机会吧去了解到相当于不同角度来看同一个问题的

就是职业发展初期的朋友想做 DS 然后不知道自己兴趣点在哪里我觉得进入一个大公司其实是一个很好的学习机会你不仅能够有很成型的这个训练系统同时你可以认识到做不同方向的人那大公司的缺点就是我自己的经历是它迭代的速度就会比较慢吧

它很多流程上的东西会延缓你真正一个产品落地的时间那这个可能对于一些人来说是还蛮痛苦的一个过程就是要花很多时间在一些不必要所谓解决问题上要花很多时间在别的方面上

对另外在大公司的感受上可能会有点像那个爬梯子嘛就是它很多的评价标准都是固定的自己的感受是这样小公司呢肯定好处就是迭代的很快有机会是真正自己去做不同的事因为人不够嘛所以就 Amy 肯定也是深有同感自己在做各种各样的事然后就是很好玩不会无聊这个过程

如果说很幸运的话公司比如处于一个增长期那也是非常激动人心的这个旅程吧那坏处就是其实波动性还是蛮大的嗯

因为像下途有很多 startup 可能就是在很短的时间内就会比如说走下坡路或者破产其实那这在硅谷也更多了所以我会觉得这个波动性不确定性其实是很大的

我不知道贾琳跟爸妈说你一直换工作然后越换越小你爸妈是开心还是觉得哎呀怎么越换越不好啊这样这是一个体外话不过我爸最开始对我期待是让我去大学当老师铁饭嘛所以他可能并不会非常开心我这个公司越换越小越来越不稳定这一点哈哈

对还好我爸妈真的就是给我很多自由然后我觉得他们更多的是希望我做一个我自己能够发光的一个工作他们一定是从父母角度他们会觉得铁饭碗肯定很好但是他们其实也能理解那种就会有点无聊父母还是很开明的我妈有一次直接说因为我的薪水是越来越低嘛有时候

他就会说你怎么越换薪水越低你确定你这样是对的吗对这个我刚刚还忘讲了就是在大公司大概绿水会比较高这个是个优点小公司就是如果是运气特别好肯定也能赚到钱不过从整体的期望来讲肯定是低于大公司的

作为 Data Scientist 到某个程度想要换工作一方面可能是自己有自己的追求一方面就我个人而言可能是发现自己对公司的加分的价值可能没有自己想象的那么多贾琳一般怎么去衡量自己在公司的定位跟价值因为我觉得这个算是所有的 Data Scientist 可能在不同的岗位都要想的因为这个跟 Job Security 有关系嘛

我其实有时候觉得这个价值更多是取决于自己的心态因为呢我觉得读书的时候肯定是有一个外界的标准嘛就是评价我就觉得你怎么样是好什么样是不好或者说考试等等可能工作之后我还花了蛮长时间去摆脱这种好学生的心态因为我就会觉得

我应该去定义自己的价值而不是说被一个框架所限制然后所定义价值可能也正是因为我这种思维模式的转变让我不断地换更小的公司完全从我自己的心态来讲我会觉得更在意自己对自己做的工作的这个认同感可能会让我自己变得快乐一些

因为工作其实有蛮多很让人头痛的地方的我也有很多那种非常不开心的时候会觉得工作很没有意思或者非常让人折磨然后也会有那种非常 drama 什么在老板面前痛哭流涕完全就不行那种对年轻的时候就还挺多这种但是可能我现在的心态就会觉得

会更在意我自己是不是认同我做的这个工作我自己有没有觉得我在创造价值我觉得这个还是现在我自己变成熟的一个转变吧

你说的这个创造价值是替公司替产品创造价值还是创造自己的价值其实这是一码事因为很难把这两者分开或者我这么说吧其实它在小公司是一码事就是我

我产品的成功其实在很大程度上决定了我在这份工作里的成功与否也包括经济上也包括其他方面如果说这个产品失败了其实很多的努力或者说所谓的 title 也好所谓一些光环也好其实都不存在的所以说其实在小公司这两者是很难分开的它是一个正向循环

在大一些的公司可能会有一些区别那我还是会觉得因为我自己在大公司的时候我是一个很 junior 是一个小朋友我自己会觉得多学习还是蛮重要的嘛无论是在技术上还是在非技术上提升自己

至于说对于公司层面的影响既然是大公司它已经有一套这么成型的流程了那它肯定有办法去筛选出那些对公司有意义的人所以说我倒不是特别替大公司担心这个事大公司里成熟的体系就是说有那么一两个螺丝钉如果工作的不是那么好其实也不受影响对

贾琳从刚入行在 Wayfair 做偏 Machine Learning 的 Data Science 工作到后来做 Growth Data Science 再到现在做 Customer Data Science

如果是我们单从技术的角度上来讲其实可能算是 data science 的这个含量是逐渐降低的一个过程你认可这个说法吗认可含数据量不断减少那你觉得现在如果要再入行的 data scientist

你会建议他们更注重这个技术方面的培养呢还是你会觉得根据你的经验来讲其实跟产品结合的更紧密有更大的广度是更重要的我个人的看法未来 Data Scientist 会越来越需要专家而不是通才我

是觉得我自己的职业发展其实也印证了这个道理吧然后这也是我对可能很多周围人的一个观察我会觉得对 Diastante 这个行业可能会更两极化的发展非常偏技术的人和非常懂产品的人

然后尤其现在 AI 的出现会让这个趋势加快因为说白了现在呢如果说我有一个很好的想法借助 AI 我甚至不需要懂很多技术我就可以快速的去实现一个想法那这个其实是降低了很多从技术角度上做产品的门槛

更重要的可能是这个想法本身或者思维模式或者说能不能真正解决问题那我倒不觉得如果说对产品感兴趣的 DS 的话它需要特别懂技术因为很多问题都是可以借助工具解决的

那如果真正对技术特别感兴趣我会觉得可能会走入另一条这个赛道这个所谓大模型研发这方面我就外行就是外行就是你讲这种比较深度的专家你们觉得现在什么方向比较有讲就业机会好了

这个问题我真的认真想过我不知道这个是不是一个普遍的观点我觉得未来啊 data engineer 是一个很好的就业方向

这个是有这么几点原因首先因为有 AI 很多数据本身的分析工作可以被取代但是数据的产生和这个处理依然是 AI 做不了的因为 AI 它很多时候是 non-deterministic 它没有办法真正 reliable 的做这个工作而且正是因为有这个趋势的产生我们需要更多高质量的数据

所以说这个我觉得 Data Engineer 这个以后的需求只增不减另外呢从现在这个市面上人才的角度说我自己遇到好的低真的特别少然后真正好的它真正能解决一个非常大的问题但是呢

屈指可数吧我觉得所以说从人才的角度我觉得也是需要很多厉害的人在这个行业里加入进来的我不知道真的是大家的共识还是我们找的嘉宾都在我们的同温层里好像看法都是比较相似的是吧对的我真心我觉得如果我现在就是重新找工作我大概也会选择做第一

我觉得我们都是只是想要找一个很好的第一合作而已天哪我共鸣了那你觉得像这种很懂测试实验的 data scientist 你说的专家吧需求怎么样我觉得还是会有而且会一直存在的因为

因为真正实验的问题其实也需要一定的量的积累吧因为虽然说大家现在都了解实验这个概念但你真正把它做到一种深入人心还是有一些路要走的可能很多公司还是依赖一些更传统的决策模式当实验变成了一个更普遍的方式之后其实有很多疑难的问题

同时这个是真的需要非常了解比如说懂统计懂有真正的行业思想经验的人来解决的

我也认同我觉得做测试其实很难而且我不相信大部分我经历过的测试就是我开完会有一种 OK 就大家开心就好的那种感觉对然后我特别特别佩服可以准确的设计跟解释一个测试的人而且我很少遇到真的很懂的人

确实有一个笑话是说学校的教授里面如果要合作写 paper 的话不要找学统计背景的人为什么因为统计背景的人就一虎直会说你做的是错的哈哈哈哈

这样不严谨对所以说做 internet product 就是那种线上的 product 还蛮兴奋的因为它可以做到大部分情况下是一个标准的测试比起要联系线下的世界的话真的是简单很多

线下的实验就永远会遇到数据量不够或者是数据不干净的状况这种时候你做出来的结果如果和 stakeholder 预期是相符的大家觉得做得好如果不一样的话大家觉得一定是数据出了错你肯定做错了 Static 的话有很多线下的数据的实验吗会有我们客户很多也是有线下业务的然后

那你们觉得如果像 Data Scientist 想要培养比较产品思维商业思维的话有什么具体的方法我还蛮好奇你们对这个问题的看法因为这也是我最近在想我要怎么能培养产品思维所以我蛮想听听你们俩的想法我觉得这个 Amy 应该有不少可以分享的

我这个人可能比较酸一点,所以我很喜欢看很多产品,然后觉得这个有搞头还没有搞头。每次看一些产品我会去内心预测一下它的成功失败的几率这样。就是看很多产品。然后我去了解一个产业,这个也可以稍微安利一下,因为我跟 Stella 之后可能会多做一些产业别的深入一点的内容。

也就是你去看一个产品会不会成功有时候是要看它的用户的思维模式是什么当然像 Notion 啊 Figma 这种它的那个目标群体比较明确的话或者是比较熟悉使用电脑去解决问题的话那个思维方式比较不一样我比较有兴趣的是有一些产业的人他其实是比较传统一点的

所以你那个产品思维很多时候是需要花大量的时间去学习那一个产业链的实际上的工作的人他们的思维方式是什么所以比较 high level 讲我觉得要有产品思维就是跟更多不一样的人交流可能会更能够理解为什么他会喜欢或不喜欢一个产品他觉得一个产品是贵还是便宜也很关键对

就是要更脚踏实地的去理解用户的他们的想法

所以我觉得卖线上的产品或者卖这种 2B 它的客户是比较熟悉技术的人都还算比较简单的因为你跟他讲的语言比较一样嘛你也明白为什么他喜欢或不喜欢一个东西基本上你这个东西只要价格合理然后是有价值的他就愿意买但是其他产业有时候他不是完全根据这个东西对我有没有价值来购买的

对所以那个方面的产品思维就会比较不一样一点这个是我这几年做比较传统行业的客户的一个心得吧然后我觉得产品思维总之你要有兴趣啦因为很多人他可能没有很有兴趣去了解终端用户他的想法是什么所以就会变成那个培养产品思维的一个阻碍因为他对他没有兴趣啊

没错对我还蛮同意艾米讲的这个点的因为我也是学工程出身很多时候在想一个产品的时候很容易就是 jump to solution 我在想这个要怎么解决它但是现在我在回想其实更重要的问题是

就是我之前可能很多时候在试图解决它的时候我并没有理解这个问题到底是什么

刚才 Amy 讲的这个是有点让我想到 tech 这个行业工作的人其实都是生活在一个 bubble 里面在这个 bubble 里面生活的久了以后其实和我有时候会觉得和真正的生活是挺脱节的很多时候我们说的产品如果是线上产品的话那当然它是跟我们的工作环境很近的

但是还有更多的产品其实是更加的贴近生活有时候我是觉得在 tech 这个行业工作的人其实没有好好生活很多人尤其在我们更年轻的时候因为我自己也经历过那个阶段我其实是觉得你没有在生活的话很多时候产品到最后也都是 first principle 就是人嘛

如果在自己的世界里面接触到的都是和自己一样的人很多时候对产品的判断就会非常的偏颇我觉得这样其实很有道理的这个可能也是就是年轻人在泰克行业中很容易陷入的一个困境中一方面想要有更好的职业发展但另一方面可能真正的生活是和他有相当的脱节的

我们的父母就是那种我觉得我有时候会跟他们聊天的时候就在想我不知道这是我们这代人的一个幸运还是不幸就是我们的生活工作是更加割裂开的对他们来讲比如说在国际或者在类似于当时的工作我觉得他们的生活和工作会更加同步

就会觉得每天都会过得非常的有非常踏实然后可能这也是很多时候代沟的来源吧像我爸妈就会经常觉得我太务虚了对吧要务实一点尤其是我最近在看那个佛学入门我觉得蛮好的已经到这个阶段了对对对已经看开了然后我妈就说你这完全是在往错误的方向上看书对你

你这越来越虚了都已经那个要看开了但我觉得就是在我自己周围人其实有我这样想法人还真挺普遍的

我这两年比较逼自己的事情是因为以前一般不管做什么工作或生活你就会方便为主怎么方便怎么来嘛就我这两年尤其是近一年开始做很多不方便的事情然后你就会发现你去做不方便的事情你就会遇到很多习惯不要那么方便的人所以就很开眼界吧因为你不去做这些事情你永远都不会遇到他们

嗯我最近两年是有一点对于技术稍微有点叛逆我现在就很不爱用各种 delivery service 就是以前我很习惯于外卖啊然后

然后或者是 Instacart 这种服务现在我会更愿意就是去超市去实体店里面或者是去餐厅里面跟人交流就觉得有时候会遇到比如说你跟 cashier 聊了一两句可能就会特别有意思比如说前两天我去超市去 sprouts

买东西然后 cashier 他在帮我收东西的时候他就说你是不是要做提拉米苏然后就这种小事情就聊两句让一天的心情很好对蛮不一样的昨天刷小红书然后就有人在聊说中国大陆人然后他嫁给台湾人嘛所以他在考虑他要住深圳还住台北然后下面就有很多留言说不要住台北太不方便了

就是台湾的话很多东西还是要自己走去那边跟他买你必须要有这个人的交流才能达成一些事情或者是他没有那么合算例如外送费在台湾就没有那么便宜所以你会选择自己去那边买你不会选择交外送可是在中国大陆的话就是外送怎么方便怎么来嘛

我就是在看那个小红书我就在想说我可能会更愿意比较那么方便一点我想要下楼去跟那个阿姨买水果我想有人把她送上来我现在很珍惜这种面对面的交流机会和陌生人之间呢

是我觉得要做一些无用的事如果说做所有事情都在从有用这个角度上出发人生会蛮无聊的人生的意义可能是在于无用的那一部分对啊是好深刻哇我们这一后半部分怎么聊得这么 philosophical 哈哈

进入了一种虚无主义对啊我们本来这时候要聊的是这个数据科学家的偶像包其实跟我们刚才聊的也蛮像的就是很多时候你有

尤其是当 Data Scientist 你刚才入行肯定就想要做 Machine Learning 对不对做厉害的模型对但其实做了一阵子你就会发现很多问题不需要厉害的模型对那我觉得我们三个可能已经调试的蛮好的就是我们已经习惯自己做的东西可能不是很 Data Scientist 这件事情 And it's okay 这样

我是觉得偶像包袱是一方面还有另外一方面就是可能和 job security 相关如果一个 data scientist 做的事情很不 data science 的话可能就会有一种危机感就觉得说我这个工作到底还保不保得住

不过如果一个 Data Scientist 只做 Data Scientist 那我觉得他的 Job Security 也会有问题对吧所以我觉得 Title 可能只是一个指导性的并没有觉得说是要

定义一个人该做什么对我觉得我们三个可能在这个问题上都已经有共识了就是经过几年的工作就会觉得可能最重要的是就是说白了要看 impact 对吧要看做的什么是解决什么问题 data science 说到底也只是解决问题的一种方法而已对是这样那贾琳如果现在你在重新变成一个毕业生你还会做 data scientist 吗我会做 data

回做 Data Engineer 大概率我不知道在学校里面现在大家有没有这个觉悟因为我们这个结论都是工作几年得出来的可是在学校里面小朋友可能得到的信息不是这个样子的就过去几年各个学校的 Data Science Program 是真的都产出了非常多的毕业生要进入 Data Science 这个领域

我觉得在没有工作经验的时候要找工作的话你可能确实就是会看说那我这个学历最对口的是什么工作机会我去找什么工作所以很多人都还是会去找 data scientist 的工作但是对于 data engineering 来讲好像很少有特别对口 data engineering 的这个学历或者是 program

没错而且一个好的 Data Engineer 有很多技能是并不和前端或后端工程师互通的这一点我觉得也增加了他的稀缺性因为一个 Data Engineer 每天在解决的问题其实和一个前端工程师是完全不一样的尽管就是都是工程师比如说就拿 Static 例子来讲吧我们的 DE 团队是非常厉害的那么每一个人都很厉害

但是他们现在就是很发愁的一点就是不好招人因为这个技能点挺罕见的他们每天想的问题是在做一个 billion level datatrillion level data 怎么能让他定时定点便宜的跑通

我觉得这个问题是一个太有意思的问题了就是我自己虽然没做过我就觉得天哪这个真的它要怎么做呢是哪一步的问题就是你每一步感觉它都 work 但是你把它放到一起这个系统突然就迅速上增然后你就觉得

不知道在哪里出问题它就不 work 我觉得这个问题太有意思了他们每天在解决的这个问题其实和我们传统意义上的这个 product engineer 有很大的不一样的 data engineer 这个行业我觉得太吃经验了所以很难有刚毕业的学生去做能做很好的 data engineer 没错而且他们的 tech stack 也是蛮不同意的

但是其实他们的 tech stack 都没有太大的改变我发现其实不会说要一直学新的东西比较是你要在这个领域做越久你累积的经验但是说到底大部分基础的工具不像 data science 每两年就出一个新的 frameworkdata engineer 他们用的东西都会比较 stable 一点对

我有一个比较 cynical 的 comment 我们这群 data scientists 天天都在唱衰 data science 但是呢我觉得像 data engineering 这一种它其实是它的 technical 的 bar 比较高然后它的工程的严密性要求也比较高它不像 data science 就是你可能相对而言比较容易就能弄出来一个新的 framework

Data engineering 的 framework 要真的被大家 adopt 要真的被大家用的话它需要花很长的时间去开发所以他们的更新换代没有那么的快但是这也是一个很好的职业护城河我们刚毕业找工作的时候就想找那种刚毕业就拿钱很多的工作机会现在就非常 appreciate 这种很吃经验的工作机会对啊

突然觉得爸妈让我去考公务员也是很有道理的因为我现在自己有小孩了嘛我这段时间就在想说有很多美国的一代移民让自己的小孩去做医生做律师是真的 make sense 很有道理的有道理的 是的是的

好那谢谢贾琳今天来跟我们聊天我就按她这样的发展下去她下一个公司就是食人以下的公司再厨一师再下一个公司是一个人只剩她自己突然

突然觉得有点悲伤不会啊投射数量越来越少那每周二数据女孩的中年危机都会在各大 podcast 平台同步更新除了 podcast 大家也可以加入我们的会员找 Stella 跟 Amy 咨询然后我们有一个英文 substack 叫 The Cocoon 连接在节目的简介欢迎听众朋友们关注大家拜拜拜拜拜拜