We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Vol. 08 从谷歌大脑到 Hachi AI|对谈王晶:AI 推荐系统的反思与“有趣”的未来

Vol. 08 从谷歌大脑到 Hachi AI|对谈王晶:AI 推荐系统的反思与“有趣”的未来

2024/12/11
logo of podcast 双成记

双成记

AI Deep Dive Transcript
People
王晶
Topics
王晶:我曾在Google Brain负责推荐系统研究,期间深刻反思了传统推荐系统的弊端。传统系统过度依赖单一指标,忽略用户体验,导致用户沉迷和信息茧房等问题。其根本原因在于优化目标错误,仅关注用户留存等单一指标,而非用户体验和乐趣。 在Hachi AI,我们致力于打造一个既有用又有趣的AI,通过大模型技术,利用更丰富的语言信号来理解用户需求,避免了传统系统中隐含信号微弱的问题。我们关注用户的情感体验,而非单纯的数据指标,力求最大化用户的惊喜感(serendipity)。 商业模式方面,我们不会完全依赖订阅模式或传统广告模式,而是探索更符合用户需求和产品特性的方式。我们认为,AI陪伴型产品需要与用户建立情感连接,单纯的数据驱动无法实现这一点。 从Google Brain到创业,我经历了从技术到产品的转变,也对大模型技术的发展有深入的了解。我见证了深度学习、强化学习和大模型三个阶段的AI浪潮,并认为这种技术迭代将持续下去。 炬成、叡成:作为播客主持人,我们与王晶探讨了AI推荐系统、大模型技术、用户体验以及商业模式等话题,并就创业经验、职业发展等方面进行了深入交流。

Deep Dive

Shownotes Transcript

当你所有的事情都归结于一个指标事情就会被过度的简化产生这种额外的不足所以我们做哈奇 AI 的时候我们希望做的不仅是一个有用的 AI 而且是一个有趣的 AI 谷歌作为一个很大型的公司在任何的转型的过程中都会碰到很大的一个主力

创业真正的是一个寻找市场机遇的一个机会并且寻找可能是比 build 还要更重要的一个过程寻找 build 寻找 build 在这个中间如何进行 balance 好的欢迎来到双城记这是一档对谈华人留学生创业者与投资人的播客我是巨城我是瑞春

今天的嘉宾是来自 Hachi AI 的联合创始人与 CEO 王金他先后在 Google Brain 担任资深研究工程师负责研究谷歌内部多个项目的推荐系统王金 PhD 毕业于波士顿大学专攻领域是系统工程那我们开始吧好的 欢迎王金那您可以先给我们讲一讲这个 Hachi AI 大概是一个什么样的一个非常高兴今天和大家在播客上见面

阿奇 AI 是一个我们的 AI 智能伙伴能够帮助大家去在做每日生活的一个决策

我们希望 HCI 能够为大家的生活提供更多的创意更多有意思的可以去做的事情可以去探索的方向明白那因为您之前是在 Google Brain 工作这个也是设计这个推荐系那我想因为您之前在在这个 HCI 官网博客上面也讲到说您认为这个 Google Brain 它有管它算它很大程度上是在玩弄它的用户

用户然后您希望说 HCI 也可以改变这样一套算法并走同期您是怎么样去完成这种转换从设计对楼经的推荐算法转向可能一定程度上在批判这样子推荐的算法是是这其实和我的一个职业的经历是有关系的这个转换的过程也经历了好几年的时间

我在谷歌的第一个组其实是广告推荐我们在做广告推荐的时候其实当时就是希望能够用户能够更多的点击我们的广告在广告推荐这个领域里面其实最后的转换也就是最后用户是否点击其实最关键用户的体验最初并没有是被至少在谷歌的广告设计里面

作为最重要的一个体验在我加入广告推荐进行优化的时候因为广告推荐有很多的部分但我所属的广告推荐的业务其实得到了非常快速的爆发性增长三年之内就达到了 80 亿美金的年营收这样一个业务在前面的几年的时候当然大家都是非常非常开心的但是到了大概 16 17 年的那个节点的时候其实有一个比较重要的世界就是苹果在 Safari 浏览器里面推出了一个防止用户

推出用户的功能这个使得很多当时的广告推荐技术就不能够很有效的去定向用户了这个对很多的广告推荐的算法影响是非常非常大的我们起初在用户在 Safari 里面推出这个的时候因为 Safari 市场份额并不是太高

我们并没有太注意这件事情但是当这个推出来之后我受到了用户的非常广泛的热情的推荐整个社会的舆论其实就有很大的一个变化这其实是我的一个出发点就是最后这个舆论出发到了即使是当时市场风格非常大的就是 from 浪漫期也被迫采取调整的姿态来减少用户定向各种各样的一个为用户体验做优化的一个影响

这个对我的一个很大的一个深刻的印象就是说你做不管是做什么样的推荐还是做产品一定要最终把用户体验或用户是否在这里面是否开心作为一个最终有可能的标准如果不是这个样子那么即使是在刚开始的时候势能很大那最后一定会有一个反弹的一个效果这是我对这是我这个转变的第一个出发点

那么我后来的职业生涯到了谷歌大脑的时候我当时就是主要是做强化学习和推荐系统的一个结合的工作但我做这个工作这是技术层面上来说是做这个但是我真正当时想要解决的问题是什么就是推荐系统和人的关系是什么因为从广告的经历里面我就发现了就是当时推荐系统其实是广告里面的推荐系统其实最主要的是为广告主服务

它不是为用户服务但是 YouTube 的推荐相对来说并不是直接的商业化部门那么理论上来讲应该是要为用户服务

但是我们当时观察到 YouTube 的这个推荐系统里面其实也有别的问题就是我们当时聊到推荐系统几个大的问题一个就是说用户非常容易沉迷这是第一个第二个是信息减防的一个问题就是只会推理喜欢看的最后每个人都会形成了一个特定的观点在 1607 年那个时候讨论比较大因为特朗普当选的时候其实也会引起了一个整个社会的一个讨论

所以我们当时就是认为这个其实是因为强化系统就是推荐系统和用户之间发生了失败的一个原因也就是推荐系统并不是在为它的用户服务在广告里面推荐系统当然是为了广告主服务的但是在 YouTube 的时候我们发现其实最大的问题就是这个优化目标的问题 YouTube 里的

把用户体验的最主要体现用户体验的指标是用户总市场就所有的功能都是为了增加用户的总市场那么在推荐的这个问题中其实就发生了很多的就是要不断的优化用户总市场在强化学习系统里面其实这也是一个常见的问题就是叫做奖励黑客最近 OpenAI 的离职的一个

离职的一个研究员翁立泰也说过这个就是奖励黑客其实也是整个不仅是强化学系统整个推荐系统里面一个很严重的一个问题就是在推荐系统里面其实这个就是说我为了让你留存下来的话那么其实我就会给你推荐看起来非常劲爆的新闻我就让你不停的看然后看完之后你其实就会觉得非常的就是有不久感

我们在当时就是希望能够做到的是推荐系统真的是为人来进行服务那么这里面可以涉及到强化学习的不断的反馈的这个过程那么反馈要做到一个正确的一个回馈所以我们当时就是去做这样一个事情所以在这个整个的一个过程中我就对整个推荐系统为什么会演化到当时那个样子有了更深刻的一个了解

最终我得出来的一个结论就是说之所以推荐系统会产生当时那样一个问题根本的原因是它的这个优化函数是不对的它所优化的目标是不对的它优化的是一个单一性的一个指标

我们当时尝试了非常多其他的指标来看有没有更好的指标当然就是从谷歌的角度上来讲也并不是说他们就一定要优化这样一个指标所以当时他是考虑很多其他的指标最后这两个指标是一个相对较好的指标但是当你所有的事情都归结于一个指标的时候那么事情就会被过度的简化产生这种额外的不足当时在谷歌还尝试过哪些其他指标呢

在谷歌尝试过其实很多其他的类型的资料比如说点赞率或者其他一些类似的但是这些都有各自其他的问题我们后来发现的是一点就是说真正每个人的想法是不一样的每个人的兴趣是不一样的

在以前的推荐系统里面实际上所有的这个优化反馈都是依赖于用户所提供的隐含信号

也就是说你是否点赞了你看的时间有没有看时长是多少有没有留言那么这是一个结构化的一个像表格性的数据然后再用这个表格数据上学习你是不是看的更多这个会造成一个结果是什么呢用户给的反馈并不清晰比方说我不喜欢看这个方面的内容了我只能点踩了五个之后我希望推荐系统能够理解到我其实不喜欢这个东西

那么因为推荐系统本身并不能得到用户来来自用户的明确的信号和信息那么他自己必须有一个非常主观的观点就是他的优化函数那不论是采取什么样的优化函数的话它都会产生相应的一个负重那么这里面最大的一个问题就是

人和推荐系统之间的交互是非常非常有限的我打个比方就说我们两个人推荐系统是另一个人我也是这样一个人我们现在不能够通过聊天的方式来聊我只能点头摇头那么我们的交互其实就最后你只能靠你的想法来猜你最终会猜出什么你就必须得是按照你前面的一个观点但如果你同时要和很多人聊的话你只能有一个观点

那么就必然会产生很多的副作用这是我当时意识到整个推荐系统的一个最大的一个问题就是说在和用户进行交互的这种过程中所用来对齐的信号是非常微弱的一个隐含信号是很难做得很好明白但是您在做 hatch 的时候您怎么样去避免这样子的问题出现

这是一个非常好的问题所以从那个时候开始我就一直这也涉及到我最后为什么会从 Google 离开来做话所以我就一直在寻找这个问题当我意识到这个现在推荐系统里面的这个主要的问题是隐含信号的时候我当时就是希望能够去寻找下一个解决方案而且从我宏观的角度上来我知道一代的技术的话大概的生命周期可能就四到五年的时间从推荐系统

比较发展其实是从 13 年到 17、18 年这样一个阶段是它的发展期是我经历了全周期的发展所以我大概能够知道推荐系统在一个成熟的阶段后面大家会考虑它后面的这一个问题所以我比较幸运的时候我在谷歌大脑的那一个组呢其实是当时就是主要做大模型研发的一个团队

后来包括谷歌的 Lambda 还有后来的 Gemulight 其实就是我当时在主力在做这是有一个历史的一个背景就是在谷歌从 16 年到 19 年的时间是可以说是在谷歌内部的话是属于他的大模型的文艺复兴的一个时代所以当时是投入了大量的这个算力

允许研究人员进行各种非常疯狂的尝试所以也就是在那个时间各种生成式 AI 的技术是在谷歌内部萌芽包括当时是有专门做艺术创作的一个组后来其实慢慢就演化成现在的生土型的应用还有当时是主要是解决顺序

决策 最续预测的类型的主当时有循环神经网络当时有深度学习到循环神经网络最后要解决循环神经网络里面的一些问题最后推出了这个 BRT 的架构就是 Transformer 的架构也是在那样的时刻就我比较幸运刚好就第一视角经历了这样一个过程而在这里面其实也比较重要的一个技术就是强化学习的技术

但这个技术最后的完善是在 OpenAI 但是当时的很多的研发已经是在谷歌就是从技术完成度的角度上来讲在谷歌已经当时做得很好而我当时因为在做强化学习所以在这个里面有做很多相关的一个工作所以我就因为这个经历我意识到语言的一个重要性

就是在这样一个时间点里我其实就是从强化领域进入了一个就是自然语言处理或者大模型的一个领域我意识到了语言所能提供的信息的丰富度远远不是隐含信号就是点赞就是喜欢或者这种类型的隐含信号所能提供的

而语言信号之所以以前没有被人重视主要是因为没有一个强大的能够理解这个语言的信号里面的一些非常细微的事情我们这是在直到很晚近的时间我们认为语言是人类所独有的一个特点工具或者说是 AI 是可能理解语言也就是说那么语言里面所存在的信号是不能够被使用

但是整个 Transformer 架构出来之后整个对语言理解其实是 Transformer 到我们后来大家都会理解说 GPT 但是在 GPT 之前呢包括当时谷歌出现的这个 Port 类型的这个就极大的提升了这个对语言的理解在这的能力使得那些信号从原来可用变成可用那么基于这样一个观察我当时就是认为说基于这个大模型

相关的这个信息分发推荐系统在以后将会成为主流这一个想法最后其实推动了我离开谷歌来自己创业

那我有个问题啊就是说现在我明白就是说您离开背后的逻辑是您觉得原来谷歌那一套推荐系统它是 based on 一些非常微弱的信号就是像您举的例子点头摇头 yes and no 然后您觉得就是大元模型出来之后通过用户他们语言的 import 他们可以更加

更加怎么说呢就是精确的去表达他们自己真正的需求或者真正的喜好然后通过大语言模型去给他们做就是更加精准的推荐嘛我理解就是下来您是有这么一个逻辑那您离开的时候谷歌他们有在往大模型背上大模型的推荐算法这方面转型吗当时是有这个方向的转型的但是在谷歌作为一个很大型的公司

在任何的这个转型的过程中都会碰到很大的一个一个一个阻力其实到 19 年之后其实有一个很大的一个趋势就是谷歌在整个大模型的方向上速度就明显的变慢了那么主要产生的一个原因是在整个 16 到 18 年间这个是技术的发展的一个阶段那么

那么整个谷歌内部是允许研究人员进行非常开放型的尝试这也是谷歌一个非常优良的传统所以技术不断的成熟到了 18 19 年的时候开始具有了能够产品落地的潜力包括我们当时做的产品就是 DrupalS 就是 AI 的可以打电话当时在谷歌 IO 里面也有展示打电话的过程几乎是无法和真人区分开来

他们有了很多很多这样的一个技术的这个原型开始技术推广到了这样一个阶段最后发现一些什么样的问题呢就是这样类型的技术它会对人们对于这个传统业务的认知产生很大的一个变那么对于谷歌作为一个已经是在整个互联网行业里面其实是一个代表性的一个公司在很长的时间里面谷歌

事实上是代表了互联网就是绝大多数互联网所承受的利润谷歌都获取了因为谷歌的想法是整个互联网越大谷歌就越大这是这样一个非常利他的想法但利他的这个背景是在于谷歌实际上是属于江湖的老大他没有必要担心竞争但是他产生的另外的一个问题就在于如果你是江湖的老大你没有必要去摇动这个江湖

我们在很多原型测试的这种包括我们在网搜索里推荐来推荐这个新系统或者在 YouTube 推荐系统我们发现这个东西对于整个市场的格局它是一个天翻地覆的一个变化它对谷歌说不清楚是好事还是坏一件事情那么在这个过程中

整个高层就犹豫下并且它确实是会对谷歌的品牌产生即使是到后来谷歌退出 Gemlight 之后大家对谷歌其实是不断的有各种就是批评的意见就是你不管做到多少好谷歌就应该做到 100 分 98 分 99 分都不行得到 100 当时那个情况已经发生了所以在那样的时候其实谷歌产生

能明显地感觉到这个速度放缓有一个暂停键在这个地方当然这个这是后来历史的一个事情因为也就是在那样一个时刻 OpenAI 获得了微软的 11 美金的投资迅速地在这个赛道上往前推进最后就推出了这个 ChatGP 某些程度上就是为什么

这种 Chad GPT 是在 OpenAI 里面推出而不是在谷歌服务从技术的角度上来讲谷歌当时已经完全具有这个能力来做出这个 Chad GPT 相关的技术这当然也是后来为什么会出现一些谷歌衍生企业也就是谷歌内部的一些成员他最后希望能够移植创业来推动这个模型的发展包括 Private AI

这也是 AI 陪伴领域一个比较重要的一个他的其实创始人就是 B&T 诺文的第一作者就是主要作者当时在谷歌内部也是推动一个聊天系统碰到了也是类似的一个问题最后他决定出来单独做一个在单独做一个这个基于大模型的新系统嗯

明白那正好聊到 character.ai 就是哈奇我感觉它也是一个作为陪伴性质的 AI 产品那您在技术和产品设计方面有哪些尝试然后去让这个产品变得更加有趣呢对在我们做哈奇的时候其实我们就考虑到了就是说我们一定要做一个 GNII 远生的营运

所以当时我就花了很多思考就什么叫做 GNI 原生的应用其实这个很重要的一个特点应该就是说以前的这个应用包括所有的互联网应用可以做到非常非常的有用但是因为你和他的沟通就只有点头摇头这么简单的一个信号你并不会和他建立任何的一个情感的连接或者联系

而下一代的互联网产品其实最主要的一个新的变量在这里的话就是模型能够懂人化那么当它懂人化的时候其实某些程度上就是通过图灵测试就是你觉得它像一个真人那么就产生一些依赖性的一个特点

所以我们做哈希 AI 的时候我们希望做的不仅是一个有用的 AI 而且是一个有趣的 AI 有趣在我们的这个产品设计里面是非常非常重要的一个那么回到您刚刚说的问题就是说怎么把这个产品做得非常非常的有趣并且

不只是说我们在产品上做一个小 trade 让它有趣而是说结合这个模型内在的这个能力让它变得更有趣我们也做了很多很多的手势我们当然最开始第一个场子就是说我能不能够直接做一个模型让它变得非常有趣这是第一个问题我们在这个方向上做了很多很多的手势但是

这个方向的尝试本质上来讲的话实际上是涉及要重构整个语言模型的一个内在的一个秉性因为语言模型我们来考虑的话其实是属于再造人每个语言模型都有自己的一个特定的特点就像我们每个人有内向的人有异人有爱人有这样类型的人模型本身是有这样的一个特性的

我们现在所说的大母亲包括去 IGPT 可能除了 Block 以外基本上来讲都是属于一个类型就属于学者性或者学生性学者性它之所以是这样一个类型的它的原因其实是来自于这是一个学术界研发的我们在当时研发这个东西的时候所采取的语料那就是采取最熟悉的学术设施

论文这些类似的那么他训练出来的当你给他为了大量类似这样的数据的话他天然是一个这样一个类型的属性你要改变他的这个改变他的这个内在的属性

当然你可以尝试比如说模型微调的方式但是我们最后意识到改变一个模型的性格和改变一个人的性格其实是差不多的其实人是很难改变性格模型也很难改变性格所以这就意味着你可能要重头训练大模型是这样一个逻辑但是我们在演化的这个过程中我们发现了就是说在目前这样一个时间点可能整个行业可能整个行业包括 VC 的行业已没有耐性再有一个新的大模型出来

而这个新的大模型仅仅是它的功更多的是说我更加有趣了这个涉及到这个价值因为普遍来说的话如果你做一个非常重要的律师的行业或者是重要的行业那么大家可能认同说这是很有价值的那我再训练一个大模型如果说我训练一个大模型的主要目的是为了能讲脱口秀能够讲段子

那么在普遍的认知里面大家对这支持力都会更低一些所以我们尝试了一段时间之后我们觉得说这个仅仅说大模型的重庆医院的大模型可能是一个长期的方案但我知道一定是对创业公司会友好了所以这是我们进入到下一个阶段去思考在这个过程中我们讲说有趣的内容其实我们发现了一点就是什么东西是有趣的当我们和朋友聊天的时候一种类型的有趣是你很会讲断的

讲梗可以去讲拋败或者类似类似的就我们其实研究了很多什么样的游戏什么样的语言是有趣的这其中一种类型的有趣那么这种类型的有趣其实是比较复杂的还有一种类型的有趣就是说你总能给输出新观点你总是很有意思我在跟你聊书的过程中觉得或者是你之前见过很有意思的事情或者你经历过很有意思的人见过很有意思的人那么在这个过程中你有输出

你的输出刚好是我感兴趣的那么这就会出现一种 discovery 这和推荐系统里面的那种有意思实际上是很类似的一个现象就是 serendipity 这样一个过程的意思所以我们就比较 focus 的是如何能够在这个过程中自然的 maximize 用户的 serendipity 是我们的一个主要的方向

那么我们沿着这个方向又进行了很多的探索包括是什么类型的信息的 sortivity 在什么场景下 optimize sortivity 其实某些程度上来讲我们所做的工作和做播客是一样的现在播客就是要把东西做得有意思有意思就是说我们能够提出一个很有意思的观点对于这个比如说嘉宾或做一些研究那么

这样在聊天的过程中能够方便嘉宾能够更好地聊说他的故事那么使这个听众感觉很有意思火星之路上我们做的其实也就是这样一件事情

所以可不可以这么理解就是哈奇这个产品在和用户互动的时候也会根据用户的 input 来尝试了解用户是个什么样的人然后呢根据用户的这个 profile 来去决定怎么样去给他输出信息然后给他输出什么样的信息用什么样的方式去输出信息等等之类的是有这一层考虑是吗是的是的所以你可以理解就是说哈奇他其实主要的目的

其实在这个里面你可以考虑是哈奇很主要的一个目的是一个是了解用户就和做访谈是一样的就是要了解用户那么可能知道他可能会喜欢什么样类型的信息那么这里的用户在访谈类型的可能是听众还有一个哈奇很重要的信息就是我们互联网里面所存在的很多很多的信息包括哈奇本身的背景设定里的一些信息那么依据互动的一个过程中

让它起来通过一个有趣的形式把这些信息释放出让用户获得这个哦 很有意思还可以这样这个地方还可以去我还可以干这样一件事情哦 这个菜我没有听过那这个过程中这个就会让用户感受到一种有意思的一个事情然后这个感觉不断地加强

其实就会实现一种这种用户不断把回来来听就是非常 engaging 的一个 experience 其实 engaging 是我们最主要 optimized 的一个 objective

明白那像您刚刚之前有在讲就是在 Google Brand 的时候油管它的这个它所衡量用户的这个偏好的这个指标非常的单一那我想知道说您在 Hatch 的时候您是要怎么去让去判断说这个用户是否觉得这个 Hatch 很有意思您是采用什么样的一种衡量方式是的这其实是一个非常有意思的一个问题就是在产品决策的过程中是应该是什么驱动的

其实有两个很大的一个哲学的方向我就拿中国最有名的两个产品来做这两个产品正好是代表了两个方向抖音的产品设计逻辑是完全数据驱动由数据点所驱动就是哪一个东西能够带来更多的用户时长那么我就去做这个产品另外一个国民级的产品其实微信

微信的产品其实是非常非常感兴趣的很多时候设计这个东西或加这个东西或不加这个东西是来自于产品经理对于人群的理解和共情这个东西并不是量化的这微信里面它不会说我要加这个功能你在微信用时常加我就多但这个决策过程就不是这样的在这两个哲学过程中其实就产生了中国的两个国民性的一个超级应用回到你刚刚说的这个问题

并不是说数据没有作用数据 YouTube 其实和抖音是一样的它是完全由数据驱动的一个产品开发逻辑我所意识到的一点就是在产品开发的过程尤其是下一代生成 AI 原生的产品开发最重要的一个是不是能够让用户和你产生共情和产品产生共情冷冰冰的数据是不能够表征共情的

很多时候我们会说微信的产品是有温度它的这个界面其实就是一个孤独的星球里仰望着这个星空我们能够感受到这种感情这是因为产品经理把这个感情注入到的产品里我们有感受到了但是我相信很少有人会说抖音的产品是有

对所以我们认为的是在做下一代的产品的过程中感情是一个不可或缺的东西尤其是我们所要做的就是一个 AI 陪伴本身就是要做共情在这样的产品开发的逻辑里面不能够为数据

不能够仅仅看这个东西用户的点击的用户看了没有而在于说用户真正的在什么样的情况下有多少的情感的出发点有没有那样一种怂然心动的感觉有没有那样一种潸然泪下的感觉那么最后我们再想办法去尽可能的衡量那么这些感觉涉及到我们怎么观测到

那么但是我觉得这两个部分是要相互分离的一个事情对

了解那我比较好奇的一点是既然咱们的产品主要是通过就是还是用户价值导向然后同时这个价值是有很多情感的因素在那你们在就是你们毕竟做的是一个商业化的产品嘛那如何去 justify 你们对用户的这个收费呢你们是用哪些 data points 或者说怎么考虑就是说这些产品在金钱上您收费多少是对

对用户来说是合理的对其实这个方向我也想过很多因为我最早的职业生涯就是做商业化所以做整个整个就是商业化引擎就是而且我们是从

刚刚提到就是说我们做到谷歌广告里面比较大的一块的商业化的一块所以商业化其实是我一直是对这个方向是有很强的一个直觉和想法的一个事就是我们刚刚一直聊到推荐系统的一些想法和一些壁端我们说要在这个系统上演进那么从 ChainGPT 诞生到现在其实有两年了大家一直是在讨论说我们要做 AI 原生应用 AI 超级应用

但是目前这个时间点里面还没有出现超紧运虽然有一些应用通过大量的投放形成了较为可观的月活和日活的数据但是如果你仔细的观察的话这个只是多华的表面那么在用户的存留其实并不是很好那么用户其实并没有很强的联系现在是大家是处于一个同质化竞争的一个阶段

但是这里面有个很重要的问题就在于就是说超级应用的一个产生也取决于另外一个就是形成商业的病回想就是互联网时代其实整个超级应用的这个探索需要五到六年的时间最终这个超级应用的探索定型定格其实是 AdWords 广告模式 AdSense 广告模式被推出之后我们发现了搜索是一个超级应用其实是来自于它的正反馈

能够不断地当这个搜索能够产生这个

大量的广告利润那么广告利润能够反补搜索搜索的质量就会不断的提升那么就会一技绝成的最先找到这样一个商业模式的公司就会不断的成功起来其实这就是 Google 成功的要诀那么你就会感觉到它是一个超级营运但是如果它没有商业闭关那么你在这个地方的投入就有限你就不可能跟着其他人拉开一个升位这就是这样一个很重要的一个特点

那么具体到商业闭环来说我们现在可能碰见的一个大量的问题就是大多数的公司都是在用互联网的一个前一代的模式那前一代的模式的打法里面很重要的两种模式一种是订阅型收费的模式当然一种是广告型收费模式那我可以再简单描述一下这两个模式特定的一个弊端订阅型模式的一个最大的一个问题就在于它把所有的用户都认为是同样的

但事实上来讲如果说互联网这个订阅性的模式比较常见的是 SaaS 类型收费的模式就鞋端收费的一个模式当然由于生成者 AI 的最盖制的应用是生产力领域的一个应用那么

很自然的大家带入这个订阅数据包括整个商搜的 Chad GPT 它就是一个订阅数据模式也形成了一个先例那么你要更多的营销你唯一的办法就是涨价就比方说我们现在这个 Chad GPT 原来是 20 美金现在要涨到 200 美金大家都在笑说为什么要涨到 200 美金这是贵族的 Chad GPT 那

即使像 OpenAI 这样的能推出 O1 这样类型的革命性的产品都无法 justify 冲 20 到 200 美金这样的一个涨价那其他的公司又弹劾起了涨价所以是普遍的付费意愿非常低的一个问题但是这个提防回过头来说它根本的总力是来自于它把所有的用户都看作是一样的都要涨到 20 到 200 有的人可能 200 是毛毛雨有钱的人

有的人 200 可能大概就是他一个月的工资你还要给他涨到 200 但是非常非常困难这里的问题就在于商业模式的个性化商业模式的落后在这个地方产生了一个很大的一个问题所以我本质是不赞同订阅型这个商业模式收费也就是说以后哈奇在进行商业化的时候并不会主要依赖并不是说我们完全不会做订阅型但是我们不会订阅做我们最主要的商业化逻辑

这是第一个事情然后第二个事情就是说其实在以前的广告的商业模式里面最重要的就是千人千面你如果买的你的品类多比如汽车类型的品类多那么你的广告单价就高如果你是低的那么你单价就低那其实就是和购买用户付费的购买力相关的

那么其实这个是更加符合逻辑的因为社会的财富它是指数分布的少数人用大多数人用少数人那么你在这个商业化的时候应该是去找到最关心你的而且最有钱的用提供最好的服务使得在这里面能够获取更多的价值那么广告其实是做到这样一个

但是广告目前在生成式 AI 里面没有一个 Test 的一个结合的方式主要的原因就在于一个是目前来说生成式 AI 所提供的价值和广告所提供的价值并没有一个很好的匹配的一个作用也就是说我们现在主要的生成式 AI 里面的一个跑出来的应用的话它主要是属于私密性聊天

的一个场景应用也就是你和你的 AI 对象或者说你和你的就是在一个非常私密的环境下那么你进行聊天在这个情况下如果你出现了广告基本上感觉就像是突然有一个销售进入你的卧室是那个感觉那么用户的转化力会非常低事实上会很快的推给用户

转移产品那么使得大多数的生存式 AI 的这个公司是不敢使用广告这样一个类型的商业化模式因为实际上那个原理就像一个销售突然跑到人家卧室里面人家一棍子打水所以你无法做商业化这个就叫过硬这叫硬过硬的特别厉害但我们所认为真正的是真正的这个商业化是要找到一个合适的成绩

一个更加清亮级的更加普世的一个场景这个场景必须得先找到后面才有可能去有一个商鞅的一个情形

所以您认为就是最终哈奇会走的商业化的方式其实是介于两者之间就是订阅和广告之间然后同时硬广和软广之间然后硬广和软广之间需要找到一个合适的场景不至于让用户觉得在这个地方出现一个广告或者说类似广告的内容会感觉非常的突兀促使他们去直接就是 switch 平台目前是这样还在探索的阶段是吗

对商业化具体的话肯定会是一个探索的方向然后但是我觉得是有一点就是是这样子就是如果是以广告的模式其实广告的话其实就是一个属于推荐性的一个模式那么其实就是付费推荐的一个模式那么在这个过程中你本身和你本身的推荐之间的一个关系是什么样子这个是要你的非常非常的清楚另外还有一个就是说当

当用户觉得 AI 是一个人那之后能产生很多新的变量并不一定仅仅从靠推荐的一个方式比如说你和朋友之间的互动那么你相互之间可能会有很多其他的一种交步的方式比如说你悟的正宗啊或者一些其他的一些方式来使得你有一个更好的体验但并不一定是通过广告的方式嗯

我觉得这是就是首先这是一个很好一个的一个问题

但是我觉得就是我在思考这个逻辑的话就是一个是要取决于什么用户和什么样一个场景当然就是说因为每个用户是不一样的所以这个场景会有所不同但是总的来说是人和 AI 之间具有更多的理解

回到我刚刚说的就是当你和你的朋友只能通过点头摇头这样一个方式的话那你们之间的交互实际上是非常非常的成熟化可能你并不是朋友这个时候你其实并不会什么可能是你可以点头摇头点个餐可以但你不会想象说我就点头摇头点餐突然就和一个餐厅的这个服务员就成为了朋友很难的但是到现在这样一个阶段的话

你有了更加丰富的跟他交互的方式你就会说老朋友那这个过程其实对于很多人的意思是不一样的对于有的人来说的话就是你懂我就是一个更加聪明的助手对于有些人来说就是对于很多人来说比如说你最信任的比如说你经常去一个餐馆

那么和餐馆的这个店员形成了朋友这个朋友关系是什么呢并不是说你就会突然晚上和他去做 KTV 不是这个意思而是说你一进餐你进餐馆他就会和你说又回来了对你就好像老熟人见面了一坐下还吃那个你的感觉就来了其实就是懂你的这样一种熟悉性的关系某些程度上来就是属于叫懂你的一个注释

这是一种类型的人跟爱的关系还有一种类型的人跟爱的关系是我现在很困惑我突然之间可能和老板有一些矛盾或者我和最好的其他的朋友有一个矛盾需要倾诉

那么我现在又需要我又很难找到一个真实的人类不让来倾诉那么我可能就这个时候就可以找 AI 这个朋友的定义它属于是我情感寄托的或情感倾诉的一个对象它又是不一样的最后取决于不同的场景下人们会对朋友的定义呈示不同的一个定义但是总的来说

人和 AI 之间的关系会人更依赖于信任或是把一些情感注入到这个里面这是一个总体的一个趋势明白 明白

好呀那我们聊到哈奇目前这个市场竞争这块吧因为刚刚也提到了其中一个就是哈奇潜在竞争对手可能是 Character.ai 虽然他们前一段时间被收购了那就是那王金您认为就是哈奇目前的主要竞争对手有哪些然后与现有产品相比您构想的哈奇未来的发展方向可能会

就是建立起什么样比较竞争优势呢和这些竞品相比是的从哈奇目前来说的话实际上我们是属于一个非常新的领域基本上在这个领域目前探索的都是属于创业公司所以当然有一些创业公司和我们一样在进行像这样的探索本质上来讲是把

从 AI 朋友或者 AI competitiveAI friend 这个领域和信息分发或 discovery 这个领域其实一定程度的结合在这样一个领域那么我们所比较关注的一个是主要的其实一类的竞争对手是属于已有的玩家

这就涉及到两个方向你刚刚提到就是 credit ally 就属于 AI 陪伴系的其实除了 credit ally 以外有很多 AI 陪伴系的一个领域的一个这个公司公司小公司都有很多在这里他们可能在以后会把这个做成更多的

信息获取信息分发这种类型的一个产品那么就会进入我们这样一个领域另外一个类型呢就是说目前的这个助手型的包括 Siri 啊 Systems 啊这些目前大家是主要是 focus 啊让他们好用这样一个成绩下但是也有一种可能他们会慢慢的把这个变得更加理人化情感化那么也会进入这样一个这是两类的那么基本上来说的话都是已有的互联网行业的呃

大厂是这样一种类型的一个竞争态势所以这样一个竞争态势我们当然是非常非常了解的所以我们所要建立的一个差异化也就是我们实际上最近我们一直在探索发现的其实这两个之间的脸的这一个整合实际上是非常非常困难的一件事情

因为这两边的逻辑之间有相互的一些冲突我举一个非常非常简单的例子就是我们在过程中迭代了一个过程视频我们曾经是要做视频还要做聊天把视频和聊天框放在一个界面上大家觉得这很简单视频下面留一个可以留言的不就可以了吗但实际的情况是你把它放在里面的时候这个产品你必须得有一个非常清晰的你让用户来代试

比如说在 YouTube 这种的产品里面这个留言框是可有可无的你有了视频还是可以完全完成整体的体验微信里面如果有人给你发了个微信的这个视频那个视频是可有可无的聊天是最主要的你只要能量如果讲话是文字量你主要的功能也是可以做的这两个是分离的当把这两个都要融合在一起的时候你就会发现你怎么去很好地把

形成一个统一的一个 portal action 就是用户在这里面体验让他非常清晰的知道下面一步该怎么做其实是非常困难的而解决这些的困难其实涉及到第一个是很强的用户的一个共情那这需要很长时间的在这里面的 iteration 还有一点就是目前模型的一个能力我觉得这个也是我们团队非常自信的一个很多时候现在做产品非常困难的一个是

其实回到刚刚这个两个国民系列用抖音或者是微信抖音的产品开发是由算法工程师是由 researcher 来 drive 那微信的这个产品开发是由产品经理来 drive 现在在做 JRI 的产品实际上某些手术上大家都意识到是要把它融合在一起那么最大的难点是做算法的这个团队无法对用户产生共情

这个其实是非常困难的一件事情产品经理虽然大家很多人提到是 AI 产品经理但大多数对于 AI 的理解还是停留在提示时工程我能把我的想法然后变成一句话然后和 AI 聊然后产生相应的效果但是提示时工程现在大家已经意识到就是说有非常多的局限性事实上整个提示时工程这个东西可能是对

社会大众产生了一个很大的误解就是说提示式工程是你可以跟他聊就像人一样聊产生的一个结果是一样的但其实并不是这样的提示式工程本身是你对大模型进行一些不要训练的那种微调那么使得大模型的输出形成专业化形成特定的输出这个本质是属于算法的延伸

属于算法以前调餐然后再加上额外的一些延伸只不过是有了一个 IHF 之后这种延伸的方式出现了一种自然语言的一种界面使得我们似乎好像他能听懂人话但是他所能听懂的人话和我们普通人跟人聊的人话是不一样的所以我看到非常多的 AI 产品你就说我要和 AI 聊天我平时跟人是这么聊的要有一个逻辑要三段论那么 AI 就会懂你的三段论

其实这个里面并不是这么工作的我觉得是很多的目前的 AI 产品走向死胡同的一个原理在这个过程中你要做一个真正的 AI 原生的产品的话其实你必须得有一个团队它对两个方面都具有很强的认知一个是对用户行为的一个深度的认知

产生这个共情第二就是对于大模型本身的特点要有超过其实工程的这个程度的认知大模型本身的一个秉性什么样的特点能够让大模型产生变化那么目前来说在这样一个阶段的话能够具有这种两方都具有的这个团队其实并不是太多了解您的团队

同事成员基本上都是从哪些渠道认识的呢都是您在谷歌的这个同事吗还是说有别的渠道我们就是创始了我的合伙人就是原来在谷歌的谷歌的同事然后在这个过程中我们其实有一些朋友加入来帮助我们来做其实都是对我们的愿景非常认同然后就是我们通过分享我们的愿景他们也相信这样一个愿景最后就走到一起来做对了解

那我们问一下您在谷歌的经历吧好的好的对 因为之前您有提到说您是在谷歌内部做很多广告推荐系统等等然后在此之前您其实不在 Google Brain 您在谷歌大的公司那您是如何就是

从内部谷歌转到 Google Brain 呢因为我们听说就是 Google Brain 它这个应该是只有 10%左右的这个内部的录取率是的 是的其实这我是也是经历了一个过程因为谷歌大佬当时在整个学术界是非常非常有名的我毕业的时候其实也想去谷歌大佬

但是我从毕业的角度登烂的时候还没有达到谷歌大脑的这个招拼的一个门当时他们对于这个学术论文的发表包括这个业界的影响力就要有一个很强的一个很高的一个 requirement 基本上你必须已经是行业顶尖了他们才会让你加入这样一个

所以我在谷歌最开始找的工作其实更加传统的一个开发的工作最开始的时候但是我个人是对 AI 非常感兴趣的所以我是希望能够在谷歌能够找到我适合的 AI 的职位然后再到谷歌大脑去经历这样一个过程我其实最早在谷歌做的甚至都不是算法方向的我是最开始做广告里面的就是第三方广告平台的集成

那么这就是一个偏软件的工程所以这对我后来也是一个非常幸运的人我就自认为我是一个非常非常跨界的一个人因为我是有一个研究的背景但是我因为因为我的这样一份经历我被迫首先成为了一名软件工程师

在这个过程中锤炼了我大量的包括高并发的软件如何进行 scaling 如何各种各样的软件工程的一些事情就是在很多的研究人员来说是非常欠缺这种技能但是因为我因为这个经历是具有的所以我就在这个里面做开发然后第一点就是我希望能够挪到更接近的位置

所以在广告部门其实是有很多做推荐推荐对广告是很重要的一个事情所以我后来的话就在里面去寻找相应的项目谷歌好在是对于员工选择项目是有非常大的一个灵活性并不会有人天天排号里的日程表里非要干这一个你设计上是自己寻找你自己想要做的事情

在那个时候呢我就寻找到就是不是我的直接的这个 manager 而是我其实是隔壁或者隔壁一些主管 manager 成为了我的 mentor 也是谷歌非常非常资深的有一些就是达到了高级总监的人成为了我的一个 mentor 在这个过程中我学习到了很多关于这个因为我表达了非常强烈的意愿我要去做一些跟 AI 相关的一些产品

那么我首先开始是在这个系统里开始做很多实现然后接着开始做算法调整的一个工作然后开始理解算法理解商业化和算法中的一个落地的一个问题如何进行做在这个过程中我非常感激就是我找到了很好的 mentor 他其实是允许我我很多的时候就是坐在后面我就反而说你做你的工作我也不打扰你我就坐在你的后面看着你

我有的时候一看好几天算法这个工作它就是有一点师徒制就是要师父带领主因为你没有办法描述清楚这个东西好或者那个东西好

它很多时候是一种感觉就有一点像是一种艺术性的一个东西那么我比较感激的就是因为我有这样一个经历那么我的 mentor 其实他在看他的这个算法模型的时候他很重要的一个技能就是很快在从一些数据里面去看到这个模型是有潜力的那个模型是没有潜力的那么这个模型后面会碰见什么样的问题

那么他会和我聊这个问题就是我在旁边听着他就会在这里聊当然我提供的其实是某些时候是一种情绪价值因为他自己一个人聊了就没有意思但是我可以给他一个正法活动对对对有道理是这样的拿个小部分的技巧然后他也非常非常的开心所以我其实某些时候上其实我们听众里面可能也很多就是留学的朋友

我觉得就是还有一个我的建议就是说如何找到一个很好的门每一个人与人之间的关系你都是要给他提供价值的当你还是比较军运的时候你肯定是无法提供经验的价值或者是其他的价值但至少有一点你可以提供一个情绪价值一个陪伴的价值

这个价值是人人都可以提供的是人人都需要的所以我其实扮演这么一个角色所以我在我的整个职业生涯的发展里面就有很多这样的 mental 给了我极大的帮助那么就是这样一个 mental 给了我的帮助之后了使得我一下子就理解了谷歌广告推荐的算法里面的很多的诀窍

后来呢我其实在谷歌的前面的一年半的时间里是相当的 struggle 就是一年半的时间里面我没有任何的我们谷歌内部成为发布我当时记得非常清楚我写了好几万行代码

然后没有任何的我们称为 impact 没有给公司挣到任何的钱最后触发了一个很大的一个系统的一个问题 alert 然后同时需要去 debuff 最后我自己亲热把我谷歌前一年半所有的弹幕全部删除所以在我谷歌我在谷歌待了五年广告待了三年三年的前一年半实际上是一个非常难熬的一个经历

我觉得我整个职业在谷歌就相当于是重新 reset 了啊那个时候我好在是找到了 mentor 这个时候 mentor 也给了我很好的一个啊情感的一个价值努力和支持往前走但是后来我慢慢的学会了这其中的一些呃门道了之后我在谷歌就啊我最后有二等达到 28 到 29 个 launch 啊基本上每周都会有一个这样一个一个速那么就啊

其实我后来发现就是要学会观察其实你还是能够找到即使是像这样子在谷歌里面调算这么复杂的事情的话也是能找到其中的文道这给我带来的一个新的机遇

那么我在广告里面就形成了比较有名气一点就是对算法比较理解这个时候我们就开始和谷歌大脑的人合作所以我实际上是通过合作的方式了解到谷歌大脑里面很多所处的项目

我也非常密切的关注整个 AI 前沿的发展因为在我做这个过程中整个 AI 一直是在不断的发展具体的来说的话我当时研究的领域就是强化学习我毕业那的时候强化学习还没有非常的火因为我和 Dmine 他们其实是同一时间进入 Google 他们那个时候还没有后来形成很大的名气

但是到了 1617 年这个阶段的时候 Steve Mudd 实际上当时在做 AlphaGoAlphaGo 当时形成一个轰动性的实践就是 AlphaGo 和李士实对战然后在这个领域里面胜出了人类之后他顿时发现强化学习成为新的一个办事就和现在的大模型几乎是差不多可能没有这么大的规模但是那个时候形成了这样一个态势

也就在因为我比较关注所有强化学习在 Google 里面发现的一个事情我就观察到 Google 这个时候需要把强化学习开始落地到他们的业务里因为 AlphaGo 出来之后大家就立刻想了说这么先进的技术能不能够给谷歌带来实际的影响和营收于是就开始当时谷歌大佬也出现了团队要 AlphaGo 到谷歌的当然谷歌最重要的业务线其实就是推荐系统

地心落地那我就了解到这样一个情况那么我和他在之前的他们在之前的这个经历里面其实已经认识了在这样一个过程中我再和他提出我要转岗到他们组那么由于我在谷歌内部的一些背景和经历另外在 LINE 的阶段这属于这个项目也是比较早期他们也没有事实上也比较难找到相应的同时具有两个背景的人所以我当时就转到了这阶段

就是我的经历当然是有我一个特定的一个特点但是我觉得从总的角度上来说的话我给大家的建议就是说首先要想清楚自己想干什么然后不管你现在处于一个什么样的位置就往那个地方去就每天保证你的信息源一直都是那样就是你感兴趣的方向然后寻找机会往那个地方挪动你总是能够找的吧

但是您刚刚也描述了您整个经历这个强化学习这整个一个发展过程之后的这整个这整个这一系列的事件您在这个过程当中您有没有一些得到一些有意思的观察可以分享对其实其实这个地方当然有很多很多的一个观察我其实提一个因为我们刚刚提到就是强化学习包括有几个大的这个 AI 的一个浪潮我就就着这一个方向说一个其中的一个观察

因为其实在过去的十几年间有几个比较大的一个节点一个是 2012 年的这个深度学习出来的时候一个是 2016 年 17 年阶段的是 AlphaGo 出来的时候一个就是 22 年出来的 ChatGPT 出来的时候那么其实这三个时间点锚定的最近十几年 AI 的一个发展每一次都是属于爆发时代在前面进行挣扎

但是总的趋势实际上就是人们发现了智能的原理这么一个趋势这个宏观的趋势实际上持续的时间会更我个人认为这个持续的时间可能达到数十年

可能这样一个阶段完全没有停止的一个特点所以我经常类比的就是我们现在大概就相当于第一次工业革命的蒸汽机刚发明出来的时候所以它是一个连续不断演化的过程事实上在前面也有更多的一个连续演化过程所以很多人认为说蔡英文突然出现了

它绝对不是突然出现它一直是有很多的征兆你只要留心观察这个趋势的话你能够预测到这个趋势后来不断发展的一个特点我可以说这个我用来观察这个趋势的一个简单的 framework 就是大家都说现在我们理解智能如果一句话来总结的话其实就是三要素起背我们称为炼丹之后

在大火小火慢炖时间长了之后智能就出现了智能涌现那么这个炼丹的元素是什么一个是算力一个算法一个数据这就是这个丹卢的三角我们过去的十几年里面实际上就是在这个三角的角里面这个角短了推那个角那个角短了推这个角就是不断的这样一个过程包括深度学习刚出来的时候它是什么情况是

最开始的时候互联网和互联网有一个一个推动的一个作用因为互联网会积累大量的数据具体来说在深度学习之前积累了大量的图像数据但是人们无法理解图像这个时候算法成为了砍脖子的事情接着算但算法为什么没有很好的算法能够理解图像呢其实是因为算力砍脖子

人们于是开始解决这样一个问题其实最早这个出发点是因为其他的领域比如说是挖矿比如说是玩游戏那么需要算力那么就出现了算力的赋予算力的赋予会触发算法的发生比如说像 Alice in 2012 年算法的发生会 unlock 原来已经存在的数据的价值就好像打一个比方是一个一个蓄水池里面一个大坝里面这个数据就像它蓄了水

大家不知道怎么把这个阀门打因为没有工具之所以没有工具是因为没有办法可能是没有其他的办法来找到这样一个工具或造出这样一个工具这里面的数据就是这个水打开阀门的工具就是这个算法造这个工具的就是这个算力

那么在 2012 年的时候实际上就是 GPU 的这个成功使得大家可以依据 GPU 上开发出理解图像的算法的这个图像的算法当这个都会出来也就是 Illustrant 它打开了图像数据的打开图而一泻千里就从 12 年到了 16 年但是你仔细观察这个改进的话你就会发现

我们经常有人在聊说指数分长 scaling law 似乎一个事情永远是一个 law 在变化其实并不是这样的就是当两边的水位差非常大的时候你就会发现这个水是一泻千里好像没有尽头阀门越开你的水就越大阀门越开你的水就越大诸如此类那么这个阀门开得越大其实就是我们说的参数量越大工具越好用但是这里面有很多限制的因素

当这个数据倾泻而光的时候两边水位相平的时候你阀门再开就不会再出现了这个事情在 AI 里面是反复出现的比如说图像的领域里面的信息到了 1617 年的时候水位就相平了这个时候大家就无法再去用来做无法再在图像里面挖出更有意思的一些东西

大家就开始需要有更新的工具强化学习就是在那个时候被推动所以深度学习第二个就是强化学习强化学习又开了一个新的门而这个门本质上来讲是打开了通过自博弈就是自己和自己对战或者是通过一种游戏化的一个构建使得数据挖掘更加深刻

使得数据的理解更加深刻的一个就比方说以前围棋里面就一个棋的规则里面似乎没什么数据但围棋的规则里面其实有很多数据非常深奥的这个里面但是你仅仅是用这个几层神经网落在一块你没有办法这个深奥的东西可以理解的但是你通过这个不断的长号学与自博弈你就可以把这个深奥的东西你理解 透测人们发现了这个道理之后就开始去做棋类的这个理解里面的这个数据

当然其内是其中一个游戏和其内就是类似的一个但是后来人们发现可以把它用来做语言因为语言也是很深奥的东西你把这个语言送到里面去理解它一下子理解不了那么我们如果能够构造很多的这种类似于就是像游戏里面自博弈这样的阶段的话那么我就能很深刻的理解语言里面的这个结构这就是所谓的这个自监督的一个学习你不需要数据的 label

当这个工具被打开了之后以前整个互联网所积累的人类文明所积累的所有的自然语言数据从不可用变成可用我们所观测到的现在整个大模型的所谓的 scaling law 就是这么一个现象我们所属于的一个新的一个咱们所开放的一个奔涌的时代那么当然这个开放大家有人在阿里说有点换版其实就是大家开始观测到这个水位开始不像以前那么大开始变得更细了

那么我们现在所说的大家强调推理时的像 O1 型的这种更多的在基于新的强化学习的这个模型其实就是大家在思考我要不要再找新的工具当然目前还没有找到但是这样一个技术迭代的浪潮会持续的不断往前走

所以您认为就是这三个点它在未来也会持续不断的复现是吗就是这三个点互相之间同体的模式是这个样子它其实就是一浪踩着一浪不到往前走的一个模式对了解那我想问一个问题就是说嗯

您现在是相当于观察到了就是 LLM 大元模型这一波浪潮然后您决定也从谷歌去转向就是自己用 LLM 做 Hachi 这么一个推荐系统那您从谷歌有学到什么相关的经验然后呢去帮助您去从就是大公司

跑到创业公司去进行自己的创业吗就是这中间有哪些就是您之前个人职业发展的经验是 transferable 到创业方面的能力的是的是我可以更加从更加广泛的一个视角来回答你刚才的问题就是说我是怎么从在一个大厂里工作变成一个创业者在过程中我发生了一个什么样的转变这个转变既可以是在 Google 发生的也可以在 Google 之外发生的

我可以简单介绍一下我离开 Google 的一个经历我并不是一下子就离开了 Google 因为我经常做事情的话我是比较有章法就是说我会去考虑以后会发生什么样的事情从 Google 离开的时候我就首先是想要知道就是如何进行创业那么在这个过程中我会发现尤其是作为一个移民在美国

要去创业实际上是一个相当相当困难的一件事情一个是本身创业就已经是非常非常的困难第二个是你要涉及到你自己的一些文化上的一些 limitation 或者说一些身份上的一些 limitation 另外你还要进行一些转化职业的转化从比如说技术性的方向变成一个实际上更好的获取社会资源的一个方向的转变

我在这个过程中其实是有很多的 mental 给我的帮助我刚刚提到有很多很多的 mental 所以在转化的这个过程中呢我养成了一个习惯就是我先去问已经做过的人已经能不能找到有人经历过这个路能够告诉是什么样子所以谷歌当时有一个就是叫 XGoogle 就是离开了谷歌的人所形成的一个组织所以我就当时在里面进行我就认识了很多很好的朋友

他就告诉了我以后创业之后会发生什么故事并且给我的一个建议就是说如果你现在还没有不太知道怎么创业完全没有头绪的时候你可以先去找一个你的风险承受能力可以接受最小的创业公司去到里面做他的 founding 那么你虽然并不是在价值位上但是你可以感受到这个创业的一个态势然后你决定

怎么样在我们下一个步骤所以我并没有一下子就从公司里到过这么大的公司一下跳转成零我实际上跳转到一个创业公司当时是很小我们是他们第一个做 AI 相关的一个人在公司然后后来我们公司我见证公司从 10 个人左右一直增长到 100 多人这样一个整个发展的一个过程那么在这个过程中我就了解创业是什么样子的

从一到一吧是怎么样子这样给我一个很重要的一个起其实就是说我不慌很多创业的人尤其第一次创业和第二次创业它最大的一个差别在于第一次创业不知道未来是什么前路漫漫非常多的 uncertainty

那么就会影响自己的决策但是第二次创业呢通常来讲会知道的多一点所以就更稳这就是包括如果把创业比方说航行的话就是老船长和第一次出海的人的一个差别但是并不代表说每个人都得第一有第一次这样的还有一个就是说你如果是要出海你并不一定第一次出海就得当船长你得当大副所以我其实就是当了大副

然后在后来的话我到这个公司做了一阵子我和创始人也有很好的沟通其实我加入的时候就是和他说我就是想创业我想到你们这里来学习但是在学习的过程中我可以帮你们把 AI 的系统搭建起来您觉得这个东西怎么样很多人在找工作的时候他们可能觉得说我在找工作其实并不一定

你也是在面试你的这个 content 的过程中一环比方说我就说的特别明确这个一方面来说是我可以保证以后的关系就是说运轮说我加入之后就准备要走还有一个就是说我更加清晰地描述我要什么那么他们就能够知道他们能不能给予我的一些事情我能找到更符合我的感觉

那么我工作了一段时间之后呢就当学到了很多东西之后呢我就开始去考虑自己的自己真正的创业再去 unlock 了这个零到一之间的这个过程每一步都非常困难实际上我从大公司到这个小公司中间有一整个转型的过程用了一段时间然后从这个小公司到我自己创业的过程中又经历了很长的一个转型的一个过程

每一步都有一个都有它独特的 challenge 所以整个在 go through 这个过程中我就会发现其实我们老认为创业公司是一样的其实创业公司在每个阶段都是不一样的

创业公司就有点像是蝉它要不断的自己的自我进化自我蜕变这样一个过程我们的职业发展就可以像我的职业发展其实就是逆流往这个前往上当然每一个人的职业发展都需要依据自己的一个实际情况我个人的建议就是依据自己的性格和风险承受能力如果你对这个东西有热情

就一直要逆流而上如果你现在是一个在一个一万人以上的公司工作了你如果成熟后现成熟你没有那么高你可以先加入一个一百人的公司还是不一样的你能学到更多如果你风险成熟慢慢变高了十个人呢如果变高了自己创业然后这样一个不断的一个过程其实这是我这个转型过程中一个最重要的一个体会

明白然后我其实想要 Q 到您之前在有应该是博客里面您大概是提到说现在美国很多创业者都在涌入这个 B2B 生产力的这个方向但是您自己却选择了一个做 consumer gen AI 的这么一个方向您可以分享一下说您这个选择这个创业方向的这个过程当中是怎么样什么样的一个考虑是的是的其实我这里面可能稍微要补充一下就是说发起是我第二次创业

我前面这创业呢其实就是 B2B Productivity 的方向所以我在第二次选择的时候我有意的选择了另外一个方向那么我第一次选择 B2B Productivity 的方向的时候实际上来讲是我可以简单介绍一下我上一家公司 Storytel 的一个经历就是我当时是在 21 年开始有这样一个想法

然后开始做这个 storytel 就是希望其实产品的形态就和现在大家这个常见的比如说 Kimi 助手啊豆包助手其实是差不多的一个类型的形态然后我们在 22 年的这个 8 月左右就是发布了我们家一个产品当时 CHIACGPP 还没有出现我们所观察到的其实是依据我当时对于这个行业的一个判断也就是我刚刚提到的一点大模型本身的秉性是什么样子

它是一个学者性的秉性学者性的秉性天然的它就是属于生产力领域它是能够很好的总结能力问答能力这就是学者本身的一个特点所以我当时就是依据这样一个 insight

我关注到这市面上并没有很强的能够用大模型来做助手总结这样类型的一些问答这样一些类型的一个应用而这个领域以后我个人接线会爆发所以在当时就一直做这样一个发想

但是回过头来我想说的一点就是每一个时候的机遇它跟自己的这个时候是非常有关系的如果在 1212122 年的时候做 B2B 的生产利率可能是一个很好但是我在当时做那样一个公司的时候有这样一整个经历就是我们在 22 年的八九月间发布了之后市场的反馈是非常非常好因为什么呢因为我们是非常独特的

在市场上没有任何一家其他的产品能够提供类似于我们的服务并不是说我们当时就没有 Helux 类型并不是说我们当时就没有 Bubble 没有粉朵但是因为他们无法再找到任何的替代所以所有的用户都必须得用我们愿意支持我们

但是当 Chad PD 出来之后我们有一个客户其实都跟我们说的很明确的就是后来和我们说你们刚出来的时候我以为你们是黑魔 Black Magic 只有你们能做当时确实真的是黑魔但是后来 Chad PD 出来之后我觉得好像其他人也可以做这句话我一直记得我一直记得做 startup 最重要的

大家经常聊说我们要做护城河护城河是很重要很重要的一件事情但是当你在刚刚开始做一个 startup 的时候你那么的弱小你根本就没有造护城河的砖你唯一的护城河就是你的独特性你就是你敢为天下先的这样一种勇气和魄力无人敢追过来其实就是这样一个特点而且

在这个过程中我学到了很多的东西就是一个是你要敢为天下先往前走你才会真正获得就你不是通过护城河你是通过室内叉来获得你生存的空间然后中间后面当然是你要去稳固自己的护城河但这肯定是后面的事情回过头来说我们为什么要进入 AI 陪伴的理由

就我个人的判断从 chativity 之后才出现的在 B2B 和 productivity 这个领域已经形成了行业的共识就是大模型的第一个领域应用领域就是 B2B 和 productivity 那么你在这个领域创业当大多数人都认为这个的时候你是无法拉开自己的身位所以我们进入的一个是不同的一个行业我们所观察到的一个动点就是现在 AI 和做这个

能够很好的理解信息能够做事能够变得有用大家都在做我们的产品不仅要有用还要有趣这个有趣这个行业没有太多人做大家都在说的是说这个行业非常非常困难做没有商业化

或者说是克莱德莱为什么行业第一的这个体量的也最后最终是收购了下场很多人可能会有一些动摇但是我个人的观点尤其是我个人的经历塑造所的观点当所有的人都认同这个事情不是好的时候这才是你真正的唯一活路当大家你谈十个朋友都说这个主意非常好的时候你可能是在浪费时间因为

这就意味着你不会有什么差异化你十个朋友都觉得你好那最后可能就会有这个公司里面就有数百上千上万家公司在里面去做你如何保证你是那一个最终受处的而且事实的情况是这个样子是最后可能没有受处的这就是 B2TL 从 01 里面说的就是 Competition for losers 因为不是 Competition for losersCompetition make everyone losers

当你是处在一个竞争激烈的行业里面那么你实际上在这个 negotiation 这个用户的市场你就会迅速的降低用户的付费意愿你的整个市场空间会非常迅速的下降最后即使胜出的人他其实也会远远比以前这潜在规模要小我们中国人都非常非常熟悉的包括这个单车大战最后大家在烧钱

并不是剩下来人就怎么样了是整个单车市场被烧掉了某些程度上整个 B2B 的 Private Activity 也是类似的一个场景我可以大概分享一下我们当时包括在这个还具有很强独特性的时候用户的这个付费意愿大概是什么样子就是在传统的 SaaS 里面的这个用户收费定价是按照 RI 来算的

就是他买你的这个 SaaS 产品如果他能够创造的价值是三倍于你的收费的话那么他就会长期使用但是这种 LM 的应用其实我们大概测算了一下其实以我们当时的技术能力也能够节省大约 40%的一个时间

因为有大量的会议啊总结啊写纪要啊文案啊这些工作都是杂事可以节省人 40%的时间但美国的一个平均工人一般一个月是 2 万美金 40%就至少是 1 万美金三倍的 RR 是 3000 美金所以我们当时的一个单个 Feed 的可以 discuss 到 2000 到 3000 美金的这个这个付费意愿现在 CHAT GPT 带着 O1 的这个模型

收了 200 美金大家在说这是贵族的服务整个行业的富豪意愿就如此的坍缩以至于行业领先的这个 Chad GPT 也以每年 50 亿美金的亏损在进行亏损那么在这个行业里面其实我觉得很重要的一点就是说对于创业公司来讲的话就是一定要控制自己的 Burrits

就是 B2B 和 Producting 并不是没有办法做但是要考虑到的是在这样一个行业里面首先你肯定是要做一个细分的一个行业第二个就是整个行业的竞争产生的标杆使得混合的付费意愿在所有的 B2B 行业里面和 Producting 都在下降

你必须得能够更加有效的使用资源你才有可能往前走降低 burn rate 而不是快速的扩大是目前 B2B 行业的一个我觉得要发展的一个方向但是回过头来说我

我经常在职业发展的过程中我会 take a step back 我愿不愿意继续往前走我愿不愿意继续做这个看起来越来越小的一个市场里面的一个细分的一个方向的一个创业者我最后的结论是我需要做一些我更有热情的事情所以我进入了一个我现在说什么环境好的好的感谢分享这一块确实挺有深度的

那我们就是每期播客结尾都会有一个保留栏目就是建议加信息源的推荐然后第一个问题是您对三个时期的自己就是第一个时期是大学刚毕业第二个时期是博士刚毕业第三个时期是刚开始创业这三个时期的自己您分别有什么建议吗

如果是我大学刚毕业的话因为我实际上是整个前面的学术阶段的话一直是非常非常的赶的一个阶段就是我希望能非常非常快速的完成这个学业所以我实际上是大概 24 岁的时候是博士毕业这样一个阶段所以我大学刚毕业了的时候我其实对我最大的建议是休息一会儿探索一下世界

因为我整个大学四年是日夜无休非常就是我举一个非常简单的例子我们大学城当年我都没有出过几趟大学四年的时候这是我当时的一个生活状况然后完了之后我就没有任何的一个休息又进行了博士的学习如果我现在给当时的一个建议的话我会建议我自己有一个 gap year

其实美国的很多年轻人都会有个 gap year 在上大学我觉得对于中国人来说学本科毕业在申请的这个阶段里面你今年申请明年申请其实没有那么大差别的在中间如果能够 take a gap year 其实你有更多的人生经历这些人生经历在写个人陈述的过程中其实会更有帮助而且最重要的是我后来的人生里面学到了一点就是人不是一直要感觉到什么事

人最重要的其实是路上的风景是你 enjoy 这个过程而不是我每天要赶着赶在那赶天天往前赶往前赶赶在那里也没有什么并不是那里有什么就是所以我对我大学当毕业的这个建议应该是说能不能 take a gap year 去环游世界

我现在开始也其实有发展很多个还不断的 explore 但是呢我希望这个年轻的话就是有更多的可信大了之后你会有一些家庭啊或者一些其他的一个因素在里如果是博士刚毕业的时候我觉得我会给我自己的一个建议是不要给自己啊

设限因为我国师刚毕业的时候我当时也希望能够找到一个最好的工作或者最好的教职或者其他的也还是原来我这样一个 pass 在做

我回过头来的话我个人会给刚才的一个建议就是因为我直接毕业了就进入了 Google 工作所以我在 Google 工作了五年的期间其实在那样一个阶段对创业还是完全没有任何的感悟这样一个阶段所以我其实还会建议在那个时候即使是比如身份的限制或什么限制没有让我办法自己去创业的话也至少去加入一些快速发展的创业公司

去了解一下其中发现的一些事情如果

在那个阶段给我更多的选项比如说那个时候可以从那个创业公司再决定是不是要去 Google 工作或者再是更小的工作就是从更加中间的这个这个 pass 进行 navigate 而我相对是基本上从一个最大型的公司在这个不断的过程在 search 这个过程然后刚开始创业的我的话我觉得给我最大的一个建议就是意识到创业这个过程是一个长期的一个人生过程

而不是一个短期的创业一定要成功的一个过程在这样一个过程中一定要关注到自己因为我在整个前面的人生经历里面总是关注外部的幸福从来没有去关注过自己自己的 mental health 自己的 health 或自己的 family 但是我现在所以尤其是你到了创业你可能会想说 You can do anything 你就会 push yourself all the way to the limit 但是我现在发现这个并不是这个样子

因为你做创业你如果 push yourself 的话第一个是你会你并不会 enjoy the process 还有一个就是你实际上会形成一种就是 turnover 就是你只看着你原来看的那个东西你不会开始看别的你并不一定会并不一定会找到一个最优的路径创业最重要的我现在了解到的是寻找而不是 build

而我当时创业刚开始创业的想法是说我有这样一个事情我就开始做做做往前做我只要做的这个技术够复杂够深入够这样子那我这个产品就可以了那我就要加班加点 996 一定要去工作而且有的时候会自我感动这个样子但是我现在发现了创业真正的是一个寻找市场机遇的一个机会并且

寻找可能是比 build 还要更重要的一个过程通常来讲一个好的节奏这就是节奏感可能就是节奏感在这个过程中很重要寻找 build 寻找 build 在这个中间如何进行 balance 那在这个过程中你需要有很强你不能够 mindset 完全是说我要 work hard

work the desk 的 mindset 你必须得是能够 take a step back 能够 reflect 这样一种成绩下所以这是我对创业刚开始创业的自己的一个建议

那您刚刚讲到就是创业之后开始关注节奏感然后开始关注自己的内心 mental health 等等这个是您开始写博客的契机吗因为就是本次访谈其实我们对于您的大部分的问题设计以及对您本人的了解除了您的领英还有很大一部分就是来自于您的博客然后我个人其实是挺好奇的这个问题就是说您作为一名工程师或者说技术人员其实我们不常见到

就是有每天一个自己个人博客并且博客上面分享的并不是一些技术就是很多不是技术性的内容而是您对于生活的一些感悟然后您对于市场的一些认知然后您前一段时间也回了趟国嘛然后就是有聊过国内和美国的创业环境的一些区别等等等等就是那问题是我们比较好奇您是什么时候开始写博客的然后是如何想到写博客的然后从博客中最大的收获是什么

是的 是的 我其实写博客的话是从大学本科的时候开始来写博客的其实我之前一直都会写一些文字但是博客这个是我大学了解到所以我开始会写博客这样一个阶段然后在这个过程中其实我一直大在都保持在每个月都会写一篇博客我至少三个星期到一个月

中间有一段时间稍微断了一些就是我在谷歌工作的时候有断了一段时间但是后来又把它捡起来重新来写所以写博客的时间实际上是就是是一个比较长的一个时间周期可能有十七八年这样一个时间周期就是谈到博客对我的作用其实我发现其实在博客对我有一个很大的一个作用就是它其实是一种 forcing function 让我自己提想来想一想

因为如果你无法把你所想的东西准确地用语言来描述出来那可能你想的还不够深我在这个我不断学习就是求索各种知识因为我从小是一个非常好奇心很强的一个人我是不断地求索各种知识包括学术的知识创业的知识我都是有这样一个特点我会发现这个知识的获取的过程中其实是有几个很重要的部分

就是 unknown unknown 你根本就不知道你不知道这是第一个阶段其实我们绝大多数的人都是很多都是 unknown unknown 而且还有一个特点就是 unknown unknown 你是知道的越多你发现知道的自己知道的不知道的越多其实是还有到支持另外一个阶段就是 unknown unknown 你知道自己不知道但是你又说不清楚自己那个知不知道是什么但你有一种朦朦胧胧的感觉

然后到最后就是 no no 你知道自己知道在这个过程有一个演化的过程但这个东西到最后的一步是你不仅自己知道你还能够给别人传播这个就不仅是知道我会我还能够把它系统性的把它总结成知识还能够让更多的人使用

那博客其实是我说这样一个文字是我做这样东西的一个工具所以我就保持了这样一个习惯这是其中一点这第二点的是我在职业生涯的不断的经历是我是一个非常非常内向的人我最开始写文字都是自己看从不给人分享慢慢的我写了博客也没有人看但是后来我慢慢的发现如何你才能找到志同道合的朋友这个寻找的效率非常的关键

最有效率的方式是让自己走到台前让别人来找你这个是最重要的一个方式因为你不知道他们在哪里但是你可以让自己说我要干这个其实某些程度上来讲创业也是这个样子我个人认为就是每一个创业者都具有要当灯的勇气也就是你有的时候你不知道怎么才能做到

但是你对这个东西有热情不要紧你先和别人说你要把这个事情做到我不知道该怎么做到我觉得这个东西很重要我要去把它做成那么周围的人看见了你发表的这样一个一个一个一个字就是这个宣言并且真正看到你为之要付出了一个成本就是我我可能对比如说很多时候创业的时候我放弃了大厂的工作我的职业生涯不要了我就是要让这个事情做成

那么很多人就开始来寻找你这个时候就能找到很多志同道合的朋友这个是我写博客的也就是总的来说是写博客或者说是自己更多的成为一个内容输出者的一个动力对

明白是关于博客这块我有一个快速的小补充就是我感觉博客它也是你在向别人介绍自己一个非常好的名片然后它是以一种编辑复制成本为零并且信息密度很高的一种形式让别人来了解你就是单纯的比起说通过对话别人来了解你的内心你可以直接把自己的就是博客网站的链接甩过去然后直接让他来通过这个来了解到你

当然就是也有很多人他是通过这个渠道首先知道你然后再去向你联系但是我刚刚描述这种场景更多是就是你先遇到这个人然后呢你把博客当做一个个人的就是名片然后发送给他这个这个对我也是有经常这样一个情况因为在很多过程中就是我跟朋友一个人聊了之后我可能

我很想认识更多的朋友但是你反复的去描述自己的故事的话是一个非常辛苦的一个事情或者说我的愿景是什么或者我想要这个世界发生什么样我个人是什么样你愿不愿意和我做朋友那我可能需要有很长的时间来描述这些事那我如果能够有一个博客的话那么大家很快就能够了解这个事情

另外我还发现有一点就是博客或者任何内容的制作的话包括像博客的话也是一样刚开始的话就是可能刚开始看不出一点刚开始一期两期三期或者一个博客两个博客看不出来但是当这个东西长的时候它就会形成一种非常微妙的事情

我非常赞同就是罗振宇他也是一个内容输出者他做了时间的朋友他比如说《四个文明》这一个系列他就说我要做一千

1000 集那么刚才第一期第二期你会觉得没有什么意思我第三期第四期没有一种意思但是当时间的维度达到一定的程度的时候你就会发现有一种很有意思的一个催化的作用因为我有的时候看我这个大学时期的一个文字的一个作用或者到后来的文字的作用其实别人我的朋友看他会发现一个很微妙的一个是他能了解到我为什么变成我是一种非常深入的了解

另外一个就是很多人他在这个经历看我这个博客的过程中这个整个经历所形成的他其实是有一个信号我是一个一以贯之永远是如此的一个人就会我有很多朋友告诉我就是说这个觉得我是一个很值得信任的人因为从那么多年以前我就是如此我现在我还是如此我也无法作假

因为那个博客就是从那个时候就发所以把自己放在那个地方其实是一个非常非常容易获得别人信任的一种方式其实正是一种除了博客本身博客的这个时间跨度所产生的这样一种化学的反应其实也会给很多人产生一个就是让更多人了解明白

明白那我们到我们最后一个最后一个问题就是说这个您可以推荐一两个对您这个说营销很大或者收获和风的一个信息源吗可以是书籍文章或者其他的博客对我比较推荐就是有一个博客叫 acquiredfm

这个博客其实是非常非常好的一个博客我在里面其实就获得了很多很多的这个信息另外我还比较推荐的是比较宽泛一点就是说如何获取一个很好的一个信息源的一个方式在这个 Aquad 里面其实就有很多

就是找一个自己为之感动的为之 inspire 的一个人去更深入的研究比如在我的这个里面就有很多的 role model 我就仔细研究过很多很多的人比如说 Morris Chang 张忠谋张忠谋他自己就写过他的传记我也非常非常的推荐其实很多时候就是你想要成为什么样的人

你去找一个你肯定这个世界上有接近的类似的人你就去看他写过什么传记没有或者别人写过他的传记没有他自己发过什么夸奉没有然后就去有意识的去主动搜索一个信息源这样的话你虽然无法去准确的就是知道你很懒每天去 plan 说每天干什么但是我发现有一点就是说

就像大海的航行的时候一样你无法建议你该左转右转因为每个人情况都不太一样但是有一点我觉得大多数水手都是能够意识到的就是你想去哪里就让眼睛先去哪里然后你就会下意识的左右但是不管怎么样你最后就会到哪里所以你如果想要右拐比如说你想去那个灯塔那个地方你不需要就是说具体的步骤可能每个人都不一样但是有一点你眼睛盯着了

过一阵子之后你就会到了那个地方所以就比较我比较推荐就是说去寻找一个自己非常觉得听到故事之后比较 inspire 的人比如像我就是张忠谋这个故事然后去寻找他所有的一个信息然后就往前走就可以快乐他之所以我推荐他其实就是里面有很多很多非常深度的对于公司或者对于创始人的一个研究对

好的好的这个之后我们两位主播也会去听一听学习一下他们是如何访谈这个公司创始人的好那非常非常感谢这个王金参与我们今天的访谈对今天有非常非常多的好的内容然后非常感谢感谢感谢感谢其实