我认为可能将来是不存在模型级产品可能也不存在所谓的模型公司因为模型本身它是没法直接产生价值的
其实我特别喜欢的是看这个理想汽车的 case 就是在当时去选择这个新能源车的技术路线的时候理想算是相对来讲比较小众的选择了增程式混动的路线那理想它通过增程式混动的这个技术路线去部分的解决了大家的续航旅程的焦虑然后它的产品化速度就能更快
就前段时间跟陆续博士交流他也认为说现在模型的所谓的鲁邦性或者说稳定性不足是阻碍现在大模型产品落地的最重要的原因之一哈喽大家好欢迎收听张小俊商业访谈录我是小俊这是一档提供一手高密度信息的商业访谈节目
做这期节目是因为我特别想看看那些融了很多钱的 AI 创业者他们到底在干嘛他们似乎已经很久不出来发声了把整个舆论场都留给了那么几家零星的基础大模型公司和巨头们本期嘉宾是深研科技创始人齐凡超
他公司的融资规模没有大模型公司那么大但是相比一般的创业者来说也已经属于账上非常有钱的了在去年的融资中他们的估值是 12 亿元人民币拿了这么多钱找方向做了一年他们现在怎么样了呢这是启凡超第一次接受访谈今天我们的嘉宾是启凡超是一名 AI 的应用创业者我这么说对吧
其实是对也不对吧本身我们团队很早的话也是在做基础大模型相关的一些研究但后面的话我们做了一些转型现在我们在做的事情是围绕一个产品的应用方向一方面去思考说产品怎么建立另外一方面的话我们也认为光靠现有的技术是不够的所以同样我们花了很多的时间精力和成本在围绕这个产品所需要的能力去做一些底层的基础研发和技术方面的一些打造
那樊超先给听众朋友们打个招呼哈喽哈喽大家好开始我们先问几个快问快答好的第一个是公司的名字深岩科技公司创立时间 2022 年 3 月 17 日融资轮次 A 加轮目前的估值 12 亿现在是盈利还是亏损我们现在还是亏损状态
你的年龄我是 94 年上个月刚满 30 岁你的 MVTIINTJ 那先讲讲你是怎么开始创业的我其实算是毕业之后就直接创业吧我 13 到 17 年在清华电子系读本科然后 17 年到 20 年转到计算机系去读博其实本科的时候就很早接触过创业当时正好有大众创业万众创新的浪潮所以
本科期间也去向投资公司还有硅谷的创业公司有过实习另外的话就是很早就接触了 AI 我本科的时候是做这个计算机视觉 CV 方面的一些研究后面的话转向了 LP 因为感觉 LP 在 1617 年那会儿的时候其实发现它的成熟度还比较低能做的事情比较多在我读博的时候就是跟随琼哈 LP 实验室的孙茂松教授期间正好有幸赶上了大默显的这个浪潮
从 18 年 Bird 的出现然后到我们去 follow 后面 20 年的时候 GP3 的出现我们又在当时比较早在智源的支持下去算是做了中国最早的大模型的一些探索就做智源误导系列的模型的一些研发到了 21 年的时候其实是感觉到说在海外基于 GP3 已经有很多用户体验非常好的一些产品出现像当时我们看到的 CopyEye Jasper 之类的产品
那会我自己判断说这是比较大的一个技术的变革我们自己从一线的研究人员的角度来讲在很多的在人员处理的任务上当时的 GPT 模型有了一个非常大的效果的提升另外一方面的话就是当时我所在的环境不管是志愿研究院也好还是我们实验室的
老师也好都非常鼓励我自己去做一些创业的事情都希望能够把我们实验室的技术去做落地然后真的转化成产品来去给更广大的这个社会和人群提供加持最后一点的话就是我自己其实一直都对做产品特别感兴趣我记得 13 年的时候那会刚上大一我
拿着一款父母给买的一个 iPhone4s 的手机然后就去探索了各种各样的 APP 就是我那会闲暇时间的一个乐趣就是探索新的 APP 下载下来然后去看一下说它有什么好玩的地方以及它能够解决什么样的问题差不多应该我记得本科三四年的时间应该下载过至少 3000 多个 APP 来去做探索后面到了博士的时候我
在 19 到 20 年的时候做了一个小 demo 叫 OneTours 反向词典然后这个产品其实到现在完全野生自然流量增长已经有将近 1000 万的用户了在当时的时候也是这个事情收到了很多用户的真反馈这个词典是做什么的反向词典
对所谓反向词典它英文名叫 reverse dictionary 它做的功能就是所谓正向的词典或者正常的词典是你去查一个词然后它告诉你这个词语的定义用法等等一些基本信息反向词典顾名思义就是反过来当你想要找到一个你想表达某种意思的词的时候它可以帮你找到
比如说你可以输入今天天气很好他可以搜到像风和日丽天朗气清等等这样的词语当然我们这个产品他还支持跨语言的你可以输入中文去找英文或者输入英文去找中文不同语言都可以其实最早做这个事是我在看到一篇 16 年 Hinton 的一篇论文他当时提出来说反向词典某种意义上是一个好的语意表示系统很重要的一个验证场景
他认为说一个好的语义表示系统应该满足的一个条件是这个词语的向量表示应该和这个词语定义的向量表示是在语义空间中非常接近的对所以基于这一点的话他可以用反向词典这个场景去验证一个语义表示系统是不是好的语义表示系统
我看到这篇工作之后就觉得特别有意思然后我当时在读博的时候做的方向也是去尝试将语言的知识和神经网络去融合起来去解决各种自然语言处理的问题所以尝试在这个场景和这个任务中去试验了一下然后发现有一个不错的效果发了一篇鼎会的论文之后我觉得这个事情应该做成一个应用或者做成一个系统让大家来去用
当时我去查了一下发现国外有一两个做类似的这样一个产品但国内是没有这样的中文的产品的所以我就也就花了一个月左右的时间做了一个 demo 一开始我自己用后面推广到实验室同学然后又推广到隔壁实验室的同学有一天突然有人发了一条微博上了热搜立马就一大堆的用户都用过来了
这个产品为什么没有支持你出来直接创业其实某种意义上它是让我下定决心创业的很重要的一个因素这个产品或者说这个 demo 最早我应该是在 1920 年的时候就做了但是做完之后那会我还在读博三还有两年左右的时间毕业另外的话就是那会大元模型的浪潮也逐渐开始我算是刚刚开始去看到大模型这个技术浪潮还有很多能做的事情我觉得我
也不至于说提前开始退学然后去做这个事情反而说是在大模型这块上让我看到了更多的可能性和更多可以做的事情但是后面真的下定决心创业的时候应该是我 21 年的五个月份记得还比较清楚在那会距离博士毕业还有一年多的时间各个因素在当时的那个节点让我觉得已经不需要再去做过多的思考和过多的决策包括大模型技术的浪潮实验室的老师的鼓励和支持其实那个产品是在 21 年的时候才开始一下子爆的
然后在当时是每天过在能收到很多这个产品的用户的正反馈的这样一个阶段每天都是特别开心的看到用户在正反馈然后我们有一个这个产品的 QQ 群直接跟大家去做交流这个群其实现在应该有 2 万多人就是有两个群然后包括微信我们也有十几二十个群
所以在当时我真的第一次发现说做产品尤其是做 2C 的产品对我的正反馈是前所未有的大某种意义上比我多发一篇好的顶规论文带来的正反馈还要强所以在那会儿我其实没有做过多的思考我也要是没有去求招没有去找工作就直接决定去选择创业了
我还有个好奇啊中间就是 14 年 15 年当时不是万众创业的那个热情非常的澎湃吗那个时候你为什么没有创业对那个时候我其实也很认真的去思考对那会我在本科我是 13 年 9 月份入学嘛到电子系然后在那会的时候已经开始就尤其在清华的话创业的氛围还是相当浓厚的
在当时就是有很多的一些社团包括很多的创业比赛我自己也加入了清华的这样起创的创业人才培养计划开始去上金管的双学位创新创业方向我应该还是第一届创新创业方向的这个学员去上了很多的专业的一些课当时有很多的想法和 idea 那会儿有什么电子签啊包括现在我们某种意义上在做的这个事情新一代的这个信息的获取或者说新闻阅读的这样一个产品
在当时有非常多的想法但是那会儿我记得和一些在创业的前辈包括有些在做投资的人交流的时候大家普遍感觉说在那会儿的创业更多还是依赖于商业模式其实它还是以移动互联网为代表的这样一代创业那会儿我自己觉得说一方面我的社会经验和准备还是比较有限然后第二个我觉得某种意义上商业模式的创业并不一定最适合尤其像学生这样的这种创业
更多还是说借助清华的平台和那段时间去做了很多学习和了解包括去投资公司和去创业公司也去有学习后面其实是到了 16 年的时候有了 AlphaGo 那会儿有了一波 AI 的浪潮的时候我确确实实是感觉到有过出来创业的冲动的因为我自己那会儿就在做计算机视觉在投资公司也聊了很多上一代的 CV 的一些公司在哪个投资公司当时在腾讯投资
就后面也成为我们的股东某种意义上还是有缘分的聊了很多的那一代的 AI 公司发现大家的技术是比较同质化的其实都是在先基础上去做一些修改然后呢用场景呢也相对来讲会比较单一更多还是在以安防为代表的一系列的这样的一些场景中在那会儿我感觉说新的一些大的一些机会也比较少了当时就决定促使我做了一个选择一方面我还是要再去
把技术去研究的更深另外一方面的话我的研究方向也从计算机视觉转向了自然源处理我当时觉得说自然源处理能做的事情会更多以及在技术上能做出来的突破也会更多它放化性更强是吗对某种意义上其实它能解决的事情会更多它能代表着更高的人类的智慧就像大家一直说自然源处理是人工智能环卷上的明珠你觉得发论文和做产品的区别是什么
在过往的话差别是非常大的当然现在他们俩的差别在逐渐的缩小但仍然很大某种意义上大家会说是读博士是在这个人知识的边界中某一个点去做出一点点突破其实发露的某种意义上也是你可以不设特别强的目标和边界然后只需要说你找到一个有意思的点或者说找到一个别人没做过不知道或者说会对别人有启发的一个点就可以从这一点上来讲它是有点
或者说它没有那么强的限制你可能这个东西短时间内根本没有太大的实际的应用场景但是它仍然对于学术界有价值而且有可能在未来的几十年之后会真正对未来的一些研究产生一些启发这是价值很大的但是短期内你不需要对它有很高的期望说一定能转换成实际的生产生活中的价值但是做产品的话未必一样一方面做产品有的时候你不需要基础的突破
你可以直接拿现成的技术去做一个组合就能解决某种实际的问题它归根到底在于说你是要去满足某些用户的某种需求这是做产品的一些价值当然在现阶段来讲比如说尤其在大模型的产品而言就我要做某个产品去满足某些用户的某种需求的时候现在可以用现成的想做大模型的一些技术但是有的时候也不够
为了满足好这个需求它可能还需要更多的一些能力和技术而这些能力和技术有可能现在有其他的一些这个研究机构或者说公司已经有现成的你可以直接拿来用但还有一种情况是没有现成的这样的技术那你就需要自己去围绕这个目标来去做了
而他和刚刚提到的说做研究同样都是想要去在某个技术上去做出突破但不太一样的点是他的目标性会更强他给你留的时间和资源是相对更有限的而且他比如说从工程的可行性从成本各方面的角度带来的约束条件是更多的
你们的创始团队来自清华自然语言处理实验室孙茂 松 刘志远他们的那一脉能不能介绍一下清华的各个的脉络院系 流派然后分别出现了这一波什么样的创始因为这一波非常多创始都来自于清华
我所在的是清华大学计算机系下的全名应该叫自然语言处理与社会人文计算实验室我们实验室算是国内最早去做自然语言处理研究的绝术机构之一了在上世纪 70 年代就开始做然后创始人是黄昌宁老师他也是算是国内的 LOP 的或者自然语言处理的一个开山鼻祖了我的导师孙老师就是从黄昌宁老师
也是从上世纪八九十年代就开始做尤其像孙老师他应该是中国大陆最早发表这个 LOP 领域顶会 ACL 和顶刊 CL 的作者之一后面的话还有这个刘洋老师和刘志源老师也都是我们实验室的老师那我们所在的是这个计算机系下面的人质所叫做就人工智能或者说背靠的是智能技术仪系统国家重点实验室不落我们这个计算机系还有其他的一些研究所像软件所啊媒体所啊
等等每个所下面又会有一些不同的实验室很多实验室也会有相应的老师去做人工智能或者说相关领域的各个方向的一些探索那唐杰老师跟你们这个实验室是什么关系我们实验室和唐杰老师的所在实验室有非常密切的合作唐老师所在的是计算机系下的软件所下面的知识工程实验室 KG 因为我们自己之前也研究过很多一些知识图谱相关的一些方向所以跟唐老师那边有非常密切的学术的合作
这两个实验室是不是现在出来创业人最多的我确实没有做过这方面的统计 直观感觉上确实不少在刚开始决定要创业的时候也找我们实验室的一些前辈和师兄做过请教我们实验室前面也有一些很不错的一些正在创业的师兄像密率智能的图存超还有像吉瑞科技的武兵都是我的同门师兄在 XGPT 火之前因为你就已经开始创业了这段时间你在做什么
刚刚提到说最早我是 21 年 5 月份决定创业的在一开始创业的时候就是找钱找人找方向这三个事尤其重要的是找方向这个事情在 21 年的 5 月份当时的大模型还是一个极强的非共识甚至我记得当时这个圈子之外的人大家对大模型那会儿还是没有概念的所以我觉得我首先做的事就是去找到说这个大模型到底能在什么方向去做落地和探索
但那会儿生成其实也不是一个共识 20 年 5 月的时候我们那会儿也会去参加一些榜单对它进行评测但相当一部分任务其实还是比较传统的自然语言理解的一些任务各种分类的任务什么 NER 这种序列标注的任务等等而且都是会去做一些相关任务的专门的一些有监督数据的训练之后再去做相应的评测而不是像现在直接去做 Zero Short 或者 Full Short 的这样一个评测
首先我自己想的是大模型到底在什么方向上能够去做出突破来而且再往下细拆的话就是理解和生成这两个方向我当时其实做过一些探索和一些思考最终选择的是生成方向因为我认为生成方向相比于之前的技术来讲大模型带来的增量更大的
同时的话它是更有可能做到真正大体量的一个 2C 的产品的而理解的任务的话更多可能只能用在为了满足某个需求的中间的一个环节而没法断道端的去走落地因为理解的话就是帮你去做一些分类做一些标注这样的一些事情这种事情很难很直接的转换成个人能够使用起来那些价值和应用
对所以找方向然后同时的话再去细化方向在那会儿也是结合我在自己读博的时候的一些需求然后探索了很多的一些可能性最终去选定说我要去从我自己的需求出发解决在信息爆炸时代然后怎么去更高效的获取信息这样一个场景我要这个场景来去做
同时的话开始从我身边的人去组建团队找一些我们的合伙人等等然后另外的话就开始接触一些投资尤其我们从 21 年下半年到 20 年上半年的时候其实少投资这个事情上还是遇到了不小的挑战的因为我们知道说这个 22 年刚过完年就进入到了这个资本寒冬了是一个非常大的一个低谷吧
在那会儿其实 AI 的投资也是特别不被看好的领域上一代的 AI 已经有很多年的时间但一直没有做出特别大规模的这种商业的落地和价值变现所以在那会儿我们需要去说服投资人或者说需要去不能只告诉大家说大目前这个技术很厉害更重要的是要给大家讲清楚为什么有了这个技术它能够做出什么样的产品而这个产品对于用户来讲是有价值的
这是有这个技术叫大模型吗那会儿已经叫大模型但是其实还没有那么统一的一些名字对会有什么说法比如说还有叫 Foundation Model 基础模型的这个应该是 Stanford 他们去提出来的概念然后还有就是全品大规模预训练模型或者最早的时候预训练模型像 Bird 的时候后面这个随着它的参数量越来越大所以开始叫大规模的预训练模型然后又在中文语境下简称就叫大模型
所以那个时候投资人什么反应你们见到多少投资人在那一年其实在整个从 21 年下半年到 22 年中间我应该见了不下一百个投资机构基本上见完了对吧对尤其是在 22 年我博士正式毕业出来的时间段你是 22 年毕业的对我是 22 年的 6 月底正式博士毕业刚出来的那段时间我正好参加了奇迹创坛的路演然后路演这时候当时其实加勒的投资人有 200 多
后面的话陆续聊了应该有六七十个在那个短短的两个月左右的时间内但是在那两个月内是一张 TS 都没有收到的他们一般会问你什么问题那会儿的话各种问题都会问到当然大家那会儿更关心的不是大模型这个技术更关心的还是说大模型这个技术它到底能解决什么问题或者说还是在考虑的是你到底要做什么样的产品这个产品它能有什么价值能对标海外的模型什么样的产品
所以你在 22 年初还是 22 年中拿了奇迹的融资我们比较幸运是在二年初的时候拿到了奇迹当时还有像清华系的英诺还有水木包括我们孵化的这个志愿研究院的算是种子轮的一个融资吧
但当时其实也没拿特别多的钱算是一个启动资金启动资金之后拿了我们本来就打算 20 年的六七月份我博士毕业之后可以再拿一轮钱因为那会儿我们想要去训更大的模型其实一开始拿的钱是远远不够的当时想训多大当时我们其实就想再训一个 10 币到 20 币这样一辆机的一个模型这个需要多少钱比如说我们之前用到的卡都是 V100 这样的
那会儿 A100 的卡数量还没有特别多而且当时卡的成本其实相比现在倒没有高特别多但是那会儿主要卡的数量比较稀少第二个就是数据的获取成本会比较高我们粗略算过可能是需要有个千万这样的投入的光靠蓄模型本身的这些算力和一些数据的成本当时做创业这个决策对你来说是一个成本很高的决策吗还是一个成本不高的决策像你这样博士毕业当时在市场上在融资的创业者多吗
客观上来讲其实在当时做创业对我来讲是一个机会成本很高的选择因为当时主流的话大家还是要么去产业界要么就去其他的高校继续去做学术相关的工作然后在创业我相信不管在什么时候创业都是一个相对小众的非大众化的一个选择客观上来讲机会成本确实也是不低的第二个就是真的像这种博士刚毕业就创业的话在整个的我当时接触到的创业圈子里面也不是一个特别大众的
这个占比也不是很高投资人对于你是博士 AI 方向的 94 年的年轻人他们是加分还是减分在当时很难说是一个特别大的加分下实事求是讲因为核心还是说那会儿大家对于 AI 这个技术是没有那么强的共识的更多还是说把我们看成一个软件公司不管是 2B 也好还是 2C 也好这样一个软件公司或者说有点像当年 21 年的时候那会儿 SaaS 的浪潮
虽然说在 20 年的时候已经下降很多了但更多还是说把我们放到大的这个 SaaS 的这个行业内去看如果在这个行业内看的话其实非常年轻
并不一定是一个很有优势的点你们当时跟他讲的产品方向是什么呢我们的产品方向其实一直到现在为止也没有什么太大的变化就是想要去做从信息的获取到存储的应用再到创作表达的这样一个闭环的一个产品我们称之为说面向从个人将来可能也面向这个企业或者组织的新一代的 AI 驱动的智能信息处理系统是 2B 的
其实 2B 也好还是 2C 也好在当时我们觉得并不一定是特别大的差别但我们一开始是面向个人用户的尤其是个人用户中的一些相对专业的用户我们称之为 2P Professional 他们当时对于这个方向白印吗对于这个产品方向不是技术方向我觉得对于这个产品方向确实是有投资机构白印的
但是在当时大的融资环境下尤其是我们可能要的钱相比于做一个简单软件产品来讲其实是要高的在这样一个情况下我理解可能他们比较难下这个决策所以整个 20 年融了两次资对但其实都很不容易对很不容易我们后面是赶上了在 20 年下半年那会有一波 generative AI 的浪潮但那个浪潮其实来自于图像生成的大的变化
大的变化对尤其我记得在 20 年 9 月份红杉美国发了一个 generative AI 的一个 report 然后在这个报告里面其实只说了从图像到文本音频代码等等非常多的一些生成是 AI 的一些机会有了这个浪潮之后我们后面达到了这个红杉的第二轮的投资 20 年的 9 月底到 10 月份就刚好在 ChangeBT 来之前对来之前对两个月左右吧
那 XGB 来了以后是不是整个融资环境都变了对其实二年底的时候我们还没有感受到特别明显的在融资环境上的一个变化是到了 23 年过完年之后大家回来才开始这个市场一下子变得非常的热我的感受就是这个事情由原来一个非常强的非共识
在短短的时间内快速变成了一个极强的共识当然这里面有很多因素的一些影响然后在这个时候确实感受到资本市场或者融资环境有一个巨大的一个过山车的这样一个变化观点突然怎么样了就是这个领域因为在当时就大模型大家迅速达成共识之后我理解从投资机构角度就会去看市面上有哪些公司是在做大模型的
我们在当时环境下应该还是为数不多的几家里面就是比较早就开始去做大模型的这样一个投资表地了所以会有很多的机构开始去接触我们希望能去做一些交流我看紧接着你们就拿了腾讯的钱好未来的钱很多大机构的钱就来了是的 23 年你们融了两次字对吧对 23 年我们也完成了两轮的融资
然后当时老王的项目应该也想并购对在当时确实老王这边还是做了蛮多的一些交流的在这之后你们的方向有什么变化吗比如说要去更大的模型对其实 21 年的时候一开始决定创业我不光是认为说看到大模型这个技术很厉害我就决定去创业了在当时其实这个逻辑是不成立的更多的还是说你要想清楚这个技术有了
或者说他在某些能力有了提升之后你要把它用在哪些地方或者说 deliver 出什么样的产品然后用这个产品去满足他能够创造出新的价值其实至少在 21 年的时候你把这个逻辑去讲完你才有可能去融到钱或者说对我来讲创业这个逻辑才比较成立然后到了 22 年的时候其实基于当时我们
最早迅的一些模型做了一些 demo 比如说 20 年上半年我们 follow 当时的 webgpt 做了一个类似于 webgg 的 AI 搜索的一个 demo 然后还有我们去做了 AI summary 的 AI writing 的一些 demo 在 20 年我记得应该是在六七月份奇迹创坛的路演上去做过一些展示在当时实事求是讲我觉得效果是没有达到我的预期的而且我觉得它没到能够做成产品让大家来用的一个程度
最核心的点就在于说我们当时判断说就是这个基础模型的能力还远远不够所以我们才决定说要去拿更多的钱然后有更多的算力去运更好的模型来去解决我们这些想要做的产品中所需的一些能力但到了 23 年开始的时候确实一下子融资比之前变得更容易了我们也确实有了更多的钱也决定说我们要投入更多的资源和钱开始去运更好的模型可能 22 年的时候还是非常慢的
而且当时为了去模型我们想了很多的办法去想去各个地方去找算力的一些支援到了 23 年我们发现我们自己的钱就可以够去训更大的模型了
23 年确实也上半年也做了很多这方面的尝试虽然我们没有大规模去刷榜或者怎样但其实我们模型效果在一些内外部评测中都拿过第一的一些好的成绩但是到了 23 年的下半年尤其是八九月份的时候我感觉就这个事情某种意义上它的价值在逐渐的变小因为越来越多的大厂也好然后其他的初创也好还有更多的研究机构也好都开始去做更大的技术模型的事情了
越来越多模型在去做开源我在那会的话就越来越感觉到说我们再去做一个更大的基础模型的价值是不是真的有那么大其实在 23 年上半年的时候我们还是有非常多想到一些技术的差异化包括说在 projecture 的时候怎么就能提前的去增加模型的指令遵循的能力
然后包括怎么去解决比较长的有结构化的内容怎么去调整你的训练数据和训练的 os function 来去做一些这种探索但到了 23 年下半年我们发现就是因为在同样的这个赛道里面大家所有的人都关注到了都在开始霸陷过海各线神通的时候你原来想到的一些差异化逐渐的要么就别人也看到了要么别人可能已经在做了再去想出新的差异化来讲会越来越难
可能 OpenAI 已经做了它还没有公布出来对有可能是它已经做了然后更重要的点是如果光 OpenAI 一家的话那它能做的事情毕竟是有限的但在当时是非常多的玩家都入局这样的话就会使得说这个矿可能 OpenAI 率先去发现了所有的人都涌进来之后不管是从表面上还是再往深挖的所有的这些有价值的东西可能在很短的时间内都会被大家发现
这是一个点然后另外一点的话就是我们一直都不是说为了训更大的模型而训更大的模型我们一直都是为了说想要去达到我们最初的做好那个产品的这个目标来去训我们的模型的所以当时一开始训的模型我们也是围绕我们的产品方向做了很多的调整
但到了 23 年的下半年 9 月份的时候我们发现说直接做虚拟大模型这个事情对于达成我们的目标带来的增益其实在变小而另外一方面的话我们又发现了一些新的问题就是我们发现了说原来我们做比较粗糙的 demo 的时候判断说最大的卡点是在基础模型的能力
但一年之后有了更强的基础模型的能力之后我们在当时又去做过一个 demo 发现效果比想象中要好了不少但距离我们理想中的能够让大家广泛的用起来的状态还是有距离的而这个距离在当时我判断说不是光靠更强的通用模型就能解决的
所以在当时我们决定做了一个比较大的战略的转型开始去转向说围绕那些光靠现成的大模型即使不断的 skill 但仍然解决不好或者解决不了的问题怎么去用新的技术来去解决这是你们要寻找的方向对吧就是怎么解决对其实在当时就决定首先要去想说怎么去解决后面的话我做了一些探索和尝试从 23 年下半年到现在一直在朝着这个目标而努力
我很好奇你去年上半年在融资的时候有纠结吗因为突然有很多钱来了我们当然要融更多的资那需要融多少资呢我们为什么没有像那几家 Foundation Model 一样拿几亿几美金的钱有想过我们融资有上限吗融多少钱是合适的
对其实当时我也去问了很多的比如说我们的股东然后包括一些比较有经验的一些创业者到底融多少才是够或者融到多少比较合适有几方面吧就一方面的话还是说看我们做这个事到底需要多少钱然后另外一方面的话就是也要考虑实际的外部的环境的变化可能说融资的环境它有好有坏你要考虑到它的周期尤其是做一些最差的一些打算
其实更多还是说基于这两方面因素去考虑说我们需要融多少钱你想要融最多的钱吗并没有我觉得要最多的钱最多的卡最好的人才我其实当时确实并没有这么去想过某种意义上在我看来融更多的钱尤其是超出当前状态和当前需要的钱数的话它的编辑效益会递减而它的副作用会逐渐地凸显出来什么副作用
它会给你带来更大的压力同时的话你就必须得为了更大的估值也好更多的融资也好去做看起来有更强共识的事情但有可能这些事情后院子来讲并不一定是成功率最大或者说最值得去做的事情你去年上半年想过你们公司就是要做一家房地产 model 的公司没有没有我们确实没有想过这个事情你觉得这个事情怎么了呢当时融资肯定对标 open 爱越好融对不对
是某种意义上是的后面的来讲但可能从我创业的初心就不是说就要去做一个纯技术导向的一个公司第二点的话我当时相对来讲还算是比较冷静去看这个事其实没有觉得说所谓什么 AGI 能在很短的时间内到来或者说所谓模型级产品是成立的我认为可能将来是不存在模型级产品可能也不存在所谓的模型公司的所以模型公司会变成产品公司
模型公司它必须要找到某些特定的场景或者说某一个产品的方向来去转换成价值因为模型本身它是没法直接产生价值的你认同他们那个说法吗 AI 的部分产品是模型在变好过程中沿途下的蛋我觉得这句话既对也不对我可以说模型永远都在变好比如说它是以多长时间的尺度几年三四年还是十年八年还是几十年的尺度
在我心目中某种意义上模型机产品也对但是如果说我心目中的这样的所谓的 AGI 能够成立的话确实没有必要再去通过产品这样的形态来去呈现它的价值了但是我认为我心目中的 AGI 可能短时间内很难到来至少在三五年这样的尺度内是实现不了的在这样一个情况下我们总得
去考虑在载行模型能力下能做什么事情其实我特别喜欢的是看这个理想汽车的 case 就是在当时去选择这个新能源车的技术路线的时候理想算是相对来讲比较小众的选择了增程式混动的路线他去在电池的基础上又额外加了一个这个油箱和一个发电机然后去为他去做一个备电
其实大家都知道说纯电的技术会一直的进步而且现在回顾看五六年前确实电池的技术有一个突飞猛进的变化我记得当时可能续航里程也就一两百公里但现在其实到将近七八百甚至一千公里都是可行的在当时应该去怎么去选择怎么去把现有的技术转换成产品我觉得这个是很重要的
理想它通过增程式混动的技术路线去部分的解决了大家的续航旅程的焦虑然后它的产品化速度就能更快同样的话后院的看确实也赢得了用户的认可这个很有意思你怎么思考产品和模型的关系呢首先我并不认为说模型机产品
我觉得至少就现在的大模型而言它还是遵循一般的研究到技术工程落地再到产品化到商业化的这样一个基本的规范或者说基本的一个框架的现在的模型和技术大家确实是在通用的技术上水涨船高但是想要去满足好产品的需求我觉得不应该从模型和技术出发而应该从用户的需求或者说从产品对技术的需求出发
看看想要做好一件事它到底需要哪些能力而哪些能力是现有的模型或者现有的技术能够解决的然后哪些能力是现有解决不了的有没有其他的办法可以去顶上或者说是不是需要研究新的技术来去填好这个空
就像上一代的所谓比如说移动互联网创业的时候我们现在比较惯常的比如说打车外卖很多的这样一些产品其实它并不是说有了 LBS 它才成只要有了 LBS 这个技术所有的这些就足够了相反其实 LBS 只是说在满足这类产品的需求的链路上把某些环节给填上了填上之后这个链路就能跑通
这个链路跑通所以这个产品能够成立开始能够去规模化和商业化我觉得对于现在大模型的技术来讲也一样对于某个产品或者所有的产品都一样它需要的有可能是 ABC 这三个能力现在大模型原有的一些技术可能已经满足好了 A 和 B 就两个能力但 C 的能力原来技术一直满足不了有了大模型之后恰好这个 C 的能力能够被满足那这样的话 ABC 凑齐了就像凑齐了七龙珠一样然后你能够把这个产品就做出来了
他们说模型和产品是南坡北坡看你往哪个方向爬所以你们是往产品方向爬
首先我其实还是并不觉得说这是所谓的南坡和北坡吧但是对我们来讲确实是从用户的价值和产品的需求出发看一看当前的技术到底跟这个产品之间的匹配度是如何有哪些还不够需要我们自己去填上你刚才说你不是从去年转型以后就一直在思考这个 gap 怎么填上就是模型和产品之间 gap 你现在的解方
核心是要把大模型控制在一个相对有限的空间内因为现在大模型它最大的一个挑战在于说它归根到底是一个概率远模型再加上说我们希望它有更大的多样性然后能做更多的事那所谓这个多样性的一体两面就是大家经常会提到的幻觉或者说它会时不时的出一些你意想不到的一些错误
我认为最核心的点就是把它的发挥错误的概率尽可能降低把它错误能够影响的面尽可能缩小这是我们在做的事儿然后怎么去做到这个事儿就需要对它的输入和输出分别有前向的操作和后向的操作前向的话就通过一些其他更确定性的方式把它的发挥空间可以缩小而后向的话就是通过其他的一些知识库也好或者说其他手段也好
能对它的结果去做一些校验这样的话就把它的犯错的概率尽可能够控制在一个比较有限的一个范围内就前段时间跟陆续博士交流他也认为说现在模型的所谓的鲁邦性或者说稳定性不足是阻碍现在大模型产品落地的最重要的原因之一
而我们魔咒印象就在尝试去解决或者说缓解这个问题是李延宏前段时间演讲说的 rag 那文模是吗不只是 rag 吧他说的是 rag 解决了大部分的文本方面的大模型的幻觉问题你认同吗我觉得很难去完全的光靠 rag 来去解决幻觉问题 rag 它确实是能够对于模型的比如说知识的更新然后它要有很多大量的知识的存储的能力其实有一个比较好的补费
但其实它解决不了换解的问题比如说就像我们现在看很多 AI 搜索的产品 AI 搜索就是核心的一个技术链路就是靠 RAG 我搜到了很多的相关的一些文章然后基于这些文章来让模型回答你的问题但我们看到的是它回答出来的问题仍然会有一些错误
这些错误可能跟他搜到的内容有的就是不匹配的不一致的可能他搜到了结果是 A 但是他回答出来仍然有可能是 BRAG 它可以去缓解的是模型自己内部存储的这些知识有可能出错的问题但它缓解不了模型对于现有的信息进行加工和处理的过程中还有可能会带来一些错误或者说幻觉
我应该怎么理解模型啊就模型相对于移动互联网或者互联网它们属于去年刚出来的时候大家可能觉得模型就是以技术本身连放在这 model 都可以自己成为一个公司然后所有的产品可能都依赖于技术的能力的迭代以此来出现那今天我们应该怎么思考模型这件事情呢就像我刚刚说的还是说把它放在一个比较通用的比较基础的从研究到技术到产品到商业化的这样一个框架下它就是这个模型能够具备某些能力
而我要做的事就是说怎么去实现这些能力和我的产品需求的一些匹配但是这个模型它跟过往技术的一些差异化在于说首先它还在迭代和变化这是可能跟之前的一些技术相比不太一样的而且它的变化是我们某种意义上未知和不可
完全预测的有些能力有可能通过它的演变又出现了而且这个速度比想象中要快很多这是其一然后其二的话就是它和之前的互联网移动互联网相比我认为最大的区别和不同在于它的不确定性它的输出是一个概率的输出不像之前我们的互联网移动互联网就是你的这些通信技术也好做一些产品的交互或者说数据库的一些技术也好数据的一些技术也好基本上都是确定性的
而这些确定性对于我们做这个产品来讲是一个非常让人觉得幸福的事情在现在看来因为在这些确定性的技术基础上相当于你的边界就是确定的你的边界是确定的下面那你要做哪些事哪些事能做哪些事不能做就非常确定但现在的模型它的特点是一方面它自己的能力本身可能会变化第二个它生成出来的内容是不确定性的
这种不确定性就给我们做产品带来很大的一些挑战之前的互联网产品或者移动互联网产品当你做出 MVP 的时候某种意义上 70% 80%的价值就通过 MVP 产生出来了比如说我们现在用到的打车也好外卖也好社交也好现在用到的产品和它第一个版本的 MVP 产品相比它的核心功能基本上没有什么变化
用户获取到的价值也基本上没有太本质的区别和变化但是大模型类型的产品不太一样的点在于说模型的输出的这种不确定性它会极大的影响这个产品是否能让用户真正的用起来比如说在 ChatGP 出现之前其实有无数的对话类的产品但是这些产品都没有像 ChatGP 这样达到所谓的 PMF 的状态而只有 ChatGP 达到了而它的成功不是来自于说它做了非常复杂的非常精巧的产品的设计相反唯一的不同就在于说它的模型能力有一个很大的提升而
而这个提升就能决定这个产品到底是 work 还是不 work 那对于现在来讲我们觉得核心就是解决你怎么去应对模型输出的不确定性然后你怎么去做一个更复杂的决策和判断说它到底是模型能力不够所以这个产品不成功还是你的需求没找对还是你的产品设计有问题这些因素会比之前要考虑的更加复杂那你们现在是自研模型用开源模型还是一部分一部分我们都会是一个混合的
对是一个混合的就像我们的底层逻辑出发点就是我们要做好这个产品它需要比如说 ABCD 五项能力那我们判断一下这五项能力有哪些能力是现在的技术可以解决的有哪些能力解决不了那解决不了的话我们就需要去做自研全部自研没有必要对我们认为说全部自研至少就当前的阶段来讲我觉得是没有必要的那我们就讲讲你的产品吧你的产品是怎么思考的为什么要做一个新闻阅读其实新闻阅读只是它的表象的一个功能
我们归根到底想要去解决的就是在信息越来越多信息的复杂度越来越高的背景下但人的大脑的处理信息的能力基本上没有什么变化人的脑容量基本上是以千年的这样一个时间持续在做变化的但信息爆炸可能就是以半年一年的这样一个尺度在演变那这样的 gap 怎么去 bridge
这是我们的产品一个核心的出发点它其实最早来自于说我在读博的时候经历了说各个溪流汇成大河大河又汇成江海的这样一个阶段原来我们可能做自然语言处理各个任务你做情感分析的你做文分分类的你做阅读理解的你做生成的大家各自在各自的领域上去做研究可能彼此之间也没有太多的交集然后随着像 Bert 这样的预训练
模型出现之后越来越多自然语言理解的任务 LOU 的任务开始合并在一块去做所以像各种 NER 的任务分类的任务情感分析的任务就用一个模型就能解决了后面随着 GPT-3 的出现之后又有越来越多的生成任务都可以合在一起
而且随着 GP 模型又往前走原来理解任务和生成任务又再合在一起大家所谓说原来最多就是大的同行但各自做的任务都不完全一样但是随着基础模型的演变所有的人都进入到了一个赛道内我要看的论文越来越多了
原来可能只看我关心的那一个任务的论文后来发现说就是必须得看越来越多通用的预训练魔性的论文甚至还有多模态的还有更多的通用的一些论文都要开始看我一直感受到一个状态就是信息爆炸以肉眼可见的速度在影响我最早的时候可能 archive 上的论文每天花个二三十分钟就能刷完但后面开始说要花四五十分钟要一个小时甚至要更长的时间
但是好像我的大脑已经到了一个处理信息的一个瓶颈了我没法再去让我的大脑的处理信息能力变强了但是信息在越来越爆炸的趋势是停留不下来的而且某种意义上 AI 也在加剧这个事情它让创作内容的门槛和成本大幅的降低甚至你不需要人就能去创作从零到一就创作很多的内容
而这些内容一定会使得说每个人可能能接触到的这个信息量又会有一个大幅的爆炸但是人的能力没有变我们就在想这个 gap 要怎么去解决对这其实是我们做这个产品的一个出发点就像做一项研究一样看到这个问题首先先看一下过往大家是怎么解决的
我们就回溯了这个历史吧从互联网再到移动互联网再到所谓现在的 AI 其实这个趋势是没有停的在互联网出现之前可能这些信息要通过物理媒介进行传递比如要通过出版的图书杂志报刊等等进行传递所以在当时的时候传递信息的效率和能传递的信息量都是相对比较有限的但后面有了互联网之后呢这个事情发生了变化
就大家更多人可以随时甚至随地的在这个网络上去发布内容然后有了各种门户网站有了各种 BBS 的论坛在供给侧来讲内容的生产门槛降低信息量增加每个人能够消费的内容和信息也在增加在当时其实就需要新的一些技术手段来去解决这个问题比如说最早的门户网站能够把内容去做一个归类的整理然后包括有了搜索引擎能够让你根据需求去找到相应的内容
但后面有了移动互联网其实有了移动互联网之后它进一步去增加了用户生产内容容易程度更多人有手机设备成本降低了真正的随时随地可以去创作内容和发表信息了然后信息再次爆炸
所以后面出现了推荐引擎这种更高效的信息的分发方式它相比于门户网站它的分发的颗粒度变得更细原来可能要么是我主动的去找到一个内容通过搜索引擎要么我打开一个门户网站或者一个论坛要根据我的主题去找它的内容分发的颗粒度其实是以一个主题或者说某些共同的属性来去做分发
但到了推荐引擎的时候就打破了这样的一些边界直接把一个文章也好一个视频也好等等这样一个内容以一个完整的内容作为最小的颗粒度进行分发然后它的分发颗粒度分发的效率其实更高与此同时的话移动互联网也让人有一个消费信息的一个时间的一个拉长就是有更多碎片化的时间能够去消费内容了
原来碎片化的时间真的很难去消费内容比如说你要在电脑上你必须得在电脑前你才有可能去进行内容的消费但有了手机之后你在任何一个场景都可以碎片化的去消费这些内容所以我们看到的一个变化就是供给侧创作内容的成本降低内容爆炸但同时消费侧有一个好处就是我的碎片化时间可以被用起来
然后通过推荐引擎可以把这两个去匹配起来进而去实现一个信息分发和消费效率的提升但到了 AI 时代我们认为说好像碎片化的时间基本上已经被占满了现在其实是所有的产品各种内容都在抢夺用户的时间但是内容爆炸的趋势没有停这个 gap 要怎么去填内容可以更爆炸现在 AI 可以产生更多无数的内容都需要一个人去生产是
是的那这个 gap 要怎么填对人来讲他理论上能接受到的信息然后他实际能接受到的信息和对他有价值的信息这三个集合中间的这个差距在越来越大而且某种意义上他对于这个人能够去发挥多大的价值是决定性的
你能处理的信息越多某种意义上你在整个社会组织网络中你的价值就能越大然后我们认为说要解决这个问题就必须得再回到信息的本质其实之前我们看到的互联网也好移动互联网也好它分发的都是完整的内容它其实所谓叫信息分发但实际上它做的是内容分发
内容是只是信息的载体内容是信息的载体对你怎么定义信息信息其实就是把你的不确定性降低举个更具体的一些例子比如说某件事比如说 OPEN 又发个新模型了这件事我可以通过各种各样的内容来去获取到这个信息我可以跟你交流来获取到我可以去看一篇文章知道它我也可以听一个音频知道它我也可以看一个视频看个朋友圈知道它
对就是这个信息可以通过各种各样的内容载体来呈现比如说同样的信息在不同的内容载体你消费完其实会的东西是一样的你可能都是知道的这件事这其实就是所谓信息和内容的不同从这个角度去看所谓的内容创作和信息分发就是创作者把他想要表达的信息装到内容这个容器里面然后就像中间的分发环节就像这个送快递一样
把内容去送给不同的消费者消费者最后就拆开快递一样把这个内容消费完之后获取到了上面存在的信息其实是这样一个过程回到这样一个本质我们就会发现说前面之前做的所谓的信息分发归根到底做的都是内容的分发
而内容分发它的一个问题就在于它会被内容的这个颗粒度所帮助它最小的颗粒度就是一个文章一个视频这样的一个完整的内容但实际上对用户来讲消费一个完整的内容并不一定是他获取这个信息最高效的方式对我从头到尾读一篇论文或者看一个视频并不代表说这个文章的每一个字每一个片段或者这个视频的每分每秒对我来讲都是一样有价值的
那这里面就会有一些低价值的一些时间我要在过程中其实是对我来讲获取到的效率或者说我获取到的单位时间内的信息价值其实并不是最高的这对我来讲这就是优化空间对我们想做的事就是怎么去把这部分的这个优化空间让大家通过一个产品能直接去感受到比如现在可能我就看一个视频不感兴趣我就拖进度条或者说我去长按加速让我把这个过程快速的去度过把我可能在低效的这个时间段定可能
缩短但这并不是一个特别用户友好的处理方式而且你有的时候就会漏掉一些东西有的时候可能还要在很多内容中切换你看到一个内容你并不知道里面到底有哪些片段的你有加持你需要一边看一边判断我理解因为内容它比较好量化但是信息你很难量化有时候可能用户自己他也不知道他到底想获得什么样的信息是的那你怎么投喂他呢
那这里其实推荐引擎它就是通过以内容的颗粒度来去判断人对所谓信息的一个价值它能够做到的一点就是比如说同样的内容其实背后承载的信息通过用户的交互行为能够去判断说他对某个内容是否感兴趣
而他判断这一点不完全基于说这个内容本身更多基于的是内容这个承载的信息所以他能够知道说你对这个内容 A 感兴趣有可能对内容 B 也感兴趣所以他会带来大量同质化内容对因为 A 和 B 可能彼此之间是会有一些信息上的共同之处的但是就像你刚刚提到的它有一个负面的作用就是它有可能会同质化
比如说我们两个都会很关注 AI 然后你看了一篇 OpenAI 发了一个新模型的文章然后我看了另外一个创作者创作的 OpenAI 发了一个新模型的一个文章有可能我们看完之后会交叉推给另一方就是你没看过的那篇但实际上这两篇上面存在的信息大部分都是一致的和重复的
但首先至少他能够做到说他能够判断说你对哪些信息可能会感兴趣但他做不到的一点是这些信息并不是说你之前看过类似的内容你就会对这篇内容也感兴趣因为他们的信息会有重复所以我们要做的事是在信息的层面怎么去判断它首先信息之间是有什么关系第二个哪些信息是重复的是一致的现在深层就可以提供这种解决办法
因为它可以打碎你之前内容的容器然后重新变成一个新的内容是的其实这就是有了大模型又是有了它大模型背后代表的很强大的生成能力而且再具体一点来讲这个生成能力是在我们 LOP 里面叫 conditioned generation 条件生成能力之后具备的
所谓条件生成就是据一个现成的一些内容或者说信息然后去从里面生成符合你给定的输入的内容的信息就叫条件生成 Conditioned Generation 那产品怎么做呢对那我们的产品其实首先第一步要解决的就是怎么去把内容去变成更小的颗粒度
因为现在让大模型直接去做的话它没法显示的去做到这一点它只能说及时的根据你当前的需求根据你的指令然后去生成一些内容但这些生成的内容跟原始内容之间到底有什么关系以及它到底承载了哪些信息过滤了哪些信息其实这是很难去建模的因为现在的生成模型很难去靠这样的监督信号或者说 reward 来去做训练相当于这是理想情况是一个完全个性化的生成
同样一篇文章可能给你生成的和给我生成的就是不太一样的但现在的模型还很难去做到这一点那我们去利用当前的技术或者现有的能做到的技术做的事是首先要去对内容进行解构对我们其实是遵循一般的语法和语言学或者说语言学的一些基本的一些原则会把原始的内容去做一些解构解构成更细颗粒度的我们称之为最小信息单元的一些片段
解构完之后我们再针对这个最小信息单元以它作为研究对象和信息的分发对象来进行分发和价值的判断判断完之后比如说这篇文章被拆解成若干个信息点它基于过往的一些用户行为和一些内容的一些特征能够判断说你可能对其中的某几个信息点更加感兴趣
那它可以基于这几个信息点然后为你重组成一个新的内容还有可能的是同样主题的文章或者视频或者其他的音频各种各样的模态的内容比如说有两个文章三个视频还有一个音频内容都是讲同一件事的每个内容上面都存在着若干信息点可能把每个内容都去解割完之后首先能知道说到底哪些信息点是都提到的是重复的
哪些信息点可能是独特的这是第一方面第二方面就是这些信息点哪些是你感兴趣的哪些是你已经看过的哪些是你不感兴趣的它也能有这样一个特征有了这些特征之后最后把你真正感兴趣的那些信息点拿过来基于这些信息点再重组成一个新的内容这个内容就是最适合你需求的
那作为一个消费者我怎么跟他互动呢我的互动方法是我问他一个问题他的答案就是一个结构化的内容还是我用搜索的形式对关于产品交互这块我也一直在思考我其实并不认为说语言的交互是一个万能的或者说是一个终极的交互形态
因为它对于人的考验和使用成本是比较高的人的考验也是比较大的就是我问他问题对我问他问题就像这个 Proplicity 的 CEO 一直在提他遇到的最大的挑战其实不是 Google 的竞争而是用户并不知道怎么问出一个好的问题因为你去想一下这个问问题这个事情真的很难首先你要有一个主动的需求然后你要把这个主动的需求转变成一个问题其次的话你要把这个问题转变成一串流畅的自然语言一句话
然后你最后还得说出来或者把敲字把它敲出来这个过程其实是一个挺消耗你的脑力和你的一些精力的一个事情对所以我们认为说语言的交互它固然有它的好处它很通用它很普适然后每个人可能也都会但是你如果想让它变成一个最广泛最普适的这样一个行为的话其实成本是很高的我们认为说需要有更低成本的交互方式还是它推送到你的面前把信息推送到你的面前
对肯定还是说人越被动越好模型或者说这个产品越主动人越被动这是一个更好的方式产品主动人被动那还是精锐头条的方法精锐头条它其实代表的一种或者说它代表的是很多的这些产品就是让用户通过最简单的交互行为
然后就能够去达到它的目的而且更厉害同时又能够去把用户画像进行建模又能够同时提升你底层的模型的能力能把这两点去做好是一个非常关键也是非常重要的一点在你刚才这套叙事中其实你改变了内容生产的关系
我作为一个创作者我就有意见你把我的内容拿回去然后结构了然后用用户喜欢的方式呈现在他面前那我怎么办呢你没有把我的内容放过去对不对对我认为说将来一定链路会发生改变就像我刚刚描述了从有互联网之前有了互联网移动互联网之后包括说将来我们认为说有了 AI 之后就内容的生产分发消费链路这个产业一直在发生变化原来最早的时候比如说有互联网之前生产端其实话语权非常强的
对当时的一些能创作内容的人他的社会地位很高他的影响力很大但后面有了互联网移动互联网之后所谓自媒体逐渐出现使得说创作内容的门槛降低和他的话语权的降低更多的 C 端的创作者涌现了涌现了但这时候我们就会发现分发平台的话语权变得非常强了是对因为他要去解决供需两端的这样一个关系但是我们看到的是在这个链路上重心一直在往下移移
我们判断说将来内容的消费者他的话以前会更强因为某种意义上现在就像刚刚有 AI 新技术之后内容其实它的供给会越来越过剩然后它的生产成本一直在降低内容的消费者他到底怎么去更好地满足他的需求我们认为是一个更本质或者是更影响产业的一个核心因素
所以我们的愿景是即使我们不做这个事情也一定会发生的这是底层的一个社会发展的一个规律吧某种意义上就是那朝着这种标我们相信说内容度创作者他在不同的阶段不同的这个阶段下都会有不同的价值当然他对这个创作者的能力要求是不太一样的就是
就像现在的想做好自媒体和比如说有互联网之前你想做好媒体的能力要求是不完全一样的我们相信有了未来的这种真正 AI 生产的个性化内容之后生产者首先必须是需要的因为我们并不认为说只靠 AI 就可以从无到有从零到一的产生所有的内容它上游一定是需要有源头的一些信息和内容作为输入的那这样的情况下其实对于内容的生产者或者信息的提供者来讲首先一定是非常有价值
第二个可能他交付的东西会有一些变化在整个经济体系下他的利益的分配方式也会有一些变化比如说他将来一方面他提供的可能就不是一个完整的内容了而他提供的是用于 AI 去进行加工的一个原来输送语料 OK
对某种意义上是搜索引擎其实前段时间也看到说美国有一家创业公司它就在做搜索引擎这个搜索引擎是专为 AI 准备的它不是让人用的什么意思这是什么公司我好像突然有点想不起来了但它这个做的事就是 AI 大模型不都需要搜索引擎来给它提供原始内容类似于刚刚提到的 RAG 技术的需要现在调用的就是像现成的给人用的搜索引擎的接口
但这家公司认为说可能现成的给人用的这种搜索引擎不一定最适用于给 AI 用到的搜索引擎的一些能力所以他就在做这样的事比如说他会定义更好的接口比如说他对于搜索的这些各种参数的设置会更加完全这是他们正在做的事情
那我相信说将来可能回到我们刚刚讨论的这个内容创作也一样内容创作者和信息提供者一定是非常有价值但是他可能提供的东西会有变化这是其二的话我们认为会出现新一代的内容创作者就像现在我们所谓有自然语言编程一样我输入的不再是编程语言了而是自然语言中间通过 AI 来去转换成这个编程语言甚至将来有可能都不需要转换成编程语言
直接转换成最底层的机器码直接运行都有可能这也是一个趋势但是类比到现在的这个内容也一样现在我们的内容还是说人在去直接创作内容的但将来有可能就是人来去操控 AI 去创作内容人真正作为这种新一代的内容创作者他创作的不是内容他是通过类似于写 prompt 这样的方式来去创作一个你的自媒体频道
然后这个自媒体频道就是自动化的做源头信息的采集做内容的加工和做内容的生成但你要调的就是这个生产系统中的一些关键参数或者给他你的一些想法但你不需要一字一句的去生产这些内容这我觉得也是将来很有可能发生这样的一些变化的那分发平台的价值呢
首先分发平台在现阶段来讲一定价值是非常大的因为有海量的内容和海量的用户怎么去做更小小的匹配但在未来的话我们认为内容的消费者他的话语权可能会更强将来有可能是每一个消费者自己会有一个专属于自己的内容加工和信息获取的这样一个所谓助手也好或者说 AI 助理也好
他来去为你去创作内容同样会有这个信息分发平台的价值分发的东西和分发的目的可能也不太一样了就像我刚刚提到的他上游的生产的不一样分发的也不一样最终其实直接到了用户这边才会进行最终的生产会不会最后我的交互界面就只有那个 AI 助手所以最强大的是那个 AI 助手也不是一个内容平台
首先这个 AI 助手他还是得需要上游的内容提供者的而且每个人可能都会有自己的助手还是需要分发的价值的但是某种意义上用户或者说消费者他的话语气能够更强因为这个 AI 助手是专属于这个内容的消费者的是专门为他来服务的
这个很有意思所以说新的技术革命你认为会改变整个内容产业特别是内容平台所以有新的内容平台的机会我能简单的这么去理解吗我觉得可能是有的但是现有的内容平台它应该有已经有非常强的网络效应它也有非常大的一些优势但是你想做的是一个
我们想做的是一个更加为消费者来服务的或者专属于一个内容的消费者的他的这样一个信息助手所以某种意义上我们跟平台不一定是一个竞争的关系不是 AI 助手是一个 AI 信息助手至少现阶段更多还是想满足的是用户的个性化获取信息和消费内容的需求他可能还会有很多的需求
但这些需求可能也可以通过类似其他的 AI 助手来满足但我们现在就想把这一件事先聚焦做好你们现在的产品形态满足你的构想吗你觉得中间有多大的 gap 我觉得还是有很长的路要走的某种意义上我们前面花了很多的时间在尝试去填现在的模型和我们理想的产品中间差的那些技术的 gap
我们也标了很多的数据做了很多的模型的探索现在有一些初步的结果我们就想说快速去做出一个 MVP 出来我们可以基于它不断的迭代但是
距离我们最终的那个形态中间还是有好多的功能好多的迭代要去完成的可以在这里说一下你们的产品我们产品其实现阶段的话有 web 端也有这个 app 端 web 端的话我们更多是想把现在的一些核心能力去做展示就像我刚刚提到的现在的生成模型你可以丢给它一些内容然后让它根据你的指令的要求去生成相应的内容
比如说做一个总结或者问他一个问题据一篇一个文章或者一些内容然后他基于原始你提供的内容去回答但是我们发现说在这样一个场景下很大的一个痛点或者很大的一个问题没有解决的是现在大模型它的不确定性生成出来的内容有很强的随机性而且
里面确实会有错有所谓幻觉就是跟原文不一致的地方也会有一些漏掉的东西尤其现在漏掉的东西还挺严重的原文中可能提到 ABCDE 五个点但是他给你生成出来的内容可能就提到了 ABCD 四个点更重要的一点是 AI 对人来讲很难去验证就是我并不知道 AI 生成的这个东西到底是对是错
从客观上来讲它是有可能有错的但我并不知道它最有可能错在哪以及怎么去校验验证它对还是错我觉得这是一个现在我们看到的普遍的 AI 生成内容的一个困境就是用户很难完全相信 AI 生成内容而且很难验证它
所以我们现在 web 端的这个产品它做的很大的一个不一样或者说很大的一个突出的一个差异化的点就是能够做到 AI 生成的内容和原始内容有一个强的一一对应比如说原文是什么样的结构然后它就用什么样的结构来去还原原文的这些信息
但他去做了一信息的压缩他能够把这些内容去按照原文的结构去做相应的一些压缩比如说我们看到所谓智能大纲的模块就是告诉你比如说一篇论文摘要讲什么领持大致讲什么相关工作讲什么实验讲什么然后你可以层级展开比如说展开领持大致介绍部分然后又告诉你介绍里面第一段讲了什么第二段讲什么还可以继续层级去展开
就以此类推它能做到一点就是跟原文内容一一对应而且从客观上来讲它的幻觉非常低与此同时它不会漏掉原文的内容所以这个产品我们给现在的很多去所谓有研究需求的人群是能够解决他们对信息的真实性和准确性的这样一个要求相反现在很多其他的这种大模型的生成产品并不能很好的满足这样的需求他们生成的越短你可以让它生成的很长
但他不管生成短还是长他没法做到说清晨的内容真的忠实于原始的内容他好像 get 不到你需要的那个点有时候是
一个是指令的理解的能力第二个就是它是不是生成出来的东西相比于原来的东西重要的东西是不是都保留下来了原来没提到的东西它是不是也没提其实就是类似于这样一些基本的就我们称之为准确率和召回率就是是不是生成的东西又准又全外部端的一些产品工具的属性就是用户可以去上传内容给定链接或者给定一个 pdf
文件然后我们的产品能够对这个内容去进行解构去进行分析并且确保说它生成出来的内容都是完全的遵循原始内容的那我们移动端的话呢也是有这样一个 APP 它同样基于我们刚刚提到的模型生成的内容是完全遵循原始的内容的结构和顺序同时能够确保说我们生成的每一句话都是可经过验证的都可以让用户追溯回原始的那个片段或者那句话
但是我们移动端会跟 web 端有所不同移动端的话会更强调说它是一个直接消费内容或者获取信息的这样一个入口你可以通过订阅的方式去订阅很多的信息源然后它会把你每天订阅的这些信息源中对你来讲更有价值的那些内容去帮你找到
比如说我们觉得很有亮点的一个功能比如说 OpenAI 发了个新模型你关注了 10 个公众号或者说 10 个来源可能有 5 6 个都发文介绍的发新模型这件事我们可以自动的帮你识别出来这 5 个媒体发的 5 篇文章它是同主题的而且我把这同主题的这 5 篇文章把信息不重不漏的给你列出来这样的话你就不需要再去看原始的那 5 篇文章了而是你直接看专门为你生成的内容就好了对我看你们生成过美国大选的内容比较结构化
对就是结构化然后同时的话它做到这个原始信息的不重不漏后面你们会加播客的功能是吧未来的话确实我们其实也会去加更多模态的一些支持这个产品为什么叫语精几个角度吧就一个是精这个动物它还是在所有的动物中智商比较高同时的话它有自己的这个语言的它可以通过这个所谓精哥两个同类之间进行交流它有自己的比较简单的语言
然后第二个呢就是鲸是一个比较大的一个生物我们希望说它能够去存储和记忆足够多的东西未来真的成为你的所谓的 AI 的信息助手的时候它一定是要帮你记住很多的东西同时能比较聪明地帮你处理很多的东西的你们的第一批种子用户希望是谁我们的第一批种子用户其实我们称之为就是各种泛研究人群就是比如说你需要去
读一些论文然后包括一些研报还有读一些比较长的一些报告等等这样的一些人群因为这些人群首先他的信息获取的需求是一个强的刚需必须要获取第二个他要获取的信息量一定是非常多的因为我们所谓想要做好一个研究的话他一定得获取足够多的有价值的信息
然后第三呢就是它对于信息的准确性真实性的要求也是非常高的那我们这个产品其实就比较好的满足这样的需求一方面它能够通过 AI 去加速你获取信息的速度和效率另一方面它能够确保你看到的 AI 生成的内容是准确的真实的而且是用户可验证的你们是中国的什么什么吗我们其实在做这个产品的时候没有想过必须要去做中国的什么什么东西没有对标嗯
对反而在某种意义上我们的这个技术和产品其实在全球范围内来讲吧也还是有它的创新性的所以我们将来也会在海外去推我们的产品嗯
你们现在到要去做增长的阶段没有需要推广吗我们现在还没有到这个阶段因为就像刚刚提到的我们产品刚刚有可用的一个版本然后更多我们理想中的一些功能还没有完全加上其次的话就是也再去找一些早期的一些内测用户去做一些试用然后去做这个产品的迭代怎么非常直观的去理解你们公司和 Kimi 月事 M&M 之间的区别
我觉得区别还是蛮多的吧首先第一个我们还是首先想做好一个产品然后才去考虑说需要去做哪些技术哪些是可以我们自己去做哪些可以这个借助现有的一些技术我觉得这是一个很大的一个不同然后第二个呢就是从产品的形态上和解决的问题上也很不一样有多少人跟你说你应该做一个 Foundation Model 的公司没有确实有多吗
也有不少尤其是在去年的时候因为本身我们算是很早入局很早就开始做然后学术积累也比较深厚然后你是怎么说的呢当时我觉得首先还是从我自己内心出发就像所谓初心吧就我自己创业还是
因为我自己认为说想做好一个产品相比于做纯粹的技术研发来讲我觉得做产品对我来的正反馈或者说我认为能够给我更大的一个激励和价值其次的话我当时比较理性的去做判断也认为说将来可能没有一个所谓的 Foundation Model 的公司可能短期内会有但是未来肯定这不是一个终极的形态
不管是从竞争也好还是从它真正能创造的价值也好我认为你最终真正能做的还是说做好一个产品不管是从我个人的价值驱动来讲还是说更好地把这个公司的价值做后也好我觉得做产品才是我们更正确的一个选择你觉得 Foundation Model 这些公司最终会怎么样这个行业的格局会怎么样
我觉得他们都会去找到自己的产品的方向或者说某个应用落地的一个方向其实某种意义上现在已经在进行中了将来我认为是就像我刚刚提到可能不会有所谓的大模型产业或者说大模型公司就像 10 年前或者 20 30 年前的时候很快时间就不会有所谓的互联网公司或者移动互联网公司了
更多它是有这样的技术属性但它还是得落到某些特定的一些场景特定的一些应用之中你觉得你是一个好的产品经理吗希望能够变得更好吧至少对做产品来讲我是很有激情和非常热爱做这个事情的你觉得你的优点和弱点是什么
我觉得优点是我还是一个比较追求极致和追求完美的人希望把一个事情做到最好但与此同时它可能也会是我的弱点有的时候你需要更加考虑你当前的现实的环境考虑你所拥有的资源在某些方面去做出一些妥协你觉得今天相比去年大模型或者 AI 进展到什么样的阶段了
我能感觉到就是从体感上今年和去年还是差别很不一样特别是现在这个时候对吧对我觉得从大家的体感上肯定相比于去年会有所降温如果说用那个 Gartner 那个曲线的话它肯定是这个在下降吧但是我觉得很快可能就会再恢复到这个上升的一个阶段通过什么肯定不是通过 Foundation Model 吧
房地产模特会有影响它能带来增益再降低但我觉得更主要的来自于说大家对这个事情的认知在逐渐的提高对它的能做什么不能做什么它的
长处和短板有更深的了解有了这个了解之后我才开始进入到下一层我跟我想做的这个产品或者想满足的需求相比哪些是已经 ready 的哪些还不够有些可能我就不能做现在做不了有些就是我需要想其他办法去填补这个 gap 那随着大家认识到这一点然后开始去转向更务实的去填那些目前他不能做好的这些 gap 之后我相信更多好的产品就开始会出现了
明年上半年好的产品会出现对我相信在半年到一年的时间因为这个行业还是有太多的人和太多的资源大家付出了太多的注意力在这样一个情况下它是会以一个前所未有的速度来去进行演变的你现在有看到什么好的产品没有不管是国内还是国外我会比较关注一个是跟我们做的再一个大的类型的这样一些产品还有一些就是内容产品对吧
对跟这个信息的分发或者说内容的消费是相关的一些产品然后还有就是我自己作为一些用户吧就会去体验很多一些产品比如说像前段时间大家用的比较多的 Cursor 这个产品我觉得还是一个很好的产品
它其实体现出几个点吧就一个是它能够让用户更加被动的去用起来这个产品原来的一些 AI 编程的辅助编程的一些产品基本上都来自于用户的主动的需求需要输入指令但 Cursor 有很多细节之处我觉得做的比较好的就是它可以主动的提醒你有些地方需要改有些它认为说它可以提出一些建议
然后这是其一其二的话就是我还是蛮喜欢 Cursor 这个产品因为它比较符合我做产品的风格或者理念它能更被动还有呢其二的话它真的做得非常细致就它把细节打磨得非常到位它一定是自己在深夜里自己编程的时候遇到了很多 bug 或者说解决了很多问题的这样一个必须有一手的这样经验才能做出来这个产品
有非常多的一些细节的支出比如说包括变量名的批量的修改等等很多这些地方他都会去考虑的非常周到能看得出来他就是很用心的而且他是在产品达到一个比较 ready 的状态其实这家公司也是有好几年的时间了但前面他一直比较低调一直也都没有正式的发产品或者推产品
但就能就是把这些细节都打磨好之后做到一鸣惊人除了 Cursor 除了 Cursor 之外还有一个是跟我们比较相关比如说像 Notebook LMGoogle 的这个产品同样也是说它在将近一年半之前就做了第一个版本但中间一直在迭代因为有了 AI 生成播客这个功能一炮而红它背后反映的也是说去
原始的内容通过 AI 技术之后加工成一个新的内容然后这个新的内容是满足用户的个性化的消费需求的你可以输入指令来去控制它的播客的一些要点或者风格同样的话它的模态也做了变化原来可能就是图文的模态或者你也可以导入音视频但是它最后都可以转成音频的方式让你来去做消费某种意义上它的爆火也帮我们局部的去验证了借助 AI 能力之后为用户去生产
还有什么产品吗 Populacity
Property 这个可能大家知道的比较多了我觉得它跟我们的共性在于说它同样是借助 AI 的能力把内容这个边界去打破了不是说 AI 搜索本身上就在做这个事它可以基于你的需求从原始的内容里面去找到你需要的信息最后重组成一个新的内容这一点上我是非常认同包括我们也是在朝这个方向在去做但不同点在于说它是需要用户主动的
它是需要用户有了一个主动的需求或者有了一个把这个需求转变成问题然后通过这个产品发出再去获得到他想要的东西但我们某种意义上是希望能够去做的让用户更被动一些让用户能够不用再消耗那么多的脑力和精力才能去获取到他想要的内容
从海外直接 coffee 一个产品过来是不是更容易在我们自己真的从零到一做了一段时间产品之后发现了脑海里我想的就像一个航海一样就是当你没有一个航海图的时候你的难度和不确定性比你有了一个航海图尤其是有人告诉你怎么走能到达一个彼岸的时候这个不确定性下降的可能是你难以想象的是有好几个数量级的下降的但如果没有航海图的时候
你就只能靠自己心里的那个想法或者你心中相信的某个那个目标去往前走其实就像那个哥伦布发现其大陆他一开始相信说去沿着这个大西洋去继续往前走是能找到印度的
但这个没有人验证只是他心里存在的某种信念某种理想但是在这个过程中就是有大量的挑战非常多的挑战而且最后他也没到印度他最后到的是北美但我自己某种意义上觉得创业真的挺像航海这个事情的尤其是如果你想做出一些真的差异化的别人没做过的事情的时候你其实没法按图索金你没法看着一个航海图或者寻宝图去找你只能相信自己内心的那个信念然后
然后遇到什么问题解决什么问题而且你可以想象就在海上茫茫无际四周都是海也没有什么灯塔而且临行可能会有一些其他的船只过来但很快又有过去你能看到的就是永远都是海然后头上可能有太阳有月亮有的时候是晴天有的时候是雨天有的时候很平静有的时候葡萄穷有但是你要做的就是自己相信
前方的那个目标然后还有这个船上有一船同样跟你相信那个目标的人带领着大家不断地往前走最终还有有可能你到的真不是你一开始设定的那个目标但也是一个不错的一个结果你刚才关于内容产业的变革这个是你从原点思考的吗是你什么时候思考清楚的嗯
我觉得是不乱的在迭代其实从 2020 年 21 年我就在想这个事情我是一个 INTJ 我是一个很强的 J 人我希望所有的事情所有的信息都能够非常好的 organized 然后我能够在单位时间内解决的问题获取到的信息越来越多越多越好所以我一直都在想
怎么去解决这个问题然后所以我之前也探索了非常多的产品但发现都没有一个解决好的一边的话就去看技术的进展一边的话我自己也不断去琢磨这个事比如说有灵感来源像那个斯蒂芬·宾克说写作就是把网状的思想用树状的语法写成线性的文字这个思想某种意义上就在影响我们现在的生活
我们的产品就是把比如说刚刚提到智能大纲它其实是作者通过竖状的语法写成了线性的文字那我们的产品就尝试把线性的文字还原成竖状的语法然后就能够把这个信息变得更结构将来有可能再还原成一些网络的思想或者说某种意义上当你有很多的内容的时候它就形成了一些网络怎么去把这些源头的这些创作者想表达的信息和他的这些想法拿过来最后再去创作出内容来
其实就是在这个过程中读读的时候也看了很多语言学的一些书也体验了很多的产品包括我记得当时比较火的双链的笔记等等都给了我很多的一些启发比如说像现在 Publica City 这个产品已经成为了一个相对成熟的产品形态 Copy 不就好了吗你有想过吗
其实就像我刚刚提到我们 20 年上半年的时候是考虑过这个事情的就 21 年底的时候 OPI 推出 WebDVT 那个某种意义上才是 AI 搜索的
最早的一个产品我理解然后 20 年上半年我们就 follow 他做了一个 demo 也是一个 AI 搜索的一个 demo 借助我们当时研发的大模型那后面没有决定说继续朝这个方向去做有几个因素就一个是当时还是考虑到竞争的关系吧因为对于现在的搜索引擎公司来讲它有现成的技术数据
市场用户去做 AI 搜索理论上来讲其实它是最适合不过的这是当时我的一些判断然后第二个的话就是尤其在国内搜索这个场景跟国外相比还是有很大的不同因为国内的上游的这些内容源或者说数据会更加的分化在更多的一些平台上而不像国外的话搜索的数据会更加集中一些包括用户侧来讲大家使用搜索的这些频率和视频
所在的这个场景也不太一样这是第二方面第三还有一方面就是我始终觉得 AI 搜索还是需要用户消耗他太多的劳力成本来去做思考做输出我希望去做一个对于用户来讲能够更广泛的使用更低成本的使用的这样一个产品方向这是比较理性的思考非理性的来讲的话
我自己确实不是一个喜欢做跟别人一样的事情的这样一个人不管是我之前做研究包括我做的很多的选择然后再到我们现在做的产品方向我希望还是去做一些不一样的事情因为不一样你才能够有价值从刚才我们说的这几个产品里面你有学到什么吗
我听起来他们可能都做了很长时间有很长时间的低沉的时期但是通过一个功能可能爆红是的对这其实也是我们包括前段时间还在跟大家讨论的功能要有所谓的基础功能也会有一些所谓的爆点功能其实我看 notebookLM 的产品负责人介绍的时候他会提到确实相当于部分人是因为他的 AI book 功能来的
但是更多的人是因为这个知道的对是因为这个功能知道这个产品但更多的人留下其实并不是因为这个功能而是因为他的那些基础的那些能力
所以我觉得这两个能力都得有我们之前可能花了很多时间在打磨这个基础能力上未来的话我们会用更快的节奏去推出所谓更多的爆点功能或者说能够让大家更耳目一新或者说更有传播效果的一些亮点有踩过什么坑吗这几年踩的坑还是相当多的某种意义上我自己其实是
算是非常年轻吧就是之前一直在学校里面读书然后没工作过毕业之后就直接创业某种意义上还是竞争比较激烈的一个赛道然后中间的话虽然我们公司时间不长但是也是一开始比较低后面一下子爆了然后后面的话又看到说大家逐渐的回归理性经历了一些小小的起伏
我自己其实完成的一个转变是原来就是在学校里面做研究虽然说做过一些产品的尝试但更多还是以研究为主现在要开始去从研究变成做产品甚至最终是做公司最终我要 build 的是一个公司然后我也要从一个人或者说带一个很小的团队大家也是一个工种比较单一的团队
一块来去做研究现在变成一个带更大的团队而且大家的有更多的分工去做一个事情这里面其实都有不小的挑战比如说第一方面就是怎么从研究思维转变成公司或者说商业的一个思维 CEO 思维对 CEO 思维这里面其实有很多转变就像我刚刚一开始介绍到的做研究你只要在某个点做出突破就够了但做产品做公司有的时候你不能有短板而且得有一些长板
然后从一个人做到带很多人做也不一样从一个人做你的所有的信息就在自己的脑子里即使就同步的但是带大家来去做的话你就需要去发挥每个人的长处然后你需要把该有的信息都同步给大家这些都是会有一些挑战我觉得到很难说是有特别大的坑但确实有很多的一些小的一些问题或者说各种各样没做好的一些地方吧比如说嗯
比如说我之前干过一个挺蠢的事情很早的时候我自己是一个非常 J 然后愿意去把所有的事都变得非常 organized 的一个人所以在有一天我就把我们公司所有人的邮箱名都改成了一个非常标准的格式都是这个名.syn.at 然后 deepline.ai 的这样一个格式公司不都这样了
对但是其实他不一定非常要求这样把这个点去做的那么的精细的因为比如说我就姓加名然后后面加个编号啊等等也都可以但我当时就是为了把这一点去做到最极致按照我想象中的非常结构化的这种方式去呈现然后就改了但后面看来这个事情的收益是没有成本高的但是可能是不是有同名的人如果还是英文名的话会不会同名啊
会有同名所以要点姓然后后面再加编号但是成本很高你改这个事情给大家带来的成本会比较高的为啥呢比如大家的所有的邮箱都改了你原来注册的一些账号啥的可能都会受影响是什么成本高是哪方面的成本高技术成本高不是技术成本高是大家的切换成本会比较高
现在看来其实是一个很难以理解的一件事情但在当时可能就是希望说所有的事情都非常的有条理有组织但随着时间的推移会认识到说这个事情它其实有成本的这个世界的商增是一个必然的趋势你想要把商降低你就要付出成本
那你就要考虑好说这 RI 是不是是正的你为了降低某些环节的伤你付出的成本是不是值得的现在公司有多少人现在我们有 60 多人你感觉管理有难度吗我觉得现在比之前应该已经有了很大的一个好转了吧
对,在一开始的时候,比如说尤其 23 年的时候,我们是从一个十几个人的团队,在小半年的时间一下子增长到四五十人的这样一个团队,在那会儿其实还是要去解决很多团队的一些管理的一些问题的,但是最近这半年多的时间就逐渐开始适应,开始学习提高,所以现在的问题已经好很多了。我觉得你的性格好像比较温和,有发脾气吗?
我确实对外直接发脾气不多对内呢我自己内心有的时候会去想这个事情比如说也会懊恼会因为一些细节没有做好而生气我对外的话就是还是去想清楚这个事情发脾气可能并不一定对于你的结果是有正向帮助的你觉得 90 后的 CEO 和 80 后的 CEO 有什么不一样
这个问题之前还真没有想过就是我觉得有很多因素会有影响吧尤其是一开始的这个时代比如说在你大脑发育最主要的这样一个阶段当时的国家所处的环境和国家所处的阶段可能会带来一些影响
对我来讲的话,某种意义上我也算是比较早的互联网的原住民了,我从七岁的时候就开始用电脑,所以从小学到后面所有的时间内基本上都跟互联网都跟电脑都离不开,然后中国的综合国力其实在当时即使比较深的时候一直都是在向上,一直在越来越好的这样一个状态,
我觉得这个可能会带来一些变化吧就是比如说从对做事情的一些决策还有说做产品的更大的一些视野啊等等我觉得会有一些不同怎么说比如说我认为现在创业 Day1 开始就需要格谋就需要去面向全球而不是只是面向中国市场嗯嗯就是跟
现在的国际环境现在包括技术带来的它的一些变化很相关的但比如说再推到 10 年前十几年前可能当时的那波的移动互联网创业大家更多还是说先把国内市场做好然后再去做国外市场 90 后会更幼稚吗这点我觉得倒未必我很难从一个群体的角度去看这个事情你觉得你呢我觉得某种意义上我还挺幼稚的在某些时候把一个事情我希望用最简单的方式去思考它而不是
去说就考虑到特别多就是说我要这个目标我就是想把这个事情怎么把它做到最好怎么来对我觉得 90 后好像脾气大都会少一些我在身边确实没有这样的数据让我去做对比你会有这样的这种体感吗因为我觉得这一波接触的 90 后 CEO 都是技术型的 CEO 就我觉得他们不太会用那个情绪去做管理对某种意义上是比如说我之前接受到训练
就是一直是这种理工科然后做计算然后去做理论然后去做推导其实我在解决一个事的时候会以理性为主吧去思考这个事情会两面三刀吗对我来讲还挺难做到这一点的比如说我们去年融资也好或者很多时候也好我们就一直讲的这个我们想做的事情从一开始想创业到现在一直没变过也不会大发雷霆是吧在公司
这个在公司从来没有过那如果员工不服你怎么办你怎么管理比你更成熟的管理人我觉得大家只要是都是在成年人的这样一个基础下其实是有共识可以基于这个共识去做讨论的我并不是一定是因为我是 CEO 我有这个角色所以大家都应该听我的而是说我们因为有前面的共识所以很多事情都是可以讨论的然后大家的逻辑还有价值观在一致的前提下
可能会因为掌握的信息不一样而做出不同的决策但是当我们把信息去拉齐的时候其实在大多数情况下决策都还是能够达成一致的你喜欢你的公司的管理者做信息差管理吗我非常不喜欢为什么呢因为我觉得这对于我最终想要达到这个目标来讲某种意义上它就是一个低效的行为那如果有更资深的职场人士进入你的公司他们用这套方法来做管理你会怎么办
我觉得对于我们来讲其实公司是有一些机制来去防止这样的事情来发生的比如说前段时间我刚跟我们的公司的其他的同事一块去沟通我们每个月都会有一次这种比较坦诚的一些沟通大家有任何问题都可以去做交流也希望通过这个场合能把所有的信息大家关注到的信息都能够拉起来
我相信这个是公司文化吧是需要通过一些首先比如说像我的一些性格和我做事的一些方式然后把它转变成公司的一些制度和一些准则然后让大家逐渐的都去遵循这样的一些准则来去做事情你会给大家画饼吗
怎么理解画饼就是从我理解意义上来讲画饼就是我要给大家描绘一个愿景这是我心里真正想到的就首先一个前提就是它确实是我真正想做的也是我们从行动上想要去达到的那个目标
那就像创业你不可能说你都是把所有的东西都已经做到了现成的然后大家才来这样的话可能对大家来讲也没有真正做的空间和价值了那我肯定得去告诉大家我们想要去达到一个什么样的目标为什么我们要达到这个目标如果达成之后对比如说这个社会或者更多的人我们的产品的用户会因为有了我们这个产品额外得到什么价值
这个事情肯定需要不断的给大家去讲而且我们也一直在朝这个面而努力所以如果说这叫画饼的话确实我觉得必须得画饼你觉得 AI 公司的组织形态和以往的公司有什么不一样比如说互联网的公司我觉得很大的一个不一样就来自于它的底层的不确定性可能更多的公司我不太了解比如说和互联网或者移动互联网相比他们的业务其实特点是不太一样的就像我刚刚描述到互联网和移动互联网它的技术是相对确定性的
你的开发这些东西是确定性的所以在这些确定性的前提下做事情的时候它能够有更加明确的目标然后有更明确的一些节奏可以去做对于组织上来讲某种意义上分工协作的难度也会低一些但是对于大模型的产品来讲它的模型的输出的不确定性非常高甚至对于传化工程师来讲这个东西到底能不能做能不能做成大概要什么时候做成这些的不确定性都非常高然后这些不确定性就会
一层一层的去影响这个组织比如说涉及到你组织怎么去定目标然后不同团队之间怎么配合大家的信息是不是更快的能够拉起都会带来影响所以从最终的结果上来讲第一个就是我认为就是大模型驱动的或者 AI 的公司它的信息的传递效率和这个信息大家在信息上的达成的一致度要必须得更高
因为只有更高才能够更好的去做出决策而不是说就有一个确定性的一些接口我只通过这个接口来去接收数据和传出数据这个可能放在之前的一些形态下可能是 OK 的但放在现在形态我们认为是不行的因为这里面很多的东西都是不确定比如说这个东西能做成这个事情是没有意义的可能它意味着说是在什么条件下然后在某些指标可能能达到而且是在什么数据下能达到一个什么样的指标
可能这才是真正有信息量的或者是大家能达到沟通在通过沟通能达成一致的地方然后第二个就是对于个体来讲他要去覆盖的链路要更长这同样是来自于刚刚提到的不确定性他如果只知道自己环节的东西的话他很难理解上游和下游这些环节到底会对自己环节有哪些影响归根到底我认为他的底层
这个差异化的原因来自于说现在我们在做的这个事情它很大的程度上依赖于算法模型但这个模型它的不确定性还是非常高的人数应该控制在多少是合理的我觉得这个没有一个很合理的一个计算吧因为组织它是有反规模效应的我们尽可能希望说在相对有限的这个组织内去尽可能做到我们当前能达到的一个目标但是比如说随着业务的增长然后尤其未来还有可能有新的一些业务出现
这个人数肯定还是会增长的对 25 年的 AI 战局做一些预测什么时候会引来 AI 的大爆发时刻对我觉得 25 年就有非常大的概率就会去爆发它的核心的这个底层逻辑就是大家越来越了解现在大模型它能做的事和它做不了或者做不好的一些事情并且我们也关注到有更多的团队开始尝试用其他的手段去补足它的这些能力
我相信到了 25 年的话随着这些能力的完善就能够去把这个拼图的最后一块给拼上然后就能有一个更完整的产品出现了然后再往后走的话其实才是开始有新的商业模式的一些出现这其实也是我认为会挺有意思的一点你们的商业模式准备怎么设计的
就是一个是现在还是一个比较开放式的一个问题我们也会去探索这种前向付费的一些模式就通过订阅然后去有更高级的功能同时的话我们也希望去探索一些新的模式大家也在讨论说现在的流量变现其实已经到了一个相对固化的一个形态了但是将来的
比如说有了 AI 之后尤其有了 AI 及时的生产个性化内容之后那怎么在这样一个技术背景下去做新的一些流量边线的模式我觉得还是有很多的可能性就像这个 Proplicity 的 CEO 他们也在尝试去做这方面的探索
怎么看创业公司和巨头的竞争我觉得某种意义上在这个赛道其实竞争是更加直接和激烈的因为它的一个特点不同于之前的一些行业尤其不同于比如说比较可类比的是上一代的 AI 因为那会儿我正好在投资公司去看这个上一代的很多的 AI 公司
当时在 AI 直接的一些储备相对来讲没有那么多所以对于那会儿的 AI 初创公司来讲是有更长的时间窗口和更长的一些领先的一些先发的一些优势的但是现在来讲的话就是大家很快就在 AI 这个事情上达成了极强的共识并且大公司在这方面的人才储备其实是非常足的相比于上一代的 AI 所以我觉得竞争会比之前会更加激烈
然后与此同时的话创业公司在前期的这种先发优势的建立很快就会被抹平了并不是说因为你做的早那么半年一年你就能够去建立巩固出来这样的优势所以核心还是要去做对于大公司来讲他自己很难去做或者说
他自己并不愿意去做的一些事情当然说现在他不愿意做的事情比之前要少很多因为投入的资源很多但是能做的事呢比想象中目前看来还是要少的所以他投了这么多资源要做的事就开始渗透可能原来看起来更小一点的事现在也会有人去做了比如说可以去学习一下像 Property City 它是在 Google 这样一个巨头的
大树之下然后能仍然去做 AI 搜索并且发展速度非常快这是一个很值得学习的公司那你觉得创业公司跟巨头之间是什么关系呢合作关系我觉得竞合关系都会有吧比如说也会用到大公司因为大公司现在尤其互联网公司它提供各种各样的基础设施各种 API 包括说它也占据了当前的一些流量的入口你也需要通过它的这些平台去做投放做推广
我觉得这些一定都会有非常多的一些合作当然他还会通过投资等等的方式来去跟这些初创公司进行合作然后在很多的一些业务上也会有一些竞争所以 90 后做 AI 创业是不是更难了相比以前我觉得也不能完全这么说就一个是从客观上来讲
它面临的环境会更复杂你要处理的信息会更多要考虑的方面也要更多但另一方面其实所谓 90 后它的生长环境和它能借助的工具也越多所以整个历史的发展都是在朝着这个方向去走的随着技术的发展
各种设施新产品新的物种新的内容新的各种东西的出现你会看到就是说你能接触的东西越多但是你处理的事情也在变复杂好像回到我们这个产品我们想解决的就是这个事至少在信息上信息在越来越多
那可能你要面临的决策想做好一个决策你的决策空间变大了你的竞争肯定变多了有的人他就是能占据掌握更多的信息他能处理的信息的能力越强可能他能拉开的优势越大核心就看说你能不能借助最新的一些力量借助最新的一些产品和一些新的工具去提高自己的生产力提高自己的这个竞争能力你觉得 90 后看待成功和 80 后看待成功不一样吗你怎么看待成功嗯
我自己会觉得成功是一个水到渠成的事情首先你有一个更高的一个认知你能认知得到说你想要做的这个事它的核心要素有哪些然后的话你把这些要素去做到了其实成功它是一个结果
就是它自然而然就会去出现你对多大的成功有期待吗如果从创业的角度来讲毕竟这也是我的第一次创业我从底层的出发点来讲更多还是说希望把我们的这个产品做好然后有更多的人去愿意用它喜欢它这个对我来讲某种意义上已经算是一个成功了
更往前走一步就是我能够对这个产业对这个行业带来一些变化那这个对我的成就感可能会更强你想象过你的公司最理想情况下会长成什么样我觉得有非常多种可能可能会长成一个就像我刚刚描述的真的为每一个用户都去有一个
专属于个人的这样一个智能的一个信息助手有越来越多的人都能够用它都能够借助它去拓展自己的这个信息处理一个边界我觉得这是对我来讲成就感最大的一个事情最差会怎么样公司会因为什么原因死掉死法其实还挺多的之前看过很多这个创业的一些故事或者说一些传记会有各种各样的一些原因不能有短板吧某种意义上如果创业不成功如果创业失败你会去干嘛
我自己大概率还是会再去创业最近让你最困扰的一件事情是什么怎么去把我们的研发迭代的效率和用户的反馈这样一个链路能够去建立的更通畅和运转的效率能够更高因为我们现在随着产品的正式的
有推出虽然说用户还不多但是也开始有越来越多的用户然后大家有越来越多的反馈比如说原来就会有很多的想做的产品的需求然后用户也会提出来然后怎么去把所有的这些数据去拿过来去做一个处理分析最后转变成我们组织的行动并且能比较高效的去完成尽可能多的这些需求这个事情是最近在
花了很多时间在这去做的你信仰 AGI 吗我觉得不同的人心中对 AGI 会有不同的定义我认为说他的思考知识推理包括语言交互这些都是必须的那还有一个很重要的点就是他能够有自我的意识从这样一个点上来讲我肯定
非常希望或者说我对于 AGI 到来这个事情是非常激动的但是我比较理性的去思考这个事我认为我心目中 AGI 可能短期内很难去达到和实现
短期是三五年对三五年这个迟点迟读上甚至更久有一些 AI 公司不融资怎么判断公司需不需要融资呢他们现在是不是出现了一种新的说法是 BOOST TRAP 自力更生低成本创业是就是融资做产品和不融资做产品有什么差别
我觉得其实跟是否 AI 可能都不一定直接相关就像之前的一些公司很多的公司也都是不融资然后到了某个节点或者说就一直都没有融资的一些公司也有做得很不错的核心还是怎么去正确的看待融资这件事情我觉得融资就是一个加速的事情它能够让你在比如说原来按你生产出来的利润比如说需要 5 年的时间才能够去做基建的一些投资或者一些技术的投资
但通过融资能够把这个时间去缩短还有的话就是有些公司前期是需要去做技术的投入和一些研发的一些投入的没法去盈利但到了某些节点形成了某个状态之后才开始去做盈利对于不同的类型的公司我觉得需要去正确的去看待它到底是不是需要
有些公司可能从 D1 开始就是盈利的然后它盈利的获取到的利润和它去进行公司的发展或者是一些技术的投入它的资源是够的那它确实就不需要融资你们怎么看待盈利这个事情你觉得在什么时候需要开始赚钱
我觉得首先盈利是对于一个公司来讲最核心的或者说最重要的一个指标就是你一做一家公司你如果想证明它的价值因为商业价值其实底层还是它的社会价值你证明它这个价值不用说别的你盈利就是一个很关键的指标如果你这家公司都没有赚钱的话那你可能就不适合做一个商业的公司
比如说你做一个社会的机构等等也好这样的有可能是更适合如果你不盈利的话但是盈利这个事情尤其我们看到过去的一些这种互联网公司它可以是靠前面去有很多的积累然后到了某个节点之后再去考虑盈利的事情
对于 AI 的很多的产品上来讲我觉得现在谈盈利尤其作为 2C 的产品来讲可能还没到那个阶段商业化前提一定是先把产品价值做出来先把用户去更广泛的验证把产品真的能做好我是底层相信说只要这个产品真的给用户带来了不可替代的价值的话它是一定能够去通过各种方式赚到钱的
但现在我觉得我们可能或者大部分 AI 的这种产品公司还处在怎么去打磨好产品怎么去对产品进行迭代让用户认为说这个产品能给他带来不可替代的价值所以先把产品化做好其实再进入到商业化的这样一个阶段至少对于 2C 的产品来讲在很多情况下是这样的你觉得一个 AI 公司的 CEO 需要哪些能力上线我觉得首先技术还是非常重要的因为大部分
大模型它这项技术或者说 AI 这项技术它和其他行业我认为可能有不同的点在于说它还在一个快速演变这项技术它是一个完全在数字世界中进行迭代的一个技术所以这就使得说它的迭代速度会非常快那它迭代速度很快的话就会看到说这个技术的变化会比较快
又因为大模型的这个行业里面技术对于最终产品的影响是非常大的所以这个现状就会导致说你必须得对技术的原理以及技术的一些演变趋势有一些了解这样你才能做出正确的战略决策比如说你要去做某个产品或者说做某个业务现在有可能说这个现在的技术是达不到的那你如果说等这个技术都已经达到了那你再去做可能已经晚了
因为在这个赛道里面已经有非常多的玩家了但你想要去投资或者说想要去赌一下现在还没做好的一个事的时候你需要有一个判断说他到底是现在的技术压根就做不到还是说有可能经过一段时间的迭代就有可能能解决这里面其实最大的不确定就来自于这些技术的判断
然后除此之外的话就是快速学习能力我觉得也是很重要的这个同样来自于说这个技术的变化会带来产业格局的变化会带来很多的一些影响怎么去更快地跟上这些变化其实也非常重要最后几个快问快答全球范围内一道你最喜欢的食物妈妈做的手感面你是哪里人我山西人所以对面是情有独钟
一个你最喜欢的地点还是去了很多地方但是现在让我想的话还是我小时候住的小院中间有一块地然后一个院子在小学六七年的时间都是在那边度过的一个很少有人知道但必须了解的知识点我觉得不确定性也是可以建模的我是学了随机过程这门课之后有更深的一个感悟虽然说很多的事情都是不确定的都是未知的但是不确定和不确定也是不一样的
其实你可以通过一些手段对它进行研究的基于所有你读过的书推荐两本书一本是《自私的基因》它是能够帮助我从更加理性的角度去思考人物种以及相应的它做出的很多的决策第二个就是
学会提问批判性思维指南这个其实是一个逻辑思维和批判性思维的一个很基本的入门的一本书吧但是其实它应付我们工作中的大部分场景也足够了说一个你现在观察到的有潜力的创投机会我自己了解到的我觉得是在养老这个大的话题上或者说怎么去解决
老年人的他们的很多的需求这里面我觉得是会有很多的机会的因为我父母其实年纪也不小了然后包括我很多的一些亲属他们上了年纪之后其实有很多需求是现在的产品没有没满足好
听过我播客没有经常听哪一期印象比较深正好最近刚听了开复老师的一期播客他可能对美国那边的信息也会了解更多也是通过播客了解到更多的一些视角包括说对于 HIA 的他的一些认知然后以及对于你刚刚其实也提到说 OpenAI 所谓是不是能成为一个垄断的路口有没有什么建议
我觉得首先做的非常好现在真的听播客的人不算特别多然后能愿意去通过播客这样的形式去比较深度的把内容呈现出来我觉得已经非常难得的一件事情了
好了,这期节目就是这样,如果你喜欢我的节目,欢迎前往苹果 podcast,腾讯新闻,小宇宙,喜马拉雅,QQ 音乐,订阅张小俊商业访谈录。如果你有其他想邀请的嘉宾,想听的内容,或者你有任何想探讨的话题,都欢迎各位听众朋友们在评论区里留言。那我们下集再见,拜拜。