你今天这个产品至少已经有 60 分了我那个大的方向已经确定了然后我能够慢慢收敛说我能不能把这个我的这个领域的问题定义成一个可以验证跟评估的数据问题然后倒过来反向来推动模型的迭代
如果你真的相信 AI,那你就投入吧,他应该把预算加大,把时间周期拉长,但是不要轻易觉得这事情短期内就能成功,但也不要因为一开始可能花了 10 万 20 万,这事情没搞成就觉得这事情不要搞,他应该把他的预算变成一个线性增长分布的斗司。
这轮 AI 最终带来的是组织内部的形态肯定会大变之前是我因为做这个业务导致我的组织发生变化今天是说引入 AI 这个事情本身要导致组织变化 AI 其实不太像电商或者不太像做 APP 比较像从纸质时代进入 PC 时代
好 欢迎大家来到 AI 练金术虽然最近有没有什么好玩的事情发生没有什么有意思的产品或者大家值得关注的事我自己最近反正我观察到一个事我觉得挺有意思的就是说或者这类的 AI 产品公司又有一个转折点就是 Curso 开始搭自己的团队去虚拟模型了
OK 就是他不是一直用 Cloud 吗对当然他现在应该开始组这个模型训练团队了然后就偏向于强化跟 post-training 不是说做预训练就是大概率应该是他们会基于开源的这些模型做 post-training 在他自己的产品场景下他应该开始会干这个事了一个应该是挖了一个 Mid-Journey 非常核心的人然后挖了一个好像是原来在学数据的一个 Professor
我的一个名字我不记得了但是我觉得这个也算是个转折点吧因为我觉得之前其实就大家一直有一个
有一个比较大的命题嘛就这轮 AI 的产品到底该怎么做对吧有套壳流跟模型训练流两种一种套壳流是觉得说这些币源的 API 也好开源的模型效果非常好嘛所以你其实没有必要做任何跟模型训练相关的事情对吧然后从这个角度来讲我觉得 Cursor 也是一个典型的这样的一个
产品吧它能够起飞是高度依赖 Cloud 的几个大的版本发布基本上是 GPT-4O 跟 Cloud 3.5 两个版本的发布我觉得帮 Cloud 搞了海量的流量海量的用户然后后来我觉得有大量的这些编程工具其实都干了类似的事儿对吧就后面的什么 Bolt.new 什么 Loverball 反正 WindsurfWindsurf 是不是也是自己做了一个模型
我印象中反正有一家有一家头部的是自己的模型有一家就是你刚说的四家里面我忘了是哪一家据我所知应该没有吧 Windsurf 的母公司是叫 Codium 吗没有 Codium 最早也是个插件它作为插件最早是你也可以选一个模型的
就可以配置一个选择模型它可能做了但是它能够起飞是因为最后还是选了 Cloud 3.5 然后做这种偏前端应用的这样的 APP 吧就是你基本上输点场景上下文它依靠 Cloud 的这个能力就能帮你把这个偏前端的 APP 就立刻做出来嘛
那你既然讲到这个我问你一下就是那个 Cloud 出了一个 code 那是干嘛的它是跟 Cursor 竞争的东西吗我觉得跟 Cursor 的 agent 或者以前叫 composer 这个东西比较类似的一个竞争的一个东西吧当然你现在也不能叫竞争了因为它第一个它是个开源的应该能叫开源的吧怎么定义这个东西呢它其实是个 agent 嘛
对我这样的人有用吗?有用嘛,你也可以直接用 Cloud Code 来写代码吧。来看,我还没试。他用 Agent 的工具来帮你写代码。我觉得比较像 Cursor 的 Agent 的版本,只是说我觉得它不能叫开源,因为它背后模型其实也不开源。但实际上它走的,本账都是通过 Cloud 本身的
API 吧那你刚刚讲这个是比较有意思的嘛那个刚刚讲说其实它有意思是因为我们就比如说大家都在讨论产品应该怎么做嘛那从你的角度现在我们都其实过去一年都做了一些产品嘛那从你的角度的话看 AI 产品到底应该从哪里开始啊
还是传统的比如说我们当然可以讲大道理从机会开始帮用户完成任务开始对吧那假设我们已经发现了机会或者我们自以为发现了机会那接下来是干嘛呢是定 Evaluation 吗还是它前几步到底是在干嘛跟传统产品有什么区别吗
我觉得第一个是说取决于你到底想做个什么产品或者说你自己的比较优势是什么吧我应该这样讲就是取决于你自己的强项是什么因为我们其实两类公司都看到过对吧一类公司是我先套壳嘛套壳套着套着套到最后
我不知道是因为大家都有这个科技的念想还是说都有这个最后忍不住都会开始说自己 trade model 对吧就比如刚才说的 Cursor 自己 trade model 之前那个 Modica 他们号称但具体我不知道因为代码他们并没有开源他们也没有公布什么技术报告但是据说他们也在这个也做了一些 post training 对吧就是说
所以你会看到一堆就是我们叫 talk 吧我会我暂时称之为 talk 或者说他就就利用 API 的那个产品化的公司随着他的这个逐步深入他开始去做模型但也有公司是说我上手其实产品就
胡做一个对吧然后我就只专注把模型做好然后突然有一天因为这个模型足够好我的产品是对我自己的模型上的一个简单包装最典型的这个公司叫做 DeepSeek 对我做了一个模型我也不需要做什么产品我的产品非常简单但就几千万的用户就来了这是至少目前来看两条道路都走得通也有那些模型跟产品相对比较一体的
我觉得比较典型的是你去年特别关注的比如 Vigo 这种现在大家在国内好像我不知道他们是刻意在国内要低调还是怎么样就像黑镜这种他们早就出去了黑镜已经完全出去了在国内其实看不到他们的 PR 宣传或者自媒体的报道但他们本质上这种公司我理解还是模型跟应用一体的他并不是说我只是简单套一个开源模型但是他产品本身也很重要对吧他也不是说我只要做好那个
模型做的好一点就行了我觉得为什么我说 Cursor 这个事情值得一提就是因为我觉得它也是个标志性事件我的假设也是 Cursor 即使能够开始招团队做 coding 肯定他们招来是做是不是就是做 coding 的模型但是即使把这个团队还是说就是做 agent 之类的事情就是即使他们把这样的人招来了我觉得短期内他也很难说我通过开阅模型 post training 一下就有 Cloud 3.5 的能力
但是我觉得这是个标志性事件就是说即使是一个收入非常好我们叫靠光做产品光利用别人的模型就已经有可能一两亿美金一年收入的公司也开始觉得说我需要组建团队做自己的模型我把这个问题往回退一退因为一两亿美金这件事其实离大部分人还很远我们先谈一二十万美金
就是因为最近我不是在混沌就是就还就是露了几次脸嘛然后就会有非常多的传统企业的朋友来找我然后就问这问那然后我会发现我跟他们聊着聊着就当然每个人都觉得自己发现了机会啊对当然很多我不觉得是机会
然后我就会发现说我跟他们聊到下一步聊到怎么做的时候他们就飞快的想要进入技术细节就问我要不要私有化部署啊然后我就非常想问他们说你们能不能出十个例子叫告诉我什么叫做一个好的满足你要求的东西对就然后他们就举不出十个例子你知道吗或者就完全瞎举
直到我说那我就按照你的这个标准做然后假设你把一百万打给第三方然后假设达到了这个标准那个一百万就自动打给我以后你们一个字都不能改然后大家就全部缩回去了你知道吗每个人都说的信心满满说那个好像就是这事我们已经想得非常清楚了然后
对后来我发现只有当出钱的时候你就直接跟他说这个东西好明天就给你做出来 100 万然后大家就会发现我还没有想清楚最早期的时候在发现机会还没有到什么一亿两亿就是开工的第一件事情是不是定 Evaluation 是不是定这个就是更早期我觉得第一个其实不是就是我们做一个产品或者做一个产品功能第一天往往是其实大部分人不管是包括我们包括我我觉得我已经算
模型用的多然后各种场景其实关注的比较多了就是往往你第一天决定要说这个事情有机会的前提下其实你对模型的能力的探索是不足的就是即使今天大家觉得一个非常成熟的场景甚至别人已经做出来的场景我举个例子啊就是比如说纹身图对吧就是说或者图身图
这个其实第一个是这些模型赛尺寸都很小就是相比你说我要布个 DF-TIC 我要搞什么 20 块 H200 来讲你布个纹身图你又有一块 A100 就能布了我们先不讲快慢对吧就基本上今天再大的这种 flux 的模型其实你搞个单块的什么 H100 肯定是能布出的
对吧单块的 H100 一个月的租金可能现在也就几千块钱可能一万块钱你就能租一块 H100 了所以从钱的角度来讲是但是你今天说假设比如说我是个电商公司我说我就做一个非常明确的效率类场景的
我都不说我们说面向消费者产品或者说什么 AI Native 我就做一个最简单的效率提升的需求效率提升的需求说我是电商我需要有我的商品的 P 图或者我的商品能不能换一个背景图就这样简单的需求然后有海量的开源模型各种各样的 Lora 其实你今天这个图大概能到什么效果以及这个效果你满不满意这件事情
其实都我觉得大家都没有完全探索清楚就任何一个人性来是说其实没有办法给你一个精确定义如果你是业务方的话你不是应该反过来吗因为就比如说我接触的大部分的人的话其实他们没有就是就你不要说 Flex 了就根本不知道这些东西他们只是说他们有业务需求那这个时候其实他漫无目的地去探索比如说 Flex 到底好不好用啊什么的
没有必要嘛他其实应该衡量的是你如果能够做到比如说我指定他身高就能出一张照片然后或者说我要改颜色就能改颜色然后衣服的款式不要变化太大比如说他假设他可以精准的描绘说他要的到底是什么比如说只跟衣服相关然后衣服又有三条要求的指标对吧然后只要这些能够做到我就觉得满意了他这样子然后再不是应该先定这个东西然后再去探索吗
因为我觉得这个东西很难定我举个例子比方说我们说常见的虚拟试穿我想把这件衣服穿在我身上怎么叫做一样怎么叫做达到了我的要求这个其实是很难定义的就是说可能我拿了十件衣服其中一件衣服有花纹那个花纹上身了之后我自己肉眼观察觉得这里有个细节不太好这个其实是很主观的我称之为什么呢现在很多时候有外流性这个事情其实挺难
就像你说的我是不是能定一个验收或者评估的指标我觉得很难这个很典型的是这样的就你今天出去招个工程师面试这已经是一个非常成熟的很多大的公司已经可能面过几十万人几百万人了对不对比如说一个大厂间招了十万人那它历史上累积的记录可能至少是几十万场吧对吧比如自己也有十万人它历史上参与过面试的人是一百万场面试肯定是有的
他已经有这个数据了你说今天说我能给个客观的标准吗就是我面试问这十个问题或者做这十道题做完了我觉得这个人就合格的我们先不讲这个人我们就讲最 entry level 的这个照片
其实你今天也很难定义对不对不是我觉得你可以说比如说这几道题都不会它不合格就是它做初筛是可以的因为如果是比如说你们来搞这件事你们因为就会熟这些模型你们就有这个可能性但是它对于大部分的公司来讲的话其实他们是完全没有这个能力的所以他们如果不把压力压在说你要提前想好你的业务标准的话
他的压力就会变成说我们要招几个懂这种玩模型可以搞的人其实更难现在更搞不到我觉得是倒过来的这是为什么我觉得不管你是一二十万还是怎么样其实你都是应该我觉得先都是应该先多试一试现在已经有的模型因为这个是为什么我说刚才我说如果是即使是我们我相信对任何一个团队来讲就是你先不要着急去定一个我做出这样就好了
为什么呢说因为今天的模型在各个维度上的能力它其实不太均衡的你觉得它能干了它不一定能干你觉得它不能干了它反而有可能能干对吧这个是这轮 AI 它不是个客观指标不像上一轮说我能做人类识别对吧我精度能做到多少或者我能做个图片分类精度能做到多少这个它的确是定义明确的但是这轮就是大家的很多想象我称之为想象大家很多想象假设出发点它其实不明确的
很多东西呢就是你不去试一下你很难摸到它的上下界而且这个上下界往往又是一个业务方自己都有感觉今天我们就讲说用它写营销文案用它写营销文案的问题是写营销文案这个问题是说到底这个东西
本身怎么算好怎么算坏我觉得一个技术的团队其实不一定能做判断的就比如我有很强的技术背景对吧就是比方说我说你要帮我做服装设计我说我要做出来这个东西很 fashion 我也可以定个标准说我这个做出来我生产出来到市场上能卖一百万件就满足需求了
但这个其实跟没讲是一样的对吧所以我理解其实就是说业务的需求和因为我们现在的 AI 其实是一种智能就是它非常稀奇古怪其实要不然就是你从这边逼你去说你一定要定义清楚但是定义清楚这事像你讲的就是说起来容易做起来难
要不然呢就是你得这边你各种的模型你都得摸一摸然后大概知道它长什么样子从中产生灵感说哎他能做这个说不定是没想过的一种东西那这边去拿着这个新锤子然后再去找钉子也可以拿着钉子找锤子也可以就定义清楚这个钉子需要什么锤子然后另外一个就是你去把锤子都摸一遍然后拿着这个奇怪的锤子去找钉子
我觉得一个是当然是拿着奇怪的锤子找钉子另外一个是摸一遍会给你一个感觉就是说会给你右方一个判断就是他大概能做到什么程度今天比如说我自己用各种 prompt 用各种开学模型我试嘛对吧我图生图我就拿各种哪个模型流行我进去我用各种 prompt 试比如写文案我就用各种试我现在试一遍我大概才能知道就今天的模型能力大概在一个什么范围然后
他在哪方面比较强哪方面比较弱这个通常是说是技术团队给不了你的我举个例子比如说我们最近比较关注比如生视频对吧我们看说哇牛逼哇厉害哇这里不好对不对那但我们觉得好的东西别人可能觉得其实很烂我觉得好他觉得烂其实并不是说大家的这个标准不一样或者怎么样而是大家对一个垂直领域的关注不太一样
对吧就比方说我就是今天就是说我这个你今天让一个一直在做电商运营或者营销的他去拍的那个商品图他觉得怎么样他显得真实好卖跟我的判断其实判断能力差别很大可能我看这两张图我觉得应该一样的他可能能觉得这两张图差异可能非常大我是在想这个东西他
因为我们两个讲的道理好像都挺有道理的,但是我真实的接触过程当中,一方面就是我看到很多人确实写一报写写不出来,就是你说的那个做起来很难,第二个呢就是很多人其实因为以前就会找我联系,然后就催他们说那你先用一用嘛,对吧,然后不要说多种模型了,你催那么久的说要用 CHAT GPT,他们其实也只提过两个问题,然后就回来用豆包或者干嘛的就不用了,
就是大家会愿意花比如说五万十万去报个 AI 的班但是其实就不太愿意花时间去把所有的模型都玩一玩都会期待说比如说找你或者找我说你们能不能给我一个答案但是其实我也不知道对吧我没有他那个业务 sense 然后很多模型我也没有玩过对所以其实这两件事做起来都是就我认识的绝大部分的
有钱的朋友来说对于他们来说都挺难的而且两条路都挺难的我觉得是都挺难的因为他不是做题他还是说在不确定性中探索做题其实是容易的最简单的对任何一个技术团队来讲我都跟你们说我都可以跟他们说你应该装一下 Cursor 就好了呀这个就提升效率了你都不用问我
对不对,你让你的所有的团队都装上 Cursor 去写代码,不管他们一开始多么抵触,你只要强制他们用这个写代码,他们很快自己也会觉得这样更有效率的。是,我现在给很多人的建议就是让他们去买那个 200 美金的账号,我说因为那个太贵了,所以你会很舍不得,然后你就会挖空心思去想办法去用。你刚才说 Evaluation,我觉得这个逻辑是没错的,但是 Evaluation 往往是你已经非常清楚你要做什么的时候。
定义外流选往往是你已经想清楚了说我就该做这个事然后这个事可以通过什么评估其实定义外流选通常说我已经明白我应该怎么做这事了不管我是通过 talk 通过一些 agent 的方式还是我自己训练一个模型的方式
就意味着你已经能用一个相对比较客观的指标去评估这个事情是做 80 分还是 100 分了还是 60 分了对吧这个是定 Evaluation 的意义 Evaluation 通常是说我的那个大的目标我想要做成什么样子已经比较确定了然后我可以开始迭代了我接触到的情况是
大部分人是以为自己已经想清楚了要做成什么样子以及那边有一个很大的机会然后当你提出 evaluation 的时候他们就会卡死在那里以及你告诉他说如果按照这个然后或者说给你乱拍一个人然后你告诉他说如果你拍出来了做出来了你就直接打钱然后他们就会
发现其实这个定的非常的没有道理我还会去想一下对第二个是往往这样定了之后我觉得有很多东西是太 evaluate 不太出来的我们最近在一些场景下我们
想象了一些场景比如说去机器去 evaluation 就用 GBT4O 或者 Cloud 去 evaluation 也尝试比如说找一些所谓的锁定人权去 evaluation 在一些数据上我们可能看到一个指标我称之为机器跟人跟人跟人之间基本上接近于随机举个例子基本上就是给你两组东西 A 和 B 对不对让你选 A 好还是 B 好
机器会说给你 100 条比如说机器会说有些说 A 好有些说 B 好然后你把这 100 组贴出来让人去选 A 好还是 B 好然后你找三个不同的人你发现不同人之间的一致性比如说这 100 条一个人标的跟机器的一致性叫做 47%47%是个什么概念就跟乱选是一样的对不对那三个人之间呢三个人之间比方说是也差不多它可能
三个人之间有两两吧两两之间可能也是在 40%到 60%之间其中有两个人可能能到 60%那其实用机器标跟用人标差不多也不差这个标出来你能比如说你希望用这个东西来没法用这个东西来评估就意味着你怎么做你做出来可能就是随机的对不对
我们现在标的是一致性对不对就比方说我在有些命题上我觉得这个事情就是难的比方说我们的具体例子我不举比如说这 AB 很简单比如说我就叫创意写作
我给你个标题让你写两篇文章然后你选你让你选一下左边这篇写的好还是右边这篇写的好是不是这个题目不对就是我知道的别人评的话第一个就是会说比如说创意文章包括五要素是不是它全了第二个就是说它有没有一个精彩的结尾还有一个就是说这篇文章里面的这个题是否是否不常见他会把它拆成比如说十个十个子维度会
会不会好一点是的第一个是这样的就是有可能是这个原因我觉得这当中有很多这种原因但是你还是有可能因为可能左边跟右边都是两个不错的模型提供的然后呢你这些维度其实你标了你可能给了他一些标签比方说他有没有一个精彩接位那其实选完标签之后对两篇哪篇好的判断仍然有可能是分辨不出来就是你找一个一般的人来标或者你找机器来标
了解是会这样但这样子人类至少好干预一点要不然好坏这事真的是没法看所以用机器标用人标准而且会不会未来这件事情会越来越难
之前的话因为有比如说你说 GBT4.0 和 3.5 这个时候两边的话你其实还蛮容易看出来差别的但是当它是 4 欧跟 3.7 的时候或者 4.5 跟 4 的时候就已经越来越是悬雪的范畴它已经超过了大部分人类的水平了这个时候我们已经没有办法跟它去标了看它是不是都出个轨
是的呀我觉得这个 case 我也只是说可能也是我们做的不对啊就是比如我们没做好或者怎么样但是标注也好评估也好我觉得本身也是个难的事这个难也就难在说我们工作中的很多命题啊今天其实并没有给出定出一个所谓的客观的经标准
对吧就是我们很多时候希望 AI 去帮我们解决一些问题然后它能不能做到怎么做到今天的很多标准是偏经验性跟这种直觉性的
真正能够拆解到说这个东西非常细分比方说就像你说的创意写作它要有什么无要素或者怎么样我的假设是说可能业内我不知道第一个是我不知道因为我不看这个主题但是我觉得很多时候是什么业内即使是很优秀的团队他其实也没有自己能非常客观的去拆分解这个问题或者定义这个问题的能力他更多的其实是靠主观的直觉以及
招聘的时候在人员上的控制做到的那我反过来讲这事就是很难因为没有竞标准但是反过来讲如果他定出了竞标准那这个时候是不是他就是最能够做好最容易做好后面的模型或者 agent 然后其实是可以吃到这口红利的因为他先定出来我觉得是的如果真的你能定到一个竞标准而且这个竞标准就是通常是你进的竞标准
跟市场上的实际放到市场的效果如果是强关联的强政客相关的最有可能能够吃到这个红利对吧就比方说你说我想用 AI 做创意写作难不难在于你有没有 idea 而是说你能不能说
说写出两篇 AI 写了两篇文章,你很容易的就能评判出这篇文章比那篇文章更好,这个更好是跟你的最终的业务目标是挂钩的,就是你的假设是更好的文章在市场上你放出去,它的点击转化曝光就是会高。那像这样不是还是应该是,比如说假设一家公司完美的,就是有一个业务的人,然后有一个 AI 的人配合的话,
就应该业务的人来定金标准 AI 的人来想办法拼出各种 AI 的能力就能够满足这个金标准这还是业务的人就要搞 evaluation 就搞那个 evaluation 那个词的缩写应该怎么读是读 eval 吗 evaluation 我看大家都写 evaleval 大概是 eval 吧我觉得要是美国人可能会读 eval 吧我不知道我说为什么都不说因为这个其实挺反直觉的业内最好的那些人
往往他的经历之前经历也不在怎么定这个金标准就我很好奇比方说咪蒙只要写公众号都是爆款
对不对他能不能定定义出一个说怎么样的文章就是更好的他往往是你给他一篇文章他去告诉你哪里写的不好哪里去感试可能他的能力很强但是他说哎我能够定义出一个标准然后这个标准你们只要照着我这个标准找一个弱一点的人去拿两篇文章就能评估出来哪个好坏我觉得是难的呀
如果是他们数据足够多比如说咪蒙有热门的一千名不上热门的让模型自己看或者是模型不断地产出咪蒙就在旁边他来给他反馈就以他个人的口味为标准这个时候是不是还是这些牛的公司只要他们肯花时间怼数据或者肯花时间怼他们的最好的人力来进行那个 feedback 可以把那个标准让模型给搞出来我自己的观察是两个第一个是
因为比方说我们在做一些产品也就我的视角可能跟技术视角吧就是说我这个东西应该用个什么模型我需要一个怎么样的一组数据我就能去训练这个事了
我两个观察第一个观察是往往业务方觉得你提的所有可以用来标注或者评估的方式他觉得都不行那最后看他主观评价吗不是不是他就会觉得你这样也是不行的你那样也是不行的我能够理解就是我跟他深入交流我能理解他为什么觉得这个不行但是这个我觉得就是这事是你让一个做 AI 的跟一个做业务的人两个人能够把这个事情沟通清楚已经是一个巨大的成本了已经是个巨大的挑战了
我的意思就是不沟通清楚能不能他们来说什么行什么不行就让他们投入人力来做比较难就是说最理想怎么行怎么不行打个比方就是你比方说那你就给我写你给我编一万条对吧你觉得好的以及是说我在这但是问题是这个时间跟成本代价太高了
有一些不是历史上已经有了吗比如说你刚刚举的咪蒙的例子他肯定发了一千篇文章然后 500 篇火 500 篇不火这个有用吗我立刻就告诉你为什么我们内部其实有一个这样类似的命题但是他因为不是咪蒙的文章但是立刻可能一个业务里你可以认为对业务专业理论非常熟悉他觉得不行为什么因为什么文章火什么文章不火随着时间是在变迁的
啊天哪对不对你去想一想是不是这样啊你说的对他说你拿历史上那些火的文章你今天发出来有用吗可能就是没有用的对不对但是呢我觉得这事又得做但是这个事我觉得就是我今天的观察我觉得它也是个摸索的过程就是我一直推测在 Cloud 内部应该有一个很强的团队在构造或者管理一个数据集来告诉你
怎么样的比如说怎么叫生成的代码好怎么叫生成代码错它不只是一个数据的标注它其实是一个不断在迭代的流程跟方法论这个事情我大概知道一遍对不一定是 Cloud 我们看过非常多的某些大型标注公司的 coding 的标注任务然后他们的标注任务不是说让你写代码
他们的标注任务是让你想很多的标注任务现在已经是这样就是让你想出一个需求而且这个需求必须是特别的业务需求而不能是写一个什么贪吃舌什么的然后让你写出这个需求之后呢那个那边会给你写代码然后写两套代码然后让你有六个不同的维度比如说叫做什么 choose for this 什么的他是否完成的这个东西然后以及他
反正就六个很奇怪的很 missy 的一个维度让你去评估说这六个不同的维度上你觉得哪段代码好为什么好然后还要你不能通过编辑器你能不能用眼睛看出来它哪里有 bug 就它把它拆得特别细以及提出来的各种东西都不是在代码层面的它其实是在整体的软件工程的层面然后和 taste 的层面它里面有一些关于 taste 的东西
就蛮神奇的我看过一些觉得就是完全是非常反人类的一种工作就是那个 label 非常难现在大量的这种工作堆积在那里就是完全 labeling 公司接不过来其实我们也有类似的任务但是我觉得做得好的在于说我怎么能够就是他也不是一天跳到这一步的
他肯定也是摸索过的说我因为这样我挂了这个数据他的确能够分他要能够验收你标完他能够去验收说你标的是对模型是有帮助的或者是好的对吧第二个他得去控制成本
这是个数据饥饿的业务我称之为所以他要想各种各样的方式跟机制能够去标出什么东西好什么东西坏我觉得这事是这样的就是上手 EVL 我觉得其实对大部分的公司来讲反而是不太合理这个反而是说你已经在产品层面做得不错了然后你的大方向或者说你做的还已经你今天这个产品至少已经有 60 分了
你其实还没有摸到 60 分你说我去定个 eval 倒过来我觉得这个逻辑是不对的而是我做到 60 分我大的方向已经确定了然后我能够慢慢收敛说我能不能把我的这个领域的问题定义成一个可以验证跟评估的
数据问题然后倒过来反向来推动模型的迭代我这点上还是跟你想法不太一样就是你这边说的其实是一家公司它已经是 AI 公司了然后它要做这个事它反正也得做但是现在更多的我见到的都是所有的公司都想做成 AI 公司
他们都想立项搞 AI 但是其实都没想清楚所以他们现在上来的前几个问题都是说我要私有化部署一套 DeepSeek 然后以及说我要干嘛干嘛就是全是问技术问题你知道吗这个逻辑是其实也是没问题的就是什么叫没问题呢就我觉得对很多公司来说你说你今天要用 AI 可能最简单的方式是你还是得先花钱就是先去交学费什么叫花钱交学费就是说
iPhone 出来了,我要做移动应用,那你第一步肯定得买几台 iPhone 你去买几个账号也行,为什么要布一个 DeepSeeker 呢?我觉得这取决于他有没有钱,他愿意在这心上做多大投入我也是,我也是才知道布一套满血的 DeepSeeker,如果只是内部用户有那么贵对啊,你基本上内部用 GPU 到能用的地步
20 块 H100 吧你现在大概一个月可能也十几十五万人民币这样一个就是有的时候其实是在帮大家逼大家说你稍微想清楚一点别上来先纯粹陷到各种技术细节上就开始花钱了你先想想你到底要干嘛然后我现在跟大家讲的就是就是有些人来找我们我就会说你先假设技术上我都能帮你搞定你先告诉我你到底要干嘛
你干成啥样你就高兴了你先把这两次定下来以及你高兴了的话你觉得里面值多少钱愿意花多少钱你先把这几件事定下来先不要考虑说 DeepSeek 到底怎么布以及我到底要微调不微调这还没到对但我觉得最大的问题是其实用户的需求很简单就是两类需求一类是说我这个东西上了我这公司就发财了对吧就是说其实我想要这个你能不能帮我搞定你说的对
对不对我上了这个东西我的 DAU 就从 100 万变成 500 万了大家容易做两头两头都简单第一个简单就是这个结果定义的过于结果我懂为定义一个结果这个结果叫我这个东西商业上要成功把它定义成结果一种就是过度的只看一个过程说我把这个东西能够 setup 起来我能调用
这两头其实最简单的其实难的是中间嘛就是中间这个中间这个目标是说你希望能够定义出一个又跟结果能够强关联的同时又能拆解成可实现步骤的你讲的有道理其实我干嘛要拦着他们花钱呢我应该说来我帮你布一套病房
对啊为什么要拦着人家呢人家想花钱对吧他想买个包你为什么要拦着他呢对啊对啊我觉得倒过来反正你是应该这样去就是不是说为了挣钱或者怎么样我也不做这个业务我们有自己的产品在自己做一些
面向消费者其实并不那么在意消费者是不是在意喜欢知道这东西是 AI 的产品我觉得对很多公司来说你今天说我要投入 AI 就是我觉得第一个是说你还是得准备好一笔预算这笔预算是什么呢就是你假设是它
它最终是有可能会打水漂的你也不能指望说移动互联网来了说哎呀我能想好一个东西我花 50 万这事情就成功了那你买两台 iPhone 那也得 1 万块钱呢对不对你总得买两台 iPhone 试一下吧你不然你做什么移动互联网呢对不对就像你说的你至少 200 美金你今天说哎我要试一下你 200 美金的 OE 的账号你都得买一个
DeeperSeek 你不一定要布一套对不对那你阿里云上开个账号 API 调用你得试一试对吧或者你规矩流动上开个账号充个几百块钱你让大家试一试你的内部有研发的你去搞个 cursor 或者什么东西装一装先用一用那这个钱你是逃不掉的就是这个钱就是应该花的你这些花的其实就是你先去摸一下水温买个 iPhone 什么的
但大家现在都是上来就要做移动应用第二个我是觉得说你上来做移动应用我觉得这个事从大环境上讲是必然会发生的我觉得也没有必要拦着大家因为说实话什么事情是正确的
今天没有人知道就是你知道吗我知道吗其实你也不知道我也不知道特别是一旦到了一个特定的企业的领域我就更不知道了对但是我会觉得说它至少有一个思考的步骤比如说你就随便拍脑袋告诉我说
我觉得这边有机会然后我觉得只要做出来什么东西可以赚好多钱那你能不能参谋参谋说用个什么 AI 就能帮助实现这个效果吗那我赶紧做一个他要不要自由化部署啊什么那是第四个问题但现在大家是直接开始提第四个问题没有前三个问题
这我就比较好奇啊就找你聊的是比方说是公司的一把手比如说或者 founder 就是还是说很多都是 founder 他们都基本上大家的思路都是要不然就是被很多 sales 忽悠了嘛说你们一定要做个啥比如说其实只是需要一个数字人然后我就不知道为什么人家告诉他要私有化不属于一套 deepseeker
我都不知道这两件事情逻辑关系在哪里我完全不能理解我说你为什么要 push 数字 deep seek 他说我们的这个东西他其实要做一个类似于 speaker 的东西就是数字人教你英语这个 deep seek 不是有话不是有个毛关系我都不知道第一种我觉得是被 SaaS 忽悠了第二种的话其实就是他看到了市场上的一个东西然后他觉得我也要做一个
然后那这个时候的话就是他其实不是很考虑就是他就直接只考虑这个东西做出来的话大概应该是什么方式做出来但是他其实没有考虑这东西做出来
就是跟他一个比如说你刚刚说还是从个人禀赋出发比如说他就觉得说我可以做一个 social CRMAI 的 sales agent 这事的话他觉得这是一个伟大的机会但是其实中国已经有 1000 家了他就觉得那就做吧然后这事太牛逼了那你就会觉得说那你前面这几步商业上是不是傻情况你为什么要直接跳到我做一个以及怎么做
对所以我就很想说你们先把前三个问题好歹你哪怕说拍脑袋我就有信心对吧也行啊还有一个我自己的私心就是我因为我中间就会故意说那你就明天做出来的话那就一百万我就用这个就可以卡死他不要跟我讨论他肯定不会做的事情因为有一些人他也就给你打嘴炮你知道吗对你就直接说明天就给你上线你今天晚上带着对
他就顿时觉得自己还没有想清楚你刚刚讲说还是得做我也觉得他们得做一方面他得试一方面他得做我们举个具体的例子比如说你是混沌大学好了对混沌大学肯定要做自己的 AI 假设你是混沌大学的产品经理
这是一个培训 APP 培训机构你会一开始的时候你会怎么来思考这个问题然后一开始的时候你肯定不会想到说我到底要不要私有化不是 Libsic 你肯定是思考一些别的东西你会一步两步三步四步会怎么来想这个问题假设你是一个有点互联网基因的偏传统的公司
第一个问题应该叫没有调查就没有发言权对吧我觉得我没有办法代入到说我是这个公司产品经理因为我的确不了解比如说它的整个的业务模式产品会怎么样的但是假设你今天作为一个外部顾问那第一个你肯定要去
使用一遍他的产品他的核心在卖什么东西然后是什么东西对不对第二个我可能要摸一遍市场市场上大家都在做什么事在这个领域都有些什么产品在做什么事情国内国外大概是什么样子的第三个我觉得就是这轮的 AI 的核心能力的差别大家也很容易来它的核心能力是智能的差别我能够规模化的靠机器提供一种叫做智能原来提供不了的东西
那我就要去回答说,在这个产品或者说它同行业里,我如果去增加智能在哪个环节或者说哪个上面增加智能是能够有价值的,就是对最终的我的用户是有价值的,从消费者角度。第二个是我是哪个环节通过增加智能能够提升效率的,这个是从 2B 的角度。
要不然我省钱要不然用户赚到对我觉得无非是从这三个出发点第一个就是你还是得做你叫竞品调研市场调查或者你大概能对产品或者行业有了解第二个我觉得所有的思考的出发点我觉得第一步还要思考说智能在这个行业或者在这个的核心场景下能有什么帮助以及说当我觉得有可能有帮助的我可能的第一步是说找这些市场上最好的这些 AI 产品
就用 pront 就先用文本或者 pront 的方式或者文本生成代码的方式去试试试着看说我用现在最好的模型的智能我没有做任何特化或者 post training 它大概能到一个什么水平吗拍一个小段子然后讲你刚说要看市场上有什么我最近发现 deep research 这件事情上做的特别好
因为 deep research 它在比如说我们懂的领域你其实会发现它做出来的东西其实挺一般的但是呢你让它去查我们不知道的东西比如说我们那个最近最近想要孵化美国市场的一个小硬件的东西然后我就让它去看说跟这个相关的就是类似的东西你反正把所有的东西给我查出来
他就想了一些我根本想都没有想过的确实跟小英建有类似的维度的一些产品说他们以前的上亚马逊上的销量到底怎么样然后说还有这种东西还有这个然后他是这样的然后就给了我几万字中间总有几千字你完全没有想过然后而且是他查到了很多 fact
所以我觉得现在用 deep research 去看市场上看竞品以及相当于别人交过的学费对吧那这点上真的是很有帮助但你看你刚刚整体上来讲你其实第一个是了解自己对吧就了解我的业务是什么第二件事其实是你去看说市场上有什么可以参考的就是别人交过的学费我不用再交一遍有什么可以学习的
然后的话你其实是在看说价值在哪里要不然就是他帮助用户比如说在完成用户任务的过程当中哪里帮到了用户创造了价值要不然就是帮我创造了价值对吧我的员工可以提效或者少找几个所以你的前几步其实还是在理解这件事情以及机会点在哪里所以我觉得就是第一步的时候我觉得这是标准套路理解事情和机会点在哪里而不是第一步先说我要做个啥呀
对啊那肯定是这样吧那我觉得这个事是这样的就是大家为什么会跳一步到这个我觉得也是一个典型的 mismatch 就是讨论有些问题的时候当你在这个领域里你会觉得你对机会点或者说你觉得你对行业很了解很有感觉但其实往往不完全是这样的
对吧?就是比方说你今天问我说我对我做在 tech industry 干了那么多年说我对 tech industry 很了解这句话既对也错对是什么呢?这个大面上是对的也错是什么呢?就是你能够有的信息是很有限的当你看
具体到任何一个事情里其实有很多的细节具体内容你是不知道的对吧就是比方说你说这个深度实际网络你说我了解什么大模型我了解我可以说我了解但是你一旦到一个领域你说语音视觉最新的进展谁大家都到做到了什么水平你不花一点时间去调研或者 research 去看一下最近的所有的进展其实又是不知道的特别是因为我觉得现在我一直是有这个假设就是
这轮的 AI 又带来了一次为什么大家觉得有机会因为它是个快速变动的过程事情都在往前走所以你才有机会就是到处都是弯道你才有机会超车就是如果是直道其实你是没什么就是纯直道就是一个成熟的领域纯直道你是没有机会就到处都是弯道但到处都是弯道的时候其实你不要光觉得大力能出奇迹对吧油门一脚踩到底
对啊,反而你是得搞清楚说,搞清楚是市场上有什么但是呢我也很容易理解,就是比方说我假设有个人说我在电商干了 20 年了我对这个领域我觉得我再熟悉不过了你说让我去调研一些市场我觉得没啥好调研的我都知道呀那就基于这种情况,比如说他就是就比如说亨顿或者某一个电商他就觉得我理解这个市场我已经找到了机会
那这个时候他应该干嘛呢就是他应该上来就是招 AI 的比如说我要不要招一个什么 AI 合伙人还是应该我比如说找市面上如果这个行业的 AI 公司聊一聊还是应该说我找这种 AI 的因为现在有很多人会帮你什么 AI 的部署自由化部署干嘛的我找技术研发的外包团队给我做 AI 外包因为不懂嘛然后那这个时候的话我应该怎么来走这前几步应该干嘛
就是现在我已经找到机会了我想做的就是这个东西我想做 AI 来颠覆这个行业我已经想得很清楚了那这个时候接下来几步是干嘛的如果碰到我我就会问他 evaluation 那就卡子在那里如果是问到你你会干嘛我如果站在一个假房就是我是那个公司的角度就是我觉得这事我已经想得特别清楚了我觉得基本上会做几个事第一个事是把它变成一个 will define problem 就是一个定义的清楚的问题然后要把它写下来
对吧往往你想起你想起你写下来就会发现你没想清楚我觉得我一定会把它写下来我还会我想把这个东西通过纸面上定义的更清楚但第二步我的确会找一个公司来聊啊就我会找很多我会职场很多供应商找很多外部顾问找甚至抓就开始启动面试因为启动面试找外部供应商去沟通他
它也是一个获取信息跟情报的过程对吧我觉得我第一步肯定会这么做肯定你聊完之后你就会发现对吧就是什么事情做得了什么事情做不了
你觉得做得了或者就是你招一个人你面试招一个人你找不同的供应商你大概会知道才能判断出这些到底做得了做不了对吧就这个就跟你去租卡你要找五个供应商是一样的呀你不能有一个人说这个东西十万块钱一台另外一个人说七万块钱一台另外一个人说十二万块一台你就问七万块钱为什么你那么便宜他可能找一堆具体的理由你拿这个理由再去问十万块钱的那家嘛
然后最后你就能搞清楚这个到底当中有哪些坑哪些陷阱哪些事能做哪些不能做那这样这边就有两个具体的问题一个是你觉得 well-defined problemwell-defined problem 的话它至少有哪几件事它是应该 well-defined 的
然后第二个就是很多人也问我说你告诉我说要多找一些专家聊但是他找不到他们有些人就好到我但是其实我有很多东西不懂然后我就只能说你去找专家聊但是我也不敢介绍专家给他们因为问的东西比较基础我也不可能介绍你过去说跟他们聊这种东西那怎么办找什么专家聊以及 how to define a well defined problem 怎么定义一个定义清楚的问题这个
我觉得这当中有很多是个形而上的方法论问题你看吧你也很难清晰定义这些事情你看这事就很难对啊对啊通常是你把这个事情我觉得传统咨询公司套路啊所以我没有在咨询公司你不就是说你想把什么 what how why 这些东西都写下来吗所以还是传统的那些东西去搞一遍麦肯锡啊什么的
对我觉得还是个传统咨询公司这些方法论或者你称之为任何一个做事情的项目拆分的方法论你肯定要把我定义的我要的是什么大概是你觉得这个东西应该是在什么周期什么预算下然后你觉得这个事情
可以能够做成的步骤是 123 对吧这个你再极端一点讲你就把它当成把大象关进冰箱里你也得先定义出开打开冰箱门把大象塞进去关上冰箱门然后第二个问题立刻就会冒出来大象冰箱放不下应该怎么办你说那我要把大象给弄死然后切开来切成一块一块这个好那冰箱格子有多大那一格大概有多少对吧需要多少个冰箱你至少你一旦开始
变成一个怎么把大象飞到冰箱里的问题这个问题就有可能是有解的了对不对了解那其实更简单的方法就是干脆直接交给 GBT 嘛说他就是这方面的一个顾问最擅长把乱七八糟的想法定义成一个 well defined problem 然后请不断地向我提出问题然后直到这个问题已经被澄清到位对下次有谁要干这个的话先丢给他一个 GBTS 这是一个嘛然后第二个就是就是一般来讲的话其实大部分人其实找不到人聊的
他们能找到的人其实往往都是要不然就是 sales 比如说告诉他要做数字人要 C1 不属定 C 我都不知道这是哪家公司忽悠的真的太扯了对不对要不然找的就是一些所谓的像老师我已经算老师里面还稍微懂一点的了大部分的就是只要做 IP 的老师基本上都是胡说八道很多人是找不到真正靠谱的一个可以沟通的就是真的可以落地做业务的一个对象的这个时候你有什么建议吗他们可以干嘛呢看 B 站吗
我觉得很难就是比如说我觉得我有很多获取信息的方式但我也不确定对别人是不是有效第一个比方说比如在海外我觉得大家对模型进展信息还是比较透明的比方说你去看这些 Lex Friedman 的这些播客去看什么 Netflix Newsletter 里很多人会讲很多非常我看了我觉得很有帮助也很有 insights 的这个
公开信息这个我觉得其实已经挺有帮助了就比方说最近我也不知道为什么大概是因为那个就是所以 mcp server 火了嘛但 mcp server 这个事情其实是他们没有用 mcp server 关键是他们反正我不知道为啥最近 mcp server 突然火了但 mcp server 这个是六个月之前就已经有的东西
对吧而且六个月之间已经有它是个公开信息它并不是一个封闭信息对我也觉得其实很多东西网上就比如说我有一次好像是我在参加国内的一个论坛你在硅谷然后你在那边群里说哇好嗨我学到好多东西然后我在那边跟你抱怨说我想的东西都是一年前的
然后比如说最近我看那个 AI engineer 因为你看的比较偏技术嘛我看那个 AI engineer 的话我就觉得说对产品方面有巨多的启发都讲的好好啊就 AI engineer 那个大会他反正也会把它都放到网上的然后就我一边一边在跑步机上然后就一边看然后就一边拿那个寄点笔记然后就哇而且现在有个好处是这些资料你的中文字幕你装个什么翻译插件一键他就是他用中文英文说下面都是中文字幕嘛
你也不需要说不像以前你说还有一个语言导致的这种信息差今天语言的信息差已经进一步降低了对如果你实在受得了的话我现在也看到有一些播客他们在做那个转录但是我发现我还是听不下去就是他做了中文的转录我看了就是质量还是不太行我看到有些在做了这个不是我一直想做的事但是一直没有时间做了
对但是质量我觉得还不太行但是我基本上判断这个事再过三个月六个月质量又会上一级这个你肯定是这样的对那你现在觉得说他们质量搞不定的那些地方你有办法搞定吗你有办法搞定的话我来出人手我们就干呗我也觉得质量不太行但是我也不知道怎么可以让他质量更行就这个事情能搞定能搞定我就两个一个是说今天签问刚发了签问奥米尼但是我还没有试过但是我相信说
这个当中很多还是这个语言的那个自然度不太行嘛但语言自然度这个事我觉得是随时间或者说随着模型的投入会去做的只是我们不太确定比如中文的模型因为中文的模型大家会开源到一个什么地步嗯了解对很多事情我现在反思就是
做太慢了 对你等到实际成熟了的话那个门槛又高了真的也不是一下子就能搞的就实际不成熟的下做做呗我觉得这事是这样的就是我自己的感受啊就是包括我对我们自己来说我觉得还是说有些事情其实要应该早投入因为他这个他因为为什么呢就是你今天毕竟你的团队不是 gpt4 的团队不是 opi 或者 cloud 的团队说我已经是专家了我只要想明白到那个时候去做就完
往往是说这个领域其实你是懂一点你是懂一点你不是说你不懂对不对但其实你懂一点你去摸索把这个东西不管是说你做模型的角度你去积累数据集你做产品的角度你去积累怎么去评估这个事去积累用户的反馈它都是需要时间的就不投入是不现实的回头前面我说你不要拦着大家在这视频上花钱花这个钱你是逃不掉的
不拦着我收钱我收钱我有改变方法我不拦着他花钱我收他钱你不能说我想明白了我今天就需要用 128 块卡去训一个模型你才租卡你就应该第一天你决定要搞模型了你今天先租两台 16 块卡有了这个卡你会去跑实验总等于说完全想明白才跑那 128 卡这个是不现实的你就永远你就觉得哎呀这个投入太大没法做
然后还有一个特别具体的小问题你刚刚比如说你提到那个 Lex Friedman 之类的因为我最近在健身然后就有更多的时间听这些鬼东西但是实在太长了就你会用 AI 在帮助吗还是你就真的真的在听这种东西太长了我一般都是读文本读文本大概时间能够缩第二个是调播放速度
对我是已经是 1.5 到 2 倍速了但是他比如说他采访 Cloud 那期 8 个小时真的是听不完但是播客的文本我有点读不下去就是不知道为什么就是是太水了是比较水但是可以读得很快那就等那种就稍微知名一点的都会那种那几个中文几大顶会都会发对我通常是用个浏览器插件一般这些都有一些三方的都会
有转入的文本然后这个转入文本再用个翻译工具翻成中文先快速快速读一遍嘛读了你觉得真的好你才看有些其实你看个十分钟我就不看了就是这个取决于因为他的内容可能很好只是不适合我比如说典型的是那个 Andrew Kapasi 前一阵子又上了一个视频就是讲 LM 的 part2 嘛对不对但是我快速看了前面十分钟我
我往后稍微拖了一拖其实我就没再往后看了因为我感觉讲的都是我知道的东西这个是我的另外一个观点就是你今天尽管有 AI 了但是不要过度依赖 AI 去帮你搞预训练这件事情就读文本读原始内容本质上是人脑的 portray 只有 base model 只有足够强你才能 IL 才能 IL 出东西来对吧所以 base model 是怎么训练的呢就是 portray 就是要读海量的高质量内容
对吧那你就想办法去输入就是这个事你逃不掉就是你直接 summarize 一下我觉得我自己的体验是说 summarize 完之后我觉得就是他很可能很长一篇里面对你有用的 insight 是那几句话或者几个小段落
但是一旦 summarize 他是把整个东西均匀吩咐的我是觉得说因为有的时候其实我也不需要他的中心思想和那个什么主题思想我受到的启发都是里面的根本跟主题无关的那些小段落他们莫名其妙提到了说最近他投的一家小公司张恰了然后是什么我发现这个我很感兴趣
或者说他提到了一个特别的一个观察他们投的公司的一个视角然后说这画了一个什么四周哎这个好对然后另外我也很赞同你那个关于 pretrain 那个想法就是你哪怕读到的是一个看起来 summary 的话但是那个 token 变少了所以你收到的影响也变少了我们得多用这种高质量的 token 来训练一下自己
我在我宝宝身上就特别明显的观察到了就是我们以为的这种智慧啊性格啊这种东西的话我觉得受到了输入的 token 的巨大的影响
因为他一直是双语的嘛像我跟我太太都是比较挨的人然后我们是讲中文的然后就他在讲中文的时候他就会比较挨一点小时候就是明显的就是就是个挨人但是呢他从小他就看 YouTube 然后 YouTube 上他看的都是那个就是那种打游戏的视频啊什么那种或者看 Ryan Torres Review 都是那种啊这种他只要一讲英文他整个人就变成了一个一个彻牛
然后他只要一讲中文就变成了一个像我一样的 I 人但是现在已经快融合了对对对但是小时候你就明显的感觉他输入的语言决定了他的性格和他的思考就是他的 token 是哪一类的他就往哪一类再变所以你刚刚讲 pre-training 我觉得还真的是真的是在 pre-training
你刚刚讲说听了十分钟就不听的那个我就在想我们刚刚那个我们后面聊这些那个产品啊什么的应该还能够挺吸粉的那个前一阵子应该是哪吒火的时候不就已经说了吗就是说出来混最重要的是什么出来混最重要是出来就是如果你真的相信 AI 那你就投入嘛这个投入既包括钱也包括时间就是而且大概率对吧它肯定是一个错或者说犯错的过程嘛
回过头来讲我觉得这也是为什么就是我自己最近也在想啊就是说为什么很多时候大家说要找年轻的人啊年轻的团队啊这个这个是个客观事实就是年轻的团队其实他觉得
试错是正常的就是越成功的偶像包袱越重越老觉得我这么牛逼那不应该一把成功吧对不对我这么牛逼我不应该我看好了就从一头就应该肯定不是这样的吧你就对那些公司来讲反而是怎么样呢他应该把预算加大把时间周期拉长
但是不要轻易觉得这事情短期内就能成功但也不要因为一开始可能花了比如说 10 万 20 万这事情没搞成就觉得这事情不要搞了他应该把它预算变成一个对吧线性增长分布的东西
对不对,我已经打算花比如说 1000 万在这事上,那你第一年先不用说 1000 万把 500 万花在第一年,第一年可能只花 100 万,第二年花 200 万,第三年花 300 万,第三年花 400 万,打个比方啊,那第一年花 100 万你就做好心理准备,对吧,你可能就得你买一些账号,就是你也是慢慢慢慢往上去投入,你对这个事情才能明确知道嘛,我觉得最终做成的事情都是什么,都得给充足的资源,足够浪费才可能成功。
因为大圆模型你要给给你 more tokens to think 这边就需要个浪费更 more resources to waste 对啊这真的是我真正为叫你啊你最后发现你得浪费不是说你故意要浪费而是说你也不要太你如果过于口口缩缩觉得我只能试这一把那很难成功就是你去看中国就看我们说会看传统中国移动互联网对不对这一轮出来的那些公司像美团呀看滴滴呀早年就你想你就想一想我觉得当年 1415 年就滴滴上线的时候
我觉得没有经历过那个时代的人你今天也很难想象像打车不要钱对不对当时也没有想到他们能够做这么大也完全没有想到最后你今天回顾看你浪费不一定能够成功但是在这种环境下你不去做投入去做试错其实你也很难成功大家来想 AI 都是两类一类是真的相信觉得这东西应该投入
还是说你不是的你就是因为今天 FOMO 嘛就是大家情绪市场情绪上来了我也要搞一把那这样来讲的话就是你刚刚说我们顺着那个说当我产生了想法那其实第一个就是研究自己然后研究市场然后我把它变成一个 well defined problem 然后我再多找人聊聊完之后的话呢其实你就是说那你慢慢清楚了就是我就想做那这个时候的话呢你的建议就是你更耐心一点啊
你要做比如说你要花 1000 万你把这个时间线拉长一点开始先小投入一点然后再加大一点然后再加大一点不要指望着自己比如说半年一定成啊你就默认 18 个月也成不了但是呢你控制你的成本投入保证自己在局里面那你 6 个月之后你可能你的位置就更好了你到时候想出来的东西就更靠谱然后 18 个月之后说不定你抓到机会了但是不要太
一定要投入一定要马上进但是呢一定不要避其功于一役对啊我觉得避其功于一役不是对大部分人来说是不合理的避其功于一役要么你这个公司已经没办法了对吧你就是最后缩哈赌一把了那这是你没有得选择对吧第二个是说我觉得你是巨型公司手上有巨大的资源比如今天阿里
他有一些你可以认为他有一种巨大的投入他们要做巨大的这个基建的投入然后又要做这种 all in 式的投入那我觉得有两个一个是他有一个巨大的体量同时他手头有巨大的资金而且有巨大的利润那他有他可能可以做这个选择甚至他觉得他花错的钱或者字节其实你看字节跟阿里都是属于今天其实都做了个选择叫补给大家的投入啊
阿里在股价上都赚回来了对啊也没有也不是梭哈似的说我今年就必须成今天不成明天就就就不干了对吧字节其实也没有吧字节你会看他们呃一直在投入一直你说他是不是拿到市场第一名也没有对吧他
就这个一开始觉得哎呀好像模型好像他模型觉得哎把你们都赶超的差不多了然后 Deep Seek 又出来了好不容易豆包变成第一了然后就 Deep Seek 又考了对 Deep Seek 又出来了 Deep Seek 又出来导致比如说腾讯的元宝又起来了
但是字典也没有说这是人家有足够多的资本我觉得对大部分公司我相信去混沌的这些你周围的这些 founder 或者一号位就是公司还是有体量有资金有钱的但是你要指望缩汗能成功我觉得这个概率太低了你想上一代的四小龙这些公司其实也是有人才有投入的
有大量的 AI 的投入在里面那他们说他是不是能成功也不一定啊对不对你刚刚举了一个例子就是比如说他有 1000 万投入分成 100 200 300 400 对我其实见到的很多的公司的话当然除了那几个就比如说大的商业公司那种级别就对于普通的公司来讲其实大部分也就是千万的投入
这种情况的话假设我们还这样签一签比如说小几百万这种时候他干嘛他用这个钱比如说他是应该花 100 万招个人还是启动这件事情是你比较建议的一个路数我们假设说我就是希望我打个比较假设我就是希望投个 500 万 1000 万分几年可能第一年你只有第一年的投入只有几十万打个比方我觉得第一个就不要去想什么就坚决不考虑私有化部署你的那些钱
你的数据没有那么有价值你的这数据对不对就是没有那么有价值你不要担心什么别人把我的数据偷走了什么你该用 API 用 API 该用开源用开源该用 SaaS 用 SaaS 我觉得第一步反而是说你在你的各个环节里把这些工具先用起来
就是往往我们总觉得说哎呀我自己观察包括我们自己的团队也会有这样就是我们已经是个 AI 公司了已经是所有的这些 SaaS 啊都是给大家报销啊都是不用大家自己掏钱或者怎么样对吧你想用什么 SaaS 只要不是太贵立刻就给你买但是呢往往也会出现就是说大家每个人都有工作的惯性是说不一定愿意习惯去用最新的工具但是呢一旦强迫用过一两次慢慢也就习惯了我自己的观察是这样的
就是比方说你跟产品经理去说你跟比如说一个设计师说你都用 AI 去做设计一开始的反应总归是觉得 AI 做的没有我好
但是用用用用它最后还是会慢慢觉得有很多事情的确 AI 就能做了或者说我跟 AI 结合在一起效率更高所以我觉得第一步是任何公司都是先把工具用起来所以你但凡你有一个想要做点 AI 什么抓住 AI 浪潮颠覆行业但凡你有这种想法第一步你先看看你们公司有没有把 AI 先用起来
先产生肉体的感觉然后再说这个就几十万就可以搞定对这个不用几十万这个可能一年十万块钱就足够了第二个我觉得说那就是在很多小的点上去试这些就你如果是试这些功能或者产品吧
我觉得还是说切口找个小有很多典型的切口什么客服也好或者我产品里做一点这种包一层 DeepSeek 的这种 API 的入口也好你就不用去私有化部署你找一个外包的团队或者说你自己有研发的团队它也是个 10 万块钱两级投入就能试的事第三个我觉得其实比较重要如果你真的相信就是说我觉得你真的是相信想要投入搞这个事这个事情还是个一号位工程
它是个一把手工程它不应该是一个说我招一个人进来这事就能解决的
就是我换句话说如果一个公司你深刻最后觉得你要逊模型他也应该是个一把手工程一把手工程可能不一定是 CEO 但至少你得是个联创或者在我们叫做在董事会或者高管会议上的人得花很多时间在具体的细节上就是你不了解这个事情是做不了这样的决策的你不可能指望说我招一个人进来招一个人进来第一个是说第一个他有磨合的时间成本第二个是说靠谱好的人很贵啊
真的招个好的这个领域好的人还是很贵的对不对刚刚我们说的那个钱都完全不够一个人对啊招个好的人真的通常在你自己没有深入了解之前这个人好不好你还没有判断能力换句话说你内部得有人快速学习这个事你能从外部招到好的人的前提是你内部有种
没有懂好的人人家既不会加入你也没有能力判断可以啊那就是先搞清楚市场然后我要解决这个问题然后多找人聊然后开始定一个计划然后先让自己用起来用起来之后的话找到中间一个小切口不要上来说我要颠覆行业的一个产品而是在一件事情上比如说只是客服里面用了一下对吧然后
然后这个时候自己的人又有手感了然后再考虑要不要招人你随口说的其实还蛮完整的我觉得这事其实跟是不是 AI 是不是也没关系对 但是道理都是一样那 AI 有什么区别呢差别在哪里我觉得一个比较大的差别还是说就是 AI 的这轮的核心能力我一直说核心能力是提供智能提供智能的一个好处是说它是一个典型的鬼雪球的状态
就是越 AI 越容易越 AI 就是你在内部外部的产品里 AI 用的越多你越容易引入更多的 AI
对吧这个事儿是一旦过了一个 threshold 是比较容易滚血球滚起来但是之前比如说你要做电商什么的不也是有一定的规模效应也好怎么也好也是有你做的越好就越容易越好吧之前是说是我因为做这个业务导致我的组织发生变化
今天是说引入 AI 这个事情本身会导致组织迭代变化 AI 其实不太像电商或者不太像做 APP 比较像比如从纸质时代进入 PC 时代其实它是一种智能我们以前说人力资源其实我们管理的是智力资源现在智力不光是从人这边来所以所有的传统的 OD 就是组织设计只设计人你现在要把这个块全设计进去组织得完全重改
对对对重新 design 对对对对我觉得这个是这是一个最大的变化这个其实跟电商啊跟那个其实不太一样那个虽然他也要组织变化但他是因为说我因为做这个业务我所以组织要设计成这个样子我做那个业务组织要设成那个样子但是我觉得这个这轮 AI 最后中带来的是组织内部的形态肯定会大变我觉得是一些新的公司已经在用一些大变的形式在管理但是我们不确定是因为他们是创业公司所以这样比较行得通好
还是怎么样但像包括像我们公司我觉得包括有很多创业公司还是在用一个传统的分工的方式在管理但是呢是不是这样是最高效的我觉得肯定是存疑的是以前往往会觉得比如说从研发的角度啊以前往往觉得是说人手不够老板有想法或者产品经理有想法然后做不来不及做对吧老师觉得发版来不及
现在明显是想法跟迭代速度不够,往往是说这个功能设计好了上线是很快的。我们现在基本上是后端的研发或者前端的开发,上线迭代速度是很快的,就功能性的开发模型我们另外说。但是往往是这个时候的瓶颈通常往往到了对比如产品对这个业务的想法或者设计合不合理了。而不是说我今天想了一个东西,我出来我说哎呀你们四个人团队为什么要搞一个月?
就往往瓶颈不在那个环节了当然其实可能也因为我们都是创过业的人我们在对于什么叫做一个合格的一个业务需求上可能会提出一些本能的有一些要求你要纯拍脑袋肯定还是每天可以拍很多的我们会天然的觉得这事真的就不靠谱心不要搞我觉得不完全是包括有些我们想要实验的想法我觉得是
但是把它转化成一个我有点发生问题了就是我的感觉是现在其实带来一个新的挑战就工作中需要对动脑的比例比动手的比例增加了
这动手的比例 AI 更多的能干掉了以前就是以前你说一个我一天能干 12 个小时是为什么比如我在写程序写增伤改查这是其实简单的但是你又不得不自己做对吧没有机器能帮你做今天那部分做的特别快对不对然后呢但是想明白这个流程应该怎么样占的占比变多了占比变多了呢你会发现这个写作效率的瓶颈在哪个环节就变了就是你当然有很多理想化的设想你说能不能不用产品经理
或者说能不能产品经理就把这个设想了它就变成自动变成代码其实都有可能对但是你会发现这个事情其实这个是一个到底应该组织应该怎么构造到底是产品跟研发应该做一块还是它是上下游两个团队还是怎么样我觉得这个是一个就是这轮 AI 带来说组织应该怎么变化的一个挑战我刚好就问一下因为我最近是在逼自己做一些事情就是我就是你刚说的脑力劳动这部分我其实本身还是都是
跟 AI 聊一聊或者说我自己弄的但我最近在逼自己说能不能把这些事情都稍微规范化一点就是跟 AI 就是就把它可以更多的给 AI 更少的我自己搞那比如说怎么去情报获取怎么样从情报当中分析机会怎么样做决策因为决策我是非常感性的我就希望说他帮我整体按照我相信的流程帮我理解
以及怎么样团队管理怎么样迭代然后这些东西我都在尝试让 AI 承担更大的责任就是我干我我更少因为我是瓶颈嘛对那那这这些方面的话你现在是怎么用 AI 把你的这个动脑的部分来做的更好的就是你你会怎么用啊这些高抽象的部分做了一些实验但是我觉得效果不太好我做过什么实验就是说我去用一些 prompt template 我比如说我想写一个需求给我的同事
以前都是我自己手写,打字写 12345,我写需求一般不会写一个很详细的 PRD,因为我们团队都还比较 senior,而且希望迭代快,往往是写 12345。假如后来我想说,比如打字其实也很慢,能不能我描绘的模糊一点,或者说我口述,然后 AI 自动帮我按照我的模板去生成我要的东西。
我试下来几个感觉第一个感觉是说 AI 一个很大的好处是它比较容易把你的一二三四五可视化出来
就他的微观上效率还是有提升他能帮你画个示意图然后你截一下给你的同给我的同事或者贴在这个这些项目管理的这需求管理的这个里面但是呢我会发现说模糊的输入给到 AI 的缺点是说他很容易事无巨细就要是我写是 12345 只重点跟非重点是明确的他很容易给我 12345 每个 1 下面还有 12345 容易重点跟细节不
就是他把握不好这个度对但这事我就挺难的我自己感觉挺难的就是我在做一些尝试但是我其实没有得到特别有成效的做法那我总结还是我自己的感觉还是两个感觉这个事情跟做产品跟做这个刚刚说一样的可能只能先在一个环节尝试优化不应该尝试在五个环节同时优化
对吧就是我今天决策我先不用他做我先使用他帮我解决这个情报问题这可能是一种方式或者我今天只帮他帮我解决完流程整理问题因为本质上就是你这个 pronf 流程你去用他的时候还要迭代因为最终你还是把他当成个人这个人你还是需要而且就是我们一直举那个例子他是一个聪明的大学毕业生
一个聪明的大学毕业生到你的公司里来你让他干活虽然他很聪明他也很积极你跟他说一句话但是他也能立刻把你写个文章出来他的确就是重点就是不明显的你就得花时间慢慢的教会他其实也是你和他在磨合的过程你不能在五个环节同时磨合同时磨合他的能力是挺强的他没有瓶颈
你有平静就是你脑子你脑子在五个上下文里去优化流程不行你还是只能一个流程一个流程优化我现在确实是切开优化的了但是也是就是经常有惊喜但是也很难说就完全的那么好对所以我现在更多的还是说只在一两个环节我现在比较多的还是在我目前晒的比较多的还是在那个其实还是把它当成一个学习助手
就是一个 topic 的主题我会做 research 然后让他告诉我比如说我应该读哪些 paper 对吧这些 paper 我还是会自己读但是我把它组织在一个 project 里各种问题都问他然后慢慢再整理 notes 就是我觉得这个是明显是有帮助的然后我尝试让他帮我写需求呢我发现比较难难在哪呢我觉得最终难在是说他的 context 太少了
你要把你的上下文完整了输入给他的成本就是比较高的然后你就选算了还不如自己写你刚说的那两个的话我都有一点点小尝试一个是
上下文这边上次我们不是找余一了吗我后来就写了大概一两千字给他当上下文果然就是我觉得效果还是很立竿见影但我的没有余一效果那么好因为他的不是一次性写进去的他是不断打磨出来的我是一次性写进去了大概 1500 个字然后就是我让 AI 不停的问我问题然后我把那些东西写进去了然后
效果确实还挺好的但是也有一些负效果就是莫名其妙的那个 GPT4.5 它对于这些东西过于敏感它就会每次跟我说话都用一种非常诡异的方式开始说话对但是整体上来讲 context 它拿的就比较准了比如说对于我正在从事什么事情啊然后我的关注焦点在哪里啊我喜欢什么书啊我的风格是什么它就已经全套知道了就是稍微花个一个小时时间的话啊
反正我觉得对一个小时时间的投入来说还是回报非常高的然后另外一个就是我除了让他学习具体的东西之外我会我告诉问他领域然后让他推荐我那个比如说因为用 deep research 你就会他最多是散嘛所以我就会让他帮我推荐 100 个这个领域的信息源
然后的话这个也是里面会有大概八九个是还蛮好的信息源大部分是你知道的或者没什么用的不知道他怎么怎么搞的对但是推荐信息源也是有用的所以你主要是用在这个领域还是学习多少你会用到反思吗我其实不太用到反思我现在用那个 GPT-4O 不是有一个 schedule 的 task 吗我让他定期问我问题比如说我每个礼拜要做一下比如说 working 的工作的 summary
或者说上个礼拜做了什么,就是说下计划下礼拜干什么,就是这个这样的话,他有一个 GPT 搜不是有个 skid task 吗?然后到时候他会推一个问你一个问题,有道理,我我的 weekly review 我自己定的,我从来就不做,除了下决心的那三个星期,对啊,我应该让 GPT 来做这件事情,但是我有时候也是哎呀,周末,
周末有时候高兴搞的时候搞下来懒得搞的时候也就没搞主人还是有很多惰性的对至少提醒了一下有道理好的我们今天主要就聊了一下说主要聊的是产品产品怎么做尤其是对于不像我们这种反正已经在这里必须得干的对就是那种还在水边上就是在那边嗨的同学们可以怎么做然后我觉得你提的东西就已经很完整了
但是我觉得这东西也不需要提啊,这个东西就像我们刚才讲的,其实我们提了一堆东西,你都后来讲一下,它跟 AI 不 AI,它跟 AI 不 AI 其实也没有什么关系。对,大道理都是一样的,所以大家就是还是按照正常做事的方法。好的呀,那欢迎大家关注 AI 联机术,反正就觉得有用的话发给自己身边的人,就是这边都是劝你不要花钱的是吧。
我劝你花钱但是我觉得你也不要把它当成是一个不要把它当成是赌博它是个必然发生的趋势所以它不是赌博不是赌博你就应该应该怎么说你应该把它当成一个你必须要花的预算把它花任任真任真任给你花但是不要指望说它不是个炒房的过程它是个慢慢还房贷的过程好比方可以你要慢慢还房贷好惨啊
这个比方讲完的话十个人里面有八个人默默地放下这个念头然后希望大家就是默默地还房贷然后十年之后有一套自己的大房子好的然后欢迎大家把这个 AI 令金术转发给所有认识的人然后我们这个月能不能破两万粉就靠你了谢谢好的那今天就先到这里好拜拜谢谢拜拜
i don't wanna be alone
i know that