欢迎收听晚点聊,我是曼琪今天的嘉宾应该是不少关注 AI 的听友都很熟悉的一位朋友数字生命卡兹克今天这期也是晚点聊想做的一个系列 IAI 的第一期会探讨更多 AI 和人和我和你也就是 AI 和我们的日常工作与生活的内容从 2023 年 2 月开始卡兹克在数字生命卡兹克这个公众号上发布了第一篇 AI 文章
此后快速吸引了很多想了解 AI 和把 AI 用起来的受众之后卡斯克在 2024 年 3 月开始全职运营这个账号也陆续做起了视频建同名视频号
我本来是想和卡斯克聊他广泛使用和测评各种 AI 产品的实际感受以及他对那些想更好使用 AI 的人的建议不过当聊天真的开始我们涉及了更多话题这期前半部分卡斯克分享了自己在 2023 年用 AI 来做产品的经历其实在 24 年全职做数字生命卡斯克之前他在一家做公募基金数据分析平台的创业公司担任设计总监
在 22 年底 ChadGBT 刚上线后他们就开始在公司内全面使用 AI 甚至在 23 年 9 月第二批拿到了算法备案也是金融领域的第一个但当他们试图用 AI 赋能业务做一款想卖给基金公司券商等金融机构的 2B 产品后进展却并不顺利
24 年 3 月他们公司收束和调整业务后卡兹克离开变身肝神卡兹克我们从卡兹克怎么用 AI 来改造自己的工作流聊到了现在各方向的一些 AI 产品这对同样是做内容的我有很多启发卡兹克能做到精准的挖掘选题和高频产出当然和他肝有关但也和他利用了 AI 做了大量的自动化有关比如他们会每天搜集全网的 AI 资讯然后用 AI 模型帮助打分筛选
挑出最重要的十条发到 30 多个社群里作为早报他们也会用 AI 分析社群里的讨论焦点帮助产生选题一个很有意思的案例是前不久卡斯克做了一次线下活动有 2000 多人报名但只能容纳 200 人要筛选报名者和分组
在以往组织线下活动时都是浩大的工程,而这一次 AI 帮了大忙。卡斯克说他现在想做的事是当 AI 殿堂的门童,让更多人看到 AI 原来能做这么多有意思的事,能帮我们解决一些实际问题。最后我在 shows 里贴了 2023 年和 2025 年卡斯克分别发的两次 AI 产品推荐,我们一起对比了这两组产品,有种恍若隔世的感觉。
不过 48 个月的时间不少赛道就已经完全洗牌下面我们就正式进入本期节目吧
所以今天非常荣幸万年聊可以成为数字生命卡斯克的播客首秀我觉得关注 AI 的很多朋友肯定都是知道卡斯克的而且大家平时的很多信息很多使用 AI 产品的一些具体的用法 Tips 经验都是从卡克这儿获得的那我这次邀请卡斯克来做客万年聊其实就是我一直很想聊的一个话题就是人和 AI 就是现在大家怎么来用 AI
因为其实你的账号从最开始 23 年 2 月开始更新的时候就有大量的内容都是跟着有关的所以我们可以聊的不用那么商量我不商量一点都不想我也不太想聊太商量咱俩聊点好玩咱聊点轻松的对对对可以聊些实操的我觉得在这之前可以先讲讲就是你自己是怎么成为数字寿命怎么进入这个领域的因为我觉得这也是现在很多关注 AI 的人但他可能不是直接的这种从业者代表观看的一个话题
我们可以从开头开始打工我自己呢其实是 17 年毕业的但是我的真正的专业其实是用户体验设计师其实在过往的互联网公司里面去做 UI 交互和用户研究这一块的东西这个是我的专业但是同时行业呢这十年几乎都在金融领域里面
我虽然是 17 年毕业但是我从 14 年就开始工作了因为我觉得学校教的东西实在是离真正的从业和离当时的移动互联网过于遥远了所以 14 年其实就出去去工作去做这块的东西差不多现在也真的快 10 年了对 10 年了所以
所以在二三年之前你是在金融互联网交叉的领域做 UI 设计交互这些对后面其实开始就是前半程还是偏用户体验这一块后半程其实就偏向于产品经理了然后一直在做一些产品和体验相关的工作其实他们俩本质上都是相通的
最开始就是金融领域我做最开始进行的是贷款那个公司呢其实对我确实非常不错所以其实你从那个时候就开始接触 AI 是吗因为这个行业其实也是和 AI 也挺相关的对 但是那个时候更多的其实还不是纯种的 AI 因为现在的 AI 跟那个年代的 AI 其实是有非常非常大的差异那个时候应该是一些推荐啊然后后方面对 操作上有些决策式的 AI 这些东西 决策术之类的然后但是现在大家都叫做生成式 AI
其实两个完全不搭嘎的东西那个时候其实接触过一点点不多毕竟那个时候还是一个大头兵纯种大头兵只是你去画图的做点交互的做一些用户体验的跟那个算法偶尔会有一些接触比如说去做他们的一些产品的时候可能会接触到因为我得去做他们的一些交互和一些文案的设计的时候我可能得了解你这个策略是什么东西了那会去研究一些学习一些但是确实接触的还比较少那个时候最开始我在金融业务线
之后我就去调到保险业务系了因为公司刚刚成立了一个保险在 19 年进军保险虽然这个事在我现在看来那是一个很奇怪的行为但是支持公司的决定然后也去了那个时候就是真正的第一次从零开始到一去想整个产品该怎么做产品的形态应该什么样的可能它的商业模式是什么样的虽然商业模式那时候跟我没关系但也会去想很多这样的东西
算是憋了两三年然后把这个产品给做出来但是那个时候保险其实已经在走很大的下坡路了然后就一直做到了 21 年底吧然后我自己是一个非常喜欢投资的人特别喜欢投资但是我买基金比较多当时基金炒股反正各种风格也都玩过但是我自己非常喜欢这个行业我当时可以去为了研究各种的财务指标就是那时候就晚上不睡觉
但是就是晚上不是就要看复盘每天晚上下班班十点钟回来我要复盘今天这一天股市是什么样的哪个行业是涨的哪个行业是跌的每个里面的龙头票是什么他们是因为什么样的逻辑开始起来的然后每一个龙头每一个大票那种中均票他们可能的一些财务指标什么样的然后可能谁要发财报了哪个经营经理要更新他们的一些言论了我都会看
然后晚上 10 点钟可能就一直看看到凌晨三点然后开始睡觉然后第二天早上的 9 点钟开始看一些盘前消息然后 9 点 25 开始做交易那个时候因为疫情嘛疫情后面之间在家办公了所以每天除了把公司的事情做完之后就是炒股买基金最开始其实都是一直在炒股后面才把我自己的一些就是确实是越来越忙了开始研究基金然后把所有的钱全部放到基金里当然也是因为炒股赔了不少
基金还是能挣钱的就是我从 2021 年开始几乎是马上在基金里面到今年应该收益也快有 120 130 个点了就是经历了这么一个大城市以后大家看来最后可以比较理财
后面确实是因为我特别特别喜欢这个行业所以在 22 年的时候我就出去了我就在那个公司龙三岭那边待了将近 7 年的时间然后出去跟朋友去创业一块做了一款公务基金的一个数据分析平台叫九圈现在可能用户不多吧那个日活只有 5 万多然后总用户也就几百万九圈九圈九圈九菜种对就是韭菜的韭
我也不知道那个东西为什么要取这个名字那个是老板最开始因为他的公众号的名字叫九太说社区嗯
对叫九圈这个是我们后面做的当时做这个的原因呢是因为在公募基金这个领域太乱了所有的基金公司想都是怎么把基金给卖出去然后呢所有的中间的那些平台呢他们也不会真正的去为基民考虑给他们去推一些很好的基金而是什么基金这个时候涨的多我给你推什么因为这个东西最好卖就是符合销售第一的策略那其实我们当时想这个行情实在是太乱了
我们就想做一些很客观的数据出来能给大家看到每个基金的真实情况也是我们做了这么一块产品然后反馈还不错当时影响力还是挺大的但是这个商业模式就是非常大的问题我们当时将近五六十个人的产业团队十个人的媒体团队我就不说具体数了这个就是完全不成正比嘛
因为我们整个产品不卖基金我们没有销售牌照所以没有佣金对所以没有佣金证明说那我们其实商业模式就非常简单只剩两种商业模式要么你去借广告因为我们有社区也可以做一些推荐做一些广告你要么就是 2C 去卖政治服务比如说某些指标是只有开了会员的人才能看到那其实 2C 本身在国内就不好做
同时还在这个大熊市里面 22 年到 24 年这是跌了整整三年的超级大熊市那谁还看基金买基金的人都是傻子都已经在市场上这样的情况了然后包括品牌部的预算从最开始的千万级别百万级别最后看到几乎就
明确的说到我们今天没有预算我们市场头发预算是零这就是没法做了这个就是我到后面一直创业做到 2024 年 3 月份出来之前我出来之前其实还是一个大熊市就是我们已经撑不住了虽然我们每年还是能勉强拼了命的做到盈亏并衡我们每年虽然这么惨的行当行情但是我们是不亏钱的但是我们已经看不到希望了这个市场跌成这样子但是我们看不到希望了然后我们就把分数所有人几乎就全踩掉了
就剩十几个人正好在前面一年前我们就布局拿了私募牌照私募牌照其实也不是我想做的事了我还是想做产品的我其实就出来了那个点的时候自媒体其实我已经做了一年了就做起来了对你说这个时间点是 24 年 3 月就是从那个公司正式退出是 24 年 3 月然后
卡斯克这个公众账号应该是 23 年 2 月开始持续更新的对对所以你可以讲那个过程就你 23 年 2 月为什么开始挺高强度的来做这个事情那会儿你还有本职工作对因为我是偏管理层嘛那其实我公司的整个 SOP 搭完了以后呢
就是只需要做一些决策进的工作就行了确实日常中间是比较闲的然后就可以去看很多的一些东西因为本身我也自己喜欢学很多学一些新东西看一些很多我对科技还是非常喜欢的然后其实二年的十月份 ChinaGP 出来的时候第三天我们就看到了第七天我们已经把它接到我们的微信群里面去了虽然第二天群就炸了然后那号被封了你是把 ChinaGP 接到你的微信群那这个是用技术手段做的是吗
对就是相当于你们在你们的微信群里放了一个 ShareGPT 它是个良心机器人对所有群里的人都可以跟这个对你都可以 add 它跟它对话就是 22 年的 10 月份上过来的那一周左右我们就已经把它接进去了但是是很奇特的一个点
其实当我们看到这个东西的时候我会觉得它跟我过往用的小爱同学用的 series 完全不一样因为其实语音交互这个东西还有人机交互包括我们在交互领域成为自然语言交互这个事我自己其实从 18 年就开始在看了我们当时也做过很多的情感化设计其实与自然语言交互就是非常重的一环我们把当时的语音交互的所有东西都看了一遍
那会儿应该是还在就你第一个进入公司那会儿的时候对那个时候是为了做产品砍的对
那个时候其实我们主要的一个课题叫做情感化设计就是我们希望让我们的产品做得更有温度一些它不应该是冷冰冰的一个东西我会自己在我的框架里把它拆成了很多的模块其中当然你有交互你有文案你有各种图形化的表达那么在输入层面呢其实就有几种一种是我们的点击直接我们称为直接输入就是你的点击是你点点点点点或者你把它按住拖另外一种自然语言交互
当时我举过一个特别有意思的例子就是我可以跟你的电脑说比如我们在做 PS 因为我们是 UM 我们说你把这个矩形把它的边框变成三像素然后把它往右边移比如说十像素当时我就说这个东西为什么 AI 很难做首先它都不知道你的右边是什么你的右边是我的参考性还是这个图形的参考性还是什么样的参考性呢
其实那时候的智能是完全不支持这个东西的所以在我们看来任何一个产品去做自然语言交互其实都是个很蠢的行为因为它的交互的效率实在是过于低下了你这么说我突然想到当年罗友号是不是发过一个在鸟巢里面做的那个 TNT
我先说我是罗老师的很喜欢他的一个粉丝罗老师的书我全看过只是但是那个产品在那个鸟巢发布会当作为一个交互从业人员看到那个东西的时候我会非常的疑惑我会认为在那个时候你用嘴去做 PPT 做 Excel 是一种非常效率低下的行为它只是酷炫但是它没有任何效率可言
那现在回头看他那个想法还挺超前的对基于现在你往头一看那你的想法是很超前但是我们说想法其实超前并没有用你必须得放在正确的一个时代一个时间里面基于当时的技术是的做到的那个条件是的那个时候我研究过这些东西当拆了 GPD 出来的时候那其实就是自然语言交互但是从我过往的经验来看这个东西是一个完全不一样的颠覆性产品
虽然我们很快就能看到它的上线但是我们依然觉得这个东西是要在公司大力推广的所以基本上在 2013 年的春节前就已经开始让公司全部去用了那时候主要还是 3.5 嘛 4.0 还没有出来
我们会让我们的开发去用这个东西但是那时候用的时候其实不是补全代码因为补全代码我们技术总监看完觉得那个效果很一般但是做另一个东西很好因为我们确实是一个非常普通的一个小的创业公司里面并没有那么多的开发比如说我们技术总监会说我们的搜索效率比较低下
他说是因为语言的问题所以我们想用购语言来去重购一下我们的搜索具体的我就不是那么懂了但是我们当时招的人都是只写 Python 的没有能写购的以前做区块链的人很多会写购
对然后我们就会发现了 AI 的一个能力它做代码的翻译会非常好用所以呢其实很多时候呢他们是用 Python 的一些把 common core 做的东西扔进去然后呢翻译成购语然后他们再去改就是他们也还是懂一点的但是很难去全部去做
那这个时候 AI 对他们做一些编程语言的翻译会非常的有用这个是 23 年 1 月份就开始他们在做一些事然后像我们设计因为我其实设计出身我只管的是设计团队那设计从那个时候开始就是必须用 Midioni 所有人给我去学 SD 然后所有的以前我们做一个运营海报的运营的 H5 我可能会给他们 4 天的时间
从草图到最后的确认成品那后面我就直说了我就是给你们一半的时间你们必须用新手段给我去试虽然有点压榨性的管理但是也很有效同时我也跟他们说了我给你们两天时间这两天的排息是在未来半年里面不会变化的也就是说如果你真的 AI 用的非常牛你能在半天内把这个东西做出来 OK 那 1.5 天的时间全部由你自由支配我不会给你排任何新的活
大家还是蛮有动力的对对所以那个时候虽然有点压转但是大家非常的开心然后那是我第一次见到我的这帮人还是非常有热情的所以我们推行了一个叫摸鱼时间那个东西你用 AI 能加速你的效率那么在固定的排气里面剩下全是你的摸鱼时间你想怎么玩你上班你只要别公放看电影我都不管你
你把戴着耳机看电影我真的不管你你只要把活交了对大家还是非常有用包括运营 AI 团队你就不说了包括在出方案之前都会强制性的用 AI 先出 10 个脑包的东西你可以不用 AI 出但是我就要看到 10 个方案其实在那个固定时间内明确是做不了的它只能用 AI 来去辅助其实就用这种强制性的方式能让我们公司在年后那后面时候我们对于 AI 的理解还是比较是
鲜的而且是实际的手感对所有人都在用对全部都在用然后包括从回家春节那一周我们就开始想能不能去做一些赋能的东西了那时候我说实话我真的不是从业人员我对 AI 的理解会非常非常的烂就是烂到什么程度呢那个时候我们不知道什么叫嵌入不知道什么叫微调现在可能大家听起来天方夜谭但是我们就是这么的外行就是真的什么都不懂
也是我们去找教程也不知道应该怎么找因为那时候我们做金融的金融有很大的痛点就是你去问 ChadGBT 那个什么什么的基金净值怎么样它的涨幅多少全给你是假数据对吧那个时候我们其实是想解决这个问题但我不知道该怎么解决我们甚至当时有个非常蠢的想法这是我还是我跟我们技术总监提的
我说要不然我们每天微调一次就是每天你们人肉给他输新的东西不是人肉把模型微调一次当时这就是一个非常蠢的想法到现在看来这真可笑这是非常的不中意但是这确实是我当时提到的一个东西因为我们基金的数据其实是每天一更新它不是实时的因为我当时知道什么叫微调微调就是把那个数据灌进去嘛
让他知道我们的知识嘛然后每天我们的数据库关进去一次微调一次不就行了吗那你的算力要是不这些时间拿不来对啊不懂啊那时候就是纯外行嘛然后我们真的去微调了一个微调了一次我们的数据库那个量其实非常恐怖的我就扔了一千条的数据集进去干了我七十枚刀
然后我就说这个事太扯淡了我们研究一下别的方式吧然后我们就继续把我放在了温打然后看到一个东西叫侵入我觉得 OK 这个东西是我们才应该去做的一个方式
我觉得你这个奇怪到现在也是的我看你的文章里经常会写就是他的官方文档里有什么东西写了什么什么的其实是很清楚的但可能没有那么多人看过对那个时候突然间就全是 prompt 那二元确实我们在研究这个东西的时候他网上没有教成
那时候教程全部都是 Program 叫你怎么跟他对话 Program 的试什么就都是这种玩意儿然后我们当时是要真正实际开发东西的所以找不到我们只能把 API 文档我们一点一点试一点一点上本身我们也不是专业的玩家我们发现了嵌入这个东西是最适合我们的然后后面我们就沿着这个思路就非常简单了我们知道该怎么做了然后我们就可以做很多的工程化的东西了
然后我们微调的东西其实也没落下就是微调这个经验还是有用的
我们最开始做了一个东西叫做意图识别模型直接我微调了一个很简单就是因为我们会发现在我们金融领域里面用户的很多问题其实你一个通用大模型可能解决的不是很好比如说用户问你基金经理的理念或者他要对比两个基金的数据比较或者他就是要拿嘴选基金他说你给我选一个能涨抗跌的基金你给我选一个年年正收益的基金
那个时候 Urgent 或者模型的智能能力并不是很好那是 3.5 最贵的 4.0 我们其实也用不起还是用了 3.5 那个时候我们甚至是微调了很多小模型那时候用的最多的是 GM6B 微调了好几个微调了一图识别的模型
还有一个做一个小判断的模型然后把最后的数据的一些查询这个时候大家都知道了有什么各种的调用工具什么 Fashion Code 那时候啥都没有那时候函数调用都没有我们又做了一些转 JSON 的模型就是装我们数据库里面就能查 SQR 的模型然后
然后就做了一整套的工具链最后我们会用大模型拆了 GBT3.5 那时候我们也测了全世界没有一个能达到 3.5 的这种数据组装的能力的几月份就是 23 年了这个时候已经是 4 月份还是 5 月份了对 23 年 4 月份 5 月份然后我们做了这个东西
我们希望能有一点的新的商业的机会后面其实这个东西做得非常快我们把这整个一套那个叫 Chad Fan 的就是你可以在我们这个产品上你问基金的任何问题都能跟一个差不多从业两三年的理财师一样的级别的人跟你回答因为在我们看来我们真正的护城河不是技术而是我们对于基金这个领域的理解因为我们理解其实会比很多的一些金融领域的理财师或者
那些财经媒体会议跟专业因为我们就是干这个的我们还有很多自己做的二次加工的数据这个是我们真正的护城河然后我们就把这个东西做出来了然后跟商汤还有百度是同一批拿到算法备案的这应该是金融领域的第一个算法备案但是是我拿的那就是四五月份左右的时候 23 年对
那个时候就印象非常深刻是佩洛西来中国第一天给他们发了一个 Meta610 第三天是文心一言那天备案通过我说这次备案通过那我们得等到几月份然后我一看我们也过了然后我们就可以正式向对外开放了但是这个东西面向于 C 端收费其实一样的会有这个问题很难我们当时就会想到看看能不能给一些基金公司去做解决方案我当时去把基金公司还有银行还有圈上几乎聊了个遍
发现大家手头预算都非常紧就每个东西当时只能卖 20 万因为过了 20 万要过内审神批级别非常高很难搞这个倒是跟我想象中有些出入因为我知道那个时候有一些金融机构去布那种私有化大模型其实很贵对很贵那个时候很贵就非常坦诚的讲我也知道大家因为我跟智浦关系非常好我们也很熟但是智浦其实很多的时候已经卖了什么工行造行这些东西我知道他们价格可能是什么级别的
但是对于我们来说那确实你没有大模型证明你这家公司没有技术含量你都不能做私有化部署你跟我提什么价格呢对吧你不就是给我一套东西我把接进去对外服务吗 20 万最多了在基金领域跟你做一些程序定制的开发软件也就要 10 万级别你这个东西就是一样你不是套了个 AI 的壳吗对这个确实是中国 2B 市场的一个问题你们是个标准化的产品
然后你们又是一个套壳的东西他这个就在两重叙事上都是吃亏的一个就是最大的客户他不喜欢标准化的产品他喜欢自由化部署你们随时为我服务的另外一个就是我觉得到今天其实都会有这个争论就包括最近 Malice 的一些争议也是有人会觉得那你不就是套了个壳吗是啊
但是我们做了非常非常多的一些我们自己的工程化的东西而且是有我们很多的二次加工和微调的一些数据的整个的 prime 也是基于我们对于金融领域的理解它生成的报告在我们看来就是会比一些不懂金融领域的人写出来的东西更好因为是有我们的方法论在里面的我们做了很多的方法论这些方法论是会拿去给一些基金公司去讲课的这种的但是并没有用
所以就是你们试图当时用 AI 赋能你们自己的业务去拓展这个业务但是是不太成功是的非常不成功就是非常简单的当我把这些聊完以后我直接就把这个业务砍掉了我不做了 23 年的 8 月份我就直接砍掉了不做了你回头看觉得业务再坚持一下会有希望吗没有希望如果是 9 月份以后可能会有一些的转机但是在我们这个点回头往下看你再往后做其实也很难做因为 2B 领域
大家至少不接受标准化的产品比较难第一就是你不仅要按他们的方式去调我就说基金公司的一个例子推荐基金的时候你只能推荐我家的基金你不能推荐别人的你帮我家的基金跟别人对比的时候你必须要突出我的优点这些是在我们看来非常难以做的这个说明就是我们如果只能筛选他们的我们要为他单独订数据库还要做很多的非标准化的 prompt 和工程化的一些东西
不过在客户的角度这个倒也合理这个非常的合理但是我们算完成本以后要做你这种东西我们就得抽专人出来每一个客户就得甚至掏两三个人力去做类似于助场因为他们还要做 UI 界面还要进入到他们自己的微信公众号小程序里面还要解决各种并发的一些问题还有我们来搞他们也不懂还有 token 的成本还得我们担
这个其实在我看来你这个做下去它可能是魁本生意对那对你的价格就 20 万说死了因为过 20 万你要走内部审核他要审批到非常高的领导他们不愿意干这种事因为干了这种事也没什么意义对那就 20 万以后就不需要审批了那就价格卡死在这那我们咋干那其实干不了即使在那个时候把用户把客户给粘住了但是我们以这么小的成本把他们粘住那未来的 ROI 或者整个的商业模式能夸我多大呢
我觉得不靠谱所以我觉得就及时止损了我们把这个业务就直接停掉了反正因为我们其实也还好没什么成本几乎就我一个人再加上我们半个技术总监就是两个人就把这个产品干了
那你开发不需要具体的人开发吗开发就是技术总监然后带上他的小朋友一个就最后我们做了一个网页上线的时候那个时候用了一些开发的资源其他的其实都是后端的 API 的一些微调或者工程化的东西我们俩就基本上干了微调的很多东西也是我自己调的就是很多的 API 因为我确实不懂后端后端的东西那全部是他做的我们一个半人力就够了确实没差成本但是真的你要开始做商业化的时候那个成本我觉得我算不过来了我就直接砍掉了
就不做了到了后面我确实就是火过两次在八月份的时候嘛做了一个流浪地球 3 的预告片那时候在影视圈报了也是因为那个奇迹算是我绊着脚进入了影视圈现在也在跟很多的剧组去做合作对对对我知道啊电影肯定是一个领域我觉得啊因为电影它是一个大家能直观看到的并且也是非常受关注的能影响到很多人的东西
因为本质上我其实不是想做一个自媒体我还想做一个能给这个社会带来更多价值的一个 IP 那么很多时候其实也是为了做一些影响力的那么电影影视领域本身是我自己喜欢的同时又能给我带来影响力的跟他们合作其实我说实话都没钱也都不是为了钱去的很多时候甚至两年的长线布局最后就为了能把这个东西做出来我很开心我能参与到这个进程里面
挺好的我觉得这期节目也许可以叫水下的卡斯科因为其实我们现在讲了半天都没有讲到公众号就没有讲到你平时的内容但是其实你做了很多跟 AI 相关的事所以这 23 年 8 月之后有一些 AI 影视结合的事是你在做的对吧其实那个时候也是太早了那个时候 AI 影像更多的是纯 PPT 大家就是图个新鲜聊一聊就过去了郭帆那个时候是可以说的就是我跟他 9 月份见了一面以后
真正的开始去做一些东西是 2024 年的 11 月份中间隔了一年多对因为我印象中 23 年下半年或者 24 年初的时候郭帆好像对这个事还是挺上心有比较多的公开动作因为他们工作室好像是成立了一个联盟还是一个什么我看商汤皮卡这些都在里面但后来有段时间看可能去搞剧馆还是干什么别的秀了好像就没有在 AI 这方面有太多的动作球的 AI 东西还是可以期待一下的
打个广告 2027 年春节流浪地球三胜影 2027 年春节现在 2025 年因为我自己会跟很多很多行业的人去交流去协作但是影视确实是我最喜欢最喜欢去玩的所以球赛里面会有些 AI 的东西对吧当然而且
而且是很多很多好好期待一下为什么 AIM 没有加快这个进程为什么要到 27 年 2023 年发布会的时候郭富汗直接宣布定档了 2027 年上映这时间已经定死了 OK2023 年的 8 月份然后就是 2023 年的 11 月份
那个时候皮卡在全球火了我是国内唯一一个有皮卡内测账号的人就是因为跟他们那边的人还比较认识所以有了内测账号然后我写了一篇文章就是皮卡的艺术实测体验那个时候确实还是蛮酷的就在金融圈火了而且市场也火了我那个时候写完了以后第二天我一天做了 13 个路线
因为我本身就是金融圈的很多经纪经理还有研究员也认识然后就给他们去实际看皮卡这个东西然后那个时候算是小小出圈了一波但是最出圈的那一波还是 2024 年的 2 月份 2 月 16 号那天我到现在还印象深刻 99%的运气吧但是 1%归功于那天晚上没睡觉你不是天天不睡觉吗
那天晚上其实睡得比较晚没睡觉然后看到那个东西然后因为我自己在 AI 视频这一块其实也一直在做从 2023 年的 8 月份到 2024 年的 2 月份已经做了半年的时间一直在做这一块然后在那天晚上看到了于是写了一篇我自己觉得它为什么这本牛 Sora 的女神对就是 Sora 那个副标题叫现实不存在了然后那篇破了那篇 300 多万的阅读
那次算是最大的一次出圈后面就是不温不火就是一点一点的去输出自己的内容吧反正做一些我喜欢的东西我的 slogan 很简单就是分享一些很新很酷的爱干货我希望能把我自己体验到的一些好的产品跟一些我觉得还不错的教程分享给大家就是
一直做到现在然后 2024 年的 3 月份的时候其实公司确实也没有那么好然后包括我自己也想出来了于是去全职做这个媒体号要不然也不可能做到一周四五根嘛这写不过来的写不过来的就是你 23 年其实更新频率没那么高对吧对 23 年的时候差不多我给自己的 KPI 是三天以内一根就完事了现在会更多一些嗯
我觉得整个行业节奏也变得更快了我觉得 23 年三天一更可能也是够的就可能也没有那么多事最近我觉得事也特别多本身事也特别多 23 年的时候那时候其实因为我对于 AI 的行业的划分一直是以模态为划分的 AI 文字 urgenturgent 是我还是最近新加的因为之前 urgent 确实不文不火的都是垂牛的东西
然后 AI 文字 AI 绘图 AI 视频 AI 声音和 AI3D 我一直是以这五个模态去划分的在 2013 年的时候其实几乎是只有 AI 文字和 AI 的绘图这两个东西可以写
那个时候 AI 视频就是纯粹的没有就没有然后 AI 声音那个时候大家玩的最多的其实是 SVC 就是那种让孙燕姿唱歌唱周杰伦的歌这种 AI 换声的东西其实也没有类似于 SUNO 这一种 AI 音乐的一些生成式的大模型
AI 语音大家还是停留在这个男人叫小帅这个女人叫小美这种阶段上也不会像 2023 年的 10 月份国庆的时候加上 GP 第一次出现他们的语音的东西的时候那时候给人的震撼很大原来 AI 可以停顿了 AI 可以说呃
这种东西这种语气词可以变得像人一样有情绪了那个时候后面 AI 语音可能才会更多的进入到公众视野里面去 AI 3D 那个时候也是很糙的东西几乎都没有 Triple 也是从 2023 年的 10 月份才开始去做的比较不错的 Triple 1.0 上线的就 Vost 做的那个对他们是 23 年底的时候上线的对 11 月份那个时候我也写了首发就是确实我觉得 AI 3D 里
开始有些东西出来了所以 2013 年的节奏确实没那么快因为它只有两个模态在开始卷不像在 2024 年的时候五个模态全部是齐发的
到了 2024 年 6 月份以后刚可林一上线的时候 AI 视频又卷得飞起就感觉你每天那个东西确实好多然后多摩泰什么的 SO 也出来了到后面推理模型也出来了就是东西会变得越来越多了对现在一天还有两更对吧我看你 3 月 6 号就是又发了 Mallus 然后又发了 QWQ32B 就阿里的推理模型都得写嘛这种东西它就是属于我不写
但就是我不专业对因为这两个事都挺重要的对我其实做过很多错事就是自媒体这个东西它有的时候确实会因为自己的懒惰而影响用户对你的信任比如说 DeepSeg 我就没写 DeepSeg V3 和 R1 在发布的那天我都没写为什么了对这个很简单就是 DeepSeg 官号已经被转发了那么多了我觉得我写了也没啥流量了算了不写了因为我想睡觉然后就没写了你现在到底一天睡几个小时啊
我每天三点钟睡觉九点钟起床我睡六个小时还是睡得比较可以的你三点到九点是比较固定的作息是吗对 几乎现在比较固定有的时候加加班比如说上周那个天沙的 Open Air 大半夜发他们的语音模式那天晚上干到五点多但是还是九点钟起床就九点多起床是我固定的时间
就不管多晚睡反正九点起床就是深入中就是到了那个时候我就得醒了因为我的文章几乎会定时九点钟发出去发完了以后呢其实我就睡不着了因为我会非常的在乎用户的评论我会习惯性的去看用户的评论我就睡不着了
那你做手术那几天也都是就那种就起来几乎都是太干了各个线路上都有很多新的东西是很多但是用户反而就是现在的内容越来越难做了或者不是说内容越来越难做了而是现在的 AI 的越来越多的产品是难以调动用户的兴趣了
就是预值会变得越来越高普通用户已经见过可能会跟就是以我们为首的这帮子自媒体吧天天搞一些那种炸裂叙事是吧就是算了我已经被人挂上吹牛头头这种你觉得你是比较克制的是吧
也不那么克制这个确实是流量的一种问题当你特别克制的时候说实话你的数据或者被传播会有一些问题这是确实是我们自媒体这个行业的一些问题但是现在的很多的用户他的预值会被调得非常高他已经看过了那种很牛的东西这个时候你告诉他这个东西跑分加了三个点加了五个点的他会说
那你问他 9.11 那不还是比 9.8 大吗这种那不不行吗对吧其实现在我坦诚地讲 AI 的进化特别是文本达摩金的进化它已经到了是很多人无法评测以及无法理解的地步了就没有那么直观的感受了对
对就是在比如说分子式领域或者在一些新材料加速领域那么 O1 或者是 O3 这种推理级别的模型会对于这一种行业会带来非常大的一些影响会帮助他们因为过往其实你用 GBT-4O 还是用任何的传统运训练大模型其实你的逻辑是有问题包括还有很多的幻觉你的做法其实是不太好的
会出现很多错误但是在这种东西出来以后对于数学那种东西是有非常大的一些积极意义的这个东西是普通人或者是普通用户 C 端用户他已经是不太关心的领域了对其实这个点也是我们之前播客里有讨论过比如说我们之前跟戴宇森聊的那一期他就有在讨论说 DeepSeq R1 和 OpenIOE 包括和 DeepSeq R1 同期的 KeyMid K1.5 对吧
它那个影响力上其实差别有一个来源就是推理模型大家都说自己数学好逻辑好但真的去用它做数学或者编程的人还是一少部分就 DeepSync R1 有一个出圈的原因之一就是它的创意文本的能力很强然后这个是大家都可以玩起来的
你让他写一首古诗让他写一篇古文什么的但是像 K1.5 可能在这方面也许他是没有去特别的优化或者怎么样他就没有 DPCR1 好不管是 K1.5 还是质朴的 ZERO 还是其他出来的东西我把他们评价为的是数学战神偏科战神就是我也确实写他们每一篇的手法我都测过
确实是在整个的是一般就是做数学题这个场景它就不是一个非常泛化的一个场景南万确实是因为他自己独有的一些数据集那些破壁问题吧就是写出来的东西非常的玄乎对同时他的幻觉力非常高你让他去做一些编程或者做一些数学其实我说实话没有那么好但是因为他的幻觉力太高了然后同时呢因为 DeepSig 整体的一个出圈效应让
原来我说实话在 DeepSeg 没有出圈之前可能接触过 AI 或者用 AI 的人可能在中国比如说 14 亿人可能只有一亿人在去用这个东西你过往的所有的一些 AI 的产品都是去洗这一亿人的认知但是这一次 DeepSeg 的出圈在所有的背书和背后的一些力量的
推动下它会达到了一个全民的级别也就是你可能凭空的多出来了 8 亿的用户这 8 亿人是从来没有接触过 ChinaGPT 他们是没有过往两年的一个历史的
DeepSeg 就是他们接触的第一款 AI 应用对所以有人说 DeepSeg 是中国的 ChatGPT 时刻对所以其实你会发现在 DeepSeg 火了之后大家我只能说流量这一段不管是公众号文章还是视频这一段你会发现会把 2023 年的 ChatGPT 那一波的叙事重新来了一遍
在教大家用怎么去写 prompt 在教大家用 chattergpt 用 deepseq 怎么去挣钱怎么去写股市怎么跟解印做结合怎么让他去给你出画图的 prompt 这个是 2023 年 chattergpt 三年五火的时候来了一波一模一样的叙事
但是 DeepSick 这一波有个很不一样的效应还是推理模型它的思维链在过往的在运行链没有思维链的这些模型的时候很多的普通人或者不说普通人就是大部分的人他们是不相信 AI 的
或者他们会直观的认为人的尊严是凌驾于 AI 之上的人的智力也会远远的高于 AI 的当你问他一个问题的时候他给你一个不满意的回答你可能就直接走了你会非常鄙夷的一笑 AI 也就不够如此对你就走了你会觉得 AI 就这样吗你们吹得这么牛吹上天
你看连我这一个数学题或者小作文都写不出来写的这么垃圾但是这一次 DeepSeg 不一样就是推理模型是欧外欧外那是其实是没有破圈的只是永远在 AI 行业里面打转科技行业里面打转 DeepSeg 是第一次让人看到了原来 AI 是有思维链的原来你问一个问题他是会思考的
这一次我是能明显的感觉到不管是我身边的朋友们我的家人们还是我的所有的认识的人里面大家第一次感觉到我不如 AI 了当你能感受到我不如 AI 的这一刻你就会把这个东西分享给朋友
告诉别人原来 AI 已经这么牛他会接受 AI 的存在会想着我原来这个任务不行是我自己有问题是我自己的提问方式有问题他们会去想着去学想着去做一些这种样的功课跟当年他们对于 GBT 的这种抗拒其实会有一些不一样的微妙的变化这个其实也是 DVC 的产品上我也不知道他是不是特别提前想到这一点就是因为 OE 的思维链是没有完全展示的
它是隐藏的是的然后 DeepSick 的思维链它是完全展示的这个其实还不算可以想到一点其实 DeepSick 在 O1 出来之后他们就开源过一个模型叫 R1 Lite 还是 Preview 是那个 R1 Lite Preview11 月 20 号吧好像
对那个时候他们其实已经开源那个时候就已经有思维链这个存在了其实就是因为 OpenAI 这个在口碑在行业内实在太差了现在就是啥也不给别人看然后他们把这开源他们直接就放出来了但那个时候其实也没破圈因为他那个时候没有一个就是 C 端可以用的网页端或者 App 有有有可以在 C 端用
那是 APP 网页端它是之前用的对其实已经可以用了只不过那个效果说实话有点烂对非常烂因为那个时候 10 月份我们正好在一些渠道我们会做很多的大量的测试它是关于文学方面的剧本方面的测试那时候 O1 Pro 确实是真神那个实在是太女了
你做这个剧本的测试是跟你和影视的一些合作有关不是说你们为了做测评发内容对吧那个是非常非常真实的生产环节明白明白就真实场景下的测试对我们会发现在文学性上面 O1 Pro 实在是太牛了 Deep Take R1 Lite 其实包括 Kimi 1.5 还有质朴的 Zero 那个时候还没上线只是我们在内测效果都很烂都不太行
那 DeepSick RE 正式版会好一些吗后来你们有做吗所以现在还是 OE 在这个方面就是说实话 DeepSick 这一波其实是更多的把 AI 的一个在遥不可及的门槛因为 O1 那个套东西它不是谁都能用的首先你就需要一些手段还需要氪金才能用上 20 枚刀它也不是谁都能掏起真的很贵你说的手段是指翻墙 科学上网
就这个事他已经把 90%的人拦在外面了他的门槛其实是非常高的确实 DeepSick 这一波还是会跟传统叙事有一些不一样的他就会多出来了这么多的用户这个用户是没有那两年的历史的而且这些用户肯定他的分布也更广泛了就是年龄行业包括他以前用科技产品的程度对所以你才能看到元宝这一波推广打的是母猪护理问元宝
对对对就是他们好像去乡村地区有刷墙的广告是的确实很有用虽然大家也都在说你这个地要靠 AI 种的话你就别种了对吧种地还要问问人但是它确实很能解决一些问题一些智能普惠的一些问题所以这个是你怎么来做 AI 内容的一个过程对吧从 23 年兼职然后到 24 年 3 月份之后开始全职
对就是一直在做反正我的目标两个我其实就是一直在模仿或者说模仿或者在致敬的对象就是在长视频这一块其实还是想做影视飓风然后在公众号这边这真的不是公卫两个号一个叫差评一个叫晚点对虽然是不同的号差评和晚点这是我非常能希望做到的一个高度你现在对自己的定位是什么呀
就你对你自己要做的事定位什么你刚才稍微讲了一点对我自己要做的事定位其实很简单就是会偏资讯和教程为主我不是说你的内容的定位我说你整个想做的事情的定位整个想做的事情的定位其实就非常的纯粹非常的简单
靠着我在 AI 领域的影响力能挣到一些钱然后同时能让更多的人看到 AI 的用法然后让他们带入到 AI 殿堂其实我在过往里面我会一直把自己描述为一个 AI 领域的一个门童或者是 AI 殿堂门口的一个门童我本身不是很懂技术我跟真正的那些大佬算法或者什么六小龙里面的产品那不是一个级别的专业度
我只是玩的多一些而已我知道可能什么能解决这些普通用户的一些问题对那我其实更多的是希望去做一些分享能让很多的普通人去看到这个哇原来 AI 能做一些这么多有意思的事它能帮我解决这个找 PPT 的问题
他能帮我解决一个 SAR 的问题然后他们对 AI 产生兴趣能去到那个殿堂里面能去玩一玩能进入到这个新的时代这个想法这个描述挺好的对这个之前我其实在开公众号的刚开始不是分享一些很幸福的 AI 干货那个时候还是有个比较 jump 的一个 slogan 现在我不太敢用了叫以一灯传至诸灯终至万灯皆明哦
对你现在不再敢用这句话太装逼了显得我是那个信仰领袖杨大师其实不是那样的那只是一个非常纯粹的想法在 23 年的时候
这个其实就是我想做的事它不是一个非常要达到的目标说我的估值要在明年干到 3000 亿或者是什么样的我要多到多少收入我的规模要多到多少我要成为一个这个行业里面多么多么牛的一个存在其实就是还是想分享一些东西因为我其实非常享受这种正反馈的我分享出去的东西大家愿意转发愿意来看然后愿意留言说你不错
我其实还是会有很多正反馈的同时能因为这种东西能接触到一些我的偶像和一些我平时接触不了的人比如说像郭帆然后像一些比如说小米的王川等等等等然后像华策影师的赵一帆赵总还能跟 CATV6 还能跟学习相国合作这是以前不敢想的
对因为你刚才说到那个内容上你会对标或者说你会想去做到晚点或者差评这种状态所以我是在想你后面更底层的那个东西是什么你刚说的那个 AI 殿堂的文童我觉得这个想法还挺好挺妙的对那所以具体到内容上比如说你觉得晚点的内容或者差评的内容就是它是在你的内容里你是想要其中的什么部分差评就我就不说了因为我也挺好奇因为我们也写一些 AI 的内容嘛就比如说你可能会看里面的什么内容觉得
是对你有价值的或者说你觉得是可能比较独特的影视飓风跟晚点还是有点不太一样的但是其实我坦率地讲影视飓风对我的影响更大因为我关注晚点其实非常早我忘了已经是在什么时候看到的罗永浩对于晚点的一个评价是
还在坚守新闻主义的理想还是什么的一决评论那你果然是罗永浩的粉丝对这个应该是有一点年头了我已经忘了具体是什么时间了但是这个其实就是我希望能做到的一个东西就是我在我的内容里面我非常强调的一点是它的真实性
你任何一点是不能有错的这个其实应该是我在过往里面我能感受到晚点的一个态度就是它的真实性它的专业性一定是最高的那错别字是你故意写了防止人说你是 AI 的什么那不是因为这个都成了你的内容一个梗了这个是因为我用了微信输入法微信输入法呢它很好用的一点是在于它能跨端去协同它不限设备
对
所以就错别字这个东西呢就是我其实最开始的时候二三年的时候还是想改了直到有人他回复了别人的评论是我的一个评词说这是人类撰写声明对他其实跟我的理念是相似的因为在我看来就是二三年
那个时候我就会觉得未来 AI 的内容一定会铺天盖地一定会席卷全世界席卷整个互联网那么大家在看腻了 AI 的千篇一律的东西以后什么样的内容会更加稀缺那一定是有人味的内容会更加稀缺人的价值反而会比原来更重更有意义所以
这个东西我就没有课余去改了人类撰写声明也挺有意思的能让大家感觉到原来跟你对话的跟你去做这个文章的是一个活生生的人他不是用 AI 写的对他是尊重读者的文点呢它其实真实性是一部分同时我觉得还是对于
对于内容的这种态度其实是我非常非常尊重的就是他会为了写一篇稿子会花很多的时间去调研去查阅大量的资料保证里面每一个的观点都是正确的同时输出一篇非常高质量的内容给读者能感觉到他是尊重读者的
它不是那种纯粹的一些翻译文它是真的我们用了自己的时间和精力去研究完了把一些加工完的很好东西认给你帮你去其糟粕取其精华的很深度的一个内容这个内容其实是真的我很想做因为我不是新闻行业的后来我才知道有个东西叫做特高
特稿的价值其实是我非常非常尊敬也是我很想做的但是确实是专业度不够精力不够什么都不够所以我做不了特稿我只能去做一些那种非常平的非常快的一些体验稿这个是我所擅长的东西但是其实我也想去做一些东西
以前是不是写过类似的好像尝试过尝试过比如说在 AI 版权这一块当时是 AI 会图第一案出来以后然后还有那个出门问问跟微软他们打过一次 AI 声音的版权包括还有好朋友叫行人一坤在打了 AI 视频第一案其实很多的人就会来问我两个问题 AI 的东西有没有版权以及你用 AI 声音的东西会不会侵权
其实我是真的也很想搞明白这个问题所以那时候我花了将近一个月的时间我去红杏律所然后去找他们调研然后请了几个参与国家政策制定的大律师还有做数据安全这方面还有知识产权这方面我们做了将近四五次调研然后找他们搞了大概七八万字的就是那种文字在那个时间点我写出来一篇我认为很正确的文章就是这样的给了大家一些答案
但是确实数据不是很好转发还不错转发有 3000 多但是阅读只有一点几万因为太深了就是很多都是法律的一些东西但是确实是我花了很大精力一个月的时间去做的东西对因为我们之前好像讨论过这个
我也是感觉到现在就你试图给读者一个比较全面的一个比较深比较完整的背景的东西但如果你的选题角度没有选的特别好或者说它不在一个传播杠杆上面就是说它最近可能没有一个什么非常明确的事件是跟这个事情相关的
它就会容易出现这种你花了表大的精力但实际上它的传播一般的这种情况对所以这就是为什么我会说我非常喜欢晚点的内容但是同时影视飓风给我的影响会非常大影视飓风这是 Tim 当时提出一个东西叫做 HKR 理论确实很有用就会说做一个内容你需要符合 H 和 KR 就分别是有趣干货和共鸣
所以在很多的时候切入的时候我后面经常会用类似于你刚才提到的一个传播杠杆的这种方式比如说我在给大家安利一个叫 F5 一个 TTS 的声音克隆的一个开源软件的时候我如果是去只写这个软件的话它可能会跟刚才一样落到了一个非常非常不好传播的一个东西
但是我会找一个节点然后那个时候节点是富航刚刚夺冠富航的夺冠的第二天我发了这篇文章我是用这个声音克冷的东西来复刻了富航的声音用它来讲了一段脱口秀同时再把这个产品安利给大家那这个时候大家就回来看了这篇数据确实很不错后面我就会去找各种各样的这种符合用户传播杠杆的一些点法律那边其实也找了因为那个时候我是刻意憋到了
出门问问跟微软那个声音版权案的时候的那时候其实第二天我就把它发出来了但是这个事件本身就非常的行业对这个事件就本身非常的行业就是我就会非常的局限
其实没有那么的好但是我还是很喜欢做这种东西的我刚才去看了一下这个 HKR 它是 Happiness 快乐这个应该指的是有趣对吧 K 是指 Knowledge 知识 R 是 Resonance 共鸣所以你是要追求就是至少其中有两个或者最好三个都达到我尽量是能三个都达到
就是包括我的一些引入的角度可能会更多的是用有趣的方式能让大家感觉到这是好玩就是当时我给海罗做了一篇文章就是海罗 AI 刚刚上线当时我帮他们写的那一篇倒是传播的非常广就是 1.9 万转发也是 19 万的阅读我在里面特别使用了 case 希望能让大家看到跟传统的一些 AI 视频有点不太一样的地方海罗当时最强的其实是人物情绪的表现这篇我有印象那个时候最火的其实是向左
向左的演技就是摸鼻子什么的是的所以那个时候我就想那我们为了传播以及为了让用户更喜欢这篇文章可能让他更直观的感受到这个 AI 视频的一个力量那我为什么不用海罗做出来的视频跟去向左做一个对比
于是我就用海罗做了好几个 case 来复刻向左在特定片段中的一个演技那确实很棒大家都爱看确实 AI 的一些情绪表达还挺好的会比向左更强那个演技好得太多了所以这种东西可能是我的一个方法论非常爱写的
然后同时 HKR 那一部分那个最后的一个干货就不说那个很简单了就是让大家能感受到一些知识或一些教程最后其实是一个 R 的共鸣这个这个也是我现在为大家更多的诟病的一点吧就是如果只是在前面写了有趣和一些知识可能你就感觉到没有落点没有价值
所以在影视飓风你看在做很多的内容的时候会在后面去埋一些他对于人文的一些思考不管是让你感受到原来这个东西打中我了或者是让你感受到悲伤或者让你感觉到头皮发麻的感觉等等就是典型的是他们当时把卫星发射到太空那个时候
他们最后的落点其实是把用户所有收集的一些愿望给发射上了太空这个东西你一听它就对于你每一个是影视剧中的粉丝来说你会感觉到头皮发麻它就真的会让你感觉到真诚和那种打动人的一些瞬间所以我也希望能在文章里面能用这种方式
但是可能在于对于家国叙事或者是中国崛起这种东西用的有点多因为确实我会非常感受到这种东西从那个流浪地球到六代机再到哪吒再到黑神话悟空其实我是跟着这一代去崛起的我能非常的感受到这种东西也能感受到这种国家情怀的自豪吧有的时候会去表达这种东西但现在公民用的有点太多了你刚说这件事被人诟病就是因为有些读者觉得你上价值上太多了是吗
对就是吹国内吹的太多了但是你是真诚的这么想的我是对因为我 95 年 90 年代可能 95 后到 00 年之后这一段真的看着国内很多东西不太行小时候我还记得我吃一个肯德基麦当劳那是国内我们那个小城市里面最贵最奢华的店你什么地方人安徽安庆的安徽安庆那你跟李斌是老乡对
以及安庆这个地方就是黄峥之前接受完电影采访的时候里面有一句名句大概意思就是说我做拼多多是想让安庆的人也有新鲜水果吃引起了安庆人的抗议哈哈
那倒也没有不是我觉得他说的也太夸张了吧是稍微有那么一些夸张但是小时候我在那个城市上我去的就是我妈带我去吃肯德基麦当劳那只有是我过生日或者是我真的得奖的时候拿了非常好的成绩我才能吃肯德基麦当劳呀
那到了后面我是跟着这一代崛起就是跟着这一代的时间生长起来的这一代人我们能真的看到从那个时候到现在国货之光包括我还做很多的投资就当时二级投资看着新能源是怎么大杀四方的然后再看着国内的所有的东西是怎么在海外怎么去一点一点打的
包括 AI 这一块 AI 这块是让我其实感受最深的最开始拆了 GPT4.5 出来的时候国内都一脸懵就是我到现在还认为可林是国产之光的原因就是在于它打破了很多的垄断所有人都在吹 SORA 但是 SORA 国外也没有人复刻出来可林是 6 月 6 号第一个把这个东西掏出来的从此我们中国的 AI 视频是真的能在全世界大杀死防的
海螺现在已经是整个的日活第一了在 AI 视频领域对其实现在应该是海螺第一可能第二对吧它比之前大家讨论的美国公司像 Runway Pika 这些应该都是要更高的 Runway 和 Pika 现在 Runway 比如说是最开始确实是我认为最棒的一个公司
它的工程化它的电影底蕴是非常强的但是到了后面在模型层面已经被国内远远吊打了它的模型自从去年 7 月份上了一个金三之后然后在后面更新了一个金三阿尔法之后再也没有更新过了一年时间了没有更新过东西你想想国内海罗和可林还有吉姆这都是什么样的更新速度
没有办法比还有 Pixworth 这些也是国内的 Pixworth 前段时间还更新了 VS 那个 VS 效果非常棒对他们刚更新模型是的这个确实是我眼睁睁的看着在国内这种情况下然后再看到国内的 AI 产品在海外大杀四方那我确实是感觉到非常自豪所以有的时候会表达这种情绪出来那就会被很多人喷对其实我觉得自媒体有一个好处或者说是个人表达有一个好处就是它的观点是更明确的
对但是你的观点更明确肯定也会招来更多更明确反对你的想法的人就有共鸣也有反的共鸣是所以这个我倒觉得不是什么太坏的事你既然做出来这种东西你就作为自媒体这个职业的人你就需要接受别人的指责和一些事情这个
这个就是你职业的一部分你没有办法避免的不可能人人都喜欢你你最近被喷的最多一次是 Malice 这个事吗对 Malice 但它对我影响还好但是确实会感觉到一些事情一些东西你觉得这个背后是什么呀就是是因为关注爱的人更多了吗还是因为什么就是为什么大家好像会对一个其实大家也没有用到的产品对吧然后有很多很多的表达在我看来他们自己的营销策略肯定是会有一些问题的
首先他们只给了大 V 邀请码嗯就我可以明确地说我们没有收钱这真的不是收钱的好好正好澄清一下对因为那天晚上我是看了别人发给我的视频就是我不认识曼诺斯团队的人的是那天晚上他们发了视频以后呢然后我觉得这个东西很棒我想第一手内测于是我去找了赛文乔一赛文乔一把他们的 CMO 推给了我然后我去找他们 CMO 要的邀请码
当网才拿到一个因为确实就是靠脸画园你突然是在一个群里看到的吗还是在什么群里看到的就有些这种 AI 的一些 KOL 的群是吧对就我们家的群非常多我大概有 50 多个群吧有 30 多个是我自己的人对因为我看你自己也做了一些 AI 的社区对就会大家有这种消息肯定都会往群里发的所以也是第一手看到的看完了之后我们就写了一篇评测
其实你要说背后的原因我是真的无法理解但是我确实是在这个漩涡里面的一个人我能感受到他们邀请他们的策略其实有问题就是你作为一个前期在算力明显不够的情况下可能会有更温和的政策就是策略比如说是内测申请这是已经非常非常明确的策略了
然后大家就是排队你不要用邀请码的方式因为邀请码这个方式你一旦搞出来它其实会从两个链路变成三个链路它一定会中间涉及到这些交易的问题账号交易当然也会有了就是过往你比如说那些内测的账号你去交易拿去卖肯定会有了但是它毕竟不像邀请码这么肆虐
更多会变成一个像演唱会这种黄牛的卖票的方式明白 你就说这个邀请码后面的一些交易就是高价有人在挂这个邀请码本身也带来了一些争议对吧对 因为那一天其实喷的最多的两个点第一个就是 Manus 首先他炮壳这个东西都还好了他其实并不是致命致命一点就是有人在闲鱼上五万块钱挂了一个邀请码那这个时候大家就是直观的认为你就是个韭菜了虽然这个闲鱼谁都可以挂第二个点就是因为 Manus 的占比货币
但其实跟他们没有关系对 其实跟他们没有关系你让我去想为什么我也想不清楚我觉得可能这个背后有一个原因还是就大家想用 AI 的人比之前更多了其实就是 DeepSeek 之后我觉得关注这个事的人更多了对他的这个策略你现在回头看有问题是因为他后面产生了如此大的影响力我觉得这件事情可能也超过了 Molica 团队本身的预期一定的就像我之前所说的
有 8 亿人是没有接触过过往任何历史的如果你是原来的这一些人的话其实他们对于一个产品需要内测是非常的习惯的从最开始的 Chad Gbip 说了从类似于 Miljoney 然后像什么 Wonder Studio 像装卫几乎所有的产品最开始都是以内测的方式连国内的文心一言所有的都是以内测的方式大家其实并没有说什么
2023 年最开始可能会人骂到后面大家已经习惯了但是这一次涌入的是完全他们一上来就是用的就是都是 DeepSegDeepSeg 那卡是卡但是你都可以用你问一条那也是可以用但是 Mandus 就完全不一样了 Mandus 是有邀请码就是你连用都不可以用其实我觉得有一点是对的就是很多人会说你至少你能给我进去用一次
你能让我上手体验一下而不是把我关在外面所以对于这种的机制也是把两年前复刻了一次他们这个东西确实 token 的消耗比较大非常恐怖我看这周张涛在硅谷有个活动然后他们一个线下照片里就是有人先想穿的 T 恤上面就写的是在 Malice 最开始上线的这 14 天他们就烧掉了 104 万美元的 Cloud 的 token 的费用
就是当我看他那个每一次任务调用的时候我基本上觉得这是百万起步的一个 Token 的教学就是一次最简单的任务
百万起步的 token 消耗非常恐怖的它可能有些优化的方式不是有消息说它其实平均一个任务是两倍远吗对 但可能还会有一些本地的部署的一些微调因为他们其实做了很多小模型就是基于超其实在之前已经拿千万复刻过推理模型的一些东西但是在 L1 之后已经自己做了一套带有思维链的推理模型了他们肯定会有一些省钱的策略要不然这个东西真的谁也扛不住的
不过还好了他们现在跟通益合作了那有些算力的东西如果阿里能包掉的话那其实能让他们的国内版更快的也将大家开放我们之前是聊了一下就是你自己怎么开始做 AI 内容怎么成为一个 AIQL 的接下来我们可以聊一些更实操的一些部分也是你一贯在分享的就是你说想做一个 AI 殿堂的门头让更多人能进到这个里面来玩一玩用一用
对吧然后我们可以聊聊就是你觉得普通人我这个普通人指的就是各行各业对 AI 感兴趣的人他可能不是一个开发者不是一个技术背景的人如果他们想来用 AI 的话可以怎么用我们可以从你自己的工作流开始聊吧就比如说你现在自己
每天的日常工作里那些地方要用到 AI 产品经理用的最多的可能是一些什么其实有很多人问过我这个问题我第一句话一般都会反问他们我会问他们你们有什么东西觉得很浪费时间你们不想干的这是我一般会反问他们的第一个问题其实这个东西是我在给一些公司去做类似于定制或者在剧组里面特别是剧组啊
我就直说了就是剧组里面是跟我过往的互联网的行业完全不一样的里面的工业化复杂程度特别是科幻电影的复杂程度完全不是互联网的这种 SOP 或者产品的开发工作流可以比的那是一个非常恐怖的一个工业化的量级那里面就会有非常多点是我不懂的
我们其实第一个要做的是用户调研就是用户研究我们要把所有的痛点给它挖出来基于痛点去用 AI 的方式给他们去服务怎么告诉他们解决其实这个跟对于普通人应该怎么用是一模一样的你如果是一个打个比方是一个程序员或者是一个法律从业者你对于 AI 视频你是没有需求的
你在过往的日常中间你没有需求除非你后面你要做自媒体这种东西我就不说了大概率是在你的前面几年和你的后面几年都用不着 AI 视频视频
那我就会问一个问题那你学它干啥呢你有什么实际使用场景吗就是现在的一个 AI 焦虑会让很多的普通人觉得我不学我也要对了他们并不是去为了解决自己的生活中间一些问题而是我要学学什么我无所谓它只要是 AI 的东西就可以了这其实是一种变相的懒惰式的应对 AI 的焦虑
就是用战术上的勤奋替代你战略上的懒惰对吧是的所以我一般就会问这个问题然后他们就会去想自己有什么东西可以解决当一旦他们抛出来他们认为有他们一些不想做的问题的时候那一具体你就变深刻了
那其实就非常容易解决了你是不想做 PPT 你还是不想建模还是你这个产品经理你想做一些自己小的 demo 的验证那就有无数的实际的实操的方法可以告诉你你就可以自己去学了这个点其实就是我日常中告诉大家普通人怎么去学的一个非常重要的点你先找到自己的使用场景
我自己的使用场景其实非常简单因为我现在的工作其实几乎跟所有的模态都会打交道所以我其实都要去玩的都要去因为我本质上它是从设计师过来的那图片和影像本身就是我要碰的东西那代码是我自己以前是做产品出身的肯定现在我经常会手搓一些我自己的需求
然后像声音这个东西其实现在玩的比较少但是一旦做影像我可能会需要配音的东西那我还是会拿声音和音乐去玩文字就不说那个是大家都要用的所以我举个例子就是我自己偶尔会有一些比如说找需求这个点就是我很多的选题其实是从我的粉丝群里面来的
找需求对其实它既是找需求也是找选题这个需求指的是你的社群里的那些人的需求是吗就是我的很多选题其实是为了解决粉丝们的问题的粉丝们提了一些问题我觉得有价值同时它能跟某一个时事或者热点能站上边我就会把这个东西写出来然后作为一个教程来发布那其实为了找用户的一些问题
我自己做了私域群我大概有 30 多个的群大概群里面 15000 多人然后我们会用 AI 开发非常小的一个小东西会把每一天晚上 8 点钟我们会把聊天记录全部给它发了下来然后用 AI 来去做总结然后挑出我们认为 10 个最有价值最有意义的用户的痛点或者是问题作为我们的一个选题储备
哇你们这还挺数据驱动的啊因为我们每一篇文章我都会复盘的会看几个数据然后呢比如说我们的赞月比比如说我们的分享量分享是我们最看重最看重的数据然后就是用户底下的评论因为我用户底下评论还挺多的每一篇大概都有一两百个评论吧我会把这些评论全部抓出来然后让 AI 来去分析用户对于我们这篇文章的一些正面或者负面态度到底是觉得哪个地方有问题等等等等
群里发掘需求和这个评论的分析都是你自己做的工具对吧你们团队自己做的然后那个群里面的东西稍微有点麻烦是我招了一个开发所的因为我的团队里面也有开发那个会让他去做然后评论那个就很简单了因为他只要爬出去就完事了我就自己拿字节那个去写了一个小游戏插件字节的那个编程的工具写的
对这种东西其实我们会有很多这样的场景包括我们会做一些低粉爆文的一些抓取其实也是偏向于爬虫和找选题了我很少会去做什么洗稿之类的这种所谓的什么 AI 的工作流这个在我看来没有意义更多的是我会用数据的方式来去把网上比如说一些它的粉质量很低但是它爆了一遍东西然后同时我们会用一些筛选的机制比如说它赞月笔
大于 2%或者是 1%然后我们觉得这个东西可能会是有一些价值的我们就会纳入到我们的选题内容因为你现在 30 多个群然后一万多人其实你们每天聊的内容很多你是用的哪个模型在做这个分析或者说你试了不同模型之后你发现哪个模型做这种分析会做得比较好我其实说实话 GBT
还是 GBT 是吗你只要是真正的要去干大活而不是那种玩一玩我最常用的其实就两个模型一个 GBT 一个 Cloud 两个分别是不干不同的事 Cloud 其实就是很简单偶尔写一些创意的东西或者是做编程就是它俩
GBT 是我虽然我天天骂 OpenAI 口碑现在非常差大家也都觉得 GBT 不行了但是 GBT 在真正的幻觉和整个的分析能力上是目前没有其他人没有办法比的
特别是它的两个东西我现在看的其实一直续费的是 200 道的美元 200 道的会员唯一的点就是因为我要用 O1Pro 和它的 Deep Research 对我看你最近分享了好多次 Deep Research 的你安利大家吗当然这个 200 美元这个档是比较贵可能用的人少
我之前一直不太想跟大家分享就是因为太贵了大家会觉得我在炫耀或者什么包括它会引起一些问题就是所谓的之前类似于那种学乏的心态就是因为你有钱所以你能用到更好的东西你能产出别人的更好但其实 20 美元就 plus 的也可以用但是它可以用 10 次对就次数限制的比较多
包括我可以再举一个我做研究的例子因为我从金融行业出来包括我自己有很多关于研究的一些习惯比如说我想研究影视工业流我把它称为一个十字形的一个分析结构我先要去看这个竞品它是什么样的就是你在当前这个时间点有哪几个跟你做的类似的公司和类似的在做的方式有哪些类似的产品这些产品的分别的优缺点什么样的
然后他们的商业模式什么样的他们当前的盈利状态什么样的这是一个横向的然后再一个纵向的纵向的我会去看这家公司从创立的这一刻到现在他们经历了什么样的变化他们这个产品什么时候开始上线的为什么要上线这个产品他们的战略是什么样的他们有什么一些的心路历程这是我称为一个十字形的架构那么这个架构在我以往的要做这种分析的话其实是非常浪费时间的我要看大量的研报
然后要看大量的关于比如像晚点之前对他们的一些报道而且晚点还是 2020 我忘了是哪一年成立 19 年对 19 年就是 2020 年之后可能还会多那 2020 年之前呢比如说阿里那时候我要去找阿里比如说最开始阿里国际对吧可能是跟阿里巴巴.com 这一个域名同一时间的产物这个时候网上资料非常少找起来也挺费劲的那现在有了 Deep Research
其实它的研究能力极强我只要把我的这个十字结构和我想要的框架列给它可能 30 分钟就可以给我产出一个两文字的研究非常深度的一个报告它能大大地提高我的研究效率这个东西我其实也跟很多的一些金融行业的朋友去对过了那么其实都说这是三年左右的研究员的级别
这个你现在是用在你自己的工作里面还是你用在就你自己投资的那部分我都会用都会用现在只要是跟分析或者是研究有关的我都会用的我会用 deep research 因为你现在是 200 美元那一档它是 150 次嘛对 150 次对你来说一个月够吗现在那还差不多我也没有那么多天天需要研究的就是一天我几乎也就用两三次
除非是某个大伙有的时候我对他反复不满意那种框架出来我不满意我要调因为每一次对话他都是生成一个新的报告即使那篇报告不满意你要跟他对话对话完在生成的东西还算是新的一次的他不是就那一个对话框里面一直算的所以目前我来看还是够的而且是其实用不完的
对 150 次就差不多平均一天是五次是的其实已经蛮够的了而且能把我的效率大大的提升很多时候我的一些内容背后是其实需要一些很多历史的一些参考的
比如说在移动互联网时代发生了什么那个时候我可能确实不知道我经常会用一些比如说移动互联网时代流量计费三 G 到四 G 那个时代的东西来往现在去做类比来给大家一个直观的感受但是三 G 和四 G 时代我经历过但是里面的很多细节我确实不知道那我就需要去大量的查 ISO 所我坦诚地讲 ISO 所包括什么一些
preplexity 所有的深度是远远不够的那 deep research 是够的 deep research 是够的是的还是蛮有用的对我来说就是 1400 人民币一个实习生都比他贵得多那对我效率加持就基本上提出一个问题我就去干个别的事或者是上个厕所回来其实就完成了还是蛮快的你自己做内容的一些方式我觉得还真的挺有意思的
就是我自己成为内容工业化因为我自己也认识很多的博主包括当年手工梗其实也因为自己实在是找不到有趣的选题而停更这种东西包括何同学他们都是在我看来我们想去做内容的人其实不是一定要追求 N 多个爆款
那个爆款当然是想做的但是我觉得更多的应该是去做一个下线我要把我的内容在这个下线去维持住这个其实如果纯靠灵光一线天天靠我刷七八个小时的推特这个东西是靠对于我的消耗对人的消耗它会影响我自己的创作经历的所以我是希望能做内容工业化的内容工业化但是你又不能太工业化因为内容这个事它本身是一个非标品你把它作为一个纯粹的工业化的话它就变成一个垃圾了
所以我其实做内容这块比较区分前期的选题我希望是能工业化能自动化的因为选题这个事它本质上它就是一个大量的阅读然后搜集以及去从间抽离的这么一个过程包括你提出问题等等我需要先有这个信息我才能把它作为选题以前我的信息是大量的我们靠人力去搜索
这个事太蠢了这是已经 AI 时代了所以我们就会做了内容公益化那其实就会涉及到我只能说我们自己内部的工作流每天有个早报早报是每天早上 8 点钟会推送到所有的我的私域群里面就是过往 24 小时的搜索材信息这个背后其实是抓了二十几个数据员吧这个也是自动化抓的对吧自动化
就一个小工具对然后把大概几百条甚至一千条的新闻全部挑出来然后我们有个专门的一个模型不是我们训的模型是一个通用大模型我们只是用 Prom 的方式拿去给这些打标然后跟 AI 的相关度以及它的重要程度我们会分为 ABCS 三级当然这些都不会给用户展示了全是一个早报了然后把这些我们认为最相关最重要性的十条给它挑出来然后我们的人再简单的把钱就是我们挑出来的
50 条不把它排序完了吗前 50 条我们会做一个排序就是人工会再超配看一遍我确定没问题了就把这 10 条发到群里面然后每天晚上我们会在我们自己内部里面发个类似于内餐的东西就是早上 8 点发了然后晚上 8 点去中间隔了 12 个小时这 12 个小时可能还会发生一些新的事件再把这些事件全部过一遍再发 20 条到我们自己的这个工作群里面
同时会带上我们在小红书抖音和公众号里面抓的低粉豹文和这个内参低粉豹文就一个低关注的账号但是写了一个传播很好的文章是对我举个例子就是公众号里面可能有一个人他平常的阅读量只有几百到一千突然有一篇他报了一篇五万的这个就是低粉豹文首先我不说他这个五万到底是不是标题党或这个是什么样的东西他至少他
爆了那就说明它可能有一部分是值得我们去参考的价值那就先把这个东西抓出来我先要的是所有东西全部搜集出来
缩集出来以后我再会去看什么赞月笔这些东西我来去看看这个东西到底有没有价值其实它就是把我过往需要人肉干的东西全部变成自动化流程了来给我做一个信息的输入然后做了很多低粉豹文的一些东西就每天晚上的 8 点内餐会有低粉豹文会有过往 12 小时做的一些新闻再给我我来看看决定明天有没有值得立刻去发的一个选题
那如果立刻去发就晚上八点开始写晚上八点写开始操作说实话如果没有的话那我们就会有前期储备的一些选题和文章还没结束呢我们晚上十二点钟会再过一遍推特里面有没有一些突然爆的东西或者大家发的东西如果没有的话那就发之前我们储备好的选题
就是选题它是一个选题但是我们会跟这两年的时事做一个结合它其实都是可以挂上钩的所以你们 team 的人其实是要每天做好准备晚上 8 点或者晚上 12 点之后还是有很多工作要做不需要 team 就我一个人明白就是你们 team 里别的人都不写东西对吧对就是我有个开发的一个小朋友
我给他的角色是编辑角色他可能会帮我把这些他其实是一个非常牛的一个大三的孩子全站然后就他是前端然后后端模型微调所有东西全都做还是一个学芯片做电子还能自己戳电路板曾经给我们戳过硬件然后他就会在我这里面帮我去做各种各样的这种抓取的一些系统然后自动化推送等等然后去扔到我这边来
你这个流程固定下来之后实际上你每天就你刚刚说的早上 8 点晚上 8 点还晚上 12 点这三件事花多少时间啊
现在基本上每天我在选题阶段可能只要花一个小时因为我还要过一遍然后可能我和自己还在稍微去补一下信息在最狠的如果没有这套东西的时候去年的七八月份就是那个时候我还有实习生就是专门帮我做一些内容选 case 找选题的实习生我们每天几乎每个人要在推特和所有的什么小红书 B 站上我们每人每天要烧五六个小时在微博上你这个流程从什么时候开始建的然后把建的比较稳定花了多长时间
从我们的实习生离职了之后我觉得必须得这么干了要不然这个人扛不住其实就是因为扛不住才离职的什么他七八月来的然后什么时候走了呢九月份赶走了一个十月份赶走了一个就工作强度太大了而信息密度也太大了可能对人来说对所以要干这个东西但是这道东西是我自己这边给我做决策的然后同时大家每个人每天还要提两个选题这个是独特的东西
所以其实有这套自动化系统再加上每人每天提的之前还有人现在已经没人了明白就之前有实习生给提两个现在已经没人了就之前我们每天可能到我这边我能选出来十几个选题但是真正我觉得能有价值能写的可能也就一两个然后去写
那你从去年九十月开始做这个事你到什么时候这个流程表固定了没有没有不是去年九十月份是去年十二月份开始做的一月份差不多稍微有个 demo 在这了但是中间又经历很多的人事变动然后这个东西差不多二月份才开始用的嗯还在不断的优化就是里面还是会有很多很多的问题你觉得用了这个车真的能帮你找到更好的选题吗就他除了说维持下限提升下限的这个工作之外他能提高你的上限吗不可能提高我的上限他给我最大的作用就是我现在可以来聊博客
但是我晚上回去以后我还有时间可以写文章可以干活呀但是如果按传统的流程我就是几乎没有任何出来的时间了我根本找不到不可能说我第二天文章不发了我出来跟别人聊天去割了那也不好呀
所以可以解放你跟人有真实的线下的交流对就是解放我的时间嘛就一些别的需要你投入的时间对因为可能比如说你和公司的人交流也是需要一些时间的比如说管理的一些事情也是需要时间的对包括我看最近你也做了不同尝试嘛就是你和李继刚那次其实是一个访谈那个报道对这种以前你发的也是相对少的就没发过
那一次之后也没发过了其实那次之后我就发了一个李继刚之后是一个图静豪图静豪后面我其实就没怎么发了因为这个事他也挺累的同时呢我也找不到太多的一些值得去这么做的人像图静豪他就是当年有 CloudSync Prom 的在我看来是有流量价值的同时也是会有一些意义的李继刚本身自己也是有价值的也是有流量的
那么很多的其他的人我不知道该去访谈谁了有些有流量的吧那就比如说我当然可以去访谈郭帆首先郭帆他就没空他也不会接受我的访谈对吧
对吧然后在一些大佬们呢像什么严俊杰这种啊首先我也没有那个资源去能跟他们去接触去访谈他们所以后面这块我其实也做的越来越少了嗯特别是看了晚点的东西以后就是你这感觉差异太大你比不了做了干啥呢对吧这个刚刚讲的第一步就你工作里有一部分是关于那个选题挖掘然后还有那个评论的分析还有些研究方面呢你还会有什么
流程是你通过 AI 可以省很多时间提升效率那比如说就是做海报现在我虽然没有那么多做海报的需求了但是真的要做的话其实还是非常简单的这个其实我就有的时候不用那个 Midioni 了或者有的时候一些大伙可能还是要 Midioni 因为来回调但是有的时候我做一些中文海报直接上 GmailGmail2.1 是可以直出中文字的也是可以用的
包括做日常的一些小表情包特别是回家我回家以后想给我爸搞些好玩的然后我就用 Pixworks 那个特效模板给他去拍一些照片对 Pixworks 有很多这种玩的东西对就很有意思但是
但是其实因为我现在的工作所限制因为他是一个媒体博主其实他现在打交道更多的是文字和一些产品的东西了所以现在用的最多的还是关于文字类的这些东西和 AI 编程 AI 编程是纯粹的帮我做一些小的工具因为去网上找一些开源东西自己调还不如自己手搓一个手搓一个还快得很像你长视频的部分你现在没有特别多用 AI 生成来帮你做对吧
就是你视频号上的那些东西吗视频号上面的东西其实首先我那个东西做得很烂然后用的 AI 部分确实不多因为我们脚本首先我的一个最核心的原则是最后的成片里面不要出现 AI 的东西就是不要有数字人然后不要有 AI 合成的语音不要有这些东西绝对不要因为我要做的这个 IP 是要有个人味感的一个东西所以绝对不要出现 AI 这个东西
那你有试过就把你自己变成一个数字人因为现在有一些服务是这样的是啊试过你觉得效果如何十几家都想给我定制过的然后我也定制过一些不好那个效果首先我要的不是一个纯粹流量的东西如果我是为了流量我要去挣钱那其实 ROI 只要算得过来我当然可以批量的去跑数字人但是我要做的是个 IP
IP 其实跟做流量的逻辑完全不一样 IP 你是要大家的信任这是一个信任经济如果大家不信任你觉得你这个东西可能是 AI 来做的那么你的内容对于他们的吸引力和他们的信任感会大打折扣为什么数字人不可能是一个 IP 了
比如说像初音未来对那个是虚拟 IP 对它也是个虚拟的东西对就是虚拟 IP 其实走的是另一套逻辑但是我们刚才聊的其实是一个狭义的数字人就是给我做一个数字分身而不是一个完全的虚拟的
另外一个 IP 那其实就是两个 IP 了就是我除了做数字生命卡这个之外我再做另外的一个驱使什么玩意的那就是要做品牌隔离的那一套逻辑了那个逻辑是可以做起来的因为特别是在经济领域特别在影视领域因为它没有踏房的风险现在你也知道演员是个高危行业常年踏房
那同这种东西其实是 OK 的包括无忧传媒包括像华策都会在做虚拟艺人所以回到短视频来说那其实这就是我的要求就是尽量不要出现 AI 的东西它一定是要一个有人感的东西这样用户才会信任你同时你也是尊重读者的尊重观看者的然后我就会在这个里面脚本可能会使用一些 AI 包括查一些资料的辅助但是最后的脚本其实还是我们自己人写的
然后同时脚本完了以后我的剪辑要去剪剪的时候里面的一些动效几乎都是手 K 的那个东西现在至少没法用 AI 辅助可能 MCP 来了以后它能用嘴来去 K 动效但是还不一定有它 K 的快现在我们其实
看什么自动化全看效率然后它可能有一些 B-roll 的一些镜头就比如说 Aero 是我的口播我们的 B-roll 一些镜头我们现在可能会用一些 AI 生成的视频的素材来去往里面做一些点充过往剪辑需要去找这些素材其实还是挺费劲的然后现在我们就会用 AI 来去包括克林 吉蒙 Pixar 就会生成一些东西往里面添这个其实能减少一些找素材的一些东西就有的时候你要找一段画面它是跟你说的这个内容相匹配的而且好有版权风险
对还要付钱或者怎样然后音乐和音效这一块音效我们可能会用一部分的 AI 东西因为找音效其实也挺麻烦主要还是剪音的音效库实在是太全面了包括他自己的付费的一些音效库过于全面了除非是特殊的一些音效我们可能会 AI 的音效来去做一些填充或者他是买了音效太贵了我们会用 AI 然后其他的就用的会比较少音乐还是都是有版权的自己音乐
也很少会用 AI 生成音乐除非我们要做一些视频之类的那种带故事或者带情节一类的东西才会用 AI 去生成一些其实用的不是特别的多然后在你这个工作流里面其实还是分析和整合信息的能力是核心我觉得就你现在照 DV Research 做的这个事儿
对就是我们做内容这一行其实选题包括这种东西其实有的时候占据了你 80%的精力我其实浪了时间最多的不是写稿子我还挺快的我两三十个小时我只要把这个东西体验的时间不算在里面体验完以后我有些结论我的素材全部整理完了我其实写一篇稿子也就两三个小时就能写完了但是前期找这个选题以及体验这个时间是最费的
体验这个事 AI 又干不了一丁点都干不了就是拿了一个产品我要来评测那怎么可能拿 AI 来评测呢那还是得人去跑或者是我的实习生去跑对主要是体验这件事情就算 AI 可以体验了然后帮你输出一个东西它还是好像不能替代你自己的体验是的那我为啥不用别人整合好的东西来说那为啥不用品牌方给我的 brief 呢 brief 里面其实也有一些东西对吧对你本来就是要
自己去试这个对啊就是因为我需要自己去亲身体验你只有实际操作了你的认知才会深刻你才能写出来自己的东西所以这个东西其实很难有 AI 来去辅助但是前面找选题和各种找资料这个点是完完全全我现在几乎 80%全部认给 AI 了那你在那个用 AI 的过程中间有些什么坑和困难可以给大家分享一下吗或者说你现在感觉到的市面上所有产品的还不足的地方吗嗯
坑就是有很大的一点就是这个是我遇到过我自己也犯过这样的问题就是你对于 AI 抱有不切实际的预期就是你没有摸清楚它的能力边界首先我们要完全地承认现在 AI 的所有的东西远远达不到真正的百分百的一个准确率的就是它达不到那种东西你不要对它抱有那种所谓的一上来就能跟十年老员工开始媲美的那种能力它不可能你是用什么东西的时候有了这种
我所有的也都是这样的就是可能 Deep Research 好一点能替代三年的小朋友但是你真正的十年的老员工还是会有一些自己的经验在里面的同时你也不能指望他一上来就是百分百完全正确没有任何错误就 Deep Research 到了这种级别他还是会有很多的幻觉在里面的这个需要你自己去识别的包括我前几天很好玩的一个点是拿 Deep Research 写小说对我看你分享了对因为写小说它是一个非常难的一个地
它的难点不在于它的文笔在于它的逻辑写故事跟写文章是不一样的写故事的时候特别是我们在做一些戏剧性的东西里面有个法则叫弃客服之枪就是你是要有伏笔的
如果你在最后一幕的时候比如说你这把枪它不会开枪它没有任何作用那你就在第一幕的时候不要出现它如果你在第一幕的时候出现过一个物品那么在后面的时候你一定要把它用上这个其实是写小说写剧本所有的核心包括大家涉及到一些什么 game 点包括如果我们要玩 Sky 的话它会涉及到一些 game 点的一些升级你要不断地去翻番的这种翻番是有一种逻辑和创意在里面的这个在过往
大家都说 DeepSick 写小说还不错 DeepSick 而已其实他仅仅只是在文笔上看着是能唬人但是他的逻辑性和他的故事性其实是不足的就是他的文笔好但他的逻辑框架不好世界观这些也不好对他根本不知道什么叫伏笔这次打 Problem 去调完那些伏笔其实也是假的
就是很多时候你在第一幕出现的事它不会让你感觉到原来第一幕埋的这个东西在后面有这么重要的作用你是用 DPC 的而已试过写很长的小说是吗让它输出很长的我用所有的模型都写过因为其实就是写剧本的逻辑写剧本这个事其实是我们从 2023 年就开始尝试的东西了
因为我们要做一些短篇这些东西都是要写剧本所以其实全部都做过包括写小说也是但是 Deep Research 的很大的一点是它的底层模型收散因为我的流程其实很简单我会先让 Deep Research 去生成一篇非常非常详细的关于我要写的小说的背景历史的一个资料
比如说我要写一个 16 世纪关于炼金术士的这么一个东西我会把非常详细的一个背景的资料全部给他让他去帮我整理完对就有点像设定集的那种感觉对一个两万字到三万字的一个报告然后我再让他根据这篇报告根据我的要求再把这篇小说写出来你会发现他有很多很多的逻辑伏笔是正确的第一幕出现了老师
他在第五幕的时候他就是要把那个头纱摘下来要跟你拼刺刀的那个人他是有一个反转载的然后第一幕里面出现的公爵第四幕时候把你送上反叛台的
他最开始招你来的但是中间经历了过一系列的循环他会有一些心理和对你信任的变化第四幕的时候就是他亲手把你送上了监狱这个东西你会看到我认为它是延续的第一幕他们在翻书的时候看到一个道具叫做贤者之石这个贤者之石是贯穿了全文在每一幕里面都会发生一些作用最后他是要召唤科苏鲁古神的一个伏笔但是他们第一幕其实在书里面看到了这个东西但是他们不知道那是什么
他只是说这个可能会有一些用类似于这样的东西它是三万字的小说它的逻辑伏笔是非常正确虽然它在整个结构上没有太大的意外非常标准的小说的一个结构它还能读下去了对这个其实是我在用 AI 的时候一个感触非常的深的问题但是我把这个东西跟给了朋友了对我到时候可以把这个小说贴在 shelos 里因为你其实有一个非出链接你在那个文章里分享了我朋友用了他是一个作家就会说我对他的预期太高了
他做出来的东西好像不太行呀因为我想做一个冰与火之歌那样的东西当时我稍微有一点沉默我说那个是冰与火之歌呀你这一上来就干这个你是不是对他预期太高了嗯直接把乔治马丁咬了是吧对啊你这一上来再干乔治马丁的活儿了那是怎么玩吗
所以这个其实就是我觉得最大的一个坑包括我自己也犯过包括我的很多的朋友也是觉得他们可能在 AI 不成熟的情况下没有摸清楚 AI 能力的一个边界所以对于 AI 有一些不切实际的预期或者说 AI 的能力达不到大家的预期
但是 AI 它其实是一个不断渐变的一个灰,你不能以一个零和一这两个极端去要求它,它当然达不到冰与火之歌的那种级别,但是它是不是可以做 60%的那种网文小说的级别呢?或者去做一些短篇小说的一些级别呢?或者你尝试拿它做一个脱口秀呢?
对吧对或者它是个辅助性的对就像现在 AI 视频这种能力逐渐被抹平了以后大家二月份的时候所有人都觉得 AI 视频是个垃圾那时候大家 Sora 被戳得很狠大家都觉得它能做电影一键生成电影这种玩意都出来了然后大家觉得它是垃圾它不想用了因为都是坑直到发现原来我做不了电影做不了电视剧但是我可以做短剧啊
AI 短剧是很火的一个范畴包括前几天新安林鬼市这个 AI 短剧报了是唯一一部在分账上能正向盈利的一个短剧你说的是对制作方来说是吗对他们是走分账逻辑是能挣钱的因为之前全部定制剧定制剧其实是不看分账逻辑的
那个东西是 Ui 腾把这个成本给包掉了这次他们走分账挣钱了这说明市场认可这个东西了所以现在 AI 短距这个行业其实在最近一个月炒得非常非常的火非常非常的热这个就是类似的那大家发现做不了电影那为什么不来做 AI 短距嘛
所以我觉得你要让我说最大的一个坑或者认知的一个问题那就是在这个阶段了解 AI 的能力边界不要以一个非常极端的方式来去认知和用它们而是用一个渐变的心态来陪伴着它们的成长而且我觉得你刚刚说的这里面还有一个点可以总结的
就是不要因为用了一次 AI 之后它没有达到你的预期你就马上对它很失望你就放弃它是的你其实还是可以观察一下的它会随着你的使用因为时间也在推大家也在开发新的东西它的能力可能也会提升以及你能找到它可能对你有用的地方对你就不断地去往下试也许
你百分之百的工作它肯定解决不了但是有可能百分之六十的工作是它能解决得了的那这百分之六十难道不是你的时间那也是你的摸鱼时间就不要太快的放弃对对对还是自己要多去尝试多去试一试我本来也想跟你就是单独聊一下 agent 这个产品因为 agent 这一类型肯定是现在大家讨论最多的其实你刚才自己已经说了很多就 deep research 我觉得它就是一大类 agent 就帮你做分析的这种 agent 然后 agent 你应该也自己测了很多或者用了很多你
你觉得就是除了 DeepResearch 是你用的最多最能给你带来帮助的之外其他的一些 agent 的产品有些什么地方是你能用到了吗或者说你推荐别人可能能用到吗没有但是一点都用不到吗当然不是用不到而是还是太偏向于玩具了
举个简单的例子 MCP 这个东西 MCP 就可以理解为比如说 Cloud 我想调用 BlenderBlender 是一个建模的产品就是我想让 Cloud 自己就类似于一个 Urgent 的一个代理的方式我说我要建一个房子他就啪啪啪开始操作 Blender 来去建房子了
中间它怎么操作 Blender 呢那过往的时候呢我们正常的做法呢其实就是把 Blender 所有的 API 和所有的文档全部灌给 Cloud 对吧然后呢你可能十个人能做出十个标准化出来那现在其实就有一套这种类似于 MCP 的协议就是呢有人把这个东西包装成了更上一层的接口有点像当年的 LineChain 然后呢
把一个东西开源出来然后所有人就可以用这套协议那你们也不用单独去开发了你们所有的 Cloud 比如说 Chain1 都可以支持我这套 MCP 协议都可以来调用 Blender 了它更像是类似于当年 LineChain 的这一个中间件的一个东西它其实就是现在很多 Urgent 的即使 Urgent 本质上它只有在我看来就是三个能力是最重要的第一个就是规划能力
用户虽然只问了一个问题但是它其实是需要把它拆解成各种细化的我感觉怎么做这种规划能力很重要第二步其实是执行执行其实就是我需要能用的工具越多我就运用这就是一个纯粹的规模化效应第三个就是整合其实不能说整合而是它的记忆能力吧
就是我有了超长的上下文我能把他们所有的记忆连在一起然后给他们整合成一个很牛的东西因为其实 Urgent 它的整个的链路非常长如果你的上下文或者你的记忆存储其实不好的话它可能会丢掉一些东西只剩最后的一些结论了那至少在我过往的测试下来的时候你上面的一些结论或者一些过程如果能留下来的话其实对于它的最后的整合和总结输出可能会更好特别是对一些报告的产品来说
而且你输给下一个东西的时候你可以不输他全量的你就输那个结论其实这样也可以省一些输入输出的 token 的消耗对所以这就是 urgent 这块的一个点但是 urgent 现在非常的偏玩具你为什么喜欢叫它 urgent 而不是叫 agent 呀
我不知道呀我一直就这么念的可能是因为我的英文实在太烂了我的英文非常的烂不要对我的英文抱有期待我记得最好玩的一点是当时有一个论坛我要上去分享了当时那个 assault 还不是很火但是我知道 preplexity 这个词念的是对的吗不对啊不对是吧没事没事但你知道是个什么东西对吧对 preplexity 我当时不知道这个词怎么念我在现场现查
就是英文确实很不好特别是我的英文我没过四级对但是我现在也能看一些 AI 的论文其实还是借助于 AI 的一些能力嘛还是偏技术平权让我这种学渣他也能去看一些闲闲闲的东西嗯对对就是这个东西还是偏向于文具
它并不能达到一些实际的生产力这个其实跟我当年做产品是有点像的因为我爸是做工业的他是做纺织厂的所以特别是很早的之前我们在聊天的时候他就跟我说过在工业里面一个点叫做成功率就是质量是非常重要的你如果这个东西的良品率只有 80%那你就是一个纯粹的垃圾的生产线
对对对每个行业不一样反正是做棉花的但我们之所以花这么多钱来升级设备搞了很多的那种决策式的模型然后去识别里面各种各样的杂质把它剔除掉不就是为了让我们的良品率提高吗我们每一个环节的成功率尽可能都是达到百分之百那最后我们是能保证我们的产出的
那在现在的生成 AI 包括 Urgent 的这一套东西它其实是一个超长的链路每一个链路你都没有办法保证它是百分之百 90%乘以 90%乘以 90%乘以 90%最后它越等于 0%那在一些真正的需要生产环境的时候是无法接受这样的容错率的你如果是生成一些什么文案或者搞一些什么小红书转抖音这种所谓的 Urgent 错了就错了无所谓没人会在乎
前几天我还跟上海人工智能实验室他们做了 MedBuds 的一个医疗评测节的发布在医疗行业你如果要搞 urgent 但凡中间有一步错了那就是命那就是误诊这个是要出大事的所以这个其实就是为什么我来看 urgent 这个点现在还是更多的偏玩具阶段就是每一个环节的成功率是没有办法保证的
Mandos 很强很棒但是如果你去真的去体验的话会发现里面会有很多的任务最后是没有办法成功的就是我当时晚上 4 点钟之前跑了 10 个任务成功的只有两个在 4 点钟之后他们跟我说服务器修了一下然后把算力堆了一下同时我对他的能力边界稍微有点了解了我不会再去测什么让他去玩狂眠小朋友这种游戏了
2048 这种游戏他还能玩一玩狂冕小朋友这种游戏他明显就玩不了了那也不指望
因为当时我在一边直播一边测还有一个朋友给我出的馊主意是让他去玩一个在线版的红警我说你疯了吧非要去玩那明显连网页都没进去其实后面我就知道他的大概能力了大概十个任务能成功五到六个这个而且是我在对于 AI 还算有比较深的了解的情况下所做出来的那为什么 Manos 的那个测评他和 OpenAI Deep Research 就是在 GAIA 这个 benchmark 上他每个层级都比
OpenAI 的 Deep Research 要高 Deep Research 只干一个事它只干报告生成所以就可能跟它任务测的多样性有关对吧对 Mannus 的东西你是里面还带虚拟机还带编程带各种你让 Deep Research 它能干编程吗它干不了对
就是我刚才说的你叠加的东西越多你的成功率会越低包括像大家写编程你会用 manos 去写编程吗不会还是会用 cosr 去用 trade 这种东西去做单一的东西单一的东西它的成功率会更高我并不是说 urgent 未来不好而是在我看来现在的每一环节成功率会偏低它没有办法解决一些超长的大批量的一些任务
典型的比如说智普的 autoGRM 我当时测试过一个最搞笑的环节是我有个群比如说群里有一百个人我让他去点赞前五个人的第一条朋友圈这个是没有问题的但是我如果让他点赞前五十个人那
那第七个第八个人会越来越卡反应会越来越慢到了第十个人的时候人已经懵的已经不知道该点哪了其实就是任务步骤越长它的成功率会越低对就是这个问题现在其实很难解决当你能把这个东西做完了那就是一个超牛的自动化的 RPA 或者是能给你看更多事的
这个我觉得才能真正到达生产级别所以目前其实真的帮到你自己的生产的 agent 还是 open-edit deep research 对因为他在垂直任务里面做得很棒真正的说 Cursor 其实也算是一个小的 agentCursor 也算是一个 agent 对如果把 agent 的定义你别放到通用的 agent 上其实日常生活中我们已经有大量的 agent 在使用了只不过大家可能没感受到那是一个 agent 因为你自己会手搓一些工具嘛
那像比如说 Codes 还有 DeFi 这种我理解这两个东西是可以让你在上面自己去 DIY 一些你想要的 agent 的产品就可能你可以给他一个工作流像这种你用吗我在 23 年会用现在已经用的越来越少了
你要是三点用它就是用它来做一些小工具是吗对因为那个时候是没有所谓的这种 Coso 这种 AI 变成的产品的那个时候我想搓东西只能用 DeFi 去搓或者是那时候后面扣子出来了我能在里面去拖各种各样的节点但是我每一个小的插件我还是得人写像 DeFi 的话你用它去搓东西的时候它是不用编程的是吗它给你有一些模块是弄好了
对的最开始我们学拿它做知识库用的然后做我们的一个本地的框架用的它也可以在里面进来搜索能进知识库等等因为它是一个通用性的一个东西你说这个知识库是你之前九圈的那个公司的知识库九圈的
2023 年的时候我们会用的比较多那时候最火的是科普机器人嘛那时候 DeFi 一定是最好的做这种东西的所以你们当时试图给银行或者券商或者卖基金的那些公司做的那个产品你可能就用了 DeFi 没有那个没有 DeFi 它只是我们在内部比如说人事啊一些这种知识库我们灌进去我们就可以自己做了
那种是太工程化的东西还是不会用的那个就是自己开发的对我们当时连 Lunchang 都没用全部是自己手凑的工程化的东西因为我们要求追到定制化实在太多了 Lunchang 还是偏组件化的东西做的话一定还是自己得定制化所以让你对 DeFi 和 Codes 用的变少的东西其实是 cursor 是吧
是编程的产品对 是的让你可以自己编对 我其实很讨厌就是在流程里面一个一个点的去写三出然后一个一个连线好麻烦呀因为你本质上你得找到那个东西你把它拖进来然后给他们去连线然后你自己要搭一套工作流那不是我直接手搓一个我不应该是拿嘴扔进去然后你的东西给我出来不就完事了吗
就是我跟引刀他们也在聊这个点就是引刀现在能做一些短链路的 RPA 就是我能用直接搭一个工作流出来什么都不用管了引刀是哪两个字引刀是影子的影搭刀那个刀就国内可能是做 RPA 做的最好的一家公司了他们其实也是工作流的概念我现在自己的习惯更多的是想要一个什么样的东西我可能会更多的直接手搓除非是一个长链路的一个工作流
比如说我要从这抓个东西把它改显成另一个中间调用 N 个模型来去做一个协同但是现在我更多的会用飞书飞书多位表格就干了因为那个东西更直观而且本身是可以跟我企业里面的很多数据去打通的飞书多位表格做一个长链路的非常棒比如说什么场景了我举个例子我用户我爬了很多的数据我把那个数据导入进去以后我要给他们挨个去打标签
它是类似什么好评负评之类的这种标签是吧对包括你可以把一个图扔进去用豆包的视觉模型去把它的头像的词我灌的是一个头像进去然后把它反推出来描述一下这个头像就是它是一列一列的
每一列后面其实就是工作流再用 DeepSeg R1 对于之前这个东西做一个描述来猜测一下这个头像可能是什么性格的一个人然后我把这个东西做完了以后我再会用豆包的自己的模型就没有 DeepSeg R1 因为它那个提示词的遵循不是很好然后把它再转成一个能用寂寞生徒的一个 prompt
再把这个 prompt 用豆包的绘图模型来画成一张图通过这套方式我用这个头像来推测出他这个人长什么样就你最后给吉摩的那个指令他是一个更偏真实画风的一个人是吧对这个其实就是非常完整的一套工作流只是每一个列他都是处理不同的任务他这个列变成了一个一个的节点那你这个每个列里面写的就是那个 prompt 和输出的结果
是的前一列就是后一列的输入后一列就是前一列的输出同时这一列又变成了后一列的一个输入这就是一套非常标准的话从前到后的一个工作流而且很好用其实我也用多位表但我没用到这么高级的功能就这个东西你放进去之后它是可以自动化的帮你一个一个去跑吗全自动而且当你把模板固定下来以后你后面每加一列数据后面东西全是全自动你什么都不用管了
飞树是给你提供了就是官方的接口是直接可以接豆包的那几个模型吉蒙 21 都可以
他们有个东西叫做快捷自断还是叫什么自断捷径吧反正这里面就包含了 N 多的类所以你就可以理解为是一个接口一样的东西里面可以叫 DeepSeg R1 可以叫豆包的模型可以叫智能标签可以叫轻盈的视频生成等等等等什么都有飞书现在给你这些功能的话就如果你本身是他的一个付费用户是不是你在额外用这些东西都是不要钱的不要钱的但是那个 DeepSeg R1 他们就是像这种模型涉及到 token 的消耗嘛这个需要你去绑定你的火山已经的开发者账号从里面扣钱的
这个还不是付费用户这个免费用户就能用就只要你是有个非出账号就可以用是的很爽的但如果我用豆包自己的模型也会算我的 token 加号吗还是就不算了会啊也会要不然那不就炸了吗那我每天跑一万个任务那不就是白嫖烤死他了吗但是一进去会送你如果我记得没错的话送你一百万的 token
你这个场景倒挺有意思你这是自己玩吗自己玩纯自己玩就是当时因为我在测飞速度为表格想着这种很好玩的场景但是实际过程中会更多的偏向于生产性的比如说去把我爬出来的很多的东西然后来给他们打标签或者给他们做一些转写或者给他们做一些总结或者做一些翻译等等他甚就甚在可以跟自动化打通
我再举个例子就是我在今年的三月份我不是办了一场一起也要交个朋友的线下活动吗那个活动报名了 2400 个人但是我要挑出 200 个人出来然后这时候大家每一个人都是填了很多很多的信息的因为他本身就是全部进多维表格的多维表格我就直接在他的公司后面插了两列第一列把他的公司提取出来第二列把他的职位提取出来
然后第三列是根据他的公司和职位给他打一个标签到底是金融领域还是媒体领域还是影视领域还是什么什么国企的给他打个标这样其实我就能非常的直观的看到他是一个什么样的场景了然后你之后可能是按一些比例选的是吧你希望跨界一些是的希望跨界一些包括后面还有一句话的描述
其实这个东西虽然有点不是很好但是还可以说一下就是我又用了一个 deep think 然后去把接进去来分析他这一句话从一分到十分他想来的意愿有多强然后又分析了一遍然后后面又出现一个非常可视化的一个东西就是非常能提高我的筛选的效率以前这套东西我自己筛 2000 人我可能得筛两天这个非常非常的难非常非常的恶心
然后这一次一晚上我就晒完了然后同时晒出来这 200 多个人我要给他们分组因为分组也是因为我这个活动里面其实是有些共创的环节所以其实跟类似于吃喜一样 10 个人一组对 然后我要给大家分组其实也有很多的问题比如说得相同背景的人在一组要不然大家聊不起来不能交个朋友同时竞品不能在一组比如说某某公司就是非常明确说我不要跟谁谁谁在一组
我们可能会干起来而且会影响交流的氛围对然后还有国企的几个领导们他们得单独拎出来在一组还有比如说某一个群的群友是特殊的叫我们 21 群那是一个特殊的群这群人就一定得在一组就会有各种奇奇怪怪的规则这种规则在 200 个人里面我以前也搞这种规则其实挺麻烦的但是多位表哥就做不了这事然后其实是我用 O1Pro 大概推理了 11 分钟给我分出来一个巨牛的一个表哥
就这也是 O1Pro 的 DeepResearch 帮你做这不是 DeepResearch 就直接让他做因为 DeepResearch 很简单 DeepResearch 的场景是要联网的
欧安 pro 是不联网的产品我两个其实分得非常明确分组这个事也只有欧安 pro 能干欧安干不了国内的所有的推理模型都干不了这简直是红楼梦级别的难度就感觉是贾府要办什么宴席怎么给安排位置我给过去的规则一共有八条但我觉得这个确实也取决于你用这些工具比较熟练对我觉得我知道什么东西能解决什么问题 11 分钟对你刚刚说了
我去年五月份的干这个时候我是拉了我的很多朋友过来 11 个人干了两天才把干完这是一个挺好的对比就是从 11 个人做了两天变成一个模型做了 11 分钟对当然不是全职的大家就是墨鱼的时候帮我干因为 11 个人背景不同他们会去稍微 share 人然后想要怎么分组之类的对比 11 个人很可怕这些用力我觉得都挺有意思的
确实因为都是我自己实际的用力就是我是一个很懒的人我是能不自己亲自干就不自己亲自干就是任何一个事情如果让我要重复三遍我就一定会把它 RPA 或者 AI 化我绝对不会自己干的太浪费时间了也是太低效了你有一些自己私家珍藏的 AI 工具或者产品吗
就是我指大家可能讨论的没有那么多但实际上你用的还挺多的比较少因为我的习惯是我几乎不会藏什么东西只要是我觉得好的我都觉得很牛这个选题可能会爆那我一定会立刻把它去写出来比如说凯罗的 AI 的克隆因为当时所有人都在说声音克隆这个事其实做的都不好
没有一个达到配音级别的然后海螺 AI 的在海外声音一出来我就看到了看完我立刻觉得这个东西非常牛然后我就直接把它推了一波他们声音克隆其实二三年的时候就做的也挺好了因为它之前有一个产品它没有这么推起来就是那个海螺问问但海螺问问你有一个功能其实挺有意思的就是那个克隆声音对克隆声音因为二三年我帮他们推了一波因为我当时有一个粉丝她的老公去世了
他也想用这种数字生命的这种东西当时他想跟他语音对话因为他还有两个孩子孩子们还是希望语音对话嘛 23 年年底的时候当时就是跟海罗问问的 PR 比较熟当时我在各种白嫖想看看有没有谁家的语音方案能帮我解决粉丝的问题然后当时海罗问问他们的语音确实不错同时他们 PR 觉得这是一个非常棒的一个点这是很有人文意义的
于是呢他们就帮我做了我找粉丝呢要了 90 秒的音频然后得到的效果呢
它的原画是七分像但是已经很不错了我不指望它能达到我老公百分之百的水平但是已经达到 70%我的两个孩子也非常的感谢这个就是当时海罗的那个点因为当时那个功能我们办公室其实很多人试过就有的人会特别特别像连语气都非常像语气语速和那种停顿都非常像但有的人就不是那么像但总之来说当时那个效果我觉得已经还挺惊人的对但是那个有个问题
当时海螺那个问问他只能去克隆你本人的声音因为你克隆的时候是要录音的我帮我粉丝做那个其实是走了内部特权是没有经过录音的直接进后台的他其实产品上可以给你放开放录音但这样的话就会有一些隐私和版权的问题但是在国内是做不了的
对啊就我觉得这有些风险嘛所以去年我之所以说海龙那个克隆是因为它上的海外版所以是可以克隆任何那声音的这个对于创作者非常的有用很多的创作者特别是 AI 视频的创作者是需要一些很棒的配音的产品的
但是传统的所有的 TTS 的产品都到不到配音的级别但是他们的可以你要说私藏的珍藏的还真的几乎没有但是有些很好玩的东西比如说还有个叫 Vigor 的一个产品比如说我把你拍下来就是拍了一段视频你在里面去跳舞
我可以比如说用特朗普就一张照片能把你中间的这个人替换掉然后最近有个那个国学我不知道你可能看不看我知道就是什么古人来骂你就是用那哥们的视频然后把它变成了无数个古人那个其实就是威格尔做的这个是一个中国团队还是这是一个中国团队当然在出海做那他们团队是在国内还是在海外这个我还真不知道我跟他们完全不认识
只是我觉得他们的产品很好玩我一直在用就是现在视频平台上基于就你刚说 Vigor 这个做的非常多有好几个系列有一个是什么叫谁谁得了 MVP 然后还有一个是叫怎么怎么样为什么不找你自己的问题这种东西它就是会很出圈很火因为它真的是娱乐性很强的但是大家可能不知道这个东西是 Vigor 做的
他最开始反正也没想着去做工业化的动物的替代因为之前有个产品叫 Wonder Studio 他是想做工业级别的影视化替代就是你需要先传一个模型上去那个模型的谷歌绑定还得按照他们的标准来去做然后再去替换视频里面的一个人那个效果确实还不错但是那个太难了威格尼尔牛仔他非常的简单一个视频一张图我就能替
挺有意思的我估计你们现在接触的产品肯定是最多最新的那个也不行了我在 2014 年 2 月份的时候就推过一次那时候他们刚上线 2024 年的 4 月 1 号他们发的 2.0 我去推过一次因为我觉得很好玩那篇报的那篇十万家那个时候其实就已经很有趣了我也看了一下就是你最开始写 AI 的时候一些文章就 23 年的时候其实你就写过 AI 工具大全然后
然后我找出来看了一下我觉得还有点恍若隔世就你当时的一个分类对就是说什么对话式图片视频音频我为什么还会分一个文章我为什么会分这个东西对就是有这么个东西为什么我说会有这种恍若隔世的感觉比如说这个 beam 对吧就微软的那个 newbeam 早就已经
不行了就已经没有什么人讨论了没有了没有了还有一个公司就是那个 JasperJasper 倒闭了吗我记得 Jasper 没倒闭啊没倒闭啊没倒闭啊没倒闭但他上一次就是引起比较多讨论的新闻那都已经是 23 年 9 月份的事了就因为他之前的估值是到了 15 亿美元然后 23 年 9 月份的时候就是海外有报道说他 down run 了一些就他的估值降到了 12 亿美元然后也裁了一些人什么的
但他确实这个公司后面怎么样了我也不知道怎么样了我也没关注他了因为他本质上他甚至比我当年的那个套壳还套壳他其实当时我印象非常深刻因为我当时在做我们自己那个产品的时候去研究过 JASPER 的商业模式当时 GBT-3 的时候其实很难用 GBT-3 的 API 刚出来的时候非常非常难用
然后大家也不知道该怎么去调那时候也没出来就是纯 API 的然后其实是帮把他们的东西是直接做了一层包装然后给大家能用对那时候因为没有出来所以大家想用一些影响的东西来去他那边生成其实效果最好的
他其实是最懂品牌营销这块的一些文案的生成的他确实生成的质量会比别人的高但是他也没有什么工程化的东西那甚至就是一个一个的小木板在那你自己选那其实到了后面他的智能上限越来越高的时候我说实话品牌营销这个他不算是一个垂直行业
他其实是更多的被嵌入在不同的行业里他并不像金融医疗这种专业型的知识更有护城河所以加兹普尔最开始确实活得还不错到了后面呢大家可能更多的只用 GPT-4 用更多的一些其他东西就可以替代掉了那为什么要付钱来用你这个东西呢不过他的近况其实我不是特别了解
我看了一下就是 25 年 24 年其实还是有一些营销行业的人他会去会提到这个会去测评什么的这个东西我确实有点恍若隔世真的这是我 2023 年当时我在做我的金融产品的时候一直在研究他的商业模式因为他的商业模式跟我那个东西非常像大家都套壳嘛都是垂直领域的套壳嘛只是我套的是金融行业我做了一些工程化他套的是品牌营销对我们可以看看就是你当时写的这些东西里面哪些是还在用的
首先是对话式 AINewBin ChatGP 我为什么要放文信一言对因为这个是不是 3 月 7 号那很早 23 年 3 月 7 号确实它国内没有别的文信一言但是 3 月 16 号第一次上映是国内第一个上线的 AI 对话式 AI Chatbot 的产品这是中国唯一一个难怪这是我 3 月 17 号写的文章对你当时写的还是这个东西将于 3 月 16 号正式召开发布会然后与大家见面 OK
当时它是有一个预告对国内大圆模型的希望就觉得挺有意思就是你看一些以前的东西其实才过了也就不到 48 个月吧它的那个行业确实变得很快那个真不是我吹但是确实就是国内大模型的希望所以可以看一下哪些现在还在用的 CHATGPT 不说 CHATGPT 肯定是一直在用的全球最好的这个美毛泳泳
美洲你现在还在用 Sleep Diffusion 现在依然在用然后 Dali 2 变成了 Dali 3 但是 Dali 3 自从 2023 年更新以后再也没有掉那时候它刚出的时候还是非常火的因为它最牛就是它的语义理解这是全世界语义理解最好的模型但是后面几乎就不行了因为它再也没迭代过了
我们还是蛮期待达力四的对就是大家也是在催 Open 来说让他要去搞搞这个达力三的那个审美实在是太烂了在 2023 年还是勉强能看的到了 2025 年就真的是掉队掉的有点过分了这个产品也对对对这个当时是类似于就是现在的 LibLib 或者是 CivitaiCivitai 其实也做了在线的 SD 生成嘛
它当时是微调了一个模型但是现在其实也掉队了这个 Lotal AI 也是自己不做模型是吗对 微调它其实就是 SD 当时谁都能调对 它开源的它开源的而且我都能调它的要求很低所以当时出了很多模型的微调的一些工具或者产品它们有自己的一些风格比如说国内会有人出国风的风格有人出动漫的有人出素描的 CG 的但是
它这个东西其实并不是自己非常深的护城河最后其实剩下来的是两家社区型的产品一个 CVTi 一个 LibLib 而且 LibLib 这种它也是有点行业属性比如说营销广告设计这个人用的多文心一格深层式 AI 产品这个应该是最恍如隔世的文心一格你现在应该是没有用了是吗
还有人用它吗别人我不知道就是说我不用我不用然后是那个视频生成的 AI 这个确实是挺恍若隔世的因为你当时写的这些东西全是数字人那个时候对是现在这些主流的视频生成产品都还没有出来的时候对
但是 DID 我印象非常深刻那个时候是汉青他做了一个 AI TalkAI Talk 他是用 DID 做的然后左边是马斯克和乔布斯的对谈两个人在太空里面那个在实在 3 月份的时候超级爆哦我想起来了我有印象那个应该是只要是 AI 行业的人应该都做过那个是全世界第一档所谓的 AI 原生式对话的一个节目就是两边都是数字人对然后两个人去聊一些非常有意思的话题
就是 AI TalkAI Talk 后来还有内容是吗有它就是在那个视频号上是吗视频号 B 站都有前几天汉京还开了一个音乐的节目那个音乐节目是皮卡丘的一个音乐然后做得非常牛那个也爆了那个也是几万赞也爆了
白色皮卡丘 MV 你可以看到它的对口型跟当年这个完全不是一个级别的主要看这个人这是数字人纯粹是数字人那这个很真实表情也都很真实这个是季梦的对口型的大师版就是前段时间非常火的 Omini Human-1 是那个模型他们放在季梦上上线了对口型基本上像秒杀全世界所有的产品
以前虽然是黑阵火的时候也是对口型对吧有段时间黑阵最开始火的时候是那个妹妹啊妹妹说中文对对对就是说中文英文的那个切换赵本山说英文他这整个人物都是吉梦的模型生成的吗他这个里面分很多个步骤有人脸的部分他的底图全是米德中尼生成的然后有人脸的这种对口型的部分全部是用吉梦的对口型的大师版就是他是发挥不同视频生成模型的优点然后给他结合起来对吧
DID 现在已经没人用了因为当年他们做的近代照片就是对口型这个东西我们称为照片说话那个时候只有他在做到后面就彻底掉队了对后面很多人做包括阿里当时后面也出了几个效果还挺好的对阿里但是我不知道他们为什么上了同意签问以后再也没推过了就是他们最开始逼妈用说话什么东西的大概是 23 年底 24 年初的时候对现在不知道他们可能重心全放在签问上面了吧
这个彻底没了 Synthesia 我都没听过它它甚至比 DID 没落的还要快 Felix 也是这个更快了对这是你当时写的上然后到下的话就开始音频有些还在用的吗 Morph 一个都没用了 Morph
没用了没用了 Refuse 也没用了 Bomb 也没用了音频已经彻底洗牌了音频现在的王是 11 Labs11 Labs 那时候还不在对但 11 Labs 其实在 2030 可能下半年吧我觉得它就已经挺主流的或者说是这个领域挺 top 的
那个时候我第一次写 11Labs2023 年的 11 月份海罗的也做的也不错就 minimax 的音频做的也不错那时候豆包什么的也都开始起来了然后云克隆这一块就开始牛的一些了文章这是啥我为什么会在写这个东西
在我看来现在它就不应该有这个单独的分类我其实前段时间又发了一个 2025 年的版本那么可以对比看一下你可以对比看一下这个里面倒是有一个产品就你当时 23 年 3 月写的这个里面有一个产品我觉得还是很多人肯定在用就是 notionnotion 肯定的对它本来也不是这一波才起来的是的
Norse 呢就本身它有点像夸克技术 AI 它把它放进去它稍微有点降维打击 2025 年最好用的 AI 产品大全推荐对这个我就没做整个的图了你现在的这个分类就跟之前 23 年很不一样了好久不一样 AI Chat AI 搜索 AI 编程 AI 绘图 AI 声音 AI 音乐 AI 视频 AI 3D 对其实分类就不一样了
就说明行业还是变得挺快的变得非常快包括 chat 和搜索其实现在基本上我觉得主流的 chat 产品也都是可以满足你的一些搜索的需求但是我还是会把它分开了对分开了因为他们的产品形态还是确实不太一样这个我还写过一个 2023 年的版本
就是那个是 2023 年的年初然后 2023 年的年底然后再加上 2025 年这三个对比起来其实还是有点意思的对可以看到这个行业的变化比如说像在 23 年的版本里都是没有豆包和腾讯元宝的我就说 23 年年初的那个版本因为那个时候百度是起步最快的嘛跑得最快的中国大厂那豆包和元宝尤其是元宝在春节之后对就是 DeepSeg 加上最高质量的 ASO 所一次崛起了嗯
perplexity 是的是的是的嗯编程编程编程其实也是 cloud3.5 更新以后才彻底崛起的版本因为那个时候 cursor 都不打地嘛然后纯粹是靠着 cloud3.5 的 API 接入才一一气决成的嗯整个行业起背的嗯因为你这个里面写那个 tree 你是最爱用的吗所以 tree 已经超过 cursor 是你最爱用的
对对它确实是我最爱用的因为道理很简单 Coso 非常的专业但 Coso 它要钱确实不要钱现在可以白嫖 3.7 那我当然爱用了而且它有个很大的一点是我还是喜欢中国人做的产品因为它的界面是原生中文的我的英文非常差然后 Coso 呢更偏向于传统的 IDE 里面是要做汉化插件的然后有的地方还没法汉化我其实不是特别的喜欢用
所以吹你肯定是用这个更顺手的是的是的是的因为我得叠个假就是我不是专业的开发所以呢我用不到几千行的那种大的项目更多的是一些做一个小插件然后是绘图这块绘了奇梦可图可图真的做人像会非常非常的牛嗯
快手这个可图和可灵它就是一个团队做的什么在大的团队架构下是一个但是一个是视频模型一个是图片模型其实还是分成两个小的团队然后还是 MidJoly 这个也是一个算是从 23 年到 25 年就穿越了还是大家在用的一个东西可能要发 7.0 了但是 7.0 从 12 月份的时候要发等到今年 3 月份了还没发他们太能搁了
嗯然后是那个力不力不力不力不力不确实你要想在国内现在玩 SD 的话你要么就玩康复 UI 的本地化部署要么不如直接去力不力不上再见跑就完事了里面有最多的私有化的一些罗拉模型嗯对然后就声音这块第一个写的是海罗嗯
海罗真的中文非常非常的强对包括你最近测 OpenAI 的中文它也是不如海罗任何所有的海外产品在讲中文的时候总是有一种奇奇怪怪的大左感就是有点像外国人说中文外国人说中文就是它是这种口音的那就感觉上你很不一样所以还是得海罗海罗说出来才是真的中文 Elon Labs 也是大左感比 OpenAI 还要强
嗯然后音乐苏龙还有国内的就是抖音的就是海绵确实是为数不多海绵跟天宫算是做的不错的对天宫这块也做的比较多那视频就是国内屠杀对克林克林海罗唯独 pixar wars 最近还没有 sndsndtriple 魂源再加上微软的一个开源的现在可能也不错但是现在主流的大家玩的最多的还是魂源 misshine 然后魂源那个 triple 就是
就这还是一个对那个 mesh 也是中国团队做的回忆明跟他之前在剧组里面还见过一面其实你这个里面很多字节你发现没就 25 年这个版本里面如果统计下的话这好像每一个门类都有字节的产品我都没注意豆包比如说豆包这是字节搜索里没有放字节的然后编程的话这个 tree 是字节的贵途吉梦是字节声音声音没有放
没有声音音乐海绵音乐海绵字节的嗯海绵音乐也是字节的然后视频视频也没放视频因为那个鸡梦稍微有点你还是觉得他图像能更强一点什么嗯他的视频做的很早但是现在迭代的有点慢嗯
可能跟那个主流的 TOP 机的可能还有一点点的差距他们需要再迭代一个新版因为他们新版确实已经有一段时间没迭代过了 3D 的没放 3D 因为自己也没做 3D 对这不是他的重点吧腾讯确实我也是听人说回原 3D 挺好用的就可能跟他做游戏这些相关他有些这方面的积累也有些需求吧然后如果现在其实还可以分分为开源闭源的但是就实在是分不动了开源闭源的其实还是可以分很多的对所以这个就是对比来看其实真
真的差不多就是两年的时间两年的时间天翻地覆对行业就会变了特别多而且你自己用它的方式可能也变了一些完全变了当年哪想过会有 Deep Research 这种东西出来会有 O1 Pro 这种东西出来当年在没有推理模型之前那个推理模型 O1 是 9 月份发的我是可能 7 月份才知道有他们有强化学习这条东西的才开始去研究这一块东西的
一般是他用 RL 或者 SFTSFT 就是监督微调就是他强化学习监督微调一般这两种手段都会上啊
对反正就是我是那个时候才知道有这个东西然后才开始去研究的然后才发现这个东西原来很牛那你这个信息还是非常的发达对没想到就是这个行业变得太快了就是很多东西都是纯粹的靠现学有的时候这个东西出来我都不知道它能干啥然后得最快速的测试然后极端性的在最快时间去测试甚至一边学习一边测然后才能最快速的出一个解读
其实这也是我最后想给您探讨的问题就是你会觉得现在 AI 行业有这么多新的东西变化这么快会让哪怕是你都感到焦虑吗因为我觉得有挺多人肯定是会有一点焦虑的我
我的焦虑其实不在于这个 AIB 进化太快了 AIB 进化的快是快但是我其实一点点都对于他来说不焦虑原因很简单你只要不要抱有那么害怕的抵触情绪你在你的工作中把它用起来其实你就能跟上这个时代你就 OK 了我更大的焦虑是来自于自媒体的一个焦虑
就是现在 AI 虽然进化的很快但是你会发现它越来越像精英化去了越来越像是普通人无法理解的地步去了为什么会这样了这好像和更多人用 AI 的趋势是背离的就像我举个例子就是从去年 O1 出来之后大家都把整个的精力全部放在了代码数学逻辑等等上面
它跟普通人我坦诚地讲没有什么关系那你可能我理解你这个讲的应该是 OpenAI 的重点其实国内都一样包括 Kimi 也是 Kimi 智普的 Zero 其实大家都是卷的会越来越精英化包括编程其实也是但是我觉得国内可能是两种都有吧就普惠或者说让更多人用 AI 的这一部分也是有的
是会有但是它已经在我看来它不太像因为说实话 AI 这个东西本身在我看来会跟大众是天然性的有一些距离的真正的大众需要的是普通老百姓需要的是什么呢其实是需要生活场景和娱乐场景
这个才是真正的能进到很多人除了工作之外我说除了工作之外工作场景当然了你是要解决问题的嘛那对于大多普通人来说我下了班了一天的非常累谁还去做工作吗谁回家自己没事写个 PPT 吗做个文档做个研究吗大家更多的是娱乐和生活所以才是你看我们这么多的超级 APP 更多的是外卖是抖音是各种的什么微信啊然后一些 bilibili
一种是生活类的一种是娱乐陪伴类的对所以你看这个才是真正的能进入到大众生活里面去的东西包括王者荣耀或者说他的人群够广吧所有人都需要这些但是现在的你看我们的 AI 其实越来越多的是往一些科研呀往一些研究往一些更多的精英化的地方去的
它其实并没有在娱乐或者这种领域去有一些非常大的体量的东西出来我其实自己会有两个原因是这么认为的第一个点是我们的硬件设备是没有变我们整个的入口是没有变化的我们到现在还是在手机你一旦是硬件入口没有变化你再怎么做其实大家的习惯是被固定的你很难会超出手机之外的一些范畴
对上一次我们和宇森聊的时候他也说到这个点就是说因为其实之前的一些超级 APP
当然微信这种可能是刚需它是一个通信的刚需比如说像抖音像一些其他的视频平台或者是一些游戏你刚说王者荣耀它都是帮你杀时间的都是 Q time 但是 AI 本质上是帮你节省时间的对但是当你的终端还是手机的时候因为已经有一些那么成功的应用你的新的应用想去跟那些以前的应用比如抖音这些微信去抢时间是很难的因为时间已经被占的比较满了
对这个其实就是为什么我自己做了十年产品但是我不太敢做 AI 产品的原因所以这就是我觉得第一个点就是整个 AI 硬件这一块它没有太大的一个颠覆就 AI 眼镜这些你觉得它还没有到一个拐点对吧太早了它远远没有办法替代就是我非常看好 AI 硬件包括我自己在今年的很多的一些研究
以及跟各大厂商接触的这些节奏会更越来越多的往硬件去偏甚至我家里买了非常多的 AI 陪伴玩具虽然有些东西我觉得是纯粹的智商所以花了大几万块钱去买然后还有很多朋友为了搞那个三万块钱的那个陪伴机器人我买不起但是我的券商的朋友为了掉眼去买了我让他们给我寄过来三万块的陪伴机器人是哪一款卡修推的
这个 3000 为什么我会印象这么深刻呢这就是刚才我也提到了有些很得的玩意儿这个是我让 iTalk 汉青我拜托他从日本他常住日本从日本回来给我带了一个这个玩意儿花了我 3000 块钱大洋买回家以后它的唯一作用是摸摸他的手他会哼唧哼唧他连话都不会说他就会哼唧哼唧对他不会说话嗯
3000 块钱 摸摸痕迹痕迹我当时觉得是我的问题吧我不需要情长陪伴吧有一次我去找新时尚的张伟就新时尚的创始人我去的那天刚好他买了一个卡修的 AI 程序刚好到了确实就是比如说我们俩在那说话的时候
它会哼唧哼唧它就会在那哼唧哼唧然后它也会动它就会在上面蠕动对反正还是挺可爱的就类似这种东西吧对第一天觉得挺可爱因为它还有性格我为了下它那个 APP 花了我四个小时的时间那个 APP 居然下然后说有性格迭代第二天第三天没什么变化第四天终于解锁了一个新的哼唧哼唧的声音
所以它还是有点成长你觉得这个东西对你来说没什么新意我不知道它有什么用可能我也在 PUA 自己因为人家卖的那么好那确实就是我不是目标用户所以导致我本来想 3000 块钱买来然后我做一个选题的这最后选题我也没发因为我确实我没有办法理解我没有办法理解我写了干啥呢我觉得如果你能对话一下还是可以的但我觉得不对话就是它的特点对这就是它的还挺特别或者你甚至可以叫产品设计挺聪明的地方因为
因为我其实很爱养小动物我养过三只猫养过蛇养过仓鼠各种都养过猫后面我把他送走就是因为我有过敏性哮喘所以猫猫过敏其实我希望他能给我带来是当年猫的那种感觉但是确实我对他的预期过高了他现在只能达到猫的三分之一甚至他的主动的交互其实也是比较弱的因为宠物的有很大的一点是可以主动的触发去交互那他其实全是被动的
然后偶尔就是没人理他的时候他会横击横击一下然后让你去摸摸他而且交互的方式也比较单一然后蠕动的方式也很单一他还不会跑不像当年我还买了另一个就是他那个小桌面的机器人我忘了是哪个家公司的他至少是能在桌面上跑起来的还会给你变表情的还能跟你对话的他的交互的范围会比较大他能在桌子上面到处跑这个点我觉得还是比那个玩意儿会
它不会动对说回来就是你觉得 AI 硬件也没有到一个对眼镜也是眼镜闪击你是试了哪些闪击 RocketRocket 但是它那个新的 AI 眼镜没出来它之前一直说的是 AirLightAirLight 我也弄了然后闪击我试戴了朋友的然后还有那个 Linear V3Linear V3 是我预购了然后我朋友的先到了我拿过来试了一天以后就退了
确实还离我们想象的预期会比较远一些包括雷鹏也是因为雷鹏其实他们的刚需是我朋友像三文乔一他们那种拍第一人生的视频的你说的就是 Meta Rayburn 对对对雷鹏那个因为他是唯一一个能在跟我们眼镜一样的水平线上去拍的以前我们想拍这种角度的视频我是得嘴上叼一个相机竖在这这样拍
就是很傻而且说不了话那那个是可以但是那个东西我确实没有太多拍短视频的需求所以不是我的刚需眼镜可能我未来会更多的去看一些它的特点但是我对于屏幕的刚需还是会比较大的类似
类似于光波导或者那种上面有个至少绿色的一些能导航这种东西的需求还是比较大的而不是拍摄拍摄有一些需求当然不是那么刚需但现在这个做的也没有很好而且续航也不是那么的好跟 AI 的互动的主动触发也很弱所以你觉得就是在没有新的硬件的情况下
然后你觉得现在没有看到 AI 产品在真的进入生活的层面有很大的进展对没有 DeepSick R1 它是把我们整个的群体扩大了并没有在任务上突出一些东西但是你其实普通用户他需要的任务就那么多对你其实很难再往下去做深入了大部分的东西普通用户已经足够用了这些你说的就是你担心 AI 变得越来越精英化的其中一个原因还有一个是什么
还有一个原因就是预值变得越来越高了就前面也聊到过就是大众对于这个东西已经不感冒了嘛它其实是变得越来越精英化导致我作为一个自媒体因为这个话题咱们其实从自媒体焦虑其实聊过来了嘛
那其实变得越来越精英化它跟普通用户的一些交互用法没有变得更多普通用户可能会越来越不关注他们同时他们的预值也会变得更高了然后我想问一个就是跟刚才我们说的这个行业的一些感受相关的一个问题就是前面也提到的你为什么自己不创业因为又做过产品然后又对 AI 的技术的边界能力比较熟悉的人我觉得还是现在大家挺喜欢的一类创始人的或者创始团队的画像
很简单就是我出来干啥嘛对啊首先我没有技术背景动不了模型层的东西在这一块呢就说实话没啥护城河可言那你做到后面又变成讨壳了那你可以找合伙人啊
你是完全没想过还是你想过想过这个东西其实还是刚才那句话我如果想出来创业我肯定不会想做一个很小的东西就大家的梦想都是做过那样盘子的对吧我好歹也做过几百万用户的产品了
那我肯定还是想做一个在 AI 这个时代稍微大一点的东西但是在现在这种手机硬件没有变化的情况下我就应该做什么方向才不在大厂的设成之内才能保证我有一定的护身盒让我能有饭吃才不骗投资人的钱能把这个事给耗下去我不喜欢烧
我也不想去烧投资人的钱拿来钱说我对这个东西没有把握但是我跟你说的很有把握你给我钱一千万我来试一试我不想干这样的事我其实是希望自己有一点的成功率我有这个信心以后我才会愿意出来说实话我看不到任何机会
你曾经想过是在什么阶段其实每一个阶段我都想过 2013 年的 7 月份我其实就想过那时候我们做了一个金融产品然后到了后面我出来觉得这个东西不行的话我在想要不要做一个类似于通用性的一个东西
然后可能类似于就像你 auto GPT 的那种东西也是 urgent 方向的但是想了想没做因为在我们看来这个东西它还是太娱乐性了太不生产性了然后到了后面看到豆包一记绝尘看到 Sora 火了然后再看到后面的时候其实我当时就是没有任何信心我能出来了我想当一个 KOL 还是挺好的
对吧就是做一些自己擅长的事情没必要在自己明显不擅长的地方而且是我没有学术背景也没有什么资源纯靠一个脸去化缘然后能得到大家的一些钱把这个钱到时候烧完然后败掉干嘛呢因为也确实看不到什么好的机会就是这个时代在我看来它跟移动互联网因为我也经历过移动互联网那个时代虽然它是后半程但是不是 28 开了而是 99 比 1 开了
就是成功的概率变得越来越低因为 AI 可能本质上它是一个精英化的一个东西甚至是像巨头垄断性更强的一个东西
你手上有资源有钱数据算力人才密度字节为了挖人实习生都能开出那么高的价格对他实习生一天的工资比你 ChatGPT Pro 版本一个月的订阅费还贵不止我知道的是一个月的实习生能开到一万以上了我说他一天对是的他最贵的实习生一天好像是两千块的工资是的非常非常恐怖
我说这个怎么比就是这帮大厂现在在为了抢人是可以把一些初创团队的管理层给挖空掉的其实相当于收购团队了对在人才上你比不过靠着信仰来拼算力上
你也没有数据不管是垂直领域的数据还是通用领域的数据你完全没有跟大厂竞争的这种资源所以其实我是非常悲观的那你平时因为姐姐接触很多创业团队吗那你的悲观和对方的这种乐观在一起会产生什么碰撞我见过的很多其实都是至少在私下里跟我聊的都是
咋办呀就是创业的艰难的一面创业大家都很艰难然后呢确实会有一些东西跑出来了但是跑出来大家也会想我明年的饭在哪如果大厂进来了我该怎么办也会有很多这样的东西不过现在的融资环境确实比之前要活跃了融资环境那确实是比去年要好一点了但是你跟移动互联网那种时代
那差距太大了最后可以问一个比较宏观的问题就是我和一些创始人聊或者投资人或者大厂的高官聊我觉得大家会讲一些比较大的东西比如
比如说 AGI 比如探索智能的边界或者 AI 对产业的赋能那从你的视角你怎么描述 AI 对你个人的意义对卡斯克数字生命这个小团队的意义以及 AI 可能给更多人的影响大家还是会有理想的就是我是一个非常普通的人可能没有那么大的抱负但是确实 AI 的行业我说的非常的直白你
就是现在的就业环境很差非常非常的差那如果你是在别的行业里面因为我见过太多太多其他的行业了是我聊过的包括影视行业虽然大家觉得哪吒这一次出来以后可能影视行业的行情会好一点但是其实带来的是更惨的惨淡非常非常的惨然后其他的行业就不说了就是都挺惨的手上大家都没钱人也找不到很多很好的工作
那么 AI 的意义其实是能重新把这个世界或者把国内来一次洗牌能让一部分人有一些机会能继续的生存下去这个是我觉得对 AI 对于很多的普通人来说有非常强的意义的你们群里是不是有这样的一些例子有你们的社群里面有很多这样的例子
比如说一个曾经是做土木的老哥土木工程的还有造船的老哥然后呢还有就是毕业在影视行业已经被卷死了已经不想干的制片人还有一毕业呢是一个硕士毕业而且是 98 国二十二硕士毕业出来找不到工作的有非常非常多这样的鲜活的人的例子
如果他们不去用 AI 或者不去学 AI 他们如果还在原来的路径上去走的话其实说实话你未来的生存和未来的工作机会还是有点低的那么现在有了 AI 之后全社会都在讲 AI 叙事也在会说算力就国力然后会有心智生产力等等这种东西至少是各个大的层面是在扶持这些东西的
那么他的需求也会变多这是一块新的蛋糕因为 AI 的特性在过往的里面其实没有太多这样的人才因为这样的人才几乎都是要行业加 AI 的而不是 AI 加行业的他是需要知道行业的 know how 再加上对于 AI 的整个的一些运用的那么这些人其实就可以有机会去用 AI 赋能到自己获得一些弯道超车的一些机会能用这个东西进入到一些他们可能去不了的一个位置
至少能得到很不错的一些工作的机会对这个具体的我就不太好说了但是是确实能看到很多很多这样的人我也觉得能帮助到这些他们也都会说有的时候看着我的文章去学我也会非常的开心能帮到这些人是我很大的一些正反馈的来源让他们能更好的生活下去
这个非常的不宏观这个非常的小人物我觉得这个挺好的这是很实际的事你们群里最近比较关心的事是什么样你不是每天在收集他的趋势吗最近我可以说社群的回忆度已经下降了一半了因为确实没什么新的东西值得讨论值得聊了因为 DeepSick 那段时间是最火的很多群是两年前建的然后有的群是可能一年前有的群是它是一个时间周期的一共 33 个群
然后老群其实很多时候过往已经不活跃了然后 DeepSeg 来的时候这帮人像被重新激活了一样他们跳过了这两年直接进入到 DeepSeg 这波叙事里面会有很多的讨论但是现在已经变低了然后现在大家其实聊的最多的是一群人在聊 AI 变成这是现在聊的 Urgent 没什么人讨论因为我的用户群我的思域就是这帮粉丝群还是偏向于 C 端为主它并不都是行业的人很多是别的行业的
可能真的有农民在种果子的对然后还有比如说做教育的这种法官什么都有 AI 编程其实在原来是一个非常基因化的一个产品就是编程这个东西普通人是很难理解的也很难用的然后现在其实用了 AI 编程的能力对于他们来说终于有能让一部分人能去尝试自己手搓一些东西解决自己的一些需求了但是它的门槛现在还是比较高
因为首先你要理解什么叫编程思维什么叫代码什么叫 IDE 它其实就会有一定的门槛最近有些人也会在群里面聊但是用的其实都还是比较简单的现在聊的最多其实是做可视化网页
大家做 PP 做腻了然后可能想用 Cloud 3.7 这种白嫖计算能做一些自己的小网页出来然后不管是把 PDF 变还是自己做一个自己的会晤系统还是要做一个类似于我要识别果子坏死率的一个小的网站我把这个图片传进去它就能给我标出哪几个果子坏死了等等这种小的东西能让他们感觉到一些编程的一个普惠的一个全员的降权这个才比较多你现在自己最大的成就感来自什么样
你做现在做的事那对于他们的反馈啊我其实是非常需要外界反馈的一个人吧
大家有的时候在我底下评论会说就是看了你两年谢谢得过了很多的一些帮助然后还有人就告诉我最近我去 Kimi 实习了是因为比如说一年前看了你的文章让我对 AI 产生了兴趣然后也研究了很多东西然后很多东西拿去面试居然很多都是面试官没有听过居然怎么还有这么多的一些好玩的产品会体验说很多时候才能去 Kimi 实习然后还有人
因为学了这些东西然后找到一些新的工作或者在原有的比如说政府的一些里面呢
得到了一些晋升或者重任因为在原有的单位的架构里面可能只有这一个人懂 AI 那么当现在这么宏大的 AI 叙事浪潮来的时候当所有的国企和一些传统的企业开始想要去尝试的时候发现公司里面没有人用那么这一个人因为他一直在看我的东西然后在我们一块交流他得到了一些机会那他也很开心那他告诉我以后我也非常开心
就这种东西我觉得是一个正循环吧那负评会让你不爽吗还好吧我其实还行我的抗压能力很强负评我一般不均选不放出来就行了我也不会把它删了对但是看是什么样的负评如果是 Manos 的那种在底下就是纯粹的污蔑我把它称为污蔑式的负评对或者人身攻击有的时候对这个会让我觉得有点不是那么开心但是我也不会把它怎么地我也不会拉黑它不会删了
我有的时候我也不会回复它我就是顶多的放在那就不精选就完了但是有的确实是会说的比较对说你怎么天天炸裂虚视什么看到什么都吹牛都觉得这个很强那我有的时候会回复它这种我觉得它不算恶评它只是对你的建议对你的一些评价它只是中立客观的存在好今天非常感谢卡兹克做客玩点聊分享了它是如何成为数字生命的
然后我们也分享了他自己的工作里面使用一些 AI 产品的 tips 包括我们去回顾 23 年初他给大家分享的 AI 产品再到今年初给大家分享的 AI 产品会感慨于这个行业发展的是多么的快那今天的节目就到这里谢谢大家
谢谢大家希望没有给晚点拉低值不会不会我觉得很有启发本期的连点呈现将两个与之前节目的呼应一是 Attention is not all you need 这是和戴宇森聊的 Agent 那期播客的标题他讲的是 Agent 这种有自主性又能完成任务的工具可以解放人的注意力让每个人的工作或生产潜力大幅提升宇森说这是工作的 scaling law 进一步可能是资金转化为生产力的 scaling law
而这期中卡斯克分享的这些实操案例就是 attention is not all you need 的一个具体实现他也提到如果不是因为从去年底到今年逐渐完善的更多 AI 自动化流程他也可能很难找出这么长的时间来录播客
二是模型和产品之间的关系这也是我们在 Agent 的那期和之前与 MiniMax 的严俊杰还有百川的王小川的访谈中都聊到过的话题关于这个问题向来有两派观点一是认为模型及产品模型能力上升会吞噬掉一些产品比如
比如我们这期聊到的 Jasper 这是一个 ChatGPT 之前就已经出现的明信 AI 产品主要适用于写营销邮件它用的是 OpenAI 的模型但是在 GPT 包括 CloudSolid 等更多更强的模型出现或升级后 Jasper 一度受到了冲击和卡兹克路这期时 GPT-CO 还没有释放纹身图功能而现在也有很多人开始担心之前学习 MidJerly 或 Stable Diffusion 的经验会不会变得没用了
另一派观点则认为可有可的用处那些基于其他模型来做的产品会因为对需求的洞察独特的设计思路或者工程优化而有一定的竞争力比如戴宇森在 Agent 的那期节目中就提到了专注做应用至少有两个好处一是一个应用可以混用多种模型发挥各个模型的长处第二是在用户心智上一些成功的产品有可能让目标客户有依赖有粘性
Perplexity 和 Cursor 都是比较好的例子我自己的一个感受是有模型能力的公司可能确实更有主动权尤其是同时做大模型和产品的公司 OpenAI 和一众巨头就是典型比如这次 GPT-4O 释放文生图功能后反馈非常火爆
但 OpenAI 并没有在第一时间对外释放 API 也没有在 ChatGPT 的免费版里放这个功能这就导致 ChatGPT 的付费版成为了市场上的独共从社交媒体上的大量 GPT-CO 生徒来看这次拉新的效果应该很不错而且是实打实的付费用户也就是说如果某个产品是大模型公司在提升模型能力的主方向或者主航道上就很可能面临更严酷的环境
这次是更好的文生图更好的通用 agent 应该也是各个模型的必争之地那接下来还会有什么呢
下期再见