历史上你会去看我们的很多应用包括今天很多火的应用其实它就是在解决一个不同的工具应用之间的互操作性的问题随着现在 MCP 的服务越来越活跃我相信一个 AIOS 的空间雏形其实已经存在了
组织协调其实两部分嘛一方面是我们底层的同频一方面是事情上的跟进嘛现在越来越觉得就是未来的那个所谓的控制会更强你真的要同频的话其实就是底层的那个 promp 的同频一层一层一层一层叠所以这样子也是可以做到说一起协作效率会更高
李峰大家你所有的服务都应该有 mcp 都有完善的文档然后你的所有的这些代码库都能很容易的测试你所有的任何一个产品经理提一个需求他也能自动发到沙盒上让别人去验收那你的效率会大规模其实欢迎大家来到 AI 炼金术这其实徐老师主动要求的
看完谷歌的发布会之后我觉得整个人受到大为震撼是吧然后说来来来聊一聊我们聊一聊来来来石老师说说您的震撼其实我觉得是三场发布会其实不是谷歌其实是 OberEye 先开了个发布会就是他们发了 Codex One
然后是谷歌发了一堆发布会对吧然后发布了一堆功能对吧就所有人都觉得哎又有一批一批创业公司要倒下了对然后之后是 cloud 又发了那个 cloud4 的那个 sonnet 跟 opas 嘛对吧然后怕又有一堆做这个 ai coding 的人可能要倒下了就我不知道这个是个预感还是一个就是的确是整个大的整个行业发展的一定阶段就其实
上两个礼拜准备再写一些内部的 memo 然后就有几个预测嘛第一个是之前跟一些朋友聊很多人会说想要去做 AiOS 聊这个时候的我第一个反应是因为我没听懂我也没想明白什么是 AiOS 哦不还 codec 发车后那个微软还开了发布会差点忘了微软 build 前一阵用了很多 mcp 突然想明白了 AiOS 应该是个什么东西然后觉得也想要写点东西
还没写呢那个微软就发了那个发了这个 Builder 对吧第二个呢前一阵因为内部开始比较多的用这个 Coding Engine 开始尝试写一些东西写了之后突然想明白了说觉得这个 AI Coding 这个事可以深入聊一聊因为我觉得有一些
比较明确的就是针对 engineering 新一代的这个技术团队组织的想法然后就看到 Codex OneGoogle 发了那个叫叫 Lutus 是吧也是个 coding agent 就是第一个感觉是自己反应怎么这么慢其实早有迹象觉得应该早一点朝这个方向走倒不是说我们自己来做这个事而是说
你从团队组织的角度其实应该尽早为这些事做好准备先聊聊 AiOS 吧就是说我们有一个朋友他们原来在做的一些是偏一些偏视觉深情的产品然后在 GPD4 Image 出来之后
他觉得这产品这日子没法过了觉得哎呀我累积了几年的这个觉得自己特别厉害对吧累积几年产品在一些垂直领域做得特别好然后别人一个新的模型级别的产品出来你觉得然后呢他觉得一个比较大的机会是 AiOS 然后呢一开始呢我其实没有想明白什么是 AiOS 上个礼拜那段时间在一直用各种 MPP 然后我突然就想明白了就是我理解其实所谓的 AiOS 其实是你需要有一个
中心化的入口能够让所有的这些你日常使用的这些工具能够通过 AI 可以互相之间可以互操作因为两个事第一个事是我们内部其实开发了很多 MCP 的工具就是把很多内部原来的服务啊或者工具啊包装成 MCP 这个可以讲这个反正具体是什么大家不知道但是
但是呢我相信很多公司都在做这个事然后呢这些工具呢其实也想暴露给非研发团队用这些 mcp 工具呢但是研发团队呢用的这个 mcp 的怎么用的这个 mcp 呢其实是用 cursor 在用这些 mcp 研发团队其实因为日常大家都写代码嘛大家都用 cursor 然后用 mcp 呢就配一下后来呢我们就发现给非研发同学用这些东西呢
最好是找个 MCP 的客户端对不对然后我们研究了一下可能最合适的还是 Cursor 很多人都连知识管理都最后都用 Cursor 来整个来做了那为什么呢我觉得有两个第一个当然是 Cursor 它其实研发端已经摸了一遍怎么在 Cursor 里配 MCP 然后已经使用了第二个我觉得 Cursor 这类工具有一个巨大的优点就是说因为它是个编程工具
是什么呢就是你的 MCP 调用任何一个东西然后或者你的 agent 调用任何一个东西你生成了代码之后其实在 Cursor 里是可以运行以及预览的
就是你不需要一个代码的沙盒去运行很多东西你有很多别的工具它也有一些这种预览的功能对吧你去找一个别的这种了解的客户端它也有预览的功能但是它的预览功能往往受限于编程的语言或者开发的框架它比方说我如果是是个 JavaScript 的东西我可以自动预览一下
当然假设今天是个 Python 的东西或者是个 Java 的东西它就不能预览或者执行但 Cursor 的好处是说它其实是个开发环境所以大家默认说我会配置这些环境里面大法就能直接执行用 Cursor 这个口为什么让非研发比如今天是个产品经理运营它为什么也要用 MCP 这些东西其实是说今天假设外部有大量的包装好的工具可以被 AI 调用
但是往往呢其实你是需要他们互相之间能调用这个时候我们想要的不是一个扣子对吧或者不是个 defi 这样的固定的我人工去拖拉拖拉定义一个 workflow 比方说我有工具可以调 API 搜一下 Google
我有一个工具可以把 Google 里面的内容比方说调另外一个 API 能够去生成一个网页或者说有另外一个工具定了说调用一下可以把文本说给我画复画打个比方而且它不仅可以调这些 web 工具内部大概率你的公司内部业务里也有各种各样的接口如果你把它也包装成了 MCP
其实你也可以用对吧假设你今天是假设你今天是 Define 你可以把你所有的 workflow 又包装成一个 MCP 的入口它也能去运行执行假设你今天做了一个 KeyMix 据说在做这种 AI 的社区那你可能要自动生成内容大概率它内部是有这样的服务的当它去筛选生成一些内容的时候你也可以用这样的工具这个时候你就会发现呢就是其实你需要的是各个可被 AI 调用的工具之间的互操作性
就互相之间他们能够串联起来这是第一个体感就是说我觉得说今天一个 MCP 的客户端很多时候他就有点一个 AiOS 的雏形了第二个我一直用一个 launcher 这个产品我们之前也聊过叫做 raycast
就是在用 raycast 过程中它也包了很多这个 AI 的功能和工具啊包括你今天买 raycast 的那个 AI 版它其实是什么什么 cloud 的模型啊 openAI 的模型啊 grok 的模型啊什么都能用其实相当于是个 poe 嘛用尽管它做了它也做了很多就是什么 mcp 的支持啊做了但是呢我就发现它有一个特别傻的功能
就是说它有一个功能叫做 notes 就是你可以寄笔记对不对你 notes 寄完了假设这个 notes 里你想说把这个 notes 里我要去搜一下你还得把那个 notes 复制粘贴出来然后再重新打开它的 chat 的功能
再把它输进去然后你再打到一个档案然后你又打到这个档案你又想把它复制连接出来再切换到它的那个 node 里然后你再把它贴回去然后这个事情你就觉得特别傻这个其实一下子让我明白了一个事就是 AI 的 OS 其实你需要的是个什么呢就是一个我身之为叫做任何环节的应用之间可以互相操作
任何一个 AI 能力在任意一个环境可以互相操作那不就应该微软做吗对啊所以过了两天就是我当我突然想明白这个事我觉得这当时可能是有机会的然后微软不就发了那个说他的下一代操作系统你就自带了那个内嵌的 MCP 吗
对他就是说我直接把我的操作系统作为一个 MCP 的客户端就这个就回到那个就我们去翻历史上你会去看我们的很多应用啊就包括今天很多火的应用其实他就是在解决一个不同的工具应用之间的互操作性的问题你去想就我今天去浏览器插件里比如说陈静是翻译他是不是就是说我想把这个翻译能力嵌入到一些场景
因为在那些场景我想调用翻译能力其实不太方便我不太容易复制复制连接出来这个实在太累了包括像 Raycast 这类
我们叫 Launcher 包括它前几代产品就 Ricard 出来之前也有其他的苹果上的这种我们叫快捷启动器就经常有一类应用我知道就像 Alfred 经常这类应用都会自带一个功能叫做多个剪贴板你去想想为什么需要就是会有一个多个剪贴板的需求
就是因为我在不同的应用之间要把这个东西复制来复制去让他们互相之间可以操作今天为什么为什么比如像 Monica 这样的产品很火它相当于说因为今天大家去用应用的时候可能百分之七八十的时间都在浏览器里所以呢我就在浏览器里把各种场景和互操作性给做了然后把我自己作为那个中间人我是觉得说随着这个现在 MCP 的服务越来越活跃
我相信一个 AiOS 的空间雏形其实已经存在了当然这个机会很难抓这个机会很有可能就大家仔细思考一下它还有是一个巨头的机会对吧你每一层都有人在抓比如说上到飞书这一层
然后再往上的话可能是 Google 它有全生态这一层然后再到安卓系统和 Windows 系统 Mac 系统这一层但是我觉得没有关系就是你可能不追求垄断你可以追求一个被收购的机会至少在海外我觉得是这样的随着 MCP 的服务越来越火最近不有一个人专门做了一个本地的 MCP 服务叫做 Open Memory 还是叫什么 Memory MCP
他说他这个 MCP 只提供一个功能就是你把我这个接进来然后呢他做的功能就是你所有大元模型都认识你不是是说你自己历史调的这些 MCP 中这种有价值的记忆会被存在这个 MCP memory 的服务里然后呢未来这个你自己用 AI 就会越来越强吧因为这个就跟 ChatGP 做了那个
记忆功能是一样的就是我们很多时候用 AI 觉得很蠢就是一句话老要跟他重复讲或者我有一些 front 对吧你存了每次得复制粘贴出来或者把它找出来比方说我假设就做一个叫做 memory 这个功能有可能它是一个被收购的机会我打个比方说它不一定是一个说我能做成 AiOS 的机会
而且 OS 的话就早几天跟另外一个朋友聊了某一个垂直行业这个垂直行业会有非常多的人其实就是每天要开好几部手机开好几个甚至要给浏览器换不同的 cookie 然后就在想说能不能做一个垂直行业的浏览器
肯定做的不会有 minus 号也不会有 final 号但是可以根据锤石行业的从业人员帮他们设计比如说 10 个典型场景然后再设置 5 个有点灰色的场景然后就靠这 15 个特殊的工作流有可能比如说 100 万人就会用这个就有可能打锤石也是有可能我觉得接下来会有一个比较大的趋势因为我觉得其实今天 AI 有很多很强的能力
那我觉得还是因为没有被封装好所以用起来不太方便其实我之前用 ChatGPT 用过一个功能就是 ChatGPT 它可以说预约它定时给我发一些提醒之前现在大家习惯用 AI 的方式还是你给 AI 安排工作
我今天想起来了我有个工作安排安排给你随着 AI 能力越来越强假设你所有的交互所有的这些东西都是跟他讨论出来的应该反向来反向过来让他来给你安排工作你应该说你每天礼拜每个礼拜早上给我想一想
对不对我一直问你各种问题写各种计划假设都在你这里假设你能够拿到我们所有的 MCP 的这些调友所有的我这些聊天记录你应该礼拜一早上告诉我说你看你这个礼拜重点就应该干这三件事你今天必须要找谁谁谁
把这个什么项目跟进做了明天要找谁对不对把这个验收一下但这个其实这个的前提是你所有的信息都能打通大家想的都差不多到一起了我早几天正在实验这个做法
但是他的前提是我那个写第二大脑就 second brain 的那个提阿哥福田他最近在卖一个课然后收的人一万美金一个其实本质上就是教人家写一个五千到一万字的叫做 must prompt 然后就把自己的生生生生生八字啊什么都写进去然后我我就在试着说写完之后我写了一个大概四千字的
然后已经放进去之后他基本上可以告诉我说我这一周应该干嘛了但还有点不太对所以我觉得我应该把我的周总结和周计划也放进去应该他就会给我的很好的建议了对现在给的已经还不还可以了就是一个五六十分吧对但是但是我觉得我把周周总结和周计划放进去的话应该可以给出八十分的东西而且已经给的很好了就是我我现在有四千字四千字的 custom instruction 放进去
其实我第一个好奇你是花了一万美元买了这个课吗我没有买这个课但是我之前听过少男一个观点叫做最好的东西永远是免费的这是他已经为了宣传他这个课他其实已经把精华讲出来了他的 YouTube 上期我听了一遍之后我大概因为我也平时早就在用我大概已经知道他的精华在哪里了然后我就自己搞了一套已经管用了
但是我觉得这些的前提啊就是说今天我觉得是大家在使用 AI 中还是有很多摩擦的就是如果 AiOS 这个事情会最终会发生其实我觉得有很多机会就是怎么去减少使用 AI 过程中的这个摩擦有太多的动作今天其实我想想就很傻对吧就是
这个事呢比如在公司里啊就是商量这个事应该他去做那么他会说好的但是如果你不去记一个 to do 说定一个 deadline 至少有百分之有一半吧我觉得这个事情最后可能就无疾而终了那但实际上
这个事完全可以由 AI 自动触发说他应该去记一个 todo 他应该自动来催你他为什么要有个人来催你甚至于我用 master prompt 的方法的时候其实它也可以用在组织上面组织协调其实两部分一方面是我们底层的同频一方面是事情上的跟进事情上的跟进就应该用提醒他自己来提醒但是组织上的同频举个例子假如你们公司有一个价值观叫做
猫是比人类更高贵的生物假设你们认为猫最高贵那这件事情在传统的组织要反反复复洗脑嘛对吧然后再把它注入留存然后员工杨凤英伟其实你也不知道
但是如果每个人都有一个 OS 是是然后公司统一的话你在公司用的 OS 又跟公司接通公司就会把它写在底层代码里面比如说你写的每篇文章他就会检查你有没有体现到就是猫比人更高贵这些现在越来越觉得就是未来的那个所谓的控制会更更强你真的要同频的话其实就是底层的那个 prompt 的同频一层一层一层一层叠所以这样子也是可以做到说那个呃一起协作效率也会更高
就是回过头来讲就是我们上次也聊过就是极缺你会发现说年轻人在用 AI 上应该能比我们用的更好因为我们有太多的历史上的 best practice 会导致你对事情的一个估算是本能性的错误的我举个例子就比方说我们公司有 10 个研发对不对你习惯性的去估算说你能做什么事情的时候尽管有 AI
因为我写了很多年代对我带了很多年代加上我有十个研发我习惯性估算说我该做什么事我会按照我有十个研发来估我该做什么事但实际上今天你应该认为比如说一个研发能当三个人用打个比方你应该定义一个研发能按照
按照以前的三个人来应该按三十个人来规划你该做什么工作这就更极端了上次我给你分享过美国那家创业公司的例子就吓死人极小的团队然后把所有的领域的所有的 SaaS 全部做了一遍我觉得怎么花现在确实我们想象力太有限了所以我的第一个体会我觉得是说其实我觉得在 MCP 渗透到一定程度之后我觉得它其实
开始进入了一个快速加速的过程它的确是说你如果只能串两个工具不太有用当你串上十个工具就特别有用而且你会很有很强的倾向或者意愿去串第十一个工具这边可以举个例子吗为什么 MCC 有这么大作用我们办公室也在用但是就用它比如说
用来 3D 打印操作 Blender 用工具就还是各把两个工具在用比方说我们今天假设我们今天在做搜索我就两会有人在线上反馈一个说这个搜索结果不好我们叫 bad case 那传统意义上技术团队有很大一份工作是有人拿到一个 bad case 然后我去分析日志
就是我去看因为搜索有很多个环节就是说我改写你的搜索词根据你的输入改写你的搜索词去搜索去召回去排序最后选出答案对吧传统这是一个工程就是说我自己写一个工具然后我去分析日志但今天其实假设整个搜索链条里的所有的服务你都能用 mcp 暴露出来你把它接进来然后说你看你告诉他说搜索就这么几个环节
用户问了这个东西拿到这个结果不太好你帮我查一查这是为什么它变成了一个就是我觉得在工作中比方说这个是搜索的假设你今天去做小红书的内容其实说你发现说这篇写字不太好你帮我去查一查为什么因为你是个公司背后有大量的系统它是有很多系统串联起来得到这个结论
当然去分析这些问题的时候如果你背后的这些系统的每个环节都是能 MTP 暴露出来的你可以让机器把你去查这些问题所以所有的重复性的劳动都可以因为我们的劳动大部分就是动脑子以及在系统之间点鼠标因为我相信大家稍微工作过几年或者说你会发现公司里其实有一类人原来特别有用这类人的性质很像浇水
我们很多希望有些人他推动能力强他推动能力强他不一定是说我技术水平高或者我业务水平高往往呢他是熟悉内部人头第二个呢他这个人不需要富士这任何一个问题他很快的他去找这个人找那个人最后能追出结果来但是能追出结果来这个其实这个人其实就是原来承担了
公司内的操作系统这个角色很多时候你看很多时候公司里会有一些 PMO 对吧他其实不是说他最懂技术或者最懂业务但是他知道这个人是干这个的那个人是干什么他先去问这个人得到一个答案然后去问下一个人然后等他问完五个人这个问题可能就解决了那这五个人做的这个事能不能包装成 MTP 那么这个 PMO 我就不需要了我用个机器就能解决
我可以把这个机器给到任何一个人哦很有道理因为一般我们想到 mcp 想到的其实是让一个工具让他比如说翻译给大模大别模型让他好用但是实际上组织里面往往是工具之间的串联嘛对吧串联然后使用所以其实一个工具
一个工具比如说你说你会用 Photoshop 然后用 MCP 去用 Photoshop 就是你好像也感觉不到什么价值但是如果是每次是好几个工具的话那其实中间会有一个浇水的人的这部分工作其实是可以极大的提高浇水这个人的效率而不是提高那个用
用 Photoshop 的那个内部的效率早几天也看了一篇文章他也是在讲类似的一个观点就是我们经常会看到的就是比如说一个具体工种的一个替代但是其实是整个系统会变整个系统价值分配啊什么都会变你这个其实整系统这个很很有道理我之前也没有这么想我觉得主要因为我在上方
上班你就会面临很多非常具体的问题你必须得去想一个办法把它有效率的解决然后 AI 编程我觉得这个也是比较惊艳的就是说我觉得 AI 编程扎之前反正我觉得有两类观点一类观点是很多老程学员始终觉得这东西效率比较低或者说只能帮助我只能辅助我解决问题
第二类观点呢就是比较激进觉得说 vive coding 我就能把整个应用给做了对吧包括现在有很多独立开发者就用之前在用有一段时间一直在用 curse 的 agent 模式然后最近那个 codex1 啊 cloud code 啊这些东西都 codex1 是发布了 cloud code 从 beta 转成正式版了然后 google 发了那个东西包括我有一个以前的同事说哎他
他他就特别震撼他说他业余时间在做一个比较 pure tech 的项目在写一个 schema 的一个 VM 然后他说他有个问题调了半天没调出来但是他试了一下用那个谷歌发谷谷歌发的那个因为 agent coding 说他发现人家一把一把就过了就是而且这些工具的一把过不是说我他在 cursor 里比如我填一些 prompt 而是说他在他是个开源项目在 github 里他比如开一个 issue 对吧描述一下需求
然后你绑了那个他就偷偷在后台开始工作了过一段时间给你提交了一个叫 pool request 叫做合并请求然后他看了一下的确他调了半天没调对两一调出来代表人家 AI 一把调对了而且这个写的非常有条理包括那个 comments12345 干了什么也给你写的很清楚然后一下子他觉得说他说以前他只关心 PureTech 现在也得关心关心业务了
不关心业务感觉也没什么活可以干了然后呢我们内部其实也有一些这种体会包括 Cloud Code 最近不是发了那个 benchmark 吗我不知道你有没有关注里面的一个 benchmark 叫做 SWE bench 就是 software engineering bench 它应该是有两种策略一种策略是 72 主要利用模型自己的能力
就是 pass1 就是一遍过另外一个应该是多遍过大概是 80%那 SWA Bench 它是什么数据集呢我给大家解释一下它不是那种就什么编程比赛的数据集它不是这种 lead code 对吧就是给你出个算法进去做一下它呢其实是收集了大概 2000 多个 Github 上的这些项目的仓库这个仓库里可能有一个 issue 就是有一个需求它可能是个 bug fix 或者可能是个功能的要求
然后呢他就是给一个沙盒给一个当时的这个 codebase 当时的这个代码库以及这个需求然后看 AI 直接去相当于说有人在给他提了个需求或者提了个 bugAI 直接能够解决的解决的成功率是多少大概是 2300 个 case 可以解决 80%了对大概是我可以讲一讲一下大概之前在 Cloud Code 的这最新的一版之前最好的指标大概是 69%还是 70%左右
这个是 O3 跟那个 Gimli 2.5 Pro 在之前在可能 GBT4 或者 GBT3.5 的时代呢大概在 50%以下可能 GBT4 在 50%左右可能 GBT3.5 可能只有 20%几到 40%不到具体指标我反正记不太清了这个第一个其实 AI coding 的能力的确已经非常非常强了而且它这个强我觉得它已经不是一个辅助编程的逻辑了
其实会变成一个你能不能给他提个需求他自己把这个事给做了但是呢提这个需求其实是有要求的你不能说你帮我做一个能挣钱的 APP 它其实需求是不明确的但是 GitHub 的 issue 呢很多需求其实是非常明确的就我可能已经有一个代码库了然后我说这里有个 bug 我能告诉你复现步骤是什么你帮我解决
对吧或者说我想有个功能我预期的我期望的表现是怎么样的 12345 会列的比较清楚这个意味着什么呢意味着如果你能把你的代码库的需求提的比较清楚 AI 是可以把这事情干的而且它很重要的是什么呢 Akai 可以并行的同时干好几件事它跟你用 Cursor 去 Vibcoding 不太一样 Vibcoding 其实你提升在效率的上限是有限的因为你始终有个人按在那里对不对
然后你给他提了些 prompt 他啪写了这代码然后就算你不懂代码你狂点 7 你也会再去点一下运行看看他运行的怎么样所以他的速度的上限其实是人跟他互相交互的一个过程但是如果是用 cloud code 和 codex 这些而且他是背后偷偷在一个沙盒的运行人的瓶颈变成提需求了理论上讲以后一个工程师应该每天上班来跑过来我手上有个需求
对吧我把它解释的非常清楚然后提了然后有一个 AI 偷偷在解第一个然后他写第二个有一个 AI 偷偷写第二个他回来只要去做验收跟合并就好但是呢其实你今天去看大部分公司的代码库或者大部分公司我觉得是做不到这一点因为呢他们的基础设施不够完善第一个是说很多公司的代码库比方说他能不能在一个沙盒里跑起来就已经是个问题了
就我看到 Codex 出来的时候很多人喷说你这个代码都不能联网 Codex 的那个沙盒不能联网那能实现什么需求但是呢如果你的基建是做的比较好的就是你每个代码你每个代码仓库都有自己的单元测试都有自己的沙盒环境那其实它不需要联网它应该在沙盒里把我这个内敛需求给做掉或者呢
或者你的公司基建更完善一点,他可以联网。我回到我们前面说,假设你线上有很多服务都有 MCP,你有一定规模的公司,你不是一个人写一个小工具吗?他通常有十几个人说,我写一个服务,你写个服务,互相这样调用要连条,对不对?其实公司里大家之前为什么觉得 AI 能够提供的效率比较有限,是因为他觉得自己有很多工作是在跟人打交道,
就是我是个前端我要跟后端打架子说你的接口长什么样啊或者怎么样啊我给你连条我一个错报给你啊跟人打架子这些事情能不能通过 mcp 包装成机器就自动能够获取我的信息你公司线上的那些服务长什么样子他输入输入怎么样假设你能不能有一个我们叫舞台环境他都可以去调了测试的你暴露给他让他去写代码而不是你不得把他描述的非常清楚
你是不是所有的代码都有一套自动化的测试我写完了你告诉 AI 你每次写完自动跑一下这些测试这些测试都得通过所以说我觉得 AI coding 接下来有一件事就不同的公司会拉开巨大的差距就是大家围绕 AI coding 这件事情有没有把基建做得很好大家有没有把今天我一个普通的工程师一个新人工程师入职
很多公司入职是非常痛苦的一个过程对吧先得入职之后先得拿一台电脑先得把环境搭建起来有些公司做好多公司做的很好可能给你的机器环境已经把你搭好了做的差一点的公司搭个环境花三天不停的问旁边的老大哥如果这些摩擦能够通过 MCP 通过我把我公司的基建做的比较好理论上讲你所有的服务都应该有 MCP 都有完善的文档
然后你的所有的这些代码库都能很容易的测试你所有的任何一个产品经理写一个提一个需求他也能自动发到沙盒上让别人去验收那你的效率会大规模提升就是我认为 AI coding 接下来要干一个什么事呢就是要让一个公司的技术的基建针对 AI 写代码是
可横向扩展以前我们都讲服务要可以可扩展对吧包括现在很多头部的大公司我觉得就国内的互联网公司有一段时间我觉得就喜欢用赛马的机制呀喜欢这个招一堆人来立刻做一个新业务呀一开始不考虑代码质量啊都是说我靠堆人来进行横向的扩展比较典型的说很多公司说自己是 APP 工厂很多公司喜欢说我就 AB 测试你们两组人干一样的活看谁做的更好
接下来我觉得说对于一个公司要变有效率取决于说你的基建对 AI 是不是 scalable 的一个 AI 一个 agent 一个 agent 一个比较 powerful 的 AI 比如给你个 O3 它是不是很容易接近你的公司的系统里快速的把所有的活动干完这个是变得非常非常重要就是我们可以去想象一下你公司里每天这些工程师也好产品经理也好其实真正花在
做核心有挑战的事情跟决策上的时间有多少有多少时间是在干具体的活又有多少时间其实是在做信息交换跟摩擦但是 AI 有一个非常强的能力是说去信息交换跟摩擦如果你的基建做得比较好的话它是不需要去问别人的
因为组织里会公司里常常会有个事这个事其实你写了文档的但是我一个新员工进来对不对我其实不知道文档在哪里所以好的公司基建通常会有比如说入职手册会有好的这个知识库你都去看一遍对不对但这件事情如果做得好那意味着 AI 看是比你人看要快得多假设你干任何一个事比方说你说我要去跑一个数据报表
大家调量一下你所有的这些数据数据表是不是有清晰的描述每个字段是不是有清晰的含义甚至你设置了一些可以用来验证的小的数据集如果有的话你今天做数据报表应该不需要人
因为 AI 写信口比一个刚毕业的大学生写信口那可厉害多了所以我是觉得说接下来如果要变得有效率其实是公司应该花很多精力去解决一个什么问题怎么让你的整个公司的我们叫 infrastructure 是 AI accessible 的你所有的这些信息所有的这些接口是不是能比较结构化的有效的提供给这些 AI agent 去来完成工作
如果你发现 AI 完成不了第一个反应不是 AI 太弱而是说我给他我到底有什么信息或者有什么 context 没有提供给他如果可以提供给他能不能包装成 MCC server 或者包装成一个知识库让他很容易的能够获取到换句话说从我的视角 AI coding 的这个能力最终会导致什么呢就是原来大家是流水线上的那个工人
今天你要去想说我怎么去设计这个流水线,这 Cloud Code 到这个 SWE Benchmark 到 80%,以及说这些外部的沙盒的环境的完善,使得大家应该从这个角度去考虑 AI Coding,它不是说我能不能写这么个东西,
因为我们大量的日常需求其实是简单的,日常大家今天做个小产品,其实需求没多复杂,但是你是不是有好的所有的这些代码库是干什么的,文档什么,AI 能不能查到,如果能查到,它其实是能在一个复杂的,以及很重要的变成一个设计,就是你的整个系统的设计的好不好,意味着 AI 是不是能管理的好不好。
如果你的设计是一团糟的原来代码就一团糟就很难干这个活如果你的原来的代码设计模块啊职责啊领域划分是清楚的那 AI 其实干这些活是快的因为它很容易的能够 top down 去解决这些问题这个我觉得会拉开不同的公司之间的就数量级的叠代速度的差异这个太吓人了这个就不光是你刚刚讲的那个代码嘛就是加上 mcp 之后所有业务流程嘛
然后我们明显的可以知道说智能水平就是会进步嘛每半年快一代嘛那快要升级个版本号升级个 0.5 嘛
那这样子的话谁已经做好了准备然后最快的接到了最新的就是公开模型好了其实它的效率就很容易有十倍百倍的提高是这样的因为前一段我记得谁说那个 Cloud 说他们 80%到 90%的代码是 AI 写的那个时候我还有点不屑一顾我觉得他们肯定是吹牛皮
你咋统计有多少代码是 AI 写的你今天用 CursorCursor 出来你 TapTap 但你得人看也确认一下就改了两个变量名那代码倒算 AI 写的还算你写的但是如果说但 Cloud Code 其实这个工具他们发 Beta 也发了一段时间我相信他们内部可能更早在用
所以从合理的逻辑上来讲你完全是通过这些工具的确它可以完成很多需求而且这个不只是做功能比如今天说我说算法想优化一下比如说我有个机器模型的模型想优化我有沙盒我告诉它怎么启动这个沙盒怎么我的数据集在哪里我怎么去调用这个代码在哪里其实模型是可以自动去就是你可以让
让 AI Agent 自动去然后你告诉他训练之后他怎么可以检查训练的进度对吧其实这个 Agent 完全也可以做到自己去优化一个特定模型的效果在固定的数据集上对啊但是今天可能比较难的说让他去找数据集这个在开放时间探索的事情他也做不了但是有大量的我们觉得的高技能的活其实对 AI 来讲如果是个套路化的对他来讲没有那么难对今天大家去训练所谓训练一个模型
哎呀无非是拿了个数据集看原代码上好先跑第一版然后去调参数对吧调参数你去看那个 loss 下降的曲线你根据这个曲线人有一个经验这个判断这但这些判断能力其实大模型都有而且没有其实是你可以给他的其实你可以把人的经验灌输给他的我自己的有一个判断是说我们内部从
研发从工程到内部的数据处理再到简单的模型条 U 都可以未来逐步交付给 Ai 去做很多活你不太需要的人力会大幅度减少当然有些活比如说前端
反而你可能还得有人你得看这个界面长得好不好看 fancy 不 fancy 交货体验怎么样我觉得这个对外找出那个不一样来感觉反而 AI 不太好做但是你如果是面向企业的这种弊端工具其实也能做掉
我得抓芒果来找你再深度聊一下这次是可以干的现在就要做准备了说不定现在开始干然后比如说明年的这个时候的话就真的一个比如说十个人的公司就可以有 1000 人公司的效率第一个是我觉得说这个会带来两代第一个是年轻人跟
中老年人肯定会有差别中老年人中可能有一小部分人会有很高的价值在一段时间内更长时间我不知道就是我其实也有点害怕了一段时间内我这种人还有点价值因为我发现今天这个系统大家的架构怎么设计包括我刚才讲的这些东西
应该要不要在内部做感觉是我能想出来我来去推动对吧一年两年以后呢这个事很难讲我的基本上一个判断包括我接下来肯定就在我们公司我肯定会干这个事我相信其实我觉得今天如果大家在用其实要回答已经不是
说我要不要用 Cursor 我要不要用 AI 辅助写代码而是说你应该想一想我内部的整个组织信息流程怎么搭建让 AI 怎么搭建得 AI accessible 怎么让你所有的内部你人能够获取到这些东西 AI 能不能获取到然后他如果能够获取到给他这个 Agent 的能力他能不能把一些事做了人要做的变成说把任务切分成
一个 AI 可解决级别的任务还是不能你给 AI 那个任务说我想发大财对吧你帮我想一下这个问题怎么解决但是你完全可以说我要出具体我要出这样一张标表字段是什么然后你 AI 应该自动帮你把这张人报道生存甚至应该自动帮你发布到一个环境里你去看一眼你觉得没问题点一下 accept 而且他可能是已经自己拿别的数据做过交叉验证跟验收了
然后如果你去写一个功能可能也是这样他给你提一个 PR 然后他所有的自动化测试都已经测过了而且他也布道了一个舞台环境你可以去验收了你看验收一下看也没带 accept 这个功能就写完了未来应该是每天早上过来任何一个就是传统的或者说所有的工程师你的角色都应该改成架构师或者产品经理这个过程中会使得那些能够清晰的结构化的表达自己需求的人
的价值会变得非常大你每天早上一次过来就是给清晰的给 AI 布置五个任务然后去吃午饭吃完午饭回来来页说这五个任务
然后再布置五个任务去吃晚饭然后吃晚饭回来再验收这五个任务然后再布置一批任务回去睡觉等明天早上来没有你这个路上再走一步应该是 AI 自己有一个你的助理 AI 在布置任务然后他会过来说老板对不对就有点像王健林和王思聪每天应该也很忙但他们的忙应该就是大部分想的事情都已经有职业经理人搞定了已经布置下去了但是会来跟你老板请示一下说还是这样的哈哈哈哈
我们先做到这一步因为我觉得做到这一步去完善自己的基建当然这个基建你也可以靠 AI 来帮你完善你说我现在代码没有测试 AI 能不能帮我补一些测试对不对我代码没有文档你 AI 能不能帮我来补文档你可能都需要但是我觉得是大家应该尽快去完善这套基建
对啊我甚至为你要让你组织既然是 AI ready 的 AI ready 的不是说我组织人里为 AI 做好了什么准备而是你组织里的流程功能信息
一定要暴露给 AI 可用你的任何一个内部的服务都应该有个 MCP server 你任何一个这种文档性的东西 AI 都应该通过 MCP 或者通过 RAG 的 search 能够检索到你的舞台环境 AI 应该能够直接触发来发布上去所以最简单的要求就是说你里面人能够碰到的东西的话应该都有 MCP 嗯
嗯很有道理一种方法是因为我们也在找机会嘛一种机会就是我们去找些产品的机会还有一种就是如果有时间的话也找不到什么明确产品机会的话可以先把公司的组织形态性打磨好相当于这个造产品的这个大机器把公司性能至少到时候手脚更快一点比如说哎我同时可以我这个 APP 工厂同时可以出 1000 个对吧你只能出两个
对我觉得这个我们叫这是个借假修正的过程也许你今天的产品方向不一定百分之百对但如果你能把这套流程转起来你能用很少的人很快的做很多事但如果你这套流程转不起来今天你暂时领先了很有可能别人会用十倍的速度来把你给迭代掉
除了 OS 那是 Build 的发布然后 Coding 你看到的是 GPT 和 Cloud 发的然后还有一件大事就是 Google 然后我看他每翻页 PPT 都在想说这个公司要死了太可怕了他一次性丢了一堆东西出来而且对我们两个这两天不是都在玩那个玩那个 VO3 对吧那个太吓人了我是但是我遇到一个 bug 我用不了那个 frame to video 我不是我是看他半下我说我一定得用一下因为我自己有一个
就是 Cloud Code 跟这个 Build 有两个我觉得带来一个强烈的危机感就是你觉得你已经在这个行业了你已经花了很多时间但是你其实始终离跑在前面的人是落后的他不是落后在能力上他是落后在原能力上的 Meta Ability 上
落后在你对这件事情的基本的组织判断上因为以前有一种说法就是前一阵我们其他的合伙人去美国说一个人能当 100 个人用我说你这个鬼扯我一个人能当三个人用顶天了但是今天如果说我们真的能把所有的 infra 都搭建完成一个人当 100 个人用也许夸张了但是一个人当 5 个人 10 个人用就有机会了
对不对然后等到 AI 能力下一步进一步进化就像你说的连分活这个事连分活这个事如果都是 AI 干了那的确一个人当 100 个人用这件事情不是没有可能的因为公司里大部分人干的事其实是一个人肉编排器我举个例子啊就比如说运营比如我们说很多很多大家都内容运营啊我去网上找找最近有什么热点去看看进队有什么帖子然后我拿过来围绕我们这里我想一些 idea
然后我做一些内容请试一下了我老板我老板说就用这个或者是你自己背 KPI 你自己把这个东西放上平台试一试试一下之后可能开数据反馈再把效果不好的下调效果好的再去找一些它其实是个非常流程式的活
而且其中的很多判断能力可能这个人还不如 AI 今天你说这个东西比如说这个东西 fashion 不 fashionAI 可能判断比你马路上随便招一个普通的运营人员要强的这个东西梗出不出效果可能 AI 能力是更强的而这些动作如果你的每一项能力你都能包装成动 MCP 比较稳定的提供出来这个活其实 AI 就能替代掉
你只需要那个更 C 念的人去想哎我怎么去优化这个流程传统的公司有那么多人他的那个层级结构就是那个比较聪明比较厉害的那个人大老板说哎我把这东西拆成了一些 KPI 对不对拆了个指标给你然后这个业务的部门他去想说哎那我怎么我所谓的管理能力我制定一个流程制定一个考核机制传授一些方法论
对不对然后下面的一线的人去做执行所以就是以前也是人类来定这个嘛最开始就是全部为人来设计嘛那现在的话设计的人的思想也是说我在人的流程里面加入一些机器嘛但是真正你要搞好的话其实你应该以机器为中心嘛对吧
就就工厂考虑事情先考虑机器先考虑现在最好的机器怎么用然后在不得不的地方可能排上一些人所以他的设计逻辑是不太一样的应该这样搞但这样搞最后还是要有那个该做什么产品吗那你现在是怎么怎么想的我觉得现在没什么产品可以做了呀看特别看完那个 google 发布会之后就愈发的觉得说就就我们现在很惨啊就是很多产品都半发不发的
卡在这里但是我在想说万一我已经发了其实也很惨对哥啊第一个是说现在世界还是分布不均匀的吧就 Google 虽然发了很多我举个例子 Vue 3 出了对不对我相信用 Vue 3 生成过视频的人
还是很少的至少我觉得短期内各种套利空间其实是非常充足的从现在到未来两三年是个巨大的套利套利空间时代就是你假设你想明白这个事我觉得还是很多事可以做的我极端一点讲嘛就是带做小视频行不行嘛
对不对而且带做小视频你完全可以做一个带做小视频的 agent 所以我觉得在但是呢你今天想要做个大事可能变得很难就你说我今天原来想有很多人想做 soraopen sora 对吧想做基础模型那就就很惨吧对啊现在这些视频模型怎么办对对对对就跟 gpt image 问出来那些做图片生成的怎么办一样啊
做可控图片是真的出来怎么办一样啊对不对这个 Viu3 出来真的太吓人了可这个他对于语言的理解对于物理世界理解那个画面的创业公司就每一页我都看到觉得说有我都想得到几家创业公司然后就觉得如果我是他我该怎么办就觉得好纠结啊就我觉得有好几种出路啊就是一种是说是不是干点脏活累活对吧就是
称之为原来总想想说哎你原来总想做拼多多对吧那今天能不能做拼多多商家去卖货这是这是两种适应模式但是做拼多多卖家做拼多多的卖家去卖货就是个脏活累活但是也许在一个有红利的时代更容易生存下来这是个比方哈第二种是说如果我们能够把组织调成说利用 AI 变得比其他人更有效率那是不是应该变成一个矩阵式的打法
而不应该是赌一个产品的打法这可能是另一个思路我觉得说最传统的那种思路是比方说我做个特别厉害的模型在某一个领域干翻别人这个可能比较难你可能得结合更多细节的产品线下的事才有可能变成一个比较大的事不然的话感觉是有挑战的当然我们在一些细分环境尽管 Google 发了很多东西
我们觉得在一些细分环节我觉得我们东西做的比他发的东西做的好然后我们看怎么调整一下能不能蹭一下热度到时候没有能这样你们还是很牛逼的很少有人能够行啊在一些非常细分的地方但是客观来讲假设今天我做的比较好我觉得很难做到就是如果你不做去更重更深的事你完全就比说他有这个功能我也有这个功能我今天做的比他好
你过一年之后肯定就应该是搞不过它了那怎么办呢就是找细分一点找细一点然后做一千个我觉得要么就是做矩阵式的就是我并不追求单个东西大通过组织效率
然后通过数量能够对吧这个其实原来的传统的中国出海团很多传统的出国出海团其实挺善良觉得这个事的这原来他是能够组织起人来干这个事今天你能不能组织起 AI 来干这个事然后你需要的人就变少了另外一个就是能不能干点脏活累活
干点巨头们不可能去干的活那你讲的比如说公司要经过这个转型这个事情本身如果他真的有可以把一家公司提供比如说 100 倍的效率的话
这件事情本身有没有机会呢就有点像比如说格林格林他就不是就公司是什么企业就是内部就是库可以把它打通然后你就方便用大圆模型干嘛这也是一家不少的公司嘛既然看准了这个方向就这个方向本身有没有一个产品级的机会啊不是那种讲课因为这个交了也没用对产品级的机会有没有我觉得这个当中有一个机会是确定性的就是第一个确定性的是咨询类的机会我觉得不是讲课这是艾森哲这种公司的机会
就是我相信就是之前大家都讲数字化转型对不对
那 AiFi 转型这件事情其实有了一个真正可落地的实现路径的方式了那你再讲讲什么叫做落地的实现路径的方式就帮他们搞一堆 MCP 然后改流程吗或者你可以这样讲其实你就是要做一个就是我觉得这是个很典型的咨询类的可做的 case 应该是什么呢你做咨询摸清楚他今天的非常细的业务流程和系统是怎么样的
能不能包装成 mcp 跟 agent 然后 maybe 还需要 homemade 的 loop 需要有人在中间但是它能够极大的提升组织效率但私有化工具太多了你搞 mcp 也搞不过来我们现在其实在工厂里面那个其实就是有有那个工业软件的 mcp 但是其实没有现成的可以搞就是要全套真的要搭对
对但是所以我说它是个像 SN 折这样的机会它其实是一个咨询加可实施的过程这个钱赚的也蛮辛苦的不辛苦的钱很快就轮不到大家来赚了产品的机会呢我觉得当中会有比较多的中间件的机会传统的大体量的产品啊或者怎么样能不能通过 MCP 暴露出来怎么把外部的各种三方工具通过 MCP 跟沙盒能够包装起来
我觉得这个当中有一系列的产品机会我举个例子因为我认为今天有很多的产品它不是为 AI 准备的我举一个例子今天大家写服务都会去写一个接口文档接口文档其实本身服务里比如这边陈语言都已经有了对不对所以这个事情你不需要重新写一遍简单包一下 mcp 也很容易但是今天所有的这些程序的接口文档
都不会告诉你线上这个服务的请求量是怎么样的它的延时是怎么样的但如果一个人的程序员去设计流程跟接口的时候他其实是要关心这些事的这个类的信息远传统上在另外一类产品里就是线上会有监控的系统会有我们叫 tracing 的就是追踪的系统那么怎么把追踪的系统跟这个文档
能够关联起来其实就是一个小的中间界的机会就是所以我说这当中是有很多产品机会的很多小的产品机会以及这些小产品机会也许能够放在一起变成一个 suit 这就是上次你讲过做这些广告创意的公司传统意义上做投放的做创意的什么追踪数据的都是分开的
但是对一个 agent 来讲对于你想希望一个 agent 把广告投了其实你希望是我都能看到在一个地方看到甚至我能够看到更多的比如说站内的比如说公司内部的这些更详细的监测数据甚至有很多原来没有想到的就像你说的更规模化的做 AV 测试人可能做不了那么多那 AI 可以做其实所有的很多东西你想想都有但你细微的去想一想是不是把所有的信息都暴露了给了 AI 其实没有
好可以做这个还有什么可以做的吗就最近觉得没什么好做反正做了的话市场上就会有 10 个然后大厂还有一个在后面等着我觉得 VOE3 出来的真的有很多偏创意类的事可以做就是这个事情本账还是个审美的事其实在有些场景下模型能力越强是好事你是说做内容或者做垂直相当于
做迷的珍妮不是做迷的珍妮我觉得做迷的珍妮的机会就反而很小嘛你其实还是想它更像一个平台但是我举个例子就是无边的我能不能今天做一个教小朋友拍电影的应用我告诉他怎么用镜头怎么用怎么去讲画面或者怎么样原来其实这事你没法做或者你很难做但今天是可以做的对不对
而且你不应该训一个自己的模型你就要用别人的模型来做这个事原来你想当电影导演对吧说教小朋友做一个怎么教小朋友当电影导演的 APP 我胡编的我线编的刚才线编的也很有道理啊就是在还是一个有的存在的需求但是之前的生产率水平达不到因为电影这事实在是搞起来太贵了嘛
然后你也不可能让他说,那这个你看俯拍是这样,然后那个横拍是这样,然后把重点放在男生身上是这样,把重点放在女生身上是这样。那现在其实就是言出法随嘛。所以我倒不觉得机会没有,反正机会其实是很多的。但是这个机会可能不是那个平台级的那个做一个 VOE3 的机会,对吧。所以那些融了很多钱说我要做个比别人都厉害的模型这件事。
就变得很难了对对对现在可以搞点小的就比如说你之前不是提可以做个翻译吗对吧做个做个播客翻译打个广告有一期已经上线了对大家可以去听一下然后我们可以看看播客翻译的效果怎么样这种东西其实像小宇宙也会自己翻嘛对吧然后也会一堆人在翻
我觉得这事是这样的就是你不能从竞争终局去考虑有些事就是谁先做的快吧就是你说 MonicaSider 做的这些事人人都能做他做的快嘛他把这头两年两三年的红利吃掉他不就去做 Manas 了吗 Manas 可能接下来也不太好做对吧因为开源版的最近出了一个开源版的叫 II Agent 我们看了一下基本上把 Manas 所有的功能都做了对吧但是我觉得现在
就在一个技术快速变动的时代你很难就定义终局来做事你那样就是做不出来嘛定义技术终局来做事那就是 AGI 对吧 AGI 之后你做啥都没有意义
那最好的方式是早上出去健身晚上回来看脱口秀哎那你还看到什么好玩的这周不是好多发布吗还有什么感想没有了我觉得这两件事想明白就是特别是 coding 这个事因为本身这个对我的工作会有重大的影响就是你可能得把
组织形式到底该怎么做事这个事可能都得做大的调整有没有可能我基于你的这个想法就是我不做公司因为公司你说爱森哲其实赚不了几个钱我觉得真不是我觉得像爱森哲这些公司都是阶段性非常赚钱就是当这个概念火了他抢到那个身位啪就赚了一波钱
然后在这但是他是一个只能赚那一个时间阶段前的机会吧就跟上半年在国内帮人接一下 diffusik 做 rag 问答一样他是个赚钱的机会对我是在想说那样子就是现在如果要我来搞这个事的话我就很容易被薅进去但是我说实话我觉得这是个大机会啊这
这本账是我相信这个世界上加拿大的所有公司都需要做 AI 转型你其实真的是要深到业务流里面就好像我说我要泡在工厂就我感觉我比如说同时搞两三家公司我就已经完了就很难规模化就是当然我现在是本着我要学习的态度但我觉得这个规模化可能就要
想一些别的方式了,maybe 你应该开个培训班,对吧,找很多聪明的人,想明,教会他们怎么帮别人做 AI 转型,或者你就真的开一家 SN 折嘛,AI 时代的 SN 折,对吧,可以考虑,但我现在刚刚还是在想,因为做惯了 2C 的产品嘛,还是在想这件事情有没有可能啊,还是 2C,
从 2C 的角度,比如说我假设有一群人他每天的工作就是 notion 打开 email,google gmail 打开什么,他有常见的常见的几个软件,然后他每天的工作流是比如说其实就是很差的一个工作流。
其实你就把常规的比如说知识管理的那个流程帮他优化一下但是自动化的优化不是说他学习一个道理学习道理那些课反正也卖得掉嘛那种的 Para 什么的 Second Brain 这种老美那种课也卖得掉嘛那其实就是帮他把这几个软件打通了然后相当于有一个人在帮他整体管起来了这样子是不是是一个产品级的机会他就不是一个咨询嘛但是他就不是肯定不能 2B2B 太费标了
2C 的话其实是存在一类人的比如说就是学习爱好者或者怎么样的一群人然后有或者说就是引稿营销的或者怎么样是不是有一个 C 的产品的机会我觉得有一个我叫做小 B 但其实是面向就是你刚才说的比方说我就是给那些卖货铺货的人我就是给那些发小红书的人
我就是给那些什么拍抖音的人然后他有一个标准化的套路能不能变成
利用今天的这些 mcp 的能力跟别人的工具整合成一些 workflow 对只是之前卖过 flow 的话你很多时候是卖一个道理嘛比如说你应该怎么看抖音的什么数据然后回来怎么检查然后你的怎么样假设或者先假设你的脚本是写在一个非数文档剪辑是用剪印然后那边是用那个发到抖音上
假设这三个都已经 mcp 了理论上来讲就有点像他应该自己可以去分析那个数据自己来重新写脚本然后指挥我拍啊拍还是人类拍拍好之后剪印那边会按照东东西来重新剪然后再自动砝码然后再自动搞吗拍视频我不知道你能不能啊我剪视频的不能那么智能但是我觉得有很多的工作是可以做的
比如发小红书比如发图文类的内容或者说一些这种一些数据分析人肉调整的这些动作其实是都可以来这么做的对但是讲到如果真的是这么规模化的话感觉应该自己来做举证号解释我觉得有一类机会
就是围绕 AI 跟 MCP 去做这种监控跟统计功能比方说你有所有的 MCP 然后所有的这些服务你应该去做一个帮助你计费计时计算成功率计算每个步骤成功率的工具产品
这个产品能够帮助你去迭代要不要调 prompt 要不要换更好的模型我们刚才讲的是正向的你有一个 agent 有很多 mcp 能去做很多事情了然后你需要有一个它的监管者或者考核者
可以做一个这样的产品对这个就感觉需要第一件事完成之后这个东西才卖得掉这个我觉得是个长期的产品类型的机会就跟在这个公司就像互联网大数据起来的这种 data dog 什么对吧就是我那个是帮你监测什么 AI 的这 AI 就是什么 apps flyer 这种对吧 AI 时代也需要他自己的 apps flyer
你公司内部也需要新一代的 DataDock 其实还挺有道理我觉得你很多的 idea 都很好做成 BP 去骗钱为什么我把这个抛出来呢这事我自己有需求就是你一旦发现你要为 AR Ready 也会面临很多问题比如说这个接口可以掉但是接口掉下来可能很贵你怕它掉爆了
你需要你你又需要把这个准备得做好确实 AI 转型刚刚讲到这一波是个大机会因为现在我几乎每天都有传统企业来找我已经开始收费帮别人聊聊天了我很快就会成为中国美元基金历史上第一家运营成本为负的福华鸡对第一张彩鞋是可以大做一下而且可以做得更认真一点就是把它更刻薄
科技一点就是帮他真的把 mcp 也搞好然后流程而不光是讲了一个 ai 转型的一个道理说你可以做这个这个就有点像开脑洞要是艾森哲那样把实施给做掉对我们之前实施是倾向于做做产品的 mvp 而不是帮他内部降本增效我们不想碰但是按你这样讲内部降本增效这一层是可以做的很有技术含量的
对而且我觉得是个巨大的市场啊就是所有人都有就所有老板都有这个需求而且这件事情在今天这个时代又是能做到的他跟以前那个他比以前你讲数字化转型啊什么的这样子的说实话实际多了你这事情做完真的就是才一批人啊这就很残酷对吧
真的能有那么好的效果吗就是你说写文案画画就是嘛但是你刚讲的这个这个 mcp 他要做他内部系统那些一个个搞的话搞完之后还要协同好像也没有那么见效果这句话不是说搞完有没有那么容易见效果而是这件事有没有那么容易搞
对新公司来讲搞起来容易对老公司来讲搞起来难对新公司来讲我今天选编程语言我就应该选 Python 为什么因为 SWE Benchmark 选的语言就是 Python 对
对老公司来说我已经选了 Java 了我总不见得把 Java 用 Python 再重新写一遍你说这个倒是很有道理如果我改不了老公司的话我其实可以第一步我先把我的复盘器内部做成是这种已经彻底的 AI Native 的公司比如说我效率提高 20 倍假设我真的能做到
做到了之后的话我就拿这个卖点说我可以帮你把创业公司我就不去做老公司了真的改起来很烦的就直接周述创业公司好了我我给他讲大道理然后芒果去把它比如说变成一一套提效然后我们用这个来占股份
然后基金投赚钱孵化的意思就不一定是那个投赚钱吗或者讲点道理吗我们是可以帮你的真的增效十倍的那这个孵化的逻辑也说得过去也可以这样做新公司会容易一些确实不要做老公司或者做老公司的做法没必须是
不是去改他的流程而是把某个流程写成一个新的 MCP 服务对就是每一件事情都会比你想象当中耗费多 10 倍的时间这算是都是这样的今天讲道理都容易啊落地其实都需要时间跟精力而且也需要它既是一个你改造流程的机会需求也是个改造组织的需求就是你的组织内部的人也要认可这个事情
这个也是为什么创业公司比如今天我就想做一个新的创业公司会更容易因为大家更愿意觉得我没有那些包我不觉得必须是这样的但是为什么年轻人更容易就是说如果说是一个工作三年人我已经做了三年的运营我不觉得说我觉得我的这些技能本身是有价值的而他不太就更不容易退出来说今天未来可能的决策不叫运营
而是说运营的产品应该是一个人我胡说啊或者你不应该叫后端开发后端开发跟产品应该是一个人这怎么让在组织内部说你既要去做这个系统的改造也要做人跟组织流程的改造甚至是你要的绩效考核机制的改造你可能都得做所以为什么我说它是一个咨询加实施的如果对老公司它其实是个咨询加实施的项目
如果是新公司你应该利用这个东西搭好自己的基建然后靠叠大速度来战胜老公司你讲这个我明白我现在也确实在做一些这样的有一个点就是是靠个人的能力我在教练一些公司在转型吧
但是基本上还是靠个人能力就是连我写了一些文档有些流程方法论啊什么的但是其实过程当中发现个人能力占的 80%吧流程在 20%方法论那你现在有没有什么这种方面的流程方法论或者你受到了哪几个比如说其实已经有一些更比我们走在前面的人的影响我可以有一些什么学习的东西吗就框架性的东东西还是说其实大家现在都是靠个人能力在往前秃
就我没有看到有谁写的特别体系化的这个东西因为我觉得所有人都在探索说 ANATIP 的组织应该是什么样子的对就其实我刚才讲这些就是说其实本质上也还是大道理对吧就是说你应该怎么样可能提了一点点可以落地的建议
但是我觉得就对我们来讲也是说内部这个事情怎么落地假设给自己建一个框架先尝试能不能用这种方式来运转因为我觉得我们就处于处于还改得动就还没不是个老公司但是可能不够那么新就如果今天你重新去打造一个组织可能组织结构也跟我们这种已经成立一两年的公司会不太好
不太一样我觉得我可以研究一下这个然后我们自己先改然后因为因为芒果比我更极端所以他接受你这种观点应该是一秒没中的事情然后他就会直接搞我觉得他是他是搞得下来的我可以在理念上把它想清楚然后我是可以写 PPT 的他是真的能把我落地
你今天还解解答了我一个很大的心结就是我之前一直别人找我做那个比如说教他们一下怎么怎么转转型或者说搞一个 ai 的一个第二曲线的时候但是听你这样讲好像这件事情本身是一个很高级的事情
接下来可以摇晃一下了我觉得这是特别有价值的一件事因为所有的公司家来我觉得都需要我们不讲 AGI 到不到来这个事情话题但是我觉得从 22 年底到这周我觉得是个非常大的节点这个节点就是为什么我觉得它是个大的节点呢就是因为 OpenAIGoogle 跟 Cloud 其实同时发了这个 Coding Agent 的这个产品然后他们这个产品的能力其实也已经
越过了一定的基准线这个意味着你分配一个独立的任务给 AI 去干活这件事情
开始慢慢成立了接下来其实要回答的问题是我怎么能更好地分配给 AI 干货毕竟它可以 24 小时不研不修只耗 token 对吧其实就是虚拟的来想的话就是机器人已经半成熟了可能明年就成熟了比如说它的手指头比较大我们的键盘不对或者说我们的办公室里面的楼梯太多了它会摔跤我们现在赶紧先做这个改造然后再为它设计工作流这事是模型一定要做的
模型再怎么 powerful 它还是需要说你能够把你的已经有的系统跟信息暴露给它这件事情你是一定要做的因为它的能力我相信就是明后年肯定就比我们强了嘛那其实我就是要把 context 给它以及把我有的一些它没有的能力比如说我可以指挥一个人去送外卖
那这个东西把它变成接口让他可被掉优我的能力和我的上下文的 share 给他然后我的欲望 share 给他然后让他根据我的欲望去他自己想办法去干的时候可以理解我的上下文并且使用我 share 给他的部分能力就是我不知道 AZI 会不会来之前其实你觉得很牛逼很兴奋但是他到底
一个阶段性的边界在哪里其实我觉得没有想明白但是我觉得这个礼拜这些东西发了包括最近一直的一些实际使用的体会我觉得一个阶段性的边界就在 AGI 之前的这个边界我已经想明白了但是这个边界从工作的角度来讲一定会让绝大部分人失业包括我
不是以前我可能还觉得不包括我现在我觉得是包括我既然包括我心态就会好很多以前的想法是说我要再厉害一点我要再干点 AI 干不了的事现在不是现在是说我应该把所有的工作
准备好让 AI 都能干我可以不用干活但是我现在觉得说就是牌子可能更重要有可能 AI 比如说两年后就比我强了但是呢这张脸可能大家还不知道这件事情可能两年之后还有人在找我付支付高额溢价然后其实背后是 AI 干的所以我们赶紧把 AI 列进去要持续更新
你有老人家给你写文章好的更新一下更新一下好的好的好的来我们就定期聊聊天然后也欢迎大家就是关注我们然后推荐给朋友们对吧这么深度的讨论很少有的然后对然后关注那个我们的还有公众号然后点击徐文浩的头像或者我的头像应该还会看到我们新开的用 AI 做的那个把海外的最新的播客转录成中文的播客对我现在也不知道他名字是什么
对,但是反正你点点点我们头像应该会有吧等到这一期上线的时候应该有了然后应该会音质和那个语言的那个风格应该会效果会好到超乎你想象的对,所以大家可以去订阅一下在这件事情上就是一个下 prompt 的角色对
对某位的小朋友出现比较多大家看看除了我们两个名字当中还有另外一个名名字出现了那位同学干活比较对他的贡献比较大一点对我们就出了出主意对不对就有一个人肉 agent 把这个事给干了好的呀那大家那个关注我呢然后推荐给推荐给朋友们然后定期可以听我们使用号聊天我们也会各自找一些呃
夜内的朋友来聊天所以关心这一块的话面向未来的话可以推荐推荐对好那今天大家就到这里我们再约个时间接着了好谢谢大家拜拜好就这样好谢谢
i know
中文字幕提供