大家好,欢迎收听尼海克,我是赛头,我是依夏
我是龟龟本期节目由 Podwise 赞助播出 Podwise 是一款为播客听众制作的 AI 学习软件产品的 slogan 是 Read before listenPodwise 通过 AI 对播客内容进行转录提取总结分析等一系列操作帮你掰开了揉碎了硬核的播客内容同时与 Notion、Readwise 等平台的打通嵌入知识管理工作流协助您的其他包括新闻 Newsletter、Vlog 的内容帮你打造第二大脑
Podwise 也为本期听众准备了三个五折优惠码针对本期在小宇宙与我们互动的精选回复欢迎大家踊跃来玩好的,那开始我们本期的节目吧
说到 2024 年最让人印象深刻的 AI 应用我个人觉得还得是 Cursor2023 年的时候 Cursor 营收才 100 万美金但是到 2024 年 11 月的时候这个数字已经突破了 6500 万美金平均下来一个月的话将近 600 万美金左右对可见 AI Coding 这个市场的潜力是巨大的
在 Cursor 营收爆炸的三个月之后我们国内的字节团队也在 Product Hunt 上面发布了自己的 AI Coding 产品 Tree
那今天我们也非常开心邀请到 Trey 的天珠来跟我们一起聊聊 AI Coding 的前世今生同时我们本期也是一期与 DevMore 迪摩王的串台节目那迪摩王的主播五花肉恰好也是 Trey 开发者运营团队的那技术运营团队的人都到了我们废话就不多说了先开始我们本期的节目吧那我们就先有请 Trey 团队的天珠还有五花肉跟大家介绍一下自己吧然后也顺道介绍一下今天的主角 Trey
嗨大家好我是迪莫王 DevMo 的主播五花肉同时现在也是在 Tree 的团队负责开发者关系开发者运营请我们的天猪跟大家打个招呼吧哈喽大家好我是天猪我之前主要是在前端这个圈子吧然后就搞搞开源这块
像如果前端同学应该 Aggs 或者是 CMPM 这块应该可能会听说过对然后我以前在阿姨跟智捷都负责过 NoJS Infra 这块的基建的建设
然后这两年的话在字节的话主要是负责就是 call id 这个方向我们的话就像去年的话其实也是有多款的产品就发布就一个是 master code 的 call id 包括 cause 里面的 id
然后还有什么决心刷题之类的一些 callid 的产品在去年年底的时候我们就干出来了刚来华洲时候的 trade id 这样的一个 nety idnety id 的话我们的 trade 主要的一个亮点就是 ai coding 这个方向就像我们比较大的一个特性就是 trade builder 它主要面对的就是那些比如说 0-1 的一个应用制作场景
可以简单理解对标就像 Courser 的 Composer 或者是 Inserve 这样的一个 AI 的 agent
其实天猪刚才也有介绍说你们那个 Mars Code 其实也是你们的产品就是反正据我所知这个 Tree IDE 本身其实不是自己第一次开始做 IDE 相关的产品对然后我就想问一下就作为你们团队你们一开始是怎么就想着说进军这个 AI IDE 这个市场的就你们内部是怎么评估就说这个地方是就是挺大的一块肉其实我是要做的而不是说像很多大厂的话他可能预见到说这个市场可能只有几千万
可能都不过亿的市场他们就不会投入了因为可能连人力成本都收不回来我不知道你们之前是怎么去看这个市场的
然后我怎么说我这一层我对这块的一个理解因为我们最早其实我们是来自于智捷的 Debianfra 就是做内部基建这块的在过去很多年我们部门一直在服务开发者相关工具的像智捷内部成千上万的工程师也都是我们在服务的在前几年大模型语言大模型出现的时候让我们看到了有新的生产力能提升开发者的效率跟体验的可能
所以我们会希望在 AI 时代能去参与到这个进程里面去因为我们在内部其实本身已经有靠这种服务去服务我们的开发者包括 MaskCore 的豆包 MaskCore 的一个代码助手对那很顺其自然那我们这个使用希望在更大的一个场合去去实践对所以说对外者也会去推出像 MaskCore 靠 ID 和 Tray 这样的产品
了解其实你说你在内部去服务内部开发者是不是有点像之前阿里内部比如说自己去运营 GitLab 等等之类的对吧其实也是在服务阿里内部很多很多的开发者是不是字节内部其实也是类似的部门啊等等之类的
对 我们之前是在 Debian 4 的话其实它的做应该会还是挺大的就是除了你刚才说的这种像什么自建的 GitLab 的话包括很多内部的中间件各种那种平台包括这种开发的工具其实都是这个大部门在负责的
了解那我就想问一下因为不光自己也有 Mars Code 然后我也知道说像阿里自己也有通一零码百度也有叫文心快码对吧我估计可能还有别的产品反正就现在大厂其实对这个领域里面竞争也挺激烈的我感觉上面每家投入都不太小
对 但是我就觉得很奇怪的是其实在业界里边大家用国产产品的我们讲我们程序员这个领域当然是我周边的我不确定别人是什么情况就在我周边里面大家用这种相关产品的人感觉不是很多但是我看包括阿里包括百度包括字节等等大家在下方有很多的企业用户而且都是那种超级大公司的企业用户就我不知道说这个里面到底是当初大家在推这个产品的时候本来打的就是企业用户呢还是说
其实我们也想做个人用户但是没推起来我觉得这个可能在国内的各个厂的大家的不同厂做这个事情的团队其实他的自己的 score 包括他所面临的一些公司的诉求其实不一样的你像百度的话主要可能他会做企业市场
对吧 然后更多的其实很多我看到很多他反对更多他先做好服务自己反对就自己公司内部的这种对而我们其实智捷的话因为我们可能会走到比较前一点我们之前就已经在智捷这块的服务的用户其实已经足够多了对在这层的话呢可能公司各方面的考虑下会希望我们有接触更大的一个市场
因为我对几个大厂的这一块像 COWID 这块我还是算比较了解跟这些同学都比较熟我当时过来这边的话其实我也是发现一个比较可能稍微有点惊讶的场景就是说像 COWE 这种的话我看到很多国内的大厂
更多只是外包在用正式员工其实没在用的但其实在字节的话在这点上是有点不同的因为我们有非常多的正式员工用这个东西我有亲身感受因为去年我们曾经有一段时间资源那种不太够的情况下是有至上到下很多来去 push 我们比如说你这个地方把我的性能稳定性要给做好的而不是说我们要去主动去跟他说你要用我们产品
你能帮我们分析一下就是为什么在字节里面能推开因为 Cloud IDE 这件事我们自己之前都是开发毕竟它是一个网上的一个东西总觉得不够丝滑总觉得不够顺手总觉得跟我内部的这些文件等等之类的东西它其实交互起来并不是特别的顺畅至少我们以前不管是在阿里内部还是我们之前就是感觉即使做了大家用的也不多我不确定说因为你到字节也是看到说字节内部有很多人在用这个背后的原因能帮我们分享一下
我只能代表自己的观点因为这个东西我也是一个观察的东西我觉得各方面的原因吧一个其实每个公司它的开发者心智跟它的基建跟业务和基建之间的关系其实都不一样的因为这块我是有挺强的感受因为我之前在阿里做 node-info 和在字节做 node-info 你的做事的方式包括你这些产品的东西都是不一样的
而 CloudID 的话我可能会有点片面的原料就是比如说自己很多就算法的比较多这些其实很多情况下它需要去做一些连条各方面的话就需要会有一些更多在线的一个要求不然的话你的机器这种规格是跟不上的然后还有一些合规各方面但这些可能会稍微点片面因为我只是个人的一些猜测但是我看到的现象就是确实有这么多用户一直在用而且在 push 我们
要去优化你知道我的 Cloud 的 ID 使用场景是什么吗我就希望我能在 iPad 上携带吧这个地方呢其实我想展开一点因为每次看到别人讲把 Cloud ID 和 Web ID 对等的时候其实我都会跳出来反驳一个点就是说我个人认为 Cloud ID 其实不等于 Web ID 我认为的 Cloud 是 anywhere
就是你在随时随地就可以去编码我们去看一个 ID 它其实两个组成部分一个就是你们看到的 UI 层这个东西对吧这一层其实我们看到它可以跑在 English train 里面在本地也可以跑在一个 web 浏览器里面对吧它可以各个地方跑就 iPad 上移动端也能跑
然后后面的容器它可以是本地的硬盘也可以是像 starbridge 那样子是浏览器里面一个 web container 的模拟
可以是本地的一个 docker 那当然也可以是像我们 CloudID 做的远端的这种一个 K8s 这样容器所以我会觉得 CloudID 这个东西它的形态其实是各种地方去用的所以我们前面说的理解的狭义的 CloudID 就 WebID 的话它可能更多是一个切断点
但是未来像包括我们现在做的东西其实它是连通在一起的这也是说为什么我 Masko 和 Trey 在我们一个团队就负责它不是两个产品我想补充一下刚上一个问题说服务企业客户其实这可能是我们推豆包 Masko 的根
零码或者等等的友商的优秀的产品的不一样的一个点就是我们会跟偏个人一些就是而不是以 2B 的模式在做的所以也可以看到我们去年在做的一些事情上也更多的在强调激发创意啊等等这些的案例和场景这可能也是一个比较不一样的点跟其他的国内的同类的插件的形式的产品
了解那我就接着想问一下因为我们今天其实聊的主要核心还是 AI 嘛如果今天没有 AI 这件事的话这个 Cloud IDE 跟五年以前十年以前的 Cloud IDE 可能区别不是很大只不过大家在后端层面上面可能今天用上 KBIS 了然后自己有自己的 container 了等等之类的对吧那我们回到 AI 这件事啊就说
我觉得 AI 这件事起来的时候可能应该是 GitHub Copilot 开始起来的吧对吧就它先开始有了一定的补全的能力对然后后续 GitHub Copilot 它是收费的嘛就石刀嘛然后如果你是开源的话是可以让你免费用的 Codium 后续它推出了一个免费版的然后可以让你用对然后之后还有像什么 Type9 啊还有 Super Maven 啊等等这些产品其实他们一开始都是做这种 AI 补全的但是其实大家补全的时候都是这种顺序补全
对吧就是比如说单行补全可能些微带一些多行补全等等之类的对以前给我们的感觉是 GitHub Copilot 挺好用的但是它属于是那种甜品级的就不太属于那种杀手级的对吧就是我用上它它能给我稍微补全一下我觉得用起来还挺爽的但是它没有说我离了它就不能编码了或者怎么样对就是从大概去年 10 月份 11 月份开始吧就是 Cursor 然后它接了 CloudSonic 3.5 开始之后
就这个感觉趋势就有点一发不可收拾了对就是我不知道你们自己在内部有没有去分析过说就为什么从 Cursor 的这个接了 Clown3.5 之后它就变得说突然就火爆就爆火起来了你们觉得说这个 Cursor 它最核心的革命性的东西是什么
这块可以展开聊一聊因为这个领域我还是观察挺久的挺有意思因为在 AI coding 这个领域从我观察来看过去几年时间基本上每个月几乎都在刷新我的认知就是你会觉得我记得前几个月好像半年前你们也有过一期高原 Courser 的讨论当时我还听了我当时还想有一些点还是想补充一下不过今天有机会挺好的
首先回到那个问题来说我觉得 Costco 比较火的原因去年比较火的原因我觉得是主要原因是基础比较大突破就是 Cloud 3.5 的时候包括今天 3.7 出来可以让 Costco 过去做很多事情去放大了
但只有模型能力其实是不够的 Costco 它跟 Cody 们这些它不是突然间冒出来而是它在这个行业中持续做了很多它的成功在我看来更像一个后期爆发的一个过程如果这里讲的话其实讲整个演变过程的话我经常会把这个东西比作一个自动驾驶
就是 L1 的话是一个人肉的编程 L2 我把它称为 AI 的一个辅助编程 L3 是 AI 的结对编程 L4 是 AI 的驱动或者主动的编程我们目前去年那个时间点就刚好到了 L3 的一个结对编程
这个阶段我就一展开讲这空间如果有问题可以我们随时随时我们给那个展开再聊对我先讲一下对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位位
早期我们写代码的话其实那个更多是像一个代码体制也就是一个下拉框告诉你这个对象有哪些属性和方法不要错对吧那个阶段的话比较好的一些的话就 TEM9 这些插件嗯然后在 TradeGBT 出来之后我们知道那个大模型它一个本质是预测下一个字符那相比这种自然语言的话其实编程语言是更简洁简简而且是可预测的所以我们就看到了 Copilot 的一个横空出世
它的话主要在代码补全上有一个极大的创新一个是很任人惊艳的叫 go test 的加工方式就刚才说的代码提示是个下拉框而 Copilot 的话它是直接就是一个浅的颜色然后你只需要一个 tab 就可以快速去采纳这个其实对程序员一个多巴胺的一个刺激是非常强烈的然后 Copilot 它的这个方式其实刚出来后它只是一个针对新增代码的一个补全
然后接下来我们看到这个行业其实像 Core 点跟 Cost 的话他们很接下来一个创新点就是 super completion 或者也叫 tap tap
这个的创新点在哪里呢就是前面是预测你 tab 是下一个字符它变成了预测你下一个编辑位置然后从新增代码变成了可以修改存量的代码一个很直观的例子就是说比如说我们写前端嘛如果你有一个地区的下压列表一开始你可能全部写英文的然后你想改为中文那你改第一行改为中文之后
它智能就下面的全部给你智能一个 tab 就可以全部提示而不是你一个一个的去改这种的话我们把它叫 tab tab 超级补全这个是目前看到在代码补全这个方向上的两个比较大的一个里程碑对所以从代码提示到代码补全再到超级补全这是 iCoding 的一个能力的体现
对这个是在补全方面的嗯对我就想问一下在补全的这个层面上面你刚才有讲说叫 super tab tab 比如说你说在 codium 跟 cursor 这个情况下面它 super tab tab 它具体在里面是做了些什么事情就是如果说我在每一步 tab tab 的时候我都去调 traggpt 的话它会不会说后面它的用量费用会比较高一些嗯
这里其实是会有很多专项一些训练的具体细节我可能也说不太出来因为模型训练我做不太多我了解到其实他们很多是
会去拿地下上很多坑密拿来去做训练所以它能去有点叫插控吧这块的原理可能我想讲不太出来但这块的门槛其实不低的因为你现在可以看到能做好的块的其实不多其实你刚才讲这个东西有一点挺有意思的就是你不讲我还没有感觉到其实大家是在用
Commit 去训练我就在想一个问题就是我们其实在写 prompt 的时候其实我写的其实就算是一个 Commit 的一个 messageGitHub 的一个 Commit message 当我写一个 Commit message 的时候其实我想描述说我其实想干什么事情但一般来讲如果一个比较好的一个 GitHub repo 的话其实它的 Commit message 是写的比较好
那如果我能根据 CommitMessage 反向训练它具体 diff 了什么样的代码进去其实如果用这个东西去训练训练训练的话就它的准确度应该会比较高就我不能说我只是拿着一个 Repo 去训练我不拿 Commit 去训练我突然觉得
好像就应该是这样训练的而不是直接拿着 repo 因为 AI 我们知道这个训练的时候其实需要有个奖励机制或者一个判断机制而 GitHub 上这些优秀仓库的一个 Commit 或者 PR 其实就一个最优质的一个数据员对对对是的对其实这种 public 的仓库本身它就会写好因为它是 public 的对吧对那你像我的私人仓库全都是 WIP 对
都是 work in progress 刚才聊到是代码的一个布局其实在我们看到 AI coding 里面还有一个比较重要概念其实代码的生成举个例子就是 TradeGBt 刚出来的时候其实对我们一个我记得当时一个很震撼的点就是我在 TradeGBt 里面问他
可以对话是他就可以生成一个算法这是当时应该是比较多一个点对吧对但是我们发现他是在这个 treblegbt 里面那你会怎么样子你需要在这个 treble 里面跟他人肉对话然后再复制回 ID 然后你改完你再复制给他那这个过程其实是比较繁琐的
所以我们可以看到很快的在 ID 里面就出现了一个东西叫 SideChad 就是在左边或在右边会有个对话框直接在里面这个阶段更多是以插件的方式比如说 Cobbler 有个 Chad 然后 Coding 也是以这个起家的就是它里面有这个插件
这个的优势是什么就是说它直接在 ID 里面就可以拿到代码仓库的上下文包括当前 ID 里面的用户的一些比如说你在哪一行什么信息就不需要人肉去给到 HPT 去了但这里其实也看起来好像很高大上但原理其实是很直白的对
然后比如说我们经常一个例子你在右边筛取的 gain iso 你帮我把 http 请求函数实现一下其实它背后的话
就是拼一段大白话的 promote 来说用户现在正在打开某某文件它的光标在第几行这行函数的名是什么注是什么最近他访问过哪几个文件整个目录结构是什么样子的他要你干嘛就拼了一段这样大的 promote 然后把这个丢给那个大模型然后大模型去根据这个需求生成回来你再把它干嘛把它给合并进去
其实跟人肉没什么区别但是 ID 可以帮你把合适的 computers 上下网给组装起来这样的话就比起前面的全部进了一步
这里其实技术含量点会有一些比如说你的项目的理解能力因为整个大的仓库你怎么去更好的理解这个项目然后 comptech 我们刚才说拼这么多东西你这个上下文 comptech 你要把合适的给他因为现在 AI 的话他的注意力其实还是有点不是很好的对吧你怎么把合适的 comptech 裁剪后给到他
多轮绘画后你怎么能把上面一些做历史啊把这个材料再放在一起对
然后还包括模型的能力以及你工程上的一些 PE 的能力这一块的话就是 Porsche 在这块他在最早去脱颖出了一个点因为他这块做了很多这种工程上的一些事情大家刚刚也提到 Solnet 的话 Cloud 的 Solnet 的话是功不可没了因为他代表了模型到了一个里程碑红额在去年的上半年的时候其实是掀起了第一波的一个热潮
所以到了这一步后我们可以看到就是说开发者其实可以在 ID 里面跟 AI 共享同样的上下文你不需要去转述对然后这里的话再接下来一个创新点是什么就是它是 AI 生成代码
你怎么把这段代码去合并回到每个文件里面去这里的话不为一个点第一个是你怎么让 AI 生成一段合适的代码是整个文件一个全量的生成还是生成一个片段
然后还是生成一个 give-div 这种格式这里就会涉及到就写回去的一些实验方式我们可以看到除了 Courser 还有一些开源项目的话一般的话就比如第一个有全文重写第二个是搜索替换一个代码片段还有 give 合并各种方式业界一般是这种几种方式会做一些结合来去实践的包括这里其实 Courser 的话它是
自己训练了一个 fast supply 的小模型我们自己也是我们也有自己训练这样的模型就专门对这种场景这样的话你就可以在前面让 AI 生成的时候你可以让它回来一个特定格式的一个代码这样的话整个 computer 包括 token 的消耗就少很多再通过这个小模型把它合并到合适的文件里面去
对那前面刚才提到这个眼镜口到这个阶段我就把它称为是 AIR 2 的阶段也就是 AI 辅助编程我们可以看到就是代码的补全还是在右边的对话它都在辅助你然后就是辅助你生成代码然后你再按一键就合并进去这阶段都是在辅助你
这是我观察到去年的上半年的时候对到了这个阶段然后再往下一个阶段呢就是 L3 的一个 AI 的一个结对编程阶段 OK 了解你刚才讲了一点就是我才发现说为什么我们写的
比如说我们在 TrackGPT 里面在 Sonnet 里面我们生成的代码质量不如你们在 IDE 里面生成的代码质量我才发现因为你刚才有讲说你们内部是怎么拼那个 Prompt 对吧其实这个里面很多信息我们是并没有带给 Sonnet
对吧比如说你刚才讲说我打开过哪些文件我现在在哪一行对吧我的光标在哪个位置其实就相当于说我现在告诉你说我的位置在哪里然后我的那个 function 我的那个函数是什么我全部都告诉你了我再告诉你说
对吧就你的前置的足够长对吧但是我们自己一般去写的时候我们就说我现在想实现一个什么什么什么的函数对吧就结束了那它的效果可能就跟你的就有很大的区别对我觉得这个还是一个挺我觉得你讲出了一个很细节的东西对就是你真正在做的时候才知道因为我们自己老想着说这个好像 prompt 你随便写一写好像大家生出来的效果都差不多对但是我仔细一想好像跟你们就这种的生成效果还是有区别很大的对
要不然继续跟我们分享一下 L3L3 的话这个的话有个词叫 agentive flow
其实 agent 这个词这其实最近也都说了 2025 年是一个 agent 的元年其实在去年中包括到下年的时候其实出现几个产品像 Courser 最早出了 composer 然后 Winster 还有我们的 Trail Builder 然后其实就在这个领域就竞争了我就把它称为一个 agent 怎么说理解这个东西就是说前面的代码生成我们看看都是一问一答的单轮的
你问一下他回给你然后你虽然是那个 fastprime 但是你要手动就他可能回这几个文件要改你就一个一个点 apply 他就帮你合过去也就是你人工要去确认这个事情我们回过来讲就是说我能不能跟他说一个事情就说一个大一点的事情他帮我拆成了 proposal 就是做一个需求分析然后再根据这个需求后再拆解一个叫 plan 就是执行计划
然后再根据这个计划一个一个的去生成代码去执行去生成生成代码之后比如说前端了前端我生成 Package.json 依赖后它能不能再帮我进一步去执行一个指令比如说 NPM install 去安装依赖装完之后能不能再帮我去启动一个本地服务 NPM run dv 对吧启动完服务后你能不能再帮我把浏览器给打开这个页面
是吧那打开之后我在这里操作操作的时候浏览器或者刚才前面说 npm install run 的时候有报错的时候这个错误信息它能不能自动帮我分析然后帮我修复
整个这个听起来其实是很智能很让人兴奋的对这个就是目前觉得他是一个 L3 阶段也就你就会觉得他像一个实习生在你旁边跟你结对编程你只要跟他说你做这个事情然后他就拆解中间的有一些要做的事情他很啪啪啪他自己做一些事情但中间有一些点会让你来确认比如说你要不要执行这个指令然后比如说你看那个效果咋样对
这个是我认为一个结对编程然后这里的话其实也会很多人会提到一个产品叫 DeepinDeepin 的话我会认为它瞄准的方向是 L4 的编段也就在下一个阶段就是说 AI 的一个主动或者驱动编程的一个阶段这两个阶段有什么区别呢
我们先说它有共性点的就是 L3 L4 它共性点比起前面 L2 的话你会发现 AI 多了几个能力第一个它有了思考的能力跟调度的能力就是你给它一句话它可以去拆解前阵子比较熟悉的 R1Deep-seed R1 对吧它可以去思考对然后同时在 ID 这里面的话它还有了两个能力第一个是上下文环境的感知能力工具的调用能力
也就是说他能感知到他自己所属的这个环境比如这个编程环境这些代码的上下文环境然后根据接收到的你给他的目标进行一个思考跟拆解子任务同时他可以调用我刚才说的各种工具去帮他实现这个任务这个是他们两个阶段的一个共性那不同的点在于是说 AI 的自主性程度
像我们的 Tributor 或者 Composer 这些的话我们是会把 AI 视为说我经常会这么形容 AI 目前是一个高潜的实习生
他足够聪明但还不够成熟他对各种比如说这个公司里面很多那种相关东西还不是很熟悉所以这个阶段只能说我跟他一起去绝对编程这样更具备一个可控性也不会打破程序员以前的工作理论就这种方式去的可以把我们的效率给提上来
Deep in 的话它更像是试图一步到位这个 AI 目前已经是一个三年以上的社招超级我给他安排任务后别管我我安排给你任务你就回去自己做最后你给我提交一天后来多久你给我提交个任务回来听起来很性感但是当下不管从工程还是 AI 的能力上还不足够去支撑他独立完成这个任务所以这个只能说未来可期对
对我记得当时 DevIn 我去调研的时候我还说那个调侃也就很好玩的就是说因为那他是 500 刀嘛我调研完后我就把它取消续费了我跟别人说他我感觉这个家伙做事又慢效果不太好
500 刀的月薪不太值得了就感觉感觉好像解雇了一个未来可期但现在还不太合适的大厂员工因为这个钱可以去雇 25 个费啦或者 windshop 这些小员工嘛是但是没关系啊这个解雇的人你随时可以把他抓回来对吧等他能力强了你就再把他雇回来对然后我当时一个冷汗老板看我们平时摸鱼是不是这种感觉
所以总结一下以上我刚才提到 A1 到 A2、A3、A4 的话就是我目前对 AI coding 这个接待了一个理解然后现在整个业界包括我们正在往 A2、A3 这个 AI 绝对编程的一个方向正在走向深水区
这也是觉得比较心愿一个点因为现在在这个大增知识然后能跟这么多聪明的同行者去竞争身处其中其实挺兴奋的
我想提问一个因为你刚刚提到 David 这个案例它实际上是不是体现了程序员还是在一个心理接受的过程中我希望对于代码或者工程化的流程还是有一定的掌控力的会有这样的心理的过渡的一个时段吗
对这个的点主要是在于是说我会觉得一个是 AI 本身能力还不具备包括工厂上的能力还不具备还有我们的程序员本身对他的一个心智认知以及
日常工作的工作流上这些东西都需要时间对你像现在我们好像把这个东西 composer 这种东西把我们这个东西聊的好像特别的兴奋什么东西但按我在社区的一些沟通的话很多程序员甚至连 copy 都只听过没用过这个是一个非常大的一个割裂对认知是很大的割裂的我是觉得像那个五花肉问的这个问题因为能力和
信任是匹配的对我个人来说我不存在说我希望有掌控度纯粹是因为他能力不到我必须去掌控对吧如果他能力足够好他出的东西总是没错或者说他稍微有点问题我让他纠正一下他能够纠正那我其实不需要掌控他但是就是因为他能力不到所以我不信任他我就必须去掌控他何况我有这个能力去掌控他对吧那你可能说我作为一个 PD 我没有能力掌控他那我没办法我只能指望他我就一直跟他说话一直跟他说话说你一定要给我搞好
对吧我就迫使他但是我有这个能力去掌控我肯定会去掌控所以这就又回到说其实像刚刚这个天猪提到 L1 到 L4 我理解现在在我这个程序员的角度对吧我一直在写代码的角度我现在能信任的就是 L2 它就让我在一个舒适的区域里面在我可以掌控它又不出错的或者说它有一点问题我立马可以校正的一个阶段对我来说是比较舒适的那 L3 它现在能做一些事情但是我总会
不信任他就更和他 L4 了所以我觉得这个东西的过程就是你得能力到哪了大家才会信任到哪然后才会有更多人去使用是这个样子刚好再问一下天珠啊你刚才有讲说 L3 嘛包括 Composer 包括 Trade BuilderL4 包括 Devin 你能不能给大家一个任务达成率
就是比如说我在 composer 或者在 trade builder 里边我一般写一个 prompt 的话它的任务达成率能有多少就跟有点像比如说之前不是大家都在 LMS 里边去爬榜吗比如说 GDP4O 它能 100 分的题目它能达成多少分我不知道你们自己内部有没有这样的一个评估
这块其实业界也有一些像 SweetBench 这种的案例然后知洁我们也有自己的一个测评团队也在去结合因为知洁本身也这么大一个工程就是整个大知洁这么多个实践所以他们会从这里面去抽出一些案例来做这些的 test cage 对
会有这块的因为现在这个阶段老实说我们自己体感就我们的 side project 包括我们看推特上有很多这种东西其实这些东西其实是能满足的但在公司里面这种大项目比如说特别是很多 mono nipple 这种目前在上下文这块还需要有一段的时间但我对这个东西会比较乐观因为今年像 DipC 和 Kimi 刚出了 Loncomtet 这种论文
我觉得我持乐观的态度但现在还是在一个引进的过程我突然想到我们刚刚聊的都是非常专业或者资深的开发者去判定的一种协作模式其实我们也看到比如说豆包也好统一也好它其实有一个在里面嵌入的一个编码模式这个
这个是在哪个位置呢然后我们认为它的受众和它解决的问题会是什么呢这个的话也是挺有意思的一个点就是说花咒提的这个要讲也是一场仗就是所以我们现在大家感受比较多的这类产品 Bot.new
然后 forza 的 v0 然后最近还出了一个叫 lovable 对 lovable 然后还有几个产品我觉得跟你这个也是一个方向比如说我们最早是 cloudcloud 的应用里面有一个叫 artified 对对对然后 hbt 后面学了他做了 canvas 对然后豆包也有类似我们豆包的 PC 也有类似的 artified 这个东西这个的话它的演建过程
我是这么观察到的其实最早的话其实在 challengebt 里面也是一样我们去问他的代码或者是以前我记得他主推一个场景就是你上传一个 ecl 给他然后让他帮你分析他就会自动生成一段 python 代码然后去执行那个叫 core interpreter 对吧他来主动生成再执行这个是最早的 core interpreter 然后呢到了
也就是 cloud 出了 artify 产品就是你在这边生成代码你可能生成好几个我这个代码能不能在交互上我点的时候在右边整个给我去看对吧比如说是好几个文件那就是用一个简单的 ID 在右边能看到有目录数什么的再进一步这代码都在这里而且你是前端的我能不能运行起来
我点一下运行我就可以 preview 了那就能看到这个东西对吧然后再往后就是我们就看到像波点 6 像 v0 这些其实我认为是往这边去引进的波点 6 跟 v0 里面它加了什么其实就加了我们前面说的 L3 阶段的 agent
有的把这个的过程给加进去了而不是像前面的只是一轮的绘画那这两个的话其实是刚好是两个形态我理解他们的中态都是往竹木兰瓦峰去探灯但是一个在南坡起步一个在北坡起步比如说像刚才说我们的 TRADE 这些的话它是从 native id 本地 id 从专业上去往那边叫我叫 autopilot
的方式去演进而像我们的 Masko CloudID 还有像波点 6 这种其实从 CloudID 这个方向或者甚至更低一点的缺波的方向往中间的方向演进这两个方向我会认为它最终其实是从一个目标去演进的只是大家的出发点包括侧重点不太一样当然场景上也会有一些区别就波点 6 的话我观察到其实用的最多是产品经理
对去年的话圈子里面很多产品经理用了这个产品然后呢一倍好玩的点就是说有一个跟我吐槽他的原话是什么呢说 4.new 这种做原型 demo 的时候其实我跟他说就好了那我作为产品经理我本来去表达这个需求我跟人家去描述这个事情就是我擅长的领域
我跟 AI 说跟我以前跟程序员说没什么区别吧然后这个 AI 还听话不给我对吧随时在线然后不用排期不用求他们所以很多产品经理是会很喜欢这个东西对所以他目前来说他的一个受众上是稍微有一点不一样的区别但我会觉得长期的话可能大家其实还是
目标可能是一致只是说用户的一个切入点不太一样了解对我觉得天猪的这个分享特别好我就想起来说 Bot.new 的这种产品还有 Loveable 他们其实就有点像颠覆了最早以前的那种 Wix 那种拖拉拽的在线可视化编辑只不过他们把它变成了 React 的一个 component
对吧然后我甚至直接生成代码的然后我的限制还更小然后我可以用 AI 去控制布局啊等等之类的然后全部都可以控制我觉得他们如果真的做得好的话是可以颠覆之前的那些产品的而且我直接描述就行了我不需要像以前我还要拖拉拽还要控制这个控制那个还要想一下它这个 layout 怎么排对吧还有什么手机版还有那个什么什么 PC 版怎么弄以前做这个东西可烦了对其实
很多大厂内部有很多做了类似这样的产品的反正大家做完之后自我感觉都挺好的但是让别人用起来都挺难用的对但现在你刚才讲说 Bought a new 的这种产品对吧产品经理用了之后就觉得好可能就打动他们透年了对吧对就去掉了中间的那些环节嘛对吧其实从需求到最终的结果
这也算什么这也算第一性原理是不是我为什么要这些我只要这个东西就好了对你说这个我忽然想到一个别的东西就是也是相似的因为你像 AI 的话除了我们老在用大模型对吧 ARM 的大模型但是那种视频生成之类的其实有一种使用场景就是你把它作为现实模拟器就比如说做游戏对吧以前的游戏它是要有一个阴晴在中间的你是
通过这个阴镜来输出画面但是理论上来说如果你的视频模型做的足够好你完全可以直接用提示词来输出画面然后再用这个画面实时去跟用户交互然后用户又用他的反应来实时输出画面其实你中间是没有这个游戏阴镜的
就是它模型本身就是承载了所有的事情有点类似于这个事情它其实中间的这些东西都被省略掉了但是你本来要的其实就是这么个东西你的阴景你的游戏阴景本来是为了达成这个目的的一个中间产物它不是一定需要的对对对是
好的那我们接着往下聊我们好像扯得有点远了 L1 都扯到 L4 了对然后我们再反过头来再聊一下我们的这个实现吧 Cursor 的 Change Log 我还特意翻了一下我发现 Cursor 最早的版本它竟然是用 Code Mirror 做的
因为它是一个挺简单的一个这种 JS 的一个前台的一个编辑器就是它不是像 VS Code 这种就是所有功能都带的有丰富插件体系然后有各种各样的 language 编程员它是专门为编程服务的然后后来我看他们的版本里面到大概 0.2.0 的时候就转到 VS Code 上了我们现在的这些产品
我们包括 Tree 包括 Windsurf 然后包括 Cursor 其实大家现在都是去 VS Code 做的嘛但是一开始的时候除了 Cursor 之外其实大家都是在 VS Code 的插件的地方做的大家都是去做插件包括 GitHub Copilot 对吧包括 Windsurf 的那个 Codium 其实大家都是以前的插件对我就想问一下说因为现在大家都在转自己去包 App 嘛我想问一下就以前的这种插件形式会对于大家去实现一些功能会有什么硬限制吗
这块那个插件毕竟它是在威斯库尔这个体系里面的你很多能力你是没办法去调用的那这里会有两个点第一个是说威斯库尔它作为一个基建它总需要考虑一些共性的能力而我们前面也聊到了这个领域其实每个月都有颠覆性的一些认知的刷新那你受它这个限制的时候你自然会你创新的敏捷性会受到限制
同时的话那这个能力其实它的一个掌控权是在威斯科那威斯科对 AI coding 这个领域的理解
其实也会去限制这个事情对吧因为 Cobital 虽然是先发者我们看到它现在企业落后很多所以其实是这个问题的点就在于说第一个 OSCore 插件本身的限制是比较严重的我们有很多想在 AI coding 上的一些交互包括想做一些能力你是没办法做到所以大家比如说包括 Cosr 包括我们 Trade
都是去 fog 一个这样的一个 VSCO 但是这个其实 fog 老实说它门槛也不低就是你去 fog 它后你能把它做好国外也就那两家然后国内也就我们 Trey 在做这块的事情了对刚好提到这个 Trey 因为 Trey 其实一打开
Tray 的界面是明显区别于 Cursor 跟 WindServe 的 Cursor 跟 WindServe 一打开我就感觉它就是 VSCode 但是 Tray 一打开就感觉界面很美观因为我自己知道是 VSCode 其实对于界面定制限制是比较严的它不像其他的编辑器然后大家会想说你可以定制我的 UI 对吧但是 VSCode UI 定制层面上面限制是比较重的你们自己就是相当于说在 UI 这个层面上面我相信你们应该魔改了不少东西吧
UI 这个确实就这个要夸一下我们的设计师挺用心的因为那个在发布之后包括我们去年 Masko 发布包括今年的去年发布后有很多前端圈子里的朋友包括他们都可能搞过 VS Code
跑过来问你们是基因什么做的我跟他说威斯科做的呀吓到了对对第一个我觉得这个东西就是因为我们设计师在这挺用心的因为而且这个过程中我们研发也非常深度的参与这个事情毕竟我们也是职称的研发嘛而且研发也都是研制狗自己的狗狗还是要是好一点的嗯回到那个问题吧就机构架构上的话其实这里确实我们
做了非常多的一个深度定制比如说包括前端很多组件把它给 Read 化了
就比如说我们右边的那个 builder 跟 changer 我们是一个 regitor 再画更好的去能去开发效率包括一些事情会更好然后 server 那层的话我们很多也因为 ID 分两层一个是 UI 层一个是那个 ID 的 server 那层 server 层一般是用 notes 去写的那我们这层其实基本上都 rush 化掉了我们用 rush 去写因为 rush 的话它可以在一些
性能内存占用包括一些安全方面各方面其实都是不错的所以可以看到我们在这一层是做了非常多深度的定制的
还有的话就是一些跨平台大家也知道我们去年先搞了是 CloudID 而 Westcore 这个架构其实它本来一开始出来是面对一个本地 ID 的所以这个当时做了很多事情就是本地 ID 可能在很好的浏览器云端的侧很多事情它是没考虑到的我们可以看到像 DHCOSBASE 和 Google 的 IDX
CostPage 的话我自己测一般的话启动一个要 30 多秒 IDX 可能要分钟几我们去年整个优化下来最后我们能做到 2~5 秒这样子
对那这里的一些优化点就会是让你的前端组件的加载时序包括刚才说的 RAS 这些组件你要做一些分离性能启动方面的东西还有就是在运工作业容器这一层就要去基于 K80 很深度定制所以我刚才前面也提到就是说都可以 Fog 但是 Fog 你要真把它做好这块的一个门槛其实真不低因为其实这些动作
我们去 fork VS Code 的别的动作最终还是要让开发者能够感知到我可能比如说像你提到的我在后端去把它改成 Rust 之后安全性上的提升可能开发者感知不到性能上的提升他可能感知得到
但还有一些动作比如说我对 UI 的整合和修改其实都是有成本的但是我们最终是需要让开发者感受到比如说 Cursor 最早为什么没有做成插件他们其实自己有解释过因为他想做的连续 Tab 在插件体系下做不到所以他就只能去改
比如说像 tree 我这两天也在用了它确实很好看但是连续 tab 是我用客人特别喜欢的东西但是 tree 里面我不知道是不是我姿势不对它只能 tab 一下它不能连续 tab 我就有点难受对这个就是刚才前面说的 tab tab 就是 super tab 这个能力我们应该下个版本就上了因为这里的话其实里面的一些性能各方面还是需要优化那块老实说做好也是挺难的
对我是觉得因为你去改 Fork 这个 VS Code 之后你也不是说我就改这一次的成本因为你要持续去 follow 他的 update 你要一直去 merge 你改的越多你每次 merge 你的成本就越高所以它其实是一个长期投入
对这里还有个点就是说怎么去跟版这也是一个挑战点然后我们这边其实也做了一些事情了让他跟版的速度会更快就做了一些自动化的一些东西甚至最近一次合版的话我们做了一个找了一个工具然后就合完后然后直接让我们的 trade 自己就给我们去合并
可以,太棒了我是一个属于颜值狗啊就是如果这个连续 tab 有了之后我应该可能就会转头 trade 毁吧毕竟 VS Code 我实在是有点看腻了包括像这两天那个 wrap 就是那个 terminal 它终于修了一个三年前的 bug 中文输入法下它没办法换出它那个 hotkey 的 window
这个 bug 三年多了一直没修它修完了我马上就换过去了因为它比 atom 要好看对这也是挺好玩的去年曾经有一段时间 AI terminal 这个概念比较火
很多 ID 也会做这个能力然后但是现在站在今天这个时间点回过去看的话其实它不就是一个 agent 吗自然语言对话对话完后然后它给你生成一条指令点面型只是说流程是一样的但是 UI 稍微改变一下我现在我之前也用然后最近我基本上都在 ID 里面就直接用 builder 去搞就完了
OK 我想问一下因为 Trey 的发布是在春节前应该春节前一两周我记得没错的话就大概是这个时间点然后 Cursor 其实最早版本很早了然后 Cursor 爆火的那个阶段是在去年的 10 月份左右的那个时间点对 可能比你们早发布大概三个月左右对 我不确定说 Cursor 后续的成功对你们发布 Trey 是有直接影响的还是说其实是你们早就已经准备好做了早就准备好发了 对
我们最早其实我最早切入这个领域其实在 23 年底就是我们当时 23 年 11 月份的时候去切入这个领域了其实当时我们已经在就在 YYM 未来的这种云端议题包括 CloudID 啊 NativeID 这块的事情但这里的话其实还是会知道你的路径你不同的路径你出发做的事情其实是有快慢的
对确实我这里那个 Courser 我们不得不佩服这些他们有些巧思包括他们有多能力的迭代其实坏很多我们也是在一个快速追赶的过程
对所以说它那个发布对我们有没有影响呢这个不能说没有影响但是很多事情并没有说超出我们的认知就很多事情其实是有在我们的 totally 上可能这个出来后就稍微我们会调整那优先级但我们其实也是有自己的一个认知跟节奏的
OK 了解那我想问一下你像 Cursor 它发布了过后然后就突然就一下子就 ARR 就暴涨就一下子赚了好多好多钱对他们的这个营收对你们自己去打这个所谓的个人市场有没有一些在市场策略或者在别的方面的一些影响因为你以前可能 Mars Code 想打个人市场但是从我自己的观察上面来讲的话我自己觉得好像没有太多人用但是 Tree 发布过后反倒我身边很多人尝试了
嗯嗯就我觉得这个对于你们就是自己去做个人市场去发布 trade 这样的一个有端册的 ID 嗯就有没有什么影响对
我觉得为什么却用这么多一方面的话是我们的能力各方面比如说 Ager 这些能力上其实是产品能力上得到大家认可另一方面的话还是回到靠 IT 和 NetEye 这个形态上你会发现大家在日常工作就是自己的项目这种的话其实虽然说现在用大模型也有一些大家可能担心和国家各方面的问题但我们自己觉得代码其实不是很直接
但你用一个本地的这种 ID 因此 Cost 啊 Copilot 大家都要用那个 Totomo 用啊都没啥问题但是你如果用像 Masko 这种 Cloud ID 的话你需要把公司的代码上云这个就会比较麻烦包括你怎么跟你内网一些服务去打通这个是可能当时在 Masko 上会遇到的一些挑战点
对那现在 Trade 的话它作为一个本地的时候其实它这些很多问题就解决掉了当然它也会遇到一些没有靠情况下的一些问题我们在这块也是说云端一体这块我们其实是有这块的一些布局跟思考对后面也会陆续给放出来给大家嗯
你提到这个点对 2B 还挺重要的我觉得我好像前两天才看到新闻是某大厂反正就是因为员工把代码传到这个大模型里面被处罚了的有这种事这个的话呢其实前段时间也是跟业界同学聊有一个观点我觉得挺有趣的就是说以前你要做这种 2B 市场其实有一些限制第一个是你这个东西能在它的内容事务化部署
像 NetEID 这种就不存在失望部署问题还有一个是模型模型其实今年春节后的一个整个眼见其实我觉得这个问题一定程度上是解决掉了为什么因为 Deep-sea 已经变成了一个我觉得是新时代的 K8S 也就像以前我们一些文服务很多情况我们默认这个公司就有私有化的 K8S 这种的服务在那里
那我把这个产品售卖给你的时候只要接住你的东西就好那现在一样那你就需要学化部署你 ID 拿过去然后你把你的 API 接到你内网的 Deep-C 什么就 OK 了因为现在 Deep-C 现在已经变成了一个我觉得算是 AI 时代的 K8S 了只要在国内对我们继续再聊回发布这件事因为 Tree 的发布
我觉得就是很不像一个国产产品我觉得你们打的就很独立开发者或者打的现在很现代你们是在 PredaHunt 上面发布的你们自己作为 Cursor 跟 Winsurf 的一个追赶者因为毕竟是他们两个先发布你们第三个发布然后我觉得你们市场策略有一招还挺绝的就是你们直接免费了 Sonic
然后你可以直接免费去用对吧虽然可能有一些软限制对吧但是其实整体的限制还不是那么多对我就想问一下你们自己在内部在发布的时候是怎么确定这个市场策略的除了这个市场策略啊还想替大家问一下因为现在可能很多人在用嘛你们能免费多久我相信这个用户会比较关心对
这个让我们的开发者关心同学花肉目前我只是一个金属宅
对刚刚是两个问题吗为什么我们的发布是采取了一个比较不一样的一个在 product hunt 发的一个模式吧在海外发布的时候我们采取了一个比较 international 的模式吗或者说我们其实去打榜的还有我们的一个加拿大的用户一个个人的创业者
他就用 Tree 已经实现了营收去做的这个产品的打保类似这样的方式也是跟国际的用户一起去做的这样的一个发布的打保行为吧这可能是最开始我们采取的是海外发布的策略决定的会是一样这样的一个不同于 Double Mask Code 在去年 6 月份 6 月份做国内一个
露营风格的发布会一样这可能也跟我们的整体的团队的风格有关我们还是一直强调的和自己主强调的那个风格也比较像是激发创造所以我们也希望用一些创造性的发布的方式来传递我们整个团队的感觉包括我们也相信
在 AI coding 持续探索的这个方向上我们去年的 Mars Code 现在推出的 Tree 包括接下来可能也会有各种服务于开发者或者服务于各种人的开发需求的场景的产品就是也希望是传递这种精神贯穿我们始终的这样的无论是运营动作还是产品还是技术这个方面所以先解释一下第一个问题
然后第二个我们最近有一些用户就在说哇用的好好啊就是想付钱就是付钱我觉得他他是什么什么之类的对但目前我们还没有推出明确的付费计划所以大家先放心的用好了对
但是我们要承认吧就是这个事情你得赚钱才能持续对吧你如果不从这个地方直观的赚到钱他总得有个办法能变现不可能毫无代价现在大家都比我们更操心这个问题对因为现在从这几年整个国内我们也知不知道付费这块的意愿度包括东西上其实提升很多作为一个开发者我觉得
为我吃饭的家伙去付费很值得这个投资是很值得的我自己也付费很多产品其实 Trey 去赚到 10 亿人民币左右的这个年度营收我觉得是没有问题的因为现在 Cursor 都已经做到了 1 亿美金的营收就 7 亿对吧你说 Trey 做到 10 亿其实是没问题的但是如果你真的要做到 10 亿的话
我们就想跟他一起去聊一下这个问题你本身免费这件事它不会是一个长久的一个卖点因为免费这个事我不太觉得免费是一个产品的永久的竞争力它可能是一段时间的竞争力不会是永久竞争力对 我就想问一下我感觉现在像 Cursor 像 Windsurf 像 Trey 大家的基本功能级还是相对趋同的
对没有说有谁有一个很杀手级的应用比如说刚才贵贵讲的那个 cursor 的 tab tab 对吧这个相对而言现在是比较顺手的但是你说 tree 能不能做对吧这个肯定也能做对但是我不确定说你们自己在去现在 tree 的后续版本里面有没有什么区别于 cursorwindsurf 或者说你们自己的独特的卖点这个能不能给大家分享一下就你们的未来的路线图上嗯
我们第一个版本发布之后用户对我们正面反馈里面比较多的就是比如说包括 UI 颜值然后我们的 preview 面板这个也是比较多海外用户在夸一个点就是像 Costar 这些做完之后你的页面是要在留言区去跑的但是我们的就考虑到就是你像 Builder 这种场景
很多情况就是你就是跟他对话生成的时候你就要去看这个效果这里的话呢到我会理解一个点就是说 AI 时代他生成了代码我们以前有个词叫采纳率就什么时候你会接受这个东西呢关键的点在于是作为一个开发者我能不能低成本的去
review AI 生成这个东西就我能不能信任它一个是我信任它一个是它生成了我能不能去更低层面的 review 这里的话如果是后端代码可能是生成一个单侧去跑 OK 的前端代码靠什么很大情况就靠预览所以说从这种情况下我们会把 preview 把它变成在一个很显眼的位置
甚至我自己去实践的时候我去用的时候我写很多比如说去尝尝蚕吃蛇啦或者是酱本的时候
我甚至把左边的 file 和代码我都隐藏掉了也就是我右边是我们的 builder 的对话框左边就是 review 我全程没有看一行代码我没有写一行代码我这边让他生成他就生成了然后生成了自动我能预览预览了中间有问题我截图发给他这里有个问题我画个箭头告诉他这里有问题你帮我改
我全程一行代码没改一行没看然后能顺顺上做很多东西这个东西对但是对我的刺激其实蛮大的对所以这第二个我们 preview 也是我们的一个亮点那 builder 的话呢也就是对标经典的话其实我们的相关能力我现在看一些用戏用的话其实对我们的一个那个真没反馈还是蛮多的对然后那个你刚才提到其实说大家去趋同这个我怎么看待呢其实我就分两点
第一个的话呢目前这个领域我认为它是一个还是比较早期的一个阶段
就是说这个认知一直在颠覆这个过程中那就看谁的耐力包括你可能面对的你的用户群因为大家可能用户群有可能不一样比如说国内的国外的大家用户群包括一些场景是不一样的在没有跨越一个鸿沟就是这个领域没到跨越鸿沟之前你对这些产品的认知包括你的跟进程度上其实是有很多不同的点的
当然我觉得这个领域没有太多秘密这是一个充分认识的市场产品型但目前这个阶段不会拉开太大的差距在没有拉开太大的差距之前
同样的模式下你的生成效果你的生产效率用户的规模包括你的综合成本其实一定程度上是决定了你的竞争优势对但我觉得这个还是比较早期这个市场足够大也能容下不同的玩家嗯 ok 了解
好的那再回到 AI 的部分我自己也有调研了一下就是所谓 AI 补全的这个层面当然你前面介绍了很多我自己有一个问题就是我发现就大部分的这种 AI 的产品它自己都会区分说我是单行补全还是多行补全单行补全一般是不限制的
对吧多行补权可能包含 chat 它可能就会有限制对就这个是不是意味着说其实他们单行补权跟多行补权的这个背后的模型是不一样的我就关注到说其实 Cursor 在前一段时间它把那个我们之前有介绍过那个 Super Maven 然后给收购了然后 Super Maven 实际上它是就是从这种单行补权起家的就它可能单行补权做得挺好的对它这个收购对它来讲是不是说能够补权它以前单行补权的那种短板还是怎么样这个能不能给我们分享一下对
supermaven 其实他作者之前就是 Tablet Night 的作者哦 OK 对收购这个事情的话我当时去跟一些朋友聊当时他们收购的一个点可能是其实是看中了 supermaven 的上下文这个能
OK 更多是补全对然后你刚才回到前面那个问题就是说单行补全跟多行的话其实前面我们有聊过这里的话其实模型的训练的数据包括它接收到一些东西是不一样的如果单行补全更多是我可能我最近打开那几个文件我在哪一行和多行有时候就是需要这用户最近的一些操作行为也要纳到这个考虑里面去才能去做然后这里训练上的语料各方面其实是会有些不同
OK 了解对那我们聊一聊这个就是跨行补全这个事现在大家都在 Cloud 的 Sonic 3.5 但是现在 3.7 出来了估计马上大家就跟进了对如果大家的模型相同的情况下那对于就是大家生成的这个结果层面上面如果大家是有差异的比如说举个例子假如说 Cursor 的当前的采纳度是更高的一个那是不是说其实是它的 prompt 写的比较好
因为我已经固定了变量了嘛比如说我的变量之前就是我的模型是一个变量然后那如果模型固定的情况下那肯定就 prompt 对吧那这个里边的话能不能给大家分享一下就是是不是说如果说我现在去做一个 AID 的话除了你刚才讲的那些补全啊等等那些就是包括 VS Code 的改造等等这些东西其实最核心的能力现在大家比较看重的就是说是不是说谁能构建出一个更好的上下文
对吧就是我的 LM 的这个更好的一个 context 更好的一个上下文因为上下文是有限的嘛在有限的情况下面我可能需要把我当前的这段代码所相关联的所有代码全部都找得着然后可能要去做 reg 搜索等等一系列的然后把相关的那些内容都放到这个 context 里面来是不是这个里面会是大家现在区别于生成的采纳度的一个最大的一个原因嗯
对这里的话其实目前你说这个效果好不好一方面取决于那个模型本身的一个能力这个 promote 大家可能要看是广义还是狭义的就是如果是广义上其实就是这个上下网你怎么拼成出来对吧那这里确实是
你怎么样把合适的一个上下文然后以最合适的大小然后合适的性能速度把它给拼出来然后给到他这个确实是目前各家做的效果有差距的一个点子
这块模型也在卷这块的能力 OK 了解就不管是说从 AST 还好还是从代码搜索也好反正这个里面去构建它的话我自己想想还是蛮复杂的它可能会决定说我到底这个就采达度等等之类的它可能如果你做得好的话可能采达度会提升好几个百分点都有可能对这里就是目前当前这个阶段核心可能竞争的一个地方
OK 了解真正提到最关键的核心点可能还是有一些黑科技在里面的对吧对就是可能比较复杂的事情在你看似简单的交互界面下面对吧可能有很多很复杂的事情在做对我想问一下就是现在大家的这个付费模型比如说像 Cursor 像 WindServe 然后大家的这个付费模型上面大家都是按次交互的比如说好像 Cursor 是 500 次对
对吧然后 Winsurf 它是 10 到大概可能是 300 次吧对吧我现在具体的次数忘记了对反正大家都按交互次数去用的虽然说大家是按交互次数但是交互次数每一次交互次数的时候到底用多少 Token 这个的就是天差地别了对吧那假如说我作为 Trey 也好作为 Winsurf 也好我能够让大家达成目标的情况下用的 Token 越少我省下来的钱就是我赚的钱嘛
对吧那假如每次其实都是超标的然后我跟别人在成本上面没法比然后结果上面没法比那我其实最终就落后了嘛我不确定说现在像 Trey 的话你们是怎么平衡这个成本跟质量的因为你刚才也在讲说当我把那个 prompt 写得越细的时候它的结果可能会越好嘛对吧我塞越多内容的时候它可能效果会越好对我不确定说你们当前成本跟质量是怎么样的一个关系还是说其实你们当前就是质量优先
只要我能做得更好我完全不关心成本这个其实就是我们需要探索的点因为昨天刚好在社区也看到有人提了个点就是 AI 的不可能三角就是在智能的程度你的成本跟你的延迟三者之间你需要去权衡的
这里其实真的是有非常多的一个工程问题去攻克也是放在一个固成核比如说前面也有提到了就是发 supply 那个地方到底是让模型回来一个完整的文件你整个 pnt 换还是让它回来其中一部分再去通过一个小模型的方式去合并
然后包括你他现在不是会规划去思考吗这里是用多个模型比如说你思考可能是用 IE 还是用 cloud 还是用什么这里有多个模型的混合这个地方有很多东西去做的然后加上你的 compare 怎么更好的裁切你的 promote 能不能做缓存各方面这个地方其实是有很多工程的点上需要去一直在持续去打磨的
对那我再替我们的用户再问一下因为我们刚才有讲说你们自己在内部其实会去构造一个 prompt 然后在那个 prompt 里面其实你们会去说我在某一行某一个点上怎么怎么样但是除了你们系统的 prompt 之外其实用户还会输入一段内容吗对你们能不能给大家分享一下就是在用 Tree 类似这样的产品的时候用户去输入什么样的内容对于它的生成结果来讲会有帮助的
OK 这块的话我就分几个点第一个我觉得就是说作为 ID 的开发者来说我们肯定希望用户不要去管这些 DE 相关的事情它更多是很直白的话来跟我们 AI 来说 AI 自动会记住它的项目的一个情况包括记忆的一个情况
所以大家当下这里说其实还是还有一些需要眼见的一个点了我们这边也是像 global 路这些能力也在逐步开放给大家也就是说在我们还没有完全完善之前给大家一些口可以来做这个事情
从我自己的一个认知来看的话其实我觉得这里你想把这个质量感触更高的话更多的情况下是应该我们要学会怎么跟这个实习生去
交流一个是管理自己的期望值就是他就是一个实习生你不要希望他能完全去独立做事很多情况你要带着他那在这个过程中呢其实也是在锻炼我们自己的表达能力你怎么能把一个事情给他讲清楚然后让他在他的能力范围之内来去做那有一些实在是超出他能力范围的这种我们自己来接手就好我觉得是一个管理自己的期望值
我记得我当时去体验我们这些产品的时候我当时跟我的同学这么说一段时间我第一次用的时候我一开始我有点挫折感但我的挫折感不在于是我觉得它不行而是更多是觉得我自己的能力不足从而没法很好的跟他描述描述清楚这个问题我不觉得它不行而是觉得我跟他之间的交流上存在一些 gap
这里的话就会有一些点第一个是我们人的表达能力上我们可能会有一些更好的表达像比如说刚才前面说产品经理他这个东西很会另一个点是工程上我能不能给到一些手段让用户更好去表达比如说现在 AD 或者我们的景演一个文件这种一种是把 computer 给到他然后 terminal 里面日志也能给到他还有一种是现在其实如果做前端我觉得很好一个点
就是你觉得有问题直接截图然后告诉他这里有问题他往往能帮你可能搞定现在的模型的多么太能力已经到了一个阶段对所以就是这样子 OK 了解那能不能跟我们分享一下未来的 TRADE 的一些规划就包括你们在产品层面上面可能未来有没有一些很大的一些功能点然后正在做的还有就是在市场层面上面你们的 OKR 里面有没有市占率要达到多少之类的嗯
目前其实我们也是在观察我们的用户用的东西包括我们自己在用这一面的话我觉得很大一点我们最近很多经历大部分是在一些把能力一个追击上就是一些相关大家很痛点这些能力你这并不是说竞品有就有因为我们会去看这个用户背后的原因是什么
然后我们会有自己一些可能不同的一个落地的方式跟时间对更远一点的话这些事情的话老实说有我们在突破一旦有很多但这个东西我感觉可能有点太早了然后这个东西太早了万一下个月整个那个东西又颠覆了然后就被打脸了对哈哈哈哈 ok 对对因为因为因为我们很敏捷的就很多东西其实是一个动态的过程中嗯
我们给自己定了一个非常激进的目标这可能也是那个自己的做事特别是我们团队的风格等达成的时候再跟大家分享一下
对我刚才那个前面补一点就是说我们现在其实很多看到的都是在研发这个链路上的因为我们我们研发出身的我们知道整个工程链路从需求然后到研码再到部署啊整个链路上其实很多事情做这也是在我们的一个突出力上会有这块的一个考虑哦 OK 因为刚刚五花肉讲到说这个人也卷 AI 也卷嘛我就想到说其实 AI 应该造福人类但是 AI 让人类更卷
懂我的意思吗就是有点可悲感觉明明有了 AI 大家应该过得更轻松结果因为有了 AI 大家就更卷了有些人的工作被 AI 所取代所以他要去想办法然后我们在 AI 上做事情因为大家都在做所以拼命地搞然后 AI 让大家效率更高结果 AI 让大家更忙我觉得有点可悲
我對這個東西持中立的態度就是說這個有點像當年汽車取代馬車馬車服務的一個想法對 會有時代這種變化會有一些人會被受傷到有可能是我們也有可能是別人但這個東西不好說有時候你看你身處的位置吧然後包括你的階段都有關但是這個趨勢我覺得是不可改變的
但其实我想说的不是说因为有些人因为 AI 的出现而被淘汰而是说我们大家的整个可能社会的状态上让所有人都更忙了因为卷这件事情我理解其实对所有人都没有好处它不是被淘汰不被淘汰的问题它只是让所有人都更忙了对
但我觉得不一定是这种他说是觉得但很多情况下我们现在 AI 这个能力让更多人以前他做不到的事情有些人是很有创意有什么东西的现在给到他这个能力以后那有可能会其实对他的价值更大是不是能感受感受到我们天珠是一个非常
还有理想主义色彩的一个研发他还是觉得有了更多的能力的加持之后他能够做出更有意思原来想象不到的一些产品然后包括他自己研发出身然后又在做一个服务原来的自己身份比如说研发这样的身份的一个产品他有这种兴奋感在所以他的痛苦可能会被削弱
对其实天柱我还想问你一点因为你们做了 Tree 做了 Maskold 这样的产品嘛普通的研发他们没有做他们只是用你这样的产品普通的研发他们的效率层面上面以前干一个活假如说要一个工作日一人日因为采用了你们这个产品他们自己在 OKR 层面上面他们需要把自己的那个时间点提成 0.5 吗
就为什么想提这个点是因为我发现我认识的很多程序员在 AI 时代其实他们都是 AI 时代的受益者他的受益体现在几个层面第一个层面他的工作更轻松了我讲的更轻松是指说他要写的那个代码他不需要写那么多行了然后其次
他还拥有同样的人日去做那样的事我发现有很多程序员在采用了比如说像 Cursor 像 Tree 这样的产品之后他说我以前预估这个工作量的时候我是三天我现在预估还是三天但其实我现在只要一个小时就写完了他可能就打酱油打很久对 我不确定说你们自己在做这样的产品之后在字节内部大家有没有因为采用你们这个产品
就是大家被动的在预估产品工时啊等等之类的时候会把它的效率提高因为我觉得我自己的体感上面或者说我的观察上面来讲很多大公司的员工其实不太会去把这个人质去减少反倒像我们这种独立开发者也好干嘛也好因为我们确实受益于这个事所以说导致我们其实以前可能要做一个周的功能可能我们现在做一两天就结束了对 其实我们可能是真正的受益者然后大厂员工也是受益者反倒大厂不是受益者
你能理解我的意思吗对我不确定你有没有观察过这个事几点吧第一个是说你他会不会因为这个在他 OKR 上去写他的时间少我好像很少会去看到 OKR 上会去写你我这个东西要多少人就去写这个事情
对然后对大厂来说我觉得也不是说他会受损什么的我觉得 AI coding 这个来后其实给我们带了一个东西就是说跨界的可能性举个例子就是像我们当时做了其中中间做了一个实验的新闻就 Builder 这个产品我们第一版也是用 NoJS 写的我的团队之前也是全站出生的然后第二版我们把它变成了云端的用 Go 写
第三版这一版是用 rush 写的但这个切换过程我们这同学其实之前是没有跨语言这种经验的但通过 AI 其实它可以帮助我们很快速去进入领域从这个点上其实我觉得是受益的
对 至于说的卷的话我觉得更多其实是在于一个层面它对某个目标的完成度上要求并不是说 AI 这个产品就带来因为本身工程效率的提升就是一个比较持续和统统的命题 AI 只是在这里面天端加瓦的
确实你刚才讲说这个整个的工程效率一般来讲我们做两个月的项目真正编码时间可能就两周吧对吧对现在会让程序员更多的点在于是你看像他说你的表达能力你的思考能力包括这个思考过程中你可以跟他去交互所以这其实我会更看好因为这个东西其实对每个程序员来说是一个会帮你去成长的一个工具
嗯 OK 了解好那感谢天珠跟五花肉的时间啊那最后给你们一分钟时间我们常规时间然后你们可以打打广告嗯好
刚刚在整个的讨论中我们聊了吃野荷豆包 Mask Code 然后如果大家有兴趣的话也可以在插件市场搜索豆包 Mask Code 我们的国内版的吃野上线了也可以去搜索下载使用当然我们团队也在吸纳广泛的有这个方向的爱好的同学来一起参与到产品的研发中请天珠来讲一下她想吸纳的伙伴吧
嗯 前面给你介绍很多这方面的领域啊其实我觉得这个领域它有非常多的一个深入的点然后所以我会希望说对这个方向感兴趣的人你现在身处在这个时代剧院的时代只有参与进去你才能更好的成就自己吧如果你想做这个来可以加入我我需要前端需要对 AI 感兴趣的同学
好的大家请把简历发到我们硬帝骇客的邮箱我们转发然后赚一下赚一下简历推荐费好可以对大家如果有什么用户反馈的话也可以通过硬帝骇客把反馈给到我们
好的好的好的那今天特别感谢天柱还有五花肉然后跟我们分享了一下 Trey 的很多内部细节的东西我今天学到很多包括 Prompt 怎么构建包括 Trey 内部改了什么东西对吧包括质量包括成本等等这些东西我确实今天受益匪浅对我希望说 Trey 在未来能够在你们疯狂的加班的努力下能够赶超 WindSurf 能够赶超 Cursor 对然后希望你们未来能够越做越好
好的那我们本期节目就先到这里吧大家再见拜拜拜拜