We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 42.和AIGCode创始人聊聊明星项目、首个端到端agent、和AI Coding的新战场

42.和AIGCode创始人聊聊明星项目、首个端到端agent、和AI Coding的新战场

2025/7/3
logo of podcast 卫诗婕|商业漫谈Jane's talk

卫诗婕|商业漫谈Jane's talk

AI Deep Dive AI Chapters Transcript
People
宿
宿文
Topics
宿文:我认为AI技术能够革新软件行业的代码供给方式,解决传统开发中成本高、效率低的问题。用户对软件的需求不断增加,但表达往往不清晰,导致代码供给与需求之间存在商业冲突。AI的介入可以将代码编写的效率提升到分钟级甚至秒级,这是一个巨大的变革。AIGCode致力于构建一个全自动编程平台,让用户无需编写代码,即可获得所需的软件和应用,从而真正实现为结果付费。 宿文:我观察到,目前大模型在软件行业的应用尚未完全爆发,这并非商业化问题,而是技术积累的问题。在基础模型能力不达标的情况下,将AI应用于其他行业可能更加遥远。Coding领域更容易产生共振和商业价值,因为程序员和算法工程师能够利用自己的专业知识弥补工具的不成熟。代码本身是有逻辑的语料,对大模型训练至关重要。因此,AIGCode选择Coding赛道,因为它离基础模型的应用最近,并且有可能成为AGI的突破口。

Deep Dive

Shownotes Transcript

写好代码这件事情跟实现 AGI 的进程某种程度上是相挂钩的对或者它是一个 AGI 的一个小闭环我们 430 的时候爬了一下 Labor 的数据哪怕它只是一个前端帮大家去做一个软件原型或者是建站这样一些工作的它的 4 月份的访问量 2700 多万这是什么概念就是说跟维护了大概快 20 年的 Github 相比只差一个数量级了

有点像王硕评价于丹的那个话就是月亮离远了看你觉得特别美往近了看就一板砖对吧瞅着一个方向快速地把它磕出来中间是脏火累火最后往远了一看哇好漂亮的一个月亮

哈喽大家好,欢迎收听商业漫谈,我是诗杰今天要聊的话题是从 2024 年火到当下的 AI Coding 自动化编程赛道 2024 年 4 月,主打 AI 程序员的创业公司 Devin 在还没有产品推出,只有宣传片的情况下就以 20 亿美金的估值筹集了 1.75 亿美元

年底 Cursor 爆火,4 个月内估值涨了 6.5 倍,9 个月做到 7000 万美金的 AR,彻底将 AI coding 赛道点燃。而热度在 2025 年有增无减,在刚刚过去的 5 月,OpenAI 好至 30 亿美金,收购 AI 编程工具初创公司 WindServe 成为业内最大的新闻,可以看出 Anthropic,

OpenAI Google 微软等大厂已经纷纷摆好了自己的 coding 生态为何世界大厂纷纷压住 AI codingcoding 领域新秀评出如何看待 lovable boat 这类新产品到底什么是 vibe coding 氛围编程 AI 编程又将给软件行业带来怎样的革新本期嘉宾是 AIG code 的创始人素文 AIG code 刚刚发布内测的编程 agent 产品 autocoder

是全球首款能够实现前后端一体化的 AI coding 产品苏文本人也是连续创业者清华工程学博士毕业这期内容他详细地阐释了当前模型和代码所处的发展阶段以及为什么他认为 AI coding 能够激发出 AGI 的能力

欢迎素文先跟我们的听友打个招呼吧大家好我是 AIG Code 的创始人素文 08 年在清华大学读本科 12 年本科毕业隋大六就留在了学校里读博士一直读到 17 年离开校园第一份工作是去做 VC 一直到 21 年 3 月份就离开了投资圈全职加入了一家公用软件的公司当时另外一个联创也是我们学校我师兄然后到了 24 年 1 月份的时候

我自己有些更多的想法在大毛鞋来了之后生死熟虑之后就做了现在的 AIG Code 你好像是个学霸这没有我对自己定义是一个小镇做题家因为我是从甘肃出来的而且也是个小县城 惠宁县典型的小镇做题家到清华进入清华之后就一路被碾压真的吗对对对 你会看到有很多优秀的人可是我查到你不是毕业式第一名的成绩那个时候可能自己努力一下

你当时加入的那家公司是叫数亿工联是吧对它是一家什么样的公司其实跟我原来的本科加博士的专业是紧密吻合的工程学其实它就是做工程管理背后是一堆运筹学随机过程规划等等的这样一些它是个 2B 公司吗是个 2B 是个大软件公司课单价能够到百万级别对当时其实我们想法是说底层有

物联网会提供大量的数据中间我们会结合自己的专业知识去做整个软件然后上层你有了原始的数据有了管理数据可以去做算法优化这样一个三层的一个构想当时赛道上觉得它是一个能够长出大软件的方向我看你在那里的身份是 CEO 那一段创业给你带来了什么其实比较多从整个团队里面

对团队搭建团队组织这面的事从最开始的十个人不到到最后的接近两百人我得忘加入了但 21 年有一波 SaaS 小高潮对是不是刚拿完钱资本市场还是比较比较好的但是马上就皱了就过了一年 22 年 4 月份你们当时有遇到挑战吗

当时其实好处就是说在寒冬来之前基本上粮食储备还是比较充足的但剩下更多的还是整个商业化这个闭环怎么去搭建的一个过程我觉得那个是最大的感触最多的成长还是商业这个事本身一直到去年 10 月份我们参加那个 AWS 这个 AI 创业加速营里面看到贝索斯的一句话我觉得具经典零售是这个世界上最性感的商业模式

对那一刻我觉得体肤观点怎么样能够让你今天做的所有的事情未来的杠杆效应它会变成像零售一样的能够快速的规模化的企量我们怎么理解这个零售是最性感的模式其实它会涉及到你的交付你的用户最终拿到你的产品拿到你的服务这个过程是什么样或者你启动的过程是不是一个能够加杠杆能够快速去成长的一个事情

你会发现在做软件过程中不可避免的有解决方案有直销有一轮一轮的去谈甚至还有投标有一堆这样的事情等等的问题没说这个商业模式有问题只是说它可能不是我擅长或想做的事情贝索斯的那句话能不能更展开讲一讲

他所谓的零售是最性感的模式这句话怎么理解就是需求和供给的匹配你给他一个供给不能远超过这个需求的范围也不能说他需求的一部分这中间会有一个匹配的过程你要尽可能地让他吻合

明确知道自己供给的边界和需求的边界如果能够对接的足够好它的扩展会好很多那你是怎么构思你现在的这个创业呢 AIG Code 大木星来了当时正好思考这个事情一直在想这样一个技术对未来有什么的帮助看到整个软件行业里面其实有很多环节的这种成本也好效率也好包括

包括交付的质量也好其实是从代码供给层开始的用户很多不停的去增加出来的需求包括他表达不清楚的需求其实最终会跟代码供给这些产生比较大的商业冲突具体的一个例子用户不停的提个性化需求这种需求其实你仔细思考

是合理的这里面还有一个用户说他经验体的需求等产品用起来之后发现它会变你发现也合理业务在成长的过程中你的软件或者说这工具的供给肯定是缓于它的业务增长的这里面所有的迭代都会涉及到说代码层怎么实现

所以这里面就和我们说可能有一个比较大的契机其实 AI 来了我们会看到说它在代码供给可以有一个新的方式就是我们以前关心的成本也好人的成本嘛效率也好以前人写项目那一个功能从沟通交流迭代改来改去的几周几个月都是很常见的所以程序员头发都白了

身体都不好大摩天蓝之后说我们能够用 token 去写代码然后这里面的效率就变成了分钟级或者秒级去做事情那是一个很大的变革对这个行业我说这个事情是值得去做的这是最初的出发点但这个事的底层其实从技术到商业还有很多的整体的构建不过这一下子就能想明白我看你是 24 年 1 月创立的现在这家公司为什么发生在 24 年 1 月份那个时间点

在那个时间点已经看了大模型很多二三年已经号号声声对在那个时间点跟 CTO 跟团队一起讨论另外一块呢那你得看你本身的技术供给时间点对不对它其实有个过程大面出来肯定会关注可能到了二三年中的时候会看到是说 OK 这技术巴拉巴拉这样的一直都在聊截至今天还都在聊

那当然因为技术在迭代对会看到是说很多应用截至今天还没有爆发式的增长没有出来那么多我们想象中的 agent 的时候这是积木的问题不是商业化不是我们做产品做应用不行的问题

可能我们把错卖了定位错问题了当然那个时间点更明显这个结论更明显我可以一直迭代到可能到年底就想清楚了这个事的第一个切入口怎么去做其实我们看到当时除了生文和生图之外生图其实当时还不是特别成熟翻过年就很成熟了哪个点可以去让技术迭代和成长当时我们觉得

我们能抓住的可能只有 coding 赛道 23 年其实本质上基础模型的能力就是不达标刚才你也提到了那在基础模型能力不达标的情况下你怎么能够确定你能做的就是 coding 呢其实这里面有一个点在基础模型不达标的时候

我们当时看到大家尝试应用到更多的行业里面去你就发现其他行业更遥远当工具不成熟的时候你冒然用到其他行业这里面的用户他其实是各自领域的专家他会说这个媒体不是说你们马上替代什么什么的

但是一用怎么这么傻这个完全没法用对吧这是一个点就是这些行业不会产生共振不会产生数据啊商业的共振相反就是代码的这拨人搞算法这拨人我们说同一类群体他会用自己的专业度去弥补

你现在工具的不成熟能够让这个轮子的两个齿轮稍微咬合一下能够转起来转的好不好那还有一些摩擦等等的那慢慢磨合嘛但起码它有一个驱动力去做大家驯魔型的时候就发现代码是非常重要的预料可能是第一梯队唯一最重要的

Aetheropics 也好然后 DeepSeq 也好其实在这方面的语调上挂的功夫挺多的代码语调对 另外一块其实就合成数据很重要它最近 Q4 的时候已经比较明显了合成数据里面其实代码跟视频最重要但是我们不碰多么其实就是代码最重要就是从技术上来看它也跟代码会挨得很近就是从商业和技术上判断你能从技术方面解读一下为什么在训练大模型的时候合成数据和视频是最重要的语调

因为代码本身是一类有逻辑的语料它可能对语言模型的促进能力最强很多实验看到的它对各个领域知识的促进也很强我有一个疑问我之前的解读不知道对不对我一直觉得用人类语言去训练大语言模型它其实是一个非常人本位的思想但是用代码那个是 AI 机器它更熟悉的语言就是用它的语言去训练它是不是更高效

其实这只是一个数据层的思考整体上还是得看网络结构比如最开始 Transformer 在后面 Moe 在后面还有一代大家一步一步的在网络结构上去迭代会设计的网络结构它本身有点像王硕评价余丹的那个话就是说月亮离远了看你觉得特别美往近了看就一板砖对吧网络结构它会迭代出什么的能力

他在预训练的时候他学到了什么样的知识因为他是个黑箱我们不能下结论他没有可解释性但是会看到说代码很重要所以你选择 coding 是因为你觉得它离基础模型的应用最近对我们甚至有一个观点就是说在 coding 这个事没有成熟的时候可能其他的 agent 都还不太好跑出来如果说大模型所衍生的一系列应用是一个军队的话 coding 一定是头阵兵

对或者是 coding 可能我们觉得在三到五年它更像一个 infra 它更像大家有时候会讨论的大模型时代的 OS 长什么样它可能是 OS 的一部分服务于产品的服务于 agent 的 24 年开端 coding 整个赛道就大火尤其是先从海外传导到国内如果一句话总结 2024 年的 coding 赛道的话会是什么样的

我们看到的是 copilot 产品先出来这 copilot 就是说你今天大木星来之后在原来的整个存量的我原来开发各种应用啊软件啊等等这样一个场景里面程序员去帮他们去做提效帮他们去写一段代码就是写一部分代码嘛肯定没法完全写完嘛给他们去做辅助驾驶就如他的名字 copilot

我不是技术出身我也不是程序员我用一个普通人适合更易理解的方式其实我觉得搜狗输入法出现之后提升了我们所有人的打字能力因为你基本上只要打一个手续它就给你补充了整句话所以每个人的打字都变快了我的理解就是 Copilot coding 的这些工具其实就是服务程序员让他们写代码写得更快更好而且它那个补的会更多对啊 有意思以前为什么叫马农

就是程序员在马山马海里面默默耕耘体力加脑力劳动所以它才会被称为马农对我比较好奇虽然你是工程学一路学到博士但其实你从来没有做过马农没有做过程序我当时在学过但是我走出校园就再也没有过了这个可能跟你这个产品的定位有

比如说像我们看 Devin Kerser 他其实还是非常想要去解决程序员具体写代码这个过程当中会出现的种种复杂场景问题但你要做的我的理解就是你要做的是代码平权把这些所谓的 no code 就是无代码产品做到极致让每个人假设我完全不懂得

编程但是我也能用你的工具来写代码我的理解对吗其实这个事跟自己背景其实没关系没关系更多的还是说考虑代码这个事情未来应该是什么样的你会发现跳到最后一步看没有人会给代码掏钱我买 100 行代码干嘛

我是为了要那个软件和应用是代码的最终的效果对我是在给最终的结果付费当然是你提供原来代码其实也在离结果越来越近但是你会发现那个事情的生态包括它的技术包括它的整个商业化更适合大厂去做所以今天你看到跑到头部的一些除了科色目前还没有明确站队之外该收的收了基本都是大厂的我们认为偏统制化产品

大厂已经各自养好自己的部队了对这个其实我们在第一天就想清楚了对那个事情就很快就会变味了然后中间 Windserve 其实也是一个很好的公司微软 31 美金收购 OpenAI 对 OpenAI 对然后你会看到是这样一个状态还是从你的视角还原一下 24 年你觉得 24 年有哪些在你看来特别大的标志性事件在 coding 这个领域

因为 coding 首先跟大模型精密相关我们可能还是会看基础模型层基础模型层我们认为 DeepSeq V2 年底其实在工程和强化这一块有一些贡献我们认为可能 V2 这一块的在整个模型架构层的贡献可能是个高点

我印象中那个里面的其实贡献出来的已经看到技术社区大家去 follow 大家去重点的研究那是个大事件年终的时候科色就比较明朗的冲出来尤其是它伴随着 Cloud 3.5 发布之后其实带来的技术的模型的红利快速的去消化这里面 Windows 也起来包括其他的一些可能新兴连点的也都会看到

但基本上到了 10 月份左右的时候我印象 10 月份左右会有 Botnew lan 过出来其实我们在那个时间点其实在

Cloud 它有一个类似的产品叫 Artifacts 之前我们也有类似的产品已经内部去做的我们觉得也不太对你要比如这个产品做商业化一它不够厚二你会发现很快也是同质化竞争现在的话我至少能输出 15 家到 20 家可能挣到钱那也是头部的 3 到 4 家我们发现这样的写前端的

工具也有一堆如果你要把那个事情持续去做商业化停下来你会耽误很多事的它当时的架构等等的都不符合我们对这个 autocode 的这个想象力所以那个产品我们也就没有再往前迭代对我追问一下就你刚才讲到一个很关键的论述你说你二三年底的时候就判断了接下来这些服务专业开发者的 coding 项目会是大厂的天下对你凭什么这么判断

两个点 一个就是它离基础模型很近你的意思是因为基础模型本身就是这几家大厂在这卷所以它做完基础模型它第一步就是要去建这样的生态其实它是对基础模型的一个最短平快的翻译

顺手做的对 其实它在 Programming 的时候微博代码样本你稍微改造改造都会有代码补齐当然大家还会决定产品决定 Type 什么 Workflow 这方面的一些产品层的属性但整体上你会发现它差异度不大当然这里面还有一个更底层的原因

就是它的产品是跟 IDE 生态打在一起的给听众解释一下 IDE 指的是服务程序员开发者的对 集成开发环境集成系统对 你必须围绕它的生态去做这里面要么你给它做个插件要么做云 IDE 要么基于现在开源的主要是 VS Code 去魔改一套 Cursor 就这么做的然后那个 WindService 也是这么做的这三个基本都是围绕着

微软这样的巨头在搞生态这个短期的时候微软说你小打小闹稍微大一点其实很难受因为 VS Code 就是微软做的我们可以理解为也是服务开发者的一些编程工具对吗而且应该是全球最风靡的吧在这个 AI 之间对对对其实尤其它的生态会更好一些所以你的判断是这一类产品你只要做了现在小打小闹没关系但是你做大了一定会被像微软这样的巨头来收割

其实它会产生一些冲突主要是你要真正优化这个产品你发现很多是不在自己手里的这个产品迭代的时候会产生冲突取道因为软件是赢者同吃天下对 你跟他们的整个 VS Code 你看 Cursor 大概一个月前就跟微软就会产生一些这种冲突什么样的冲突就是他想给 VS Code 的一些功能等等的那边不开放或类似这样的一些点因为这一类工具它其实是基于 IDE 这些系统做的是吗

对然后 IDE 是人家的对你要在人家的土壤上面如果要做一些改造什么的它就涉及到授权的问题或者它的开源生态能不能允许你这么干最核心的东西不在自己手里就像今天整个中国是没有 IDE 的但是华为这些尝试在解决那个还距离全球头部比较因为这都是迎着通吃的一个生态性的所以微软的 VS Code 做了多少年

可能我们也查一下这个很久很久反正我上学的时候就用的非常悠久所以其实你 23 年的这个判断是准确的因为 24 年就发生了大厂收购这一类 coding 项目真实发生了

对 其实你发现好像除了 Windows 4 之后也没有我印象中没有大的并购世界 Cloud 有自己的产品微软 GitHub Copilot 对吧 都自己做的还有一些大初创还没有站队还没有被收购他们自己也在逊模型像 Posite Magic 国内其实在那个时间点已经出来了就是百度也好阿里也好华为也好包括腾讯内部也能看到都有这样的工具

我有捋了一下 24 年的一些我认为行业里面比较关键的事情就首先 24 年开年 4 月份的时候 Devon 在产品还没有推出的情况下就已经以 20 亿美金的估值筹集到了 1.75 亿美元而这个会让我觉得在 24 年开端的时候这个赛道是不是已经很热了热钱是不是已经很多了对 应该从 23 年就一堆了普赛的 Magic 这些应该都是 23 年甚至还是 23 年上半年启动的都拿了很多钱

包括 Divine 这样的团队出来从他用的模型从他解决自己要做什么以及怎么做这个事情上其实没有暴露太多的让我们幸福的点当时用的 GP4

然后这个产品本身能不能做更多的他所谓那个 Multi agent 这样一些东西其实不太对其实不太对最终其实从年底 deliver 的效果也看到了后面其实他们也换方向做了有一个新的产品就从你的视角就是你最早知道 Devin 这个团队是什么时候因为我看他的这个创始人我觉得他筹到 1.75 亿美金也合理因为从创始人的这个配置上面来看他应该是

硅谷很爱投的那一类吧对吧非常年轻天才然后之前还得过奥林匹克竞赛的金牌也是有很深的这种编程的背景你是什么时候知道这个项目的我们也是跟着他们 PR 知道的知道有 10 块奥赛金牌这样的我们当然也会说他在所有的信息里面没有说自己到底要做什么以及怎么做他只是说自己

奥赛金牌团队位置等等我说那我们等它下个阶段因为奥赛金牌每年可能远不止 10 块对吧那我们还是看它做什么所以后来 Devin 的发展是符合你预期的吗明显不是订阅费 500 美金刚开始大家测完能做一些任务但是马上没有什么太多的这种正向的反馈了他们也在做调整吧看起来是一个明星团队但整体上从结果来看今天还不理想我们不知道他们后面有没有更让人信服的产品出来

但很快 Cursor 就变成了最明显的项目是吧 Cursor 在你这边评价会更高一些吗那当然我觉得它肯定是好产品对那么大收入了你还要说它要不要好产品那是自欺欺人嘛对但只是说我们要不要做这个事已经这个商业生态怎么演变我们团队能不能说继续做这个事情得到收益我认为不会在代码补齐就是 copy 的这个赛道上那毋庸置疑它还是一个很好很好的产品

他应该是 9 个月做到 7000 万美金的 AR24 年算是一个 CodePilot 的大年我用 AI 做代码补齐然后也跑出了很不错的产品像 Cursor 我觉得是其实我们刚才有讲到做 Coding 有分两类一类其实就是早期的做 CodePilot 其实更像是一个面向专业开发者做一个给他们的搜狗输入法很简单的类比

另外一种也是现在我觉得竞争更激烈的可以理解为做 coding agent 面向的是专业开发者以外更广泛的人群然后它的自动化能力更高就是说跟 copilot 对应的另外一类是在我们在各个行业的叫 autopilot 从辅助驾驶到自动驾驶其实这里面就出现了一堆公司大概是在去年 10 月份左右开始出来的

当然这个底层能力的供给还是 Sony 3.5 给大家带来的技术红利 Larbo 也好 Bode New 也好 V0 也好 Rebelit Agent 也好有一堆国内也出来了一堆马上去跟上去的在去年底刚才提到 24 年两个大的基础模型是标志性里程碑一个是 DeepSeek 的 V2 另外一个是 Cloud 3.5 对吗对对但因为它避远其实有些信息大家觉得很好效果很好但你没有办法

对或者说技术的这种共享让这个行业发展更快上面就还好但我们也能够看到一些它的分享确实很牛我好奇的是这两个基础模型从技术层面它怎么能够让后面涌现出那么多 coding 的项目我觉得一个点就是网络结构往前走了一些 MOE 等等这些

但这里还有更大的贡献会发现其实大家在 print train 或者说后续的这种 post train 过程中就未进取的代码语料越来越精良了从模型到语料数据层面都在发力

所以 Cursor 它用的是哪个技术模型你可以选最开始我印象上 OpenAI 还投了它们用了 GP4 后面用户用脚投票选出来的效果用脚投票应该结果就是用 Cloud 更多你之前有评价过你说 Cursor 是想做在大厂和 AGI 巨头的车轮前面抢钱的一个创业公司这句话怎么理解

这话其实就是它离鸡膜很近你在它前面抢就能抢到它碾压过后面跟上的就没了或者说难度会大很多它能够快速地比鸡膜的这个时间点早准备一点点你不能太早等不到早准备一点点然后趁着这个转动的势能它能够快速地抓住代码补齐这个赛道这也是一个非常强的能力

这个团队其实对产品对整个事情的认知那是很深的就他需要对技术的预判因为他其实相当于是买一个时间点对或者说他自己的预判没有特别准可能也做了很多调整动作但整体而言是对的这个也是很强的他预判了比如说好 3.5 可以到一个什么样的程度然后这个时候他其实自己已经准备好了所以他可以强跑一段就把这个离基模最近的 coding 做好

然后它可以迅速的卷住用户对吗其实我觉得它也不是说预判了有考 3.5 这么一个强模型出来但它基本会判断就是大模型能够带来什么的红利其实就代码再结合它把 IDE 这些事情做得还不错能够让原来这部程序很重的开发习惯有一个转变类似这样的一些事情都是 ready 的

所以你的意思是他也并不一定就压住了一定会有 Cloud 3.5 但反正大家都有基础模型大厂总有一个能做到这个程度然后他可以基于这样的基础模型把产品做到最好是吧对但我比较好奇的是这种抢来的钱

怎么避免不被巨头收割走呢那是跑得更快就你一直在前面是可以的包括井凯他从去年 10 月份开始说自己有虚模型今天也没有 deliver 出来他肯定围绕自己产品会做一部分但是短期内没法把 Cloud 给切掉然后他体量大到 Cloud 在做 primetrain 的时候可能要跟他配合一下他们中间有一种生态效应嘛这个过程当中你跟大厂共舞你跟他之间的这种竞合关系其实是不是还挺有难度的

如果你做 Cursor 这件事情的话这个得看在哪我们觉得可能硅谷会健康一些硅谷会健康一些在国内就比较难了国内就是我们会遇到有伤给代码你先做一个方案我说啊这个这几什么要这么做很快方案就被拿走了一分钱都不给一分钱都不给我说这怎么可能这不是一个健康的生态

那肯定就很难嘛所以你的意思是在硅谷 Cursor 可以存活在中国你做出了 Cursor 之后你也很可能首先做不出来也没做出来对对对这不能说假设我做进了做出来这有点太高抬自己太高傲了那你是怎么判断出来说 Cursor 这样的事情你做不了那个时间点 Cursor 已经发展了很长一段时间了

已经有很多沉淀了另外我们觉得为了 IDE 生态去改变 IDE 生态去改变程序员的 IDE 使用习惯你做不过大厂这个是多难啊主要是那个使用习惯的问题那个多难啊这个其实不应该是我们去干的它不是一个创新性驱动的事初上公司不擅长所以你总结一下为什么 AI for coding 会在 2024 年大爆发呢

除了刚才我们讲到就两个基模其实推动了这个行业对还有别的因素吗好像没有了刚才我们讲的主要是硅谷那边的公司国内的这个 AI for coding 在 24 年的时候是什么状态大家也都在努力的该 follow 的 follow 对吧该转型的也在转型转型你是指之前在 coding 这个赛道就有在做这样的事情其实 23 年上半年那个时间点我记得奇迹创谈讲 agent 的时候就那些已经有五六七八家的

做 AI coding 对 他们到二三年过节前有一部分就开始转型从什么转为什么完全转其他方向比如转硬件转其他方向去了你是说放弃做 AI coding 就是换方向为什么具体他们也没告诉我整体肯定就是还是没有熬到 Cloud 出来也没有熬到中国的市场或者生态的 PMF 的时间点那就快速去尝试其他点嘛

你说底层是什么底层肯定还是对这个技术本身的认知我很好奇像 V2 和 Cloud 3.5 出来之前中国这些做 AI for coding 的项目他们用的基模是哪些基本上大家也会去调国内海外的都会用去做这种事大家只有测过才知道

都可以用研发嘛 coding 和模型这个事不是一些特殊市场大家都是能够去使用全球最好的工具的就是用海外的基模是不受限的你做研发是不受限的那你的意思就是比如说像奇迹的那六七八个项目他们可能就是倒在黎明前他放弃了其他的有没有在继发下的我们要关注了只是我看到确实有换方向的有调整的但其实你创立的时候这两个基模也没有出现

对 它的没有出现跟出现了对我们干扰也不大因为我们去做一个真正能够把成全替代的业务转移性的把一个软件从数据库到后端到前端到它的测试运维部署全部完成当时的模型 今天的模型 未来的模型其实都还是有比较大的卡链的能用 但是未来的迭代需要自己手里有大脑去持续迭代

对 但是你会发现产品的迭代会在模型层这个模型就得想办法自己去处理对 我们昨天可能聊到可能 Cloud 4 可能要发布对吧但你要等 4 吗它的每一次模型的大变革导致上层生态位的

大变革其实这不对的这个其实一定是上层创业者没有想清楚这个事情举个例子就是 V3 出来 R 出来你发现大家就开始各种一蹭对吧或者说我调整了什么我换了什么因为它的到来我要做什么其实就意味着他不知道这个技术边界在哪儿

它没有任何的预判如果一个创业说半年或几个月因为一个底层或者其他人的变动自己有大调整那可能是有问题的您这个话其实还挺反共识的因为大家现在都会觉得因为基础模型是最底层如果你最底层有比较大的这种技术迭代的话那你在上层构建的所有的

都可能要快速迭代重来一遍也不重来可能大调整大调整对所以大家今天强调就是组织一定要反应敏捷然后快速调整

有些人可能对模型边界有判断有些人就觉得还不确定它的边界在哪其实共识非共识没有对错之分就是说在山腰或者在山底看到的肯定不是山顶的还有一个点就是说既然我们把它作为一个商要公司撬动了股权投资投了很多人力去算力如果我没有判断清楚这个底下的地基不能建 100 层的楼然后我现在贸然在建然后说后来出来一个说这玩意原来是建别墅的这玩意原来是

跨江大桥的那就很错误浪费资源是吧对 这个很关键那你判断模型边界是什么模型边界就是做翻译做转移传统架构天然是用来做这种比较扁平化的转移从 A 形式到 B 形式你让它去做长逻辑链条的思考其实今天是泛化不出来的

这是传送架构的天花板当然未来还要持续去提升但今天或者说很长一段时间没有提升的时候怎么办要结合你的场景去持续迭代它要收敛它的边界同时要放大它擅长的点你觉得它擅长的点在 coding 这个领域怎么让它发挥出来其实它就有翻译各种各样的有翻译因为我们的听众可能很多是非技术人士能不能用更通俗的方式解释一下这种

业务的转移业务的转移其实最早传统出现应该就做英语道德语翻译的对吧这是最直白的其实今天你会看到他做的比较成熟点主要是语言模型里面其实今天做的好的他还是在利用这个点

去做一些文件的抽取整理等等的包括我们今天看到的一些可能跟搜索相关的项目整体上都在发挥这些能力都是都挺好的它是明显是很擅长的运用了今天的模型的技术红利但是说我们指望它想数据库怎么做中间件怎么做微服务怎么拆前端怎么做 UI 怎么做

API 怎么办你有点为难这个技术简单来说如果把它拟人化的话他们其实是不同种类的技术人员比如说你所说的转移可能就是一个常规的马农能做的事情他其实干的是一个清脑力加体力劳动对吗对其实它更多的就是原来为了让人协同的更好发挥规模效应我拆得越细越好但是当中性网是不是这么考虑的你拆得越细它的错误率就会越高不会说在三五年就是说

完全就又颠覆式的也有可能有可能新的架构或其他点出来那其实就是你怎么驾驭这个模型就有点像说它是个发动机它到底是飞机的火箭的汽车的高铁的还是一个四驱车的你怎么去驾驭它这个怎么驾驭大家凭借的是什么呢其实就是你技术层的所有的模型以前的经历是什么啊

接下来全球真正在做的为数不多的团队大家的认知尝试去迭代的是什么我们刚才聊到辅助型 co-pilot 和你说的慢慢演变现在另一大创业气候就是 autopilot 你做的其实是 autopilot 对我之前听 lovable 的 CEO 说过一个形容我觉得还蛮有趣的他说其实这两者的区别就是从体力劳动被 AI 取代到认知劳动被机器超越

你认同吗他指的是 Copilot 和 AutopilotCopilot 更多还是帮你做一些体力劳动的事情但是 Autopilot 可能在认知上有可能会超越人类我觉得这个更多的还是说是因为大家都是这一代大模型的产品就他们本身给用户的服务就他是在制造内容他不是在产生链接在做撮合外卖打车这些事他就是在给你造内容但 agent 就要干撮合的事了 agent 还要影响物理事件呢

这个就其他人做我目前还没考虑的这么多我只是在 coding 这个市场上那将最终就沉淀下来的内容看起来比绝大部分人的能力要强其实它就是一个正常的内容供给而已你能够把软件写出来你写的好你设计的好大家能够附用能够共享那你能够做商业化变现嘛所以从 Copilot 到 AutoPilot 你觉得它其实就是辅助驾驶到自动驾驶的进程是吗对但现在自动驾驶也没达到呢

这个只是一个类比 总的驾驶它涉及到轮力各方面的问题你不能犯错 不能犯错又不现实对吧会有这样的一些卡点在但是代码没关系今天我们基本能够验证这个事情有 bug 没关系 我们改掉就行它不会死人的 它不会出恶性事件这个观点其实我之前好像听 Devin 的创始人也有可能是另外一家的创始人我记得不太清楚

这么类比但他也说不能完全的类比因为自动驾驶其实需要 99.9%的准确度但是像你说的代码不用但另外一个层面他也提到了说其实今天的 autopilot 它的这种自动化的程度可能远没有到当年这个 vmall 出现的这个状态 vmall 没有出现但不代表它未来不会出现我们今天哪装内测产品各方面的其实基本把这个苗头也都出来了因为我们做出来了

还有迭代还有一些工作要做但这个事也快了基本上也就 6 月底顺利的话大家可以体验到这样的产品了所以你觉得威慕时刻已经来了已经到了我觉得差不多截至今天就上个月会最近两三周红杉在美国开的这个会技术层的对于 coding 这件事的讨论它就陷于

FDE 就前端开发体验它没有提及整个权质你刚才提到海外的这些所谓的明星公司他们都还只局限于在做前端但是你其实前后端一体这是你的这家公司的创新点是吗对 这就最大的创新点有点像这个软件工程前端可能占比是很少的八九十的工作都围绕着数据库后端为什么之前的这些 coding 项目没有做后端只做前端

大家会去尝试我们看到有尝试失败的会有只做后端的也不太顺的你的意思是别人也想这么做但你现在先做出来了对 讲这个事的肯定有你说为什么只能做前端因为这些都是基础模型只用基本上都是用 Cloud3.5 和 3.7 基础模型给你的能力共计就是这些为什么是你们做出来了呢

其实我觉得就两件事情涉及到我们现在团队核心的产业风拿两块就过去的十几个月到底做了什么事一个就是模型用字眼的模型也好或者包括我们对很多模型的这种探讨关注对它边界的定义也好它会涉及到你怎么设计这个产品另外一块就是说大家要写软件不能按照人的方式去断断断的写就是人的逻辑跟大模型写软件的逻辑是不一样的

但其实我们还做另外一件就是软件架构什么叫生成式软件架构这个事情也得做我们做了这两件事情才达到这样一个效果我们一会儿再详细的去讲一下你现在这个创业就是你具体在哪些方面使了劲我们还是先回到行业的这个部分其实我觉得 25 年的话 coding 这把火感觉是有增无减你觉得是吗

是为什么呢因为其实是因为基础模型迭代也很快能力也迭代的很快对主要还是全球有几款产品已经验证了跑得比较快也不能叫完全验证了这个事情还得发展往后看都得发展大家看到的数据不管是 SROPIC 老板也好普萨老板也好一些做的好的团队大家也已经把说大部分出口就是代码这件事情摆在桌面上绝大部分也接受了这个共识

2 月份的时候 OpenAI 的那个连创 Andrew 他就提出那个 vibe coding 然后中文翻译是氛围编程然后这个词一下子就非常火其实我一直都不太理解到底什么叫做氛围编程对对我有一个视频我可以给你看一下好啊好啊这个视频回头可以放到你们的 show notes 里面没问题但有没有版权我不知道对很短很短他们俩是都被蒙了眼睛吗对

对这个很形象给听有观众们解释一下这段视频的意思这个技术边界你不知道怎么去驾驭大模型就变成了就是说有什么结果我用什么结果出了问题再说但出了问题又不能解决最终其实这这这就是一个阶段性的事情我自己最好奇的一点是 vive coding 它到底是一个

带有一点点贬义和审视的词还是一个建设性的词但是在我身边很多人讨论尤其是懂技术会编程的他们都说这个 webcoding 带来的可能会是很多垃圾袋吗我觉得都有点极端化我们怎么评估最重要的作为这个产品我们有三个指标第一个指标就是成熟度成熟度意味着你是一个真正的进生产

能够去解决问题的靠 webcoding 这件事去做一个建设性的未来的目前技术路线不明朗所以大家是专业人才会有点调侃它的当然你说你指望它去写一堆史山代码你要用起来也没人用啊也没人用它只是一个大家探索这个技术过程中的一个中间态而已

有点像汽车最先出来时大家把它做一个小玩具一样那你说汽车没意义吗其实也不能这么去说这是个中性的只是今天我们还是要得到一个更成熟更严肃的产品而已到底什么是氛围编程我看到的这就是大部分给什么你接受什么就完全不可控了这是扭蛋机和真正零售的区别

但我指的扭蛋机不是指娱乐我指的是就是你的获得的不确定性不可控 盲盒盲盒对对对而且你扭出来的东西也并不一定是你现在需要的那零售的话就像你讲的需求跟需求是更匹配的但是现在不管是 Copilot 还是 Autopilot 假设你是一个专业的程序然后你能把它用好吗

因为我听说有一些说法是说这个东西你没用的时候你可能瞧不上它你用了之后你可能就离不开它

这个是符合现实的描述然后你再用一用你发现这玩意怎么乱来对因为随着你的使用时长它会还是幻觉导致的一些问题会导致质量会大幅度下降其实 Girson 这种补漆在下面它确实是一个严肃的工具给程序员这类群体带去了很大的帮助但是有些成员当然看不起它因为它写出一堆 bug 导致它很崩溃或者在不告知的情况下

一些写过的东西覆盖什么拉伞发造的这样一堆问题那小卡他的 地他的 A 字只写一页一页的都在写但整个它确实是从用户量和收入上其实它一定是有一定的效果在的但是它也持续迭代包括 OpenServe 结合自己模型的你持续去迭代这肯定是个发展的过程它会越来越成熟

因为去年底的时候其实大家从技术圈有些测试会看到说基本上写一个半小时到两个小时左右它会有问题但今天应该这个数据有所提升我很好奇为什么会有一个时间边界就是超过这个时间边界效果今天看到是跟它的大上下文就写着写着它可能信息的

就是跟它上下位容量有关系对 跟这些有关系所以今天我看到他们也做了 workflow 方便就是在左边的关键夹里面方便你去找 bug 什么之类的你刚才又提到 25 年另外一个很重要的事情就是 OpenAI 31 美金收购 WinServe 怎么看待这个收购这个是一个很自然的状态我们觉得现在初创去做 AI coding 的没有自己模型的要么自己做模型要么你可能要么就被收购

我们说大厂都会去做这个事当然他因为大厂看的这样不错的产品且不考虑他 overpay 的这个故事那其实他就是有比较好的协同 OpenAI 收购 WindServe 是不是可以理解为模型加工具的结合可以这么说他以前还有 Codex 他也有补齐的工具但认为他一个大事的话 WindServe 在原来在工程时代的很多积累在 idea 上的积累能够给 OpenAI 带来帮助能够让他把这个事做得更好

大或者更快这个方向是对的像您讲的比如说我做这类基于 IDE 的 coding 工具我要不就是接下来自己训练自己的模型要不我就是被一个大厂大金主给收掉今天看到的是因为大金主要干这事要么自己干了要么我今年还不错把你收了其实是这样一个现象但我们也不能预判说一个出账公司未来最后的规矩就被收购掉只是今天要做这个事确实跟模型偶合的非常的紧密

你现在做的这个 autopilot 难道跟鸡膜偶合的就不紧密吗紧密那大厂为什么不能顺手把这个事也做了呢

它还得做另外一部分事就是软件架构这一层这两个东西基本上占比 50 50 机模和软件架对 可能未来机模会反超一些但今天可能机模还占的少一点涉及到机模能力不够的时候得用其他能力补齐其实你这个问题根底层是说大厂会不会做类似的产品我觉得会那就做竞争的源头就今天还属于行业早期的时候就是组织和人

你的认知你的知情力最终做出来的产品能不能快速跑起来那只有速度迭代出来才算那你是觉得做 autopilot 这个 50%需要软件架构的这件事情是比前者做 copilot 的要更厚一点吗

就是大厂如果要先做的话做前者他可能更顺理成章更轻松做你这个事更难所以不是说他未来不会做只是说他短期之内可能先不会做 Copart 那个产品也难它的技术延续性它的内部的这几万甚至十几万的程序员包括外部的 2B 生态的集成包括整个战略跟随因为头部有人先就干了他肯定要跟随性的战略懒惰也证明战略正确的一个事情

他们就去做了那个时间点已经看到了都在做了这是一个状态另外的说做我们这块的话他做 copy 的能不能技术继续延展到 output

其实从目前来看不会它所得到的用户数据场景数据程序案其实跟非编程人用的场景要设计产品的思路是不一样的包括连模型底层要迭代的能力重点能力都不一样在大模型出现之前我常听编程机会讲 D 代码但是现在讲无代码这两者的区别到底是什么他们现在在技术上是互相合作还是互相覆盖还是替代是什么样子的

大概是我在做创业还 1819 年的时候我会多一点地代码零代码就整件地代码可能就就是说你还是要有写一些零代码其实我们看到的很多拖拉拽的这种功能去搭一个应用啊等等的当时还有 RPA 啊等等的这些东西再结合 OCR 去做一些这种识别啊等等但其实我们会更往前去推自从人类有了规模化的信息技术产业就 IT 产业

我看到从 80 年代 90 年代就已经出现了低代码零代码只有一个点做代码供给因为程序员本身是成本高的效率低的这个事因为需求大嘛不就卡在他那儿了吗对吧那他就老想解决这个卡点只是说他们没有完成这个历史使命那其实大模型有出来有更好的工具能够去做这个事情我是不是可以理解为把代码模块化有一些重复大家都需要的这把他模块化

你就不用专门为了这个其实可复制的东西专门雇一个程序对 你会看到有些是擅长金融行业的因为金融行业 IT 预算最充足最中国有些可能海外的生态更好一些他们可能会做得更饭一些

就卖代码预制菜嘛对对对有点像你还得划分这是川菜对你不能说我这个其实啥菜都有所以现在这个无代码跟当时的无代码有本质区别吧这个是有本质它重点是你要利用模型代理的红利贩华

它的灵活性那个架构又完全不一样你可以理解为是鱼制菜但那完全不一样规模化的鱼制菜跟自己家里厨房早上炒好等着中午热一下会不一样长期来看的话低代码和无代码就是会一直存在然后在具体的场景当中都会运用到我觉得都会存在就是技术出现时

通过增加供给的方式激发新需求你一直在强调其实我是增加供给对具体增加什么供给比如说你去见投资人的时候你怎么跟他讲的其实就是说我们会看到因为有了滴滴才有了网约车有人每次有外卖市场

一样的其实代码这个事我们不是说今天做下来我想的是原来程序员去做定制的场景我们有时候觉得那个表达会让大家觉得有点误解就是替代程序员更多是原来是我这个场景我就需要一个软件但我一咨询公司软件公司或者说开发个人兼职的这种都是几万块钱的这种我就不干了但今天我只花几块钱我烧点 token 就能做到的事就会有一堆需求出来

我简单理解的话其实就是假设我们今天是一个开发者假设今天就要做一个 demo 或者做一个 mcp 那我其实需要配齐假设 ABCDE 五个生产资料生产的条件但是可能现在那些你的竞品们如果他只做前端的话我可能五个生产条件当中变成四个了只配备一个

还差四个然后你能把全站都给它做到端到端我把你这个生产要素全部配齐你要做的就是这件事那这个很好理解听上去确实会有很多的需求所以你的融资是顺利的吗

今天我会摆事实我做这样产品大家已经能够看到甚至说给投资人开一些内测等等包括我怎么实现它的把事实先摆清楚接下来的演化其实也是一个动态调整的过程有时候那个饼也不适合画得太大有一堆因素会影响你但你 Day One 去融钱的话你肯定要有一个故事去融还是说就针对你这个人的 reputation 还是事还是事情最终人的能力要映射在事上面去所以你 Day One 讲的事是什么事

我当时想的就是我要做 autocode 就做一个端到端 coding 这个一直没变从第一天认识我的就肯定没变过所以第一笔签好难吗还

还行 低比前 还行包括我今天都能找出当时就日期都没变的那个 PT 里面内容剩下的执行和调整的事方向和具体要做的事大的关键节点一个都没变我觉得瞅着一个方向你快速的去把它磕出来中间是脏火累火最后往远了一看哇 好漂亮的一个月亮其实往近你看全是板砖一个一个的板砖

其實是這樣一個過程今天這個時間點不是一個故事大家可能會看到這樣一個產品包括這樣一些需求我們 430 的時候爬了一下 Labor 的數據哪怕它只是一個前端幫大家去做一個軟件原型或者說建站這樣一些工作的

它的 4 月份的访问量 2700 多万这是什么概念就是说跟维护了大概快 20 年的 GitHub 相比只差一个数量级了对 这时候我们还需要质疑就管它是谁对 未来的这个故事是什么其实它是一个有庞大的需求在那存在的一个事情就是说有了供给这些需求才会释放出来今天其实已经很明朗了这个量很大

第二个阶段它会是变成生态性的就是说一个软件自身的 good market 这件事另外一个就是刚才提到的它对于基础的原因对于支付对于很多这种通用软件的分发是这样一个过程我来进之前我也读了一些 AI coding 的报告当然那些报告也可能是写给行外人看到就是大体上那个报告里会有一个判断

Copilot 这个领域里面目前统治化比较严重大家更多的还是去卷一些 benchmark 然后如果我 benchmark 卷的比较出色的话我就可以优先说服更多人来试用我然后看起来好像有一个用户或者付费的这个护城河但整体上来讲这个行业现在是缺 dubrick

这个你们同意吗对是这样子的是不是这个其实就刚才这产生的原因都这样一个是今天刷一些榜单等等的得看具体是哪些有一些就是奥赛金牌什么的刷这个能力的就是它是通过强化的方式去做的一些纯刷榜型的工作它不太能验证太多的泛换

考前刷题命题作文大学纪点高然后成绩好并不意味着踏上社会之后这些能力可以泛化的好对或者说普及的产品真正的程序员用户要用他其中看出的是最初的效果根据你们的介绍你们最直接的竞品也是海外现在最火的两款

一个是 lovable 一个是 bot 就刚才其实这两家你都有提到其实它不是竞品它是做了前端从产品形态它做不上你的竞品产品形态不是竞品有时候我们制作业会抓这个它的用户画像是我想找的对

你们都是面向不一定一定要是专业的那些创作者开发者 Curse 为啥不是它的用户到我这儿来解决不了人家的问题对 我不会暴露代码相反就是说尝试 Bot 尝试 Labor 尝试 Rebel 这些我们去看它的社区用户反馈这很精准用户是重叠的但是从产品层面还不太是进队它一部分用户可能倾向喜欢我有一部分可能还是喜欢人家它可能就是只要前端

你只要有 I 层的工作内部服务就是他有先锋优势让他先跑就不要做同质化的纯你立地打滚的事情对我们可以稍微介绍一下 Loveable 因为它其实也是今年上半年最火的 AI 新秀之一而且它是一个来自瑞典的团队这个地方本身就还挺神奇的你很少看见非常有名的 AI 创业公司来自于北欧而且大家觉得说好像来自北欧的应该是比较 work life balance 的结果人家团队贼绝

据说根据 CEO 口径说他们的首约付费用户的留存高达 85%但咱也不知道这个是真的假的姑且就当做是真的这个表现是非常好的吧就三个月 AR 就到 1700 万美元了我们就看单月的收入基本上应该快 400 美金了这个首先验证了这个需求因为它的定位是帮助普通人能够去写编程对哪怕他只做了一个 prototype 这也是有价值的对

所以他帮你验证需求在前对其实也不能创业地下等别人去验证其实自己心里对这个事情的分析是有一些在的只是说最终的数据的左阵是他先跑他这么火数据表现这么好在你的预料之中吗超出预料你有没有研究过他们增长这么快付费这么好可能有哪些事情做对了

因为他们的运营能力很强用户可能会关注的一些点看起来是小功能但他们迭代的很快包括最早跟 SuperBase 的集成等等的其实我们觉得还挺好的肯定是有它的强项的它的整个工程的班底或者说整个起步其实比 Botnik 要晚一些我印象中晚两个月但实际上 Velabra 这个团队就是可能在增长上挺彪悍的它俩在定位上面有区别吗可能我没有深度体验

我觉得可能差不多 比较同质化你为什么没有深度体验它解决不了我的需求我要生成一个直接可用的但是我们可能几乎它每天都会送一些 token 都会去体验一下它有没有能力的提升等等的按照你自己的定位你们是做全球首款前后端一体的 AI coding 的项目 对吗像你讲的虽然有人在做这件事情但是目前还没做出来

对我理解我理解单位好像应该也是想做类似的一个结果吧是所以你没有比较因为在这个方向上面的对手暂时还没有交付成果目前没看到包括你们其实也没有还没有投入到市场嘛对所以你暂时没有办法比较说这个方向赛道上面其他对手做的怎么样但是你自己做出来了之后你给自己打几分嗯

我觉得纯粹产品来看应该是一个九分的产品满分十分的话对对因为基本上会把核心的事做完但剩下的一分很重要我们说那一分不重要那一分可能正好是要命的一分要命的是什么

商业化持续迭代我不是程序员坦率讲我也不太能够熟练的去使用这些 coding 工具但是因为我确实也最近聊了或者试了很多这些 AI 产品无论是辅助创作者的还是辅助普通人的一些工具我发现现在的 AI 产品付费势头还挺好

至少如果你去海外看的话大家还是有一批长线用户不管多少钱比如说像我们之前说的 400 美金 500 美金一个月都有人会付费但是留存很重要之前有个创业者就跟我说留存的数据很有可能是连投资人都看不到的因为投资人看了可能会两眼一黑就是说大家乐于长线也乐于付费但是这个付费可能是一种

瞬時間的假象對 就是大家說的 Web Revenue 對對 這是怎麼樣 搶先者的氛圍 氛圍增長是吧對 但是一些對這事感興趣

也在密切关注我大家尝试要付出点成本的这拨人很多这种 token 最终没有流向最终的用户还没到真正的 C 端用户里对对这就是我们说这个事还很不稳还有很多不确定性当然有很多魅力所在的所以你在产品的 day one 会收费吗

我们当然会给大家每个账户开通之后会给一些给一些免费 token 基本上会我们说可能一到三个项目的时候看具体的情况但是额外如果你再想要就要付费了对付费现在基本上也都是这样的模式基本上都这样这得看情况看之中的社区反馈大家如果说你的 crush 送太少

天天投诉那我们想办法弄点呗因为自己的模型后面全部切换掉成本也蛮低的还有一个做模型商业化竞争的极致大不了打成本价格战呗你要是今天采购了别人的那对不起可能有点困难就用投资人钱打价格战

因为自己就好办很多这个事但坦率来说因为你的产品还没有发布刚才虽然讲了很多义美之词但是毕竟他还没有去 public 接受大家的试用和审视坦率来讲现在采访了很多 AI 的创业者大家对自己的产品评价都会挺高的然后有一个业内人士评

说现在大模型产品其实就是大家都互相卷但其实卷的是某一个维度就每家都是最强 360 度每一个角度我都可以找出一个我自己最强的角度因为可能我只卷这一个角度一样的就是在这个领域里面我比别人都强因为通过这样的一些可以理解为 PR 方式可以去吸引用户你的产品一定也有这样子的 PR 口径和思路

是吗那就是做了什么你才能 PR 什么没做的 PR 也没有因为你就是做了前后端议题的对那么我重点就是这就是你最大的优势对大家要全这样的但是我大概可以想见我相信你一定是现在能够做到前后端议题不然你不敢这么说吗

对但是做出来了和真正效果好满足它需求其实可能还差当中有一个有个迭代过去对不对你预期你第一波产品发布之后最新的这批长线者他们用你的 coding 的能力来做一个前后端一体的项目你预期他的这个项目

或者说具体的场景会是什么样子的其实我们目前主要聚集到四个场景但是这里面可能率先上的是两个这两个又是紧密的绑在一起的就一个就是说我们说前台就 Lightning Page 网页建站这样的需求就我们看到了但这里面如果带登录功能就会很复杂的这样东西对吧如果你是社区你是一个企业吧类似这样的或者你是

天猫的商城的网页版 它没有那么简单 不是纯粹的官网 有相应的后台 它更多的是可以理解为大的这种 SaaS 型的产品 它就是面向 B 端的 它对于 UI 啊 交互啊什么这些弱一点但它可能对逻辑 对数据的这种一致性啊 这种都会更强一些 对 完成各种 B 端又翻译的 这是两大场景 后面其实还会有 APP 和 agent 的这两个场景

移动端的对对对今天还是 PC 端的产品那这个就很有意思我之前听一个非技术人士也是我的一个朋友他发朋友圈就说到今天用这些 AI coding 的产品很像是早期没有大模型的时候也可以手搓网页就是非专业人士也可以手搓网页因为他可能通过一些模块化的这种拖拉拽他自己可以形成一个网页今天的搓网页和过去的搓网页有什么区别

它还是分场景的最早的 Discord 上的铁拔剑战都是基于这一套做的你可能中国最早的剑战的低代码或零代码今天可能大门市在上面会满足的更好成本会更低效率会更快还有一个就是以前的产品有个很重要的点也是只管前端后端不搭理有一些卡点的但你为什么一定要自建模型呢

会设计的一个迭代一个就是你正向的看一定是一个更好的模型不然我花那几那那精力那算力那时间成本就很高的对吧另外一块就会回到说更初心的一个状态大模型时代的产品的很多问题的优化都在模型层这个东西不在自己手里你创作那些内容没法优化但是基本上行业都认为说卷基础模型的这些

游戏这一页都已经翻过去了上桌的就是上桌了然后你怎么能保证你做基础模型做的比人家好在 DeepSeek 出来之前一堆人以为自己上桌了他出来之后就会下桌今天一样没有人永远在桌上这个就直接说你有没有能力去在桌上抢个位置更故事的回答就是说你能不能做出更好的模型来

这个不是在同一个平台上去卷算力数据你往第二个台下去新的网络结构的效果的出现

其实是在这个层次去做的所以你没有做过基础模型你怎么能保证你做的基础模型比别人家好炼丹有一堆实验数据你不是说我今天早上起来我要干我过六个月就有了又都是脏活累活又都是板砖每天搬一块砖看它长啥样对吧这个能不能最后建成一个万里长城所有的研究是一步步做出来的

线上的实验跑出来的所以你的技术模型在你这个 coding 项目里面扮演什么样的觉得它提供什么样的能力你去的技术模型是什么样的模型还是剪着 MOE 往后叠待后面有 MMOE 有 CGC 有 PoE 顺着还有更新的其实它带来的就是说这模型架构层能够让它更高效的学习知识就是解除一些幻觉层的能力

包括就是说你给他迅进去我自己产品要专用的一些样板等等他都能更高效的学进去其实这个都是自己有金模的一个好处才会有数据飞轮今天我一堆数据我靠微调起那个飞轮转不起来那个很多都转不起来这个要能转起来这个市场不是今天这个状态那你这个金模你给他喂的数据是什么迅金模的整体上大的配比啊方向大家都都差不多都差不多没有人有特殊的有些特殊的我们不用比如非要做安全那我们可能就不做

会涉及到那些剩下的我们就关注自己的产品代码这方面肯定会去加强包括一些产品优化的包括产品未来跟其他的软件生态的这种打通跟其他工具打通就会有些数据要么迅进去要么调进去都有可能我的理解你肯定不是光做泛化甚至你的重心都不是做泛化而是你要让你的基模在你要做的这件事情上能够提供最好的通用能力对吗对 其实好的模型是一强俱强的

只是说我今天要把泛化的能力变成卖 token 的商业模式我们不太发言包括这个时间点有没有到我们觉得可能都不太对你只训自己用的

对我指望自己方向去优化未来这个模型的出入未来在哪它一定是一个很强的模型在今天不着急你之前有提到过一个观点就是你觉得让模型写好代码这件事情跟实现 AGI 的进程某种程度上是相挂钩的对相一致的对或者它是一个 AGI 的一个小闭环率先能够造出来的对它的逻辑是

他认为就是说整个模型的出口内容的承载其实是代码 auto coding 这件事当然 auto coding 其实是说它让整个大模型有一个完整的闭环其实它就能承接很多泛化的场景

就是今天假设我们做通用 agent 每一个生成应该最终大部分都是网页对吧那这个网页它不缺东西嘛这个闭环在哪这个 agent 闭环就是说起码你把代码端到端这件事得完成我的理解就是让 AI 写好代码应该是实现 AGI 沿途下的第一个蛋对

你是这么认为的对可能是通往 AGI 也比较高效的一条路这个其实有很多人都在这么讲但这个为之上早没必要着急下结论先提供一个能解决问题的产品那你之前还讲过一个观点你说你觉得目前模型的发展和代码应用的进程有点异步这个怎么理解

其实就是说头顶讲的东西基模它没有做供给这个频率大家是对不上的相当于你要基于它去构建你的产品和应用的这个基础它其实跟你不匹配它是在按照修高速公路的方式在打地基你是按照修高楼大厦的方式做那其实就会出现一些问题那现在底层基模的这个技术它确实就是每个

半年甚至一个季度就会有一个特别大的一个跌打那不管它的这个发展方向是不是按照你们 coding 所需要的那个能力去进展的但它底层就是一直在飞跃对那在上面建筑应用的这些 AI 创业者他该怎么去思考呢

这个问题是大家共同面对的就是首先模型提升的是一个整体的能力最终只是使用的过程会单向的优化不管你是 coding 你是聊天你是搜索你是什么但是最主要的点就是如果完全依赖于机模既希望机模一代提升比如从 3.5 到 3.7 其实它的调整方向会不一样你发现有些产品 3.7 出来怎么还在主要调用 3.5

不是说成不能其实说人家调的效果你丢失了一部分所以这个时候就体现出来说比如说那些大厂基模也是自家的在基模上离得最近的这些 AI 应用我也都不觉得话其实我有一个协同效应对可能我有地方使得去选择我从哪些雷度更多的去卷我基模的能力对对吧它就有协同效应是的那对于这些创业公司来说岂不是要看天吃饭

我觉得商业生态大家会有各种细分方向二十二年的思路不是这么小家子气的对对他有时候想做生态有些想做基础设施有些想做他会希望大家一起繁荣我们看到健康的商业市场包括整个市场随着供给越来越多也会有很多方向的他不会说是老是纠结于同质化的卷这有时候会是中国一些大厂的

但我觉得整个 Global 市场不这么思考问题其实今天聊下来我还是会对于你们的这个目标付费用户稍微有一点点模糊就你刚才虽然你说了四大类可能其中两大类场景是你认为会最先 target 的那比如说有没有更具体的使用你们的产品的会是创业者居多还是独立开发者居多

虽然你的产品现在理论上普通人也能用但是我暂时好像找不到普通人用你这个东西要去付费的刚需其实这里面就是他还真不是普通人就这一类我们看到的就是因为创业者跟独立化有时候还是有重叠的但是我们对他的同学画像来看他是他是一个软件真正的需求方

而且是在通用市场没涨的话通用市场不能满足它的它一定要去做这个软件开发或者如果说这个开发的成本我可接受的情况下这里面就会有一堆你光想想光建站这个事情承载了好几个百亿美金的公司还有一堆小不拉几的公司包括拉布布出来很多这样的场景这只是一个很小很小很窄的但是又承载了这个大公司的一个事情

当然他们切入点不一样沉淀了这么多年大家都自己能力点那我们接近也会有我们的这个能力点就是短平快的一个业务的翻译明白不会说我今天指望有人在我这生成一个抖音和微信没必要为什么你这上面不能长出抖音那抖音在成为抖音之前它也只是一个小项目而已抖音的能力不在于

有没有代码在于它的整体的各方面的能力如果用你的产品做的更多的可能不也是一个代码或者早期产品未来可能会有一个产品它的最开始的 MVP 或者 PMV 之前跑的点是哪个做的后面就是说但是支撑着它去做支撑着它持续迭代就好所以现在对你来说会迫切需要商业化吗

需要 需要验证今天产品到今天一个内测的阶段这些工程那肯定要有用户的反馈进来或者说我们把刚才那个 9 分打的低一点打到 7 分剩下的 1 到 3 分怎么弥补要用户来说我们自己闭门造车意不大那你具体会怎么去找用户

首先我们肯定是推一个全球市场目前我们已经做了很多工作了核心的就是做两件事一个是做英镑 marketing 就是内容另外一个其实是做 SEO 但是这里面细分下去那个工作量非常大但是又看起来又是一个一个的反转当时最开始的就每个渠道上已经被中国人和印度人刷坏的这个 PH

Barton HuntHack News 还有一堆这样的工具这样的工具可能有二三十个一个一个都在做做内容工具包括我们现在已经出了一些 KL 去带货包括我们去做社区做很多 Use Case 内容上的引导等等的全渠道的这些包括一些必要的营销等等其实都会做但是

那更深一步的问题是像 AI coding 包括你现在在做的某种程度上也是一种技术平权嘛那它带来整个生产力重塑会是什么样子的我们觉得在这个阶段还没有到生产力重塑的阶段是在供给需求但是我们觉得基本上会在 3 到 5 年上在一些场景就我们切的这类场景里面它会变成一个 infra

大家会认为代码这个事只要你调算力就能够完成的事本质上就是由以前的人来写代码今天变成了 token 就行了

它具体在商业世界里面它会带来什么样的生产力和生产关系以后大家不再受限于代码供给不再受限于程序员就简单来说比如说如果是一个大公司像您说的 500 强如果我只是其中一个部门我自己并没有配程序员我可能就不用求着中台了我自己也能搞定一些事情对吗如果我是一个独立开发者那我可能可以以更低成本和更高效的去做一个 MCP 就做一个 demo 对

对当然对这种得看它的场景也可以做成熟的商业化产品一步步迭代你们现在是实现了编程临门槛对吧对技术上面实现了是效果上呢效果上也实现了剩下的其实确实会涉及到产品的打磨比如交互很烂对吧也不会很烂这就同时听了不开心就是要优化要优化其实工程还有很多点去完善其实都是剩下的不是卡列我卖不过去都是给予过去的经验可以复刻的事

不再说是我不知道我也没有别人可参考过去也没做过咱们先做做看对这也是我刚才跟你讲的大部分创业者对自己的产品至少在 CEO 的口径当中都是充满信心但你真的开放测试之后可能还是会收到一系列赌槽但我的理解是某种程度上今天 AI 创业者需要的就是这些其实他就是要一个先发效应然后让这些用户的反馈帮助我去

快速的迭代这里面其实有一个假设是说 ok 你这么做的用法能迭代吗不能吗有谁不能吗你看到今天有谁迭代出来了吗你想想有没有迭代出来的因为其实刚才很多源头是基础模型能力的问题或者说你对模型的把控能力把它位置要摆对的一些问题这些都是大问题那你怎么解决呢你就有信心你一定能迭代出来

首先就是我们自己训练这个模型我们首先要能去碰它的 print train 从基模的训练层面开始解决那个闭环明显缺着一环的那肯定感觉不太对如果别人的技术模型做的就比你好怎么办就比我好那很好我也可以用它的你就用它的我不有所有的每个节点的微调数据吗那你产品上线之后你最期待的反馈是什么真正的反馈不一定是从用户口中来表达出来的而是真正的买点数据表达

就看他跳速率等等一些点有时候用户提出的需求并不一定是真实你还要做很多分析的点用户给你掏多少钱才算是帮助你完成这第一轮的笔换不太是

钱上面的事而是说它生成的软件它要部署说明真正这个内容达到它想要的结果软件的出口是玩它吗是扭单机吗是什么吗我觉得还可能是用它就是它用你的产品生成的软件真正可以面向用户了对那个产品是从我这拿走要部署

是放在一个服务器上给你今天访问一个网站那个网站是有部署那问一个外行的问题你怎么观察到它部署没那个很简单就是我们有 Deploy 那个按钮我们会把部署这个事跟云上合作好对都是可追踪的你的产品上面都买好了这个追踪点是吧对它点了部署最后部署那个每一个环节我们跟云上合作那些点上我们能看到包括它那个在维护包括说大运用软件最主要是用的我要改需求我要升级对吧我要增加一些东西还会回来再改

你买了这个 iPhone 手机你拆机然后就能用上了对激活了 OK 明白因为你自己也是投资人嘛你在融资的过程当中遇到的投资人你觉得他们没有问你但是他们该问的问题是什么

我觉得好像问题已经足够多了但我觉得更多的是今天可能面对大家还是对这个事的认知如果以前市场好的时候没有一堆这种卡点的时候可能我们投一个赛道我们会去选全球最好的都会交流到那大不了我们去投全球最好的团队但今天会发现科瑟这样的或者一些 coding 产品在硅谷或海外先行的时候大家失去了交流的机会

也失去了说大家主动去了解它或者说体验它这个其实是很难的一件事我觉得大家还是没有跟创业者或者跟一些最好的团队没有同步失去交流的机会怎么理解今天哪个投资人跟 OpenAI 的核心团队真正交流过对吧是因为现在的逆全球化吗过去可以吗过去其实基本都可以

不是很敏感的军工行业这些肯定不行比如大家做自动驾驶对吧那基本上就是 OK 我国内的那我基本上全球最好的我也能交流到包括特斯拉的核心关系为什么要选择这个方案基本上他也能交流到以色列团队也能交流到对吧今天那边飞机可能没法降落就会有这样一堆问题但是今天回到大模型有谁真正跟 Ethiopics 老板或核心团队交流过深层次的问题

没有甚至连他持续的大家的这种在他们的 blog 或者访谈上第一手的信息都没看我们说有时候大家就看记者转了很 N 多道的一些东西你觉得这是因为现在中美科技竞争的大环境带来的一个最明显的改变对就很多层次的很多层次不太好展开讨论就很多层次的那你个人有办法补足这些信息吗没办法也没办法市场什么样我们接受它适应它

好了本期节目就到这里欢迎在留言区评论分享听后感也欢迎留下你想听的选题或是嘉宾这期节目已经在苹果 podcast 网易云音乐 QQ 音乐豆瓣微博音频等平台同步上线欢迎订阅我们下期再见