风言风语听见科技与人文的声音大家好我是 Justin 大家好我是自立好希望我们最近的更新频率能上来美好的愿景
美好的 严谨今天就最近我用这个 AI 写代码写的还是稍微有点爽的所以我们就这个 AI 写代码的这个话题来聊一下看一下现在的这个所谓的 AI 啊它到底能够帮我们帮到什么程度毕竟之前 GitHub Copilot 出来的时候大家呼声还是蛮高的对吧还是觉得哎呀终于来了一个这个智能小帮手
但是这个 Gihako Pilot 出来有多少年了起码 Gihako Pilot 得出了有三年了吧才两年吗不止吧我记得的话应该是差不多两年它是很早就出了但是它很早出的那个时候是不好用的后来有了 CHPT 之后它变得好用了一点它最早出是在 2021 年就出了所以确实是三年了但是那个时候不好用
后来微软跟 TrackGPD 合作才把它变得更智能一些但依然不好用主要还是因为它不太确定我之前也买了 GitHub Copilot 的会员然后用过几个月发现我确实是不太用得来这个东西它不够智能所以我就把它给停掉了我的理解 GitHub 的 Copilot 它厉害的点在于它拥有全部 GitHub 的代码
的知识库作为训练的这个素材对吧不管他有没有真的去用啊但是至少他背靠着自己那么大一个平台那我觉得他拿到了所有程序员写的各种
各样的这种代码然后再去学习可能会强一些但实际上使用下来确实就没有那么强对只有公开的我们早期也是这么想啊进水楼台先得月嘛对作用给 hub 你还能差到哪里去那实际上用下来效果就是不太行本来呢你是写一些注释他就会帮你去生成代码
但生成的代码表面看起来是能用的实际上跑起来它也确实跑起来了但是你一眼就看出来这个代码是不可用在生产环境的你还得自己手改一遍既然我都要改一遍了我当初为什么还要用给 Hackle Pilot
它的用处是非常有限的不是说它完全没有还是有一些地方是有用的比如说帮我改某一行代码然后我懒得改就是那种焦水的代码或者是格式化的这种就那种很重复的那种它用起来还是可以的
但确实不太能够成为我日常的真正意义上的这个写代码助手直到最近啊那个 CloudSonic 3.5 就是这个 Anthropic 旗下的这个 AI 大模型它和那个 OpenAI 的 ChatGBT 基本上是对标的竞争关系两边是在互相竞争的对
但是 GPT-4O 它有个比较大的优势就是它背靠 Microsoft 它有那个 Bing 后来可以联网了所以 4O 其实可以说是在目前的所谓的通用的大模型里面确实它可能是最强的尤其是后来
他加入了那个什么拍照那些功能还有多模态识别啊这个做的好对他既能识别图片也能够帮你产生图片就是整个多模态做进来而且他做的确实最好所以他现在已经是这个通用的大模型里面第一梯队当之无愧的第一啊确实也跟别人拉开了一点差距但是在第一梯队里面其实差距也没有
那么大就比如说这个 cloud3 这个 opers 你跟他聊天的话其实基本上跟 4o 的那个体验也不会差太多就在第一梯队里面但是我们什么时候能感受到巨大的差距呢就是第一梯队和第二梯队什么是第二梯队呢比如说那个豆包比如说那个温馨一言比如说 kimi 这种你就很明显能感觉到他和 4o 之间还是有一个比较大的差距
我有点感觉他们就像去年的 CHPT 的 3.5 之后强一点点的版本但是还没有达到 4 欧的水平我不知道你怎么看对 之前我们不是看过有人玩花火去测高考题目的时候也能够展示出他们的一些强弱点而且最近国内不是搞了一个大事情吗什么联合了 15 家模型去
聚在一起好像是周鸿祎搞的然后去跟 SO 去竞争说我们一个人打不过你但是我们每个人派出自己最擅长的比如逻辑理解推理数学或者是中文对吧去跟你打可能就比较好打 AI 搜索这一块那结果呢现在在搞真的搞出来了这样的一个网页然后里面可能有 15 家模型可以去选然后去分拆任务这样子
对也是一种思路我只能说对对对就打差异化竞争嘛那通用的搞不够你我搞差异化竞争那你要这么说的话 Cloud 3.5Sony 其实也有点这么个感觉就写代码写的比较杰出写代码是他的其中一个能力他比较像一个理科生
就是 4 欧的话他更像一个啥都会但是胡言乱语的一个人他很容易发散对但 3.5 就像那种 nerd 就是标准的你给他约束好了之后他就不会变了对上周我和资历才刚用那个 Sonic 3.5 去尝试生成我们上期节目的那个时间轴哇之前我们是试过
用 TrackGPT 来生成的其实我从 3.5 之前的时候我就拿去试过了然后他每升级一个版本我都希望他能帮我去生成我们播客的时间轴因为我们编辑播客时间轴其实不是一件容易的事情我们动不动一个小时的节目你录完之后你可能就忘了
对啊如果你真心想要去做一个很好的时间轴那你最好是从头听一遍但我肯定不干这种事情我做时间轴我就是先拿那个开源的 whisper 也是 openai 旗下的那个语音转文字的那个 model 在我的本地把语音转成了文本就是你平时看电影会用的那个字幕带有时间戳的文本嗯
对的然后我就拿了这个文本因为我本身路过这期节目我对它有印象我就去找那个关键点在哪里然后我就总结一下把那时间戳戳上去就好了这个是我以前的做法但依然这种做法还是挺低效的还有更低效的那就是我的做法因为我拒绝用你那个小工具就时间轴的那个工具对你从头到尾听一遍我是从头到尾在 audition 里面用快进的方式听一下段落就是我大概也记得录的过程中咱们有几个段落
然后就拖着那个时间点之后用手动的方式把它打到那个点上去但这样的话我也试过这样的感觉是比较容易漏因为毕竟你如果用眼睛看文字那个阅读效率肯定是比你用声音听效率高得多得多但实际上不是的因为我们两个人去聊特别是像科技快乐星球还有一些那种嘉宾节目的我们鬼本来就是分开的我们的鬼是分开的那你用视觉化的去看就能看到这一段是谁在主讲
那这一段的内容的下一个衔接点应该就是我们启程转合的一些地方包括我 cue 你你 cue 我的一些地方就会换话题了如果可是话加上这个时间戳的文本同时有的话我觉得就可以满足我们的诉求可以满足你的对
对但反正我现在就是先看文本因为阅读速度快嘛但最后我就把整个的文本全部给到了这个 GPT 从 3.0 应该是 3.5 之前的那个版本到 3.5 到 4 欧我每个版本都试过他每一个版本都给我一个胡言乱语的结果其实就是不能按我想要的给我你还记得上周吗上周你把那个带有时间戳的
所有的字幕给我了一份嘛然后我不服嘛我说那我去用 4 欧生成一波你用 Cloud 生成一版然后 4 欧给我的果然就是胡言乱语吧胡言乱语的对我每个版本我都试过了它就是胡言乱语的当时你那个 Cloud 3.5 给我的那个版本我就震惊了大家可以去看我们上一期节目的时间轴基本上就是 AI 出出来的
非常的好用对他说出来然后我们再修改了一下那个文字基本上就是他能够识别出哪一个时间节点是比较关键的而且还能做一些总结这个就非常非常棒了是非常好的提效工具啊非常绝佳的应用场景对而且我们给他们的那个 prompt 是一样的但是 4 欧没有理解我们想要的格式是一个精简的摘要
而 Cloud 理解了这点就还是很强的你也不能说 Cloud 理解你应该说 Cloud 3.5Sonic 这个模型对对只有这个因为 Cloud 它有三个模型它是分开的不一样的就像 GPT 也有多个模型但 GPT 它专门只做一件事情就是我只给你一个通用大模型
所以他就是特别擅长胡言乱语但 CloudSonic 他据说三种模型他现在一个是 3.5Sonic 说是他最智能的模型然后有一个 Cloud3 OPPOS 说是比较适合用来辅助你写作的另一个 3Hiku 是最快的模型那我猜可能是一个精简的一个小模型
那这三个模型呢可能说分别会做的事情是不太相同的但我本人因为一直在写代码我就用 Cloud 主要就是为了写代码所以基本上都是用这个 Cloud 3.5 Sonic 我当时在 Twitter 上面看到别人说 Cloud 在 Reddit 上面火了嘛然后我就去试一下你们都说他厉害我就去试一下试了第一下的时候我就震惊了当时我是用他来干什么来着稍等我去看一眼就还能记得
他有历史记录其实 Cloud 我很早就有拿来做尝试了我拿 Cloud 去做一个事情然后我震惊了我最近在做一个开发者工具
我让他帮我解释一些我不太了解的代码术语并且我让他生成一些可以给我用的小的函数就比如说 ULID 是个什么东西你帮我生成一些函数来实现这个东西我说的也不是那么精确就还相对比较含糊他帮我实现了一个 swift 的函数并且是可用的
当时我就震惊了哦原来他是能做这件事情的但同样的震惊呢其实早年当 GPT3.5 出来的时候我也被震惊过因为当时我拿他来写 share 脚本而且他的 share 脚本
对写第一遍的时候它看起来是能用的但是当你去跟 GPT 说我想要修改这个 shell 脚本的某一行的时候不好意思它不会只修改某一行它通常会给你修改很多行我记得你那个 shell 的正经点我当时是让他给我写那个视频去转音频或者视频转格式的那种脚本的时候他写的非常的好因为他对于所有的参数的理解比我透多了我得查文档他不需要
对啊这种就非常适合拿这种大模型来帮我们生成但 GPT-4O 它的问题就在于你没有办法通过自然语言去跟他做一个精准的调优而 CloudSonic 3.5 它可以就我刚才说的如果他帮你生成了一个需要脚本然后其中某一行你觉得他实现的不够好
你可以用自然语言跟他描述说我要把这一行换一种实现做成什么样 Sony 3.5 会保留其他所有行完全不变只改这一行他做得到他只做他必要的修改现在的 GPT 的 SO 也可以做到因为他后来加了一个 memory 功能他在 memory 上把你历史的所有的行数都记到了比如你说我要改第 14 行怎么怎么样他也是可以办到这个点的
但改完的效果可能其实 4 欧是不行的现在还不行可能你太久不写代码了就是你很久以前还写过一点前端的但现在你都不写代码了这是一个问题我们如何去向不写代码的听友们去解释就什么叫可用什么叫就是觉得质量可以了对吧对或者再换一个例子因为 Shell 脚本这个例子还是有点太简单了因为 Shell 本来就是一个很简单的东西但它是一个非常实用的场景
另一个例子是我后来拿一个网页上的一个截图就是那个 coolers 的话它是有一个工具是可以帮你做一个颜色的转换的你可以 RGB 转 hex 或者是转别的东西我把那个界面给它截下来然后我跟 Cloud 3.5 说你用 Swift UI 给我生成一个
他真帮我生成了一个勉强能用的这个时候呢通常情况下你直接拿来用的话会有各种各样的问题那么你就可以跟他说左边那个空间那个按钮我希望他怎么怎么样然后他就会实现一个什么效果你可以这么跟他说他会理解你说的这句话他
他表现的像一个人你知道吧表现的像一个实习生对吧就像是能听懂你在跟他说我这个按钮不应该这么实现你给我换一种做法或者是你跟他说你不要扣一堆的颜色值在这里我的颜色值都是可变的他就会帮你重写那部分代码而且他重写的部分是跟那个输入相关的部分他不会瞎搞我懂了就是他不会像之前我们每次改一个小点他就把头尾也都改了就很烦
对就 4 欧会瞎改 4 欧会改出来一堆你没要求他改的东西对这个让我想到跟那个 Darley 还有之前的一些文生图都很类似我把图已经给到你了然后呢我说哎呀我需要他戴个眼镜结果你把他头型也给我改了
就很烦没错但后来不是出了这种圈圈圈举步然后说只给这里其他地方不要动的这种能力吗你说的对的它搭理出了用画笔图的功能之后你可以更精确的去描述这个东西了但是 CloudSonic 3.5 它就有点像
带了画笔的功能但是你可以用自然语言跟他去交流的非常离谱所以后来我就拿他去尝试做一些比较复杂的任务我发现他有些是胜任的有些还是有点不太胜任的比如说我虽然一开始被他震惊的是我截个图他就能用 savety UI 帮我把界面实现了这个省我不少功夫我直接想要做一个什么界面我直接复制粘贴他就帮我做好了
表面看起来是这样子的但实际上现在 Cloud 对于 UI 图像的理解没有那么到位怎么讲它做出来的东西总是会有点别扭就它不是用一种最佳实践去实现这个 UI 的哪怕它做出来看起来长得还 OK 但就是它不是一种最佳实践所以我在 SplitUI 这一块的代码的调优上面
还没有做到过一次过能让我直接用上了就可能让他做一些很精细化的就是这种很子任务时候可以你像之前我们前端去写那种页面的时候有两种写法一种是用合模型一层一层的去写逻辑结构然后去把它们调好位置还有一种人就是可能有一些刚入门的同学可能会选择用全部用绝对定位相对定位用绝对定位然后全部贴在这个页面上
你看起来整个页面是 OK 的长得像设计稿但是如果你去拖一下它的那个字适应或者小屏幕就露馅了你说的这个是的不过你说的这个有点上古了现在基本上只要用 view 用 vit 就不可能会出现你说的这种因为已经不允许你写这样的代码了是但是 cloud 可能就会用这样的方式去实现你的你看是好的绝对不会现在可以不会了不是 cloud 不会对
我是说我类比你刚才说的 Cloud 去给你实现你给他一个截图的这种东西它的实现方式可能不是你想要的其实也不是它实现的也还 OK 也没有那么糟糕其实但是就是距离你想用的那种生产代码还是有差距的所以在 UI 这一块我觉得他现在做的还不是很好还需要学习还需要进步那有没有可能是你的要求太高了呢
就是它可能是对于普通人来说已经是具备的那种生产环境了就只是对于你来说因为你经常 review 很多很资深的这种程序员的代码你可能还是要有一些改进和意见对吧你这个就涉及到我们今天要聊的一个话题了就是像 Cloud 或者 GPT 这样的就是用大模型来做代码生成它到底适合什么样的人你说的那一种从特别浅的角度来说它勉强算是 OK 的就是你一个
完全不会 SwiftUI 的人或者是你完全没有写过代码的人使用大模型帮助你写出了一个工具看起来这个工具是可用的因为它帮你解决了一些问题完成了一个需求
那么从这一个角度来说从它的第一个版本来说 OK 它是胜任的你说的没问题但是你总要往下开发吧除非你告诉我你用大模型做出来的应用它永远只停留在这个差不多 1.0 的版本如果是这样的话那我接受那它就是一个生产环境的代码没问题但只要一旦你想往下迭代不好意思
这个就需要那个操练 AI 的那个人本身至少得懂一些怎么写这些代码的技术背景否则你真的没有办法往下走对所以这个真不是说你一定要说我的要求高或怎么样这个不是的因为客观事实摆在那里你只要 1.0 你说我永远以后每次用 AI 做出来的我只做 1.0OK 那你赢了那你就这样搞吧
你永远不会有 1.1 了但只要你但凡想要网上迭代一点东西不好意思你最好是具备写代码的技术背景而且我发现 Cloud 3.5 想要用的好的话最好是你得是一个经验丰富的程序员否则的话里面有很多坑你不一定能那么快识别出来也不一定能够跟他配合的很好
举另外一个例子你之前用那个 Sano AI 去生成歌曲对吧你发现专业的做音乐的人和普通玩家的差距是不是就差特别多是的包括章节段落然后包括这种一开始的弹幕弹出鼓什么时候进那些专业的人写出来的 Project 里面就非常的精准比如说我们可能只能主歌副歌重复然后结束你这样都已经很不错了我看
你这样都已经是起码已经懂一些阅历在里面了周杰伦的歌听一听你也会好吗 OK 那 anyways 就是大概这个道理就是你在一个经验丰富的人手里你可以拿 3.5Sony 来作为你辅助你去实现代码生成过程的一个工具它是你一个好帮手但如果你是一个完全不懂的人那么你很可能会被他忽悠反过来他会反噬你
因为你分辨不出这个代码生成出来之后到底合不合理你既然不知道它合不合理你也就不知道哪里下手去让它改得更好对不对所以我们刚才说 Sony 3.5 它现在在界面就你给它一张图生成界面这里做得不太好那么它做得好的到底是什么呢
毕竟我最近每天都在用我觉得感觉已经有点快离不开他了做了 Copilot 的想做的事情对而且 Copilot 如果能够有他这么聪明的话现在 Copilot 应该就很好用了现在 Copilot 就是没有他那么聪明你还记得那个数字游民的最牛逼的那个 LevelsIO 吗 LevelsIO 这个 handle 就是那个 Trader handle 他的名字叫 Peter Lebel 那个人就是
他最近跟另外一个人合作做了一个基于 VS Code 的一个编辑器叫做 Cursor 这个东西就集成了 ChatGPT 还有客家模型在里面对使得
给他 Copilot 不再变笨了就是他做了一个聪明版的 Copilot 只是换了一个好用的底子嘛对吧就成了没错就让他变得更聪明了更好用了然后我去用了一下我还是不是很习惯我现在还是切回我的 S-code 和 VS-code 用聊天来做那用聊天怎么做呢目前我让 CloudSonic 帮我真正完成的可用于生产环境的代码有哪些呢
主要是有两类一类是用在服务器的我是基于 node js 用 type script 去写的然后基本上服务器的东西说简单不简单说难其实也不难因为大部分的业务逻辑你就是一个请求如果你是跟客户端配合的话你比如说客户端上来请求你一个东西然后你就去 db 里面读写一些东西然后你就回一个包回给客户端这就是一次请求一次回报这就完了对吧
这样的逻辑它自己是一个自我闭环的过程所以你可以用 Cloud 描述给他说我需要完成一个基于 Express 的 Server 的 API 然后我需要做点什么你帮我写出这样的代码
如果你为了让他的写出来的这个代码跟你的整个后端的语言风格以及使用到的基础库一样的话你可以把你的其中一个 CGI 的那个文件传给他你跟他说参考这个写法帮我写一个然后他就会因为我们一般会封装一些方便方法会有一些什么请求检查也会有一些校验逻辑
会有什么 DB 的读写逻辑这些都是通用的嘛那他其实就会直接参考你上一个给他的那个去很聪明的调用过来然后你描述什么他就帮你改什么
很快我用 CloudSonic 3.5 就完成了一个简单的 CGI 调了一下发现可用很开心然后就上线了结果这个东西不可用为什么不都调过了吗主要是当你遇到复杂场景的时候你必须要很耐心的去跟他解释你这个代码为什么写不对因为他毕竟没有在跟你的服务器直接交互
也不是就比如说我写了一个请求这个请求是要去另外一个服务去拉一堆 XML 回来的 OKXML 的其中一个字段它是一个 String 那这个 String 呢它其实是分了好几节就每个空格代表一个字段这个字段是什么什么什么
就是我去苹果的服务器拉了一个 ISX 回来这个苹果服务器告诉我 Xcode 15 Beta 多少多少后面括号是他的 bill number 这一段 stream 其实它就有很多个代表的信息在里面了你需要去解析这个 stream 那你解析这个 stream 呢只有一个 case 的话就很简单那 Cloud 3.5 就会根据你提供给他的一个 case 去写了一堆解析代码但实际上
他这个 String 是可以多变的呀对他可以是 Xcode 15 beta 他可以是 Xcode 15 没有 beta 他可以是 Xcode 15.1 他是不是还可以是 iOS 对他可以是 iOS MacOS 任意的一个东西所以 Cloud 你需要告诉他很多的这种边界的 case 然后尽可能在提前的阶段就跟他讲好你可能会遇到的东西分别是什么
他就能够帮你去写好但如果你只是给他一个简单的 case 他真的就会像一个刚毕业的实习生一样就很直觉的就写出来一堆看上去能 walk 的代码但是这个用力可以跑得通对吧对对所以我后来做了一个什么事情呢就是我担心他写的代码老是给我这种只有某些 case 能 walk 的我就让他帮我写单册
你让他自己把测试做了我让他自己测自己然后我看他的 test case 我大概就知道他的思路是怎样的就是你到底有没有把 sql15 sql15.1sql15.1betasql15.1beta 再括号都给我写进去没有的话我就怀疑你这个代码是不是写的有问题怀疑他的偷懒没有把所有的测试都做完
也不是没有把测试做完而是他没有把逻辑写完备对而且 Cloud 其实在很多方面帮我们程序员去解决的问题是非常省时省功夫的比如说写正则表达式又是一个我相信每一个程序员都不愿意写正则表达式虽然它看起来很酷但是你要手抽一个是很费时间的对那 Cloud 帮我去写正则表达式我看起来
屌爆了这真正表示他是一用直接都能用上了妈的但又出现这种问题换一个用力过不了换一个用力就不能用了就很坑爹所以我就不得不让他帮我写单册那让他帮我写单册的另外一个好处就是我也不想写单册程序员都不愿意写测试代码
所以他帮我写单册的话我偷懒的部分就是我没有动手去真的写这部分代码但我花时间的部分是他帮我写出来的测试 case 的每一行代码我都要过一遍我要看你是不是真的写对了不只是 review 了实际上就是你得把它当做一个工具
你不能够彻底的信任他对就你其实只是没有敲而已但其实都过脑子了对吧对必须要过脑子因为他真的会出错的我觉得呢在给他 copyright 的那个阶段你会把他完全当做一个白痴就是你会觉得说他就是一个纯粹按摩版
吐出来的代码你是几乎不可用的所以在给他 copylet 的阶段他吐出来代码我全部都是手动改改改改改基本上能复用的地方就是他的函数名复用了他的整个结构我复用了但是在到了 CloudSonic 这个阶段呢我发现他基本上可以等价于一个计算机科学刚毕业的普通学生的那个水平了为什么说是普通学生呢首先他体现出了应该有的聪明
这个大模型的聪明我觉得大家应该都是有目共睹的因为他知道的东西很多然后你只要问题描述的足够精确他一般都能给你一个特别不错的解决方案这是我觉得大家用大模型的时候都会遇到都会感受到的但是与此同时呢他又像是一个没什么经验的刚刚学会写代码的很聪明的程序员
就是你虽然很聪明但是你经验不够丰富需要我不断的去写很多的用自然语言描述各种各样的 backcase 告诉你说你不可以这样不可以这样不可以这样最后你才能够帮我给出一个生产环境能用的代码所以为什么我说一定要使用者他是一个经验丰富的人因为如果这个使用者他都不知道这些 backcase 的话他就没有办法告诉这个 AI 这里会有这么多的坑你要绕过它
那有没有办法就是你一开始把这些前提条件都告诉他呢就说你的所有接口的地方都要考虑成动态的啊
然后你要去网络上检索更多的 bad case 来做这个测试他不能联网但这个不重要他不能联网不是解决你刚才说的那个问题的根本途径因为 4 欧做的也不好他即便能联网我相信他也做不到这些然后我想说的是 bad case 只是我刚才提的其中一种 case
这个甚至不是最关键的因为这种东西呢你说的上网搜一下也能够找到现成的那确实是更关键的是我举个例子你在 iOS 上面有一些数据需要存起来那么一个没什么经验的人他可能会直接明文用 JSON 写在了 user defaults 里面啊
我刚才说的都是一些术语就是在 iOS 上面我们存数据有很多种方式但是 user default 是一个非常不安全的官方提供的可以持久化存储的一个接口这个时候一个经验丰富的程序员就应该要告诉他你如何去存一些敏感数据你如何加密你是否要使用 keychain 你如果用 keychain 的话你用哪个东西更好这些东西不是你 Google 就能 Google 回来的
这些东西是你要有一定的写代码的经验和技术背景你从一开始写的时候你脑子里面就是这么想的那 CloudSonic 3.5 能帮你干嘛呢就是本来你要吭哧吭哧写这堆代码现在不用了怕一下给你写完了这是我觉得最爽的地方
所以我觉得 Cloud 目前帮我解决的问题一个是我刚才说的这种就是我先从一个简单的需求开始描述给他包括我怎么新增一个数据增三改查全部告诉他然后增三改查应该在哪个线程我是要做成有锁的还是做成无锁的我要不要开一个 dispatch queue 还是说我要用新的 swift 的 task
还是说我用一个 operation queue 等等这些是由我来决定的我本人告诉他我要怎么去写然后 Cloud 就会帮我去把这个写完写完了之后我会自己跑起来发现能用我就用的用着用着会发现需求变了那需求变了怎么办我是不是就要改原来的代码实现了这个时候 Cloud 厉害的地方就在于他能够读懂我几种不同的文件并且知道他们之间是有联系的
比如说我 UI 上有一个按钮以前它是只允许增加一个新的东西塞进去后面它可以修改这个东西了那于是我的 UI 要改我的数据存储和逻辑的部分要改我就告诉它这些是我的哪些文件负责什么部分的我现在要新增一个需求这个需求是在原来的这个基础上你帮我右滑然后就出一个 edit button 这个 edit button 点了之后我就可以弹出一个什么东西弹出这个东西之后我点保存它就会发生什么事情
Cloud 3.5 它能够完全理解我说的这些是什么然后就帮我去实现了这些代码的修改应该是要改好几个文件对吧好几个文件都要改甚至有新增的数据结构它会自己新增有新增的引入它会自己去引入当然这个任务我刚才描述的是稍微有点复杂的一般我不会一下子搞这么复杂因为容易出错然后它这堆代码修改好了之后我再 copy 回我的 IDE 里面然后我会打开代码的 diff
去看一下他到底改了啥对每一行每一行看一遍到底有没有改错看了一遍没改错好那就这样吧然后他有时候确实也会犯一些比较低级的错误像我说的用 user default 明文的去存一些东西那样是非常糟糕的即便是你用 AES 加密了存在自己本地确实也不是一个很安全的做法明明有 keychain 能用为什么不用 keychain 诸如此类的等等这些他都会犯所以我都得看到了就跟他说看到就跟他说
也不用批评就纠正就好他就会帮我去给他改回来我平时在用他去不管写脚本还是写一些前端代码的时候经常会批评他就说他这里做的不好应该怎么怎么做然后他就会先道歉然后再帮我做然后我们团队的几个人就把这种过程戏略的称为 PUA 就说这个代码不行啊你再 PUA 一下 GPT 看他能不能再给一个更好的版本出来就很搞笑这样不好
不要仅仅是说这个代码不行你要告诉他哪里不行就告诉他哪里写的不对就应该换一个思路或者怎么怎么样我们就说这个过程一来一回的在不断的纠正他他可能没有考虑的很周全以前用 GPD4O 的时候我会跟你做一样的事情就是有一种说我知道正确答案而 4O 是在乱讲的那种感觉就是有一种从上往下俯瞰的感觉但现在用 Cloud 3.5 的话我不会这样想
反而我会去倾向于平等的跟他对话就我会倾向于从他那边多套一点我不知道的东西就是因为我很担心我那句说你这里写的不好这句话会直接使得他对吧
对我担心他在否定他之前给我的方案而事实上我其实不能够 100%的肯定说你现在给的方案不是最优的我希望听到更多你为什么要这样做以及整个业界通用的遇到这种情况怎么做更好我最近跟他的对话是这种类型的而不是直接就说你这样做的不对
那你这个可以解决我之前的一个诉求我之前有企图使用 GPT4 去做 review 的相关的事情我会把这个文件给到他或者说把我这一段样式给到他然后我说你帮我看一下我这里面有没有什么地方可以改得更好的然后他其实在这个工作上没有完成的那么好因为他给出来的改得更好的那个点我不认可我觉得
不是一个更好的方案但是如果他聪明程度到了说 3.5 的这个状态那他是否可以用来 review 你的代码就虽然说你布置任务的时候他没有办法像一个资深程序员但是他 review 你代码的时候是不是可以呢 Cloud 3.5 他能够做但是呢我依然不建议你用特别含糊的通用的
提问去向他提问因为所谓的好其实有一万种好所以不管是 Cloud 还是我遇到这种问题我都可以答出一万种比这个实现更好的实现但它是不是真的是最好的我的目的不是说要用它那个好的版本
因为我是懂的我懂我这段代码我只是想套跟你一样我说你帮我看看我这代码还有没有可以优化的地方我的话术是这样的然后他会告诉我说 12345 我大概这样几个点然后我看完我就会觉得 123 就在扯淡可能第四个点是我没想到的然后我就说这确实可以优化如果单纯只是想要少一些没想到的这个问题问是可以的不过我最近跟他聊的过程中
通常情况下是不会聊这种范的通用的好和不好而是我会比较具体的去跟他讨论我会把他当做一个有点像合作的同事或者合作的编程伙伴
这种方式去跟他讨论因为我心里很清楚我现在的这个存储方案它未必是我想要的最优解但是呢基于目前的用户体量和我当前的项目状态以及我的开发进度那现在的这个做法可能是我当下的最优解所以我并不需要你给我一个所谓的最优解是一个什么什么样更复杂的方案我并不需要那些
我只要知道我的方向上这个东西我还能够有什么改进就好了所以通常我会比如说当我做性能优化的时候
早期的那个现成模型是很简单的就是随意开一个 GCD 或者随意开一个 Task 就是你的一个类一个 service 我在想要怎么去跟你就不要讲这一块因为这很难理解是的非常难以去用这个普通人的语言去表达出来但总而言之就是之前的现成模型比较简单然后我就去问他说因为这个过于简单的现成模型使得他不可控
就有点像很多条火车轨道然后火车太多了之后把我的这火车站给挤爆了然后我的手机就卡住了差不多是这样因为很多火车想进站然后我就问他说能不能够有一些什么好的解决方案能够去改进我自己会向他提我说如果我用 NS operation queue 好不好如果我用另外一个方案好不好
如果我用某某某方式这种提问方式还蛮好的对他就会帮我总结说你说的这几种都挺好的能解决问题但是呢限于什么什么条件在这个项目里面你用什么什么会好一点甚至他能帮我把 demo 代码写出来那就很一目了然了用某个方法看起来啊确实是会比较好一点比较简洁一点诸如此类的不错然后呢我还用他解决了一些我不懂的问题就是
就是我是一个多年的这个客户端的开发所以可能像苹果平台的客户端开发的领域的东西我知道的会多一点但是在后端领域里的一些比较深的东西我了解的其实没那么多比如说后端的安全应该怎么做比如说你现在做一个小工具然后呢
通常大家都有一个登录用户名密码的一个校验的过程对吧你有一个用户名密码那后面我就有你的登录态了有你的登录态我就可以拿着这个东西去做校验了那我就可以确保你来我这个服务器拉东西一定是这个用户是合法的我就会给你东西对吧但问题是我们现在做一些小工具它往往是没有用户的
没有用户也没有登录态那我怎么知道你是一个合法的用户还是一个不合法的用户如果你在后台不做任何的教验的话那就意味着任何人都可以来用你的 API 去做一样的事情了那你不就相当于损害了你的这个付费用户的这个利益了吗因为你这个服务反正谁都能用对那付费的意思是什么为什么我要付费呢
对啊所以我就会去问他一些这种我不太懂的但是当他给出解决方案的时候我又能读懂哦哪些方案是合理的哪些方案是不太适用我的然后我就去挑挑完之后我还把代码给他他就能够帮我修改我原来的代码去适配这种新的解决方案嗯还挺有意思的
你这个我就我知道一个类比你这个就很好去类比了就是一个画师他可能只擅长于这一类风格的他不擅长于抽象的但他有一天就是想要接抽象相关的那再有一个 Darling3 可以绘制抽象相关的好他的任务绘制完之后他是可以选出他想要的是哪一幅的对吧对跟 Darling 还是差别比较大因为 Darling 你就不能二创了
除非你说 DALI 给你的图之后你拿到了啊激发你的灵感你拿自己再手抽一个新的那这个可以但我们代码其实是能用但是一般你不会真的直接 copy and paste 然后直接就上了你还是会自己去改一些东西的嗯就比如说我说那个安全的那个校验的那个点他做好了之后呢我会去质疑哎你这段代码写的不是很合理啊这个不是很容易就被人家把你密钥拿走了吗那你还加密一个鬼
然后他就会告诉我是的非常抱歉你说的没错对那我就会问他说通常这个应该怎么解决就是你这个很容易被人拿走然后他就会给一堆解决方案然后我再去选一个然后我们就按这个来吧
就我隐隐有种感觉就是当他对你的项目了解的足够多的情况下现在 Cloud 3.5 真的就像一个你问他问题他就会动起来的一个盟友他不是一个真正的盟友因为你跟你同事一起干活的时候呢通常接到一个任务你也不用去问你的同事你同事自己就能做了对吧因为他是一个完整的人嘛对啊但现在这个 Cloud 3.5 你始终得不断的问他你不跟他聊天他是不会动起来的
所以他其实还是占了你一部分的时间的你不是说放着让他自己跑起来的他现在没有这样的一个能力所以我就想就是有没有可能我们因为之前也有这种 AI 的形态就是他在里面有不同的角色他训练了不同的角色然后各个角色之间去协同去自动的自驱的产生一些东西 auto GPT 类似那种对就是产品经理给到了一个 idea 然后这个 idea 接下来有一个 GPT 区域
拆解它然后一步一步到下面大家协作的把它推出来而不是说我要一步一步推着你然后才走这会不会是未来的一个形态呢我觉得跟你说的这个有一点点不一样你说的是多个不同的 AI 他们各自擅长的东西不同但目前来看 Sony 3.5 和那个 Track GPT-4O 他们都是一个通用大语言模型而且都做的还挺好的就他们各个方面都能做啥都能干
做的都还挺好的我是说我补充一下我知道我知道驱动的那个部分我想说的接下来的部分就是可能你不再需要那么多个分开的 AI 了只需要有一个但是你得有办法去自动驱动它
其实现在你要说能不能实现的话呢也不是不可以就是你想办法写一个机器人这个机器人是比如都是用 Cloud 3.5 然后他自己跟自己对话然后他用我纸巾对话对直到他最后 match 到你那个中指条件就像你写了一个 while 循环
比如说你现在跟 Cloud3.5 说你好我们来其实发出那句话的那个人也是用 Cloud3.5 的 API 知道吧然后两个同样的 Cloud3.5 在那里聊天说我们来想一个 app idea 我们来写个计算器比如是这样我们来写个计算器对然后他就顺着这个思路往下走你过 5 分钟去看计算器出来了然后就把代码一点一点
对最后他输出的结果就是你的中止条件就是你把计算器的所有的工程代码完整的实现出来然后打包一个 Zip 给我他打包完了 OK 那就算 OK 了但是这里面比较大的问题就在于说我刚才说很多东西 Cloud 他自己并不知道自己有问题
他就会说两个人就怎么狼狈为奸就说你写的好吗我写的好你写的好呀好那交差吧
对是有可能出现这种情况的因为他不像我作为人是做人工监督的部分对我人工监督你这个到底做的好不好到底符不符合我的要求相当于他这个 team 里面只有生产者没有监督者确实不太好所以就要引入一个监督者就再引一条 API 进来然后他们所有的东西完工了生成了一个工程文件然后监督者就来 review 这个工程文件然后再告诉他们说不行重做
那么我的问题就在于说如果存在这么一个能够知道什么行什么不行的 AI 那么是不是这个 AI 自己就能把这个东西做出来这里确实有点悖论的状态因为这个监督者我给他的初始指令 prompt 指令是说尽可能的严谨和质疑接下来给到你的内容但如果你一开始把它作为了最开始的输入
给到了前面这两个在合作的他能不能执行和贯彻下去我觉得我会打个问号至少 Cloud 3.5 是可以执行贯彻下去的然后你说的严格的监督者你仅仅是给他这一句 prompt 的话也不能实现你说的他自己就能决定仲裁出你做出来这个 app 到底合不合格所以还是得引入人吗所以我的疑问就是如果有这么一个 AI 他自己确实能仲裁
这个 idea 是不是够好这个 AI 是不是做的产出的结果是足够好的那么他自己就应该能做出这个东西所以他就应该是那两个人的其中一个其中一个负责生产另一个负责仲裁嘛就不存在第三个说比他们做的更好的就是但凡会出现一个我们认可的裁判那我们就直接让裁判干活就好了对啊对啊就是他嘛因为他体力无限就一定是他
是的呀甚至他自己一个人从头到尾鼓捣出来也可以还可以少点 token 是吗可以少点这个过程一秒就出结果根本不需要对话所以还是聪明程度的问题对吧或者对你项目或者对你 idea 了解的这个程度我不知道就是现在像 Cloud 的话它现在
是很好用但还是就像我一开始说的他就像一个人很聪明但没什么经验的家伙所以有很多点我问他能给出一个
看似有用的东西就像你问他一个生物化学或者数学题他能给你一个精确的答案但是你需要的往往不是这种精确的答案你需要的很可能是推导一个适合的或者好的产品的这个过程而这个过程这个能力本身是他不具备的
这个只能靠我有一个办法就是比如我现在有五款 APP 我把我五款 APP 的全部工程文件加设计稿都喂给他前提他能吃掉吃掉了之后我给他一个指令我说我要做一款技术器你已经知道我的代码习惯我的设计风格等等你
抄袭我或者仿照我来做一个技术器因为我已经有计算器了所以不让他做计算器了然后他做出来了不管是 UI 也好还是语法还是那种产品思维是不是就可以尽量的贴合我所以我们唯一要解决的就是能为更个性化的内容给到这个 AI 模型那么他就能生长成一个可能符合我胃口符合我思维方式的一个合作人
对吧其实不太行就是你想的是特别特别简单的但实际这个过程会特别特别痛苦
我就先说一个大前提你东西都给他了并且他全部理解了而且我们且不说我一开始说 3.5 现在做 UI 还特别垃圾嘛嗯能用但是几乎不能用就差不多是这么一个情况就 3.5 现在他能写代码但是他写 UI 是不太行他总是会进步的但你如果要假设进步的话那我们完全可以假设他就是最后能出现那个大师的产品那我们还讨论啥呀我的意思就是我要喂养他嗯
我的一些个性化的内容因为他成长为大师了以后他也依然不能够知道我想要什么对吧我们现在的假设的大前提是他是现在的水平还是未来的水平这个还是要说清楚否则没有讨论的基础我其实想说的是未来的一个水平未来的去更好的辅助我们的一种方法
就是怎样让它变成那样的一个方法如果现在的话对来应该没有办法把我所有的工程文件都喂给他吧现在好像也办不到其实可以的他现在应该能接受这么多的 token 只是你消耗的比较快所以我打一个包我工程文件整个打一个包进去我感觉应该就没 token 了吧那多少文件多少图啊你想如果一个 app 不要太复杂其实是可以的他能吃得下很多东西的我现在跟他的聊天基本上是一个一个文件这样的
一个文件会来回很多次他可以解这包我试过了所以起码 100 个以内的代码文件应该是问题不大的但肯定是要打成要打成那个包因为不然的话没有那个层级结构不管他打不打包回到刚才你提的那个问题来说现在他能够吃进去并且他 UI 还做得贼好因为你说的是他的未来的形态这未来形态没人知道他到底能做成啥样
他全部吃进去了并且他 UI 还做得贼好然后他自我启发的去做了一个新的东西出来这个时候呢有一个现在他做的确实还不太好的地方就是原创性的东西他还是比较少的他毕竟是一些现在已有的东西拿来训练的然后他根据过去他训练好的这个训练级的数据来推理出一个你给他的这个东西应该要长啥样他其实是这样子的
所以当你去用一些新的接口我说的是很具体的就是新的就比如说我写单册的时候我那个库更新了但是它的训练数据还是去年的结果它其实不太理解今年新的 API 长啥样给我的代码就是很用的所以我都得做一些小的修改那么我们相信未来它其实也会有这样的问题也就是说
他不认识的东西他就是不认识他就是做不出来而且他不具备立刻推理出这个新东西的能力他能不能具备一个推理新的抽象能力的东西这个我不太确定但至少他不能够根据他现在的这个训练去训练出一个这个酷的新的版本应该长啥样这个确实也是客观事实他确实也推理不出来这很合理啊
所以你要说未来他能不能够做到估计是不行但如果他有联网的这种能力他直接连上去看不就好了吗像人一样人也是通过去联网查看的你才知道这个库更新了联网能力的话现在 GPT 做的也还是比较弱的因为你去联网的过程其实也是一个数据清洗的过程
现在的大模型做得特别好是因为他们数据清洗能力特别强而这一步其实人工参与的程度还挺高的虽然我人工筛选不了那么多大的我肯定也有些工具去辅助我去做数据清洗但是很大程度上还是需要人的参与的
那什么时候大模型 AI 能够自动从网上巴拉巴拉这么多的网页在很快的时间内就自动清洗出了他认为靠谱的材料并且自动化的实时训练完并且实时的就给你这个东西我觉得这个未来可能还稍微有点远至少明年肯定是不行的
你看他们现在这个训练的那个语料的量级已经是非常可怕了对不是人类能够去感知出来的对的但你要说那种仅仅是说很轻巧的说一句能联网不就行了吗那这个不就行了吗这四个字其实是特别特别重的至少目前明年或后年应该都也还不行这个有点太可怕了具备这个能力
但如果说放到 10 年后它具备了这个能力了哇哦那也就是说它是一个能够实时拉取网络所有的语料并且能够实时训练自己并且能够实时更新自己的能够实时迭代的一个模型对啊那它的迭代速度就不是现在这样的了就不是说一年出个 3.5 一年出个 4.0 它可以迭代自己对它可以一年内就出个 4 万个版本对
这个太可怕了所以这样的未来也挺可期的那 iOS28 的时候我把我的 APP 丢给他让他去做一个迭代版本他就做出来了做完了借口全是最新的但是呢你说的这个现象很可能不会存在因为如果说我刚才说的那个大前提成立的话其实大家都已经习惯了由 AI 做的实时生产的
实时可变的 APP 甚至可能那个时候它就是一个实时的 iOS 然后会根据使用者的所有的微小变化做一个特别实时的自我修改自我更新自我迭代所以也不存在你去做一个 APP 这种事情了因为已经完全不需要 APP 已经没有必要存在了它可以拥护自己现在的 APP 对所以我才说回到最早为什么要问你到底是一个未来的 Cloud 还是现在的 Cloud 因为你一提未来这个事情是没完没了的这个假设
它不是一个固定的假设它是一个流动的假设所以这个没法讨论下去你只能畅想只能变成科幻好但如果是现在的那我们回到现在的这个 Cloud 那我作为一个程序员我们就分为两个群体一个是程序员群体一个是非程序员群体那作为程序员群体我该如何取舍在什么样的场景或者项目里去使用什么样的不要用呢嗯
非常好我觉得绝大部分的项目都可以用另外就是如果一定要说不可用的话就是当你不能够把你的代码传给 cloud 的时候就不要用因为我现在都是个人项目去传代码给他的对所以我在公司上班的项目绝对是不会用这个东西的这个很危险因为你根本不知道你传上去的代码会被谁拿去用所以我全都是我自己的个人项目并且我还不会整个项目全部打包给他
我肯定是挑的因为有一些核心加密逻辑数据库连接文件丢给他就有一些 SSH 密钥给他 key 什么的你不能随便给他因为他自己在给势力的时候他就会说一个
常见的 SHH 密钥是长啥样的搞不好他就是拿别人给他的训练出来的所以这种敏感文件不要给他另外就是我现在使用的场景有那么几个一个是 iOS 客户端然后我相信 HTML 的 View 的应该也是问题不大的我以前用 GPD 4O 的时候写过一些但是 4O 给出来的结果不太好所以后来我就放弃了再后来我就没有再用它去写 View 的代码了
的 ls 的代码我现在试的是 swift 还有 swiftui 都挺可以的他理解的不错用的接口也不是很旧也都能够给出一次就能运行的代码只是说一次运行之后最好像我刚才说的一样打开那个代码的 diff 看一下每一行看看他设计的合不合理不合理让他重来对
还有就是后端的代码我是用 node.js 的 type script 写的那个后端基本上写下来也是都问题不大基本上都能够成功运行然后也能理解我原来写的代码是长啥样的能够理解我的基础库另外还有一个是非常好用的点也是我觉得它目前用起来最爽最契合的一个地方就是用来写 shell 脚本但是
它是那种很 cheek 的 share 脚本就是我希望我写的那一行代码是可以用一行 share 因为我们知道 share 它不就是一个很长的一个文件吗我只要把每个换行变成一个斜杠它就可以变成一行了嘛
对变成单行了之后我就可以 copy and paste 放到任何一台 Linux 的机器上面去跑了我就想要达到这种效果而写这样的代码是特别啰嗦的可读性还贼差对你让 AI 帮你生成就特别好对当然它有一个缺点就是如果你强行压缩成一行的话有可能在某些 Linux 发行版它那个单行命令的长度是有限的
你可能就被截断了这就像那个 URL 如果你在后面的 QA 传参传的太长的话也有可能被截断是同一个道理然后什么样的项目不要用好像也没有我目前用下来都可以用只要不敏感用的还挺舒服的那还挺好的
好那刚才回答了程序员的一些那作为非程序员啊其实我还有两个问题一个问题就是我跟程序员可能是合作的这种关系那我有没有必要给他们配备这个 cloud 或者说去驱动他去使用 cloud
这个角度作为一个效率工具我不知道你啊如果是我的话呢想用就用不爱用就别用了这个我不会去强求的就没有说提升效率到那个状态就是说可以节省非常多的这个因人而异真的因人而异我的意思是你真的想用的话你就用但你不爱用的话我不强求这个无所谓就你用就用不用就不用但如果可以提升整个团队的这种效率那它其实是一个很好的工具就跟之前我们对 Copilot 的一个期许一样
不一定它也有可能是反作用就像在去年其实有一个北京的朋友就说过这个事情说他们团队因为用了 AI 之后就从十几个程序员砍剩了两个程序员但一方面是人被砍了那被砍的人肯定就是个反作用另一方面是我在想其实那个时候的 AI 还没那么好用它就能够做到这个程度我觉得是存疑的
就是其实 AI 可能真的就能像我开头说的那样给你做了一些你看起来好像实现出来的需求但是如果用这个 AI 的人他并不理解怎么做是最佳实践的话反而可能埋下隐患除非你不要发 1.1
永远版本只停留在 1.0 否则你用这种似是而非的代码我觉得未来埋下隐患的可能性还更大的就等哪一天爆雷而已嗯
所以它是双刃剑了有好也有坏的还有一个我觉得大家可能会比较关注的点就是你像 AI 做图或者是 AI 音乐我们还有一些方法包括 AI 论文去识别它去区分出是人做的还是 AI 录的那代码这一块
我们普通人好像没有办法去辨别说我这个程序这个工程里面是用到的 AI 辅助或者怎么怎么样对吧代码是分不出来的我给他的我那个代码的文件之后他就按我的那个风格去写了这个分不出来的所以确实当一个程序员使用 AI 去提效让自己的工时变小之后他就可以把自己的时薪做上去其实
变相的去提效了不一定你要看这个程序员是为自己打工还是为老板打工这是两回事他为老板打工的时候他剩下的时间到底能不能真的被他自己用这是另一回事反正是省力还是好的了
省时省力对我来说肯定是好的因为我做个人项目本来就没多少时间每天就那么吭哧吭哧苦逼的就搞那么一下子那现在有这么一个工具能帮我理论上我应该能够单位时间的产出会更多尤其我现在小孩子老是打断我导致我人脑的这个上下文切换成本贼高有 AI 之后我真的是觉得有点离不开 Cloud 了好
我还有个问题啊就是我们之前其实经历过 AI 翻译然后 AI 绘图 AI 音乐 AI 视频生成等等包括最近比较火的 AI 搜索跟 AI 医生这些的那我们怎么去看待 AI 能够携带因为咱们这期的标题就是能够
去生产环境去写代码这个节点它其实是在这一系列的里面的难度作为一个非程序员的话怎么去理解它的难度是很难吗还是说其实是最先应该被 AI 攻克的点因为毕竟 AI 更懂计算机更懂这种零和一的关系你说一个普通人怎么去理解这个点
不对啊 AI 怎么会更懂计算机更懂零和一呢你这个其实还是在把 AI 当做一个电影科幻中的那种抽象我是抛出来这个问题我是说应该放在哪个点就是当 AI 可以替换程序员了还是 AI 可以代替画师哪个更难简单来说
其实都不能替代也都挺难的像我前面讲的感觉应该还挺清楚的就是你现在用这个东西不要去被那些社交网络传出来的说什么我用一个小时 AI 就帮我做好了一个什么东西这个做好了三个字每个人定义都不同的像我说的除非你永远停留在 1.0 否则你 1.1 要做的时候你就知道你可能不具备写代码的能力你就做不下去了
AI 还是没有办法帮你解决所以这个还是因人而异我们不能笼统的说 AI 去代替一个化石外包我们全把它变成一个外包就是可能执行一个任务比如说我们的播客的封面我们播客封面这件事情现在这些 AI 已经可以满足我们的诉求了对吧
是的画图是可以的那如果是我们去生成播客的一个时间轴的这样一个脚本我们上一个 AI 程序员去写因为这个东西在上个月是不行的我们也是上个礼拜用了这个 cloud 之后才产生这样的状态的那这个是后到来的它比其他的那些像绘图啊音乐啊是更晚到来的那是不是我们就可以去
总结出说其实让他去具备这种代码能力还蛮难的我觉得现在说这个东西还为时尚早就是现在 AI
这个概念已经好几十年了但是只有最近这几年因为有自然语言的接口才使得大众重新关注了 AI 这个东西我认为这几年虽然 AI 进步特别快但这里的 AI 特质尤其是大语言模型因为就像我们之前去年还什么时候提过的就是因为有了自然语言这种交互才使得大众能够很轻易地使用 AI
但是大众能很轻易的使用 AI 不代表说那些能做专业的事情的东西就很容易的被替代你刚才一直在强调一个东西就是 AI 能替代什么对吧你提到了一个插话
其实 AI 能替代的那些插画我们之前聊 3.5GPT4O 的时候也提过它能替代的那些插画往往是那种对于原创性或者个性化要求不是那么高的对艺术性要求也不是那么高的我们的播客封面场景其实就随便用在一期节目里面用完其实过一段时间播客这东西本身没有时效性但是在现在这个社会环境里面它慢慢变成了好像过一期节目之后再过两个月就没人看了所以就变成了有一点像运营性质的东西
那你看隔壁台那个银杏树下每一期还是有人首会的原创首会哦那简直就是播客界顶配资源爆表的那种级别了所以你要说的替代我觉得还是一种就是偏一次性的运营的低成本的插画的替代是 OK 的我知道怎样去描述这个事情了就是反过来讲就现在各行各业其实有些人是拥抱矮有些人是挺惧怕矮的包括之前的这个萝卜快跑这个无人驾驶
确确实实冲击到了很多司机他们就是后面可能要面临着没有工作或者被 AI 冲击了这种点那我们从这个角度来看各种职业在被 AI 的冲击的这一波来看那程序员还有像我们说的画师翻译同声传译等等大概在一个什么样的一个状态就是我们作为程序员我们怎么去看待这个事情我觉得对于各行各业来说它基本上是一样的
跟程不程序员也关系不是很大大家都是被冲击从过去的历史的角度来看基本上这种新的科技它往往是会掀起一波替代的浪潮的但是这个替代的过程它是一个渐进的过程不是突然一下子啪一下你就该没的就全没了就好像以前那个码头扛包裹的那些苦力的那个劳工嘛
他会在码头上帮人卸货然后就可以赚钱后来有了集装箱了对吧有了全自动的器械那这些做苦力活的这些岗位和工种就没了嘛对你刚才提到的那个滴滴的也一样那其实大家会担心被替代就是因为这个东西他做成了一个零和一的选择有或没有嗯有工作或没工作
但人是活的呀而且往往能够轻易的被替代的工种或者说在这个工种里面能够轻易的被替代的人群往往就是还没有掌握到一些相对具有不太可替代性的能力的人群
就举个例子 AI 能替代滴滴可能是因为你只要有个驾照能开车上路就好了你就能开滴滴虽然说一个经验丰富的滴滴司机和一个新手上路的滴滴司机乘客的乘坐体验差距还是挺大的但是这并不影响他能够获得滴滴司机的岗位他都能做
但是呢他替代不了的是现在 FE 围场里那些 FE 车手但那个少呀
那个人少呀对吧对啊那个人少呀没关系啊但是那些人我的意思就是说同样是开车但是呢在开车里面也有具有不可替代性的一部分人和具有可替代性的一部分人那最容易被替代的就是可替代性的那部分人那如果我们把这个眼睛再放远一点不是说只盯着当前的这个行业 AI 来了之后他把这个行业给颠覆了那他创造了一个新的行业
那如果这个人本身是在这个行业里面是具有一定的不可替代性的往往他也是一个能够在其他行业获得一些不可替代性能力的
那么他完全可以去一个新的行业里面再去开创一个新的生活新的工作这个是比较理想一点的对就是可能更多的人会比较的就是焦虑吧对于这样一件事情冲击如果从人数的比例上来说呢肯定大多数人
其实这个不可替代性这个部分会稍微比较的少一点这个是肯定的因为这个东西就决定了不可替代性的人群本身就是少可能就 10% 20%那剩下 80%就不行那怎么办呢放到这么大比例的人群里面往往就是一个组织了往往就是一个社会了往往就是一个国家了我们通常不会在播客里面去讨论的话题了这个大家懂的都懂对对对
这种往往是通过另外的方式去做调节和处理的也不是我们现在能关心的事情了对了好像这一期我们还有一个事情本来应该放在前面聊的没有聊就是现在 Cloud 3.5 的成本是多少就是要用起来其实不是免费的 20 到一个月
所以我们是花了 20 到一个月的成本的对如果大家去用 Cloud 3.5 的话就是有免费版跟 GPD 4.0 是一样的你直接打开然后你就能用了但是免费版的话首先是它特别慢然后 4.0 的话它是会经常断对吧你用免费网
Cloud 3.5 倒不会经常断但是很快你的 token 就用完了它会限制所以我之前写代码的时候要传代码给它没多久它就告诉我你已经中了限制了你就没法用了所以我很快我就给它冲了明天再来好像也不至于可以它就是有一个时间的就是冷冻期但反正我很快我就买了能看出来你用的强度还是很大的因为我没有遇到过提示
我在免费版的时候就已经遇到过那个 limit 了然后我很快的就冲了直那以后就再也没有遇到过了难怪我上来就直接付费了替你一件事我现在的 AI 大模型的成本就是一个 cloud20 到一个月然后还有个 4 欧也是 20 到一个月两个加起来 40 到一个月有点离谱我之前 mini 还多一个我有一个 meetjourney 我现在最近没有继续了我现在不用 meetjourney 了已经对因为我之前要给歌曲做封面我之前就有很多诉求了
最近有一个新的叫 Flux AI 还挺屌的可以试一试而且它是开源免费的
那我们倒试一下有可能会成为下一期节目可以啊下一期节目倒不确定但未来我们拿它生成一个封面应该是问题不大 Flux AI 最近有一个视频是挺火的因为它的那个生成出来的那个真实的光照效果已经比较接近照片了你还知道 AI 生成的照片往往我们一看一眼角就是 AI 生成的对为什么呢因为它的皮肤的那个光照跟那个环境光差很远
他整个人太圆润了太光滑了这游戏一直在追求物理引擎物理引擎这怎么能够像真实世界一样去做一些动作没错然后那个 flux 他做出来的图就基本上跟我们真实环境光的那个光照已经非常接近了你很难识别出这个人到底是真的假的然后就有人拿他做了一段视频然后那个人呢在讲话的过程中手会动嘛我怎么发现他的那个露馅的地方呢你还记得早期 AI 生徒的时候那个手指对
他现在讲话那个人的手指啊没问题但是不好意思他把那个光照做得太好了于是他手指在墙上会打出来那个影子那个影子是乱的太假了就很搞笑看 AI 生成的人物的影子来辨别是不是真人太搞笑了是啊但他整个真人讲的看起来还是比较真的讲话也没问题就是他后面的那个影子那个手指是乱的那就还需要用话对对对好
好不管怎样我们今天主要聊的是一个 AI 写代码我自己个人觉得是 Cloud 3.5 确实在很多个方面都能够成为我们写代码的好帮手但前提是希望使用的人最好是一个经验丰富的写代码的老手这样的话比较容易去识别出它里面的坑
然后其实我本来还想扩展一点就是 Cloud 3.5 我说它是比较像一个理科生所以我跟他因为经常搭档写代码所以我了解他的脾气所以我们上周我才用它去生成了我们的时间轴好
对吧我是把它扩展过来生成时间轴并不是写代码但你用写代码的思路去跟他交流了对啊难怪下午那么好当时震惊了我没错但这个自然语言跟他聊的过程就是哎我当时想到我想要的就是一个固定格式的输出那他是不是能胜任呢我试了一下发现卧槽真的可以
你还记得我在有期节目里面提到了一个点就是我们最需要的小助理就是我们自己就我其实想跟另外一个叫小丽的自己的助理去对话然后他帮我完成一个事情那程序员以前不是很流行叫结对编程吗两个人嘎在一起去编程那未来可能更好的一种绝对编程的方式就是你把你所有的习惯你所有的历史代码和经验喂给他然后他以你一个贴身小助理的方式去协作你做很多事情
那体验会很棒吧你说的也有道理不过 Cloud 3.5 呢它现在会忘东西它还不像 4 欧有那么大的一个 memory 我估计 Anthropus 烧钱是没有微软资助烧的那么舒服的微软有自带机房对
对所以他这一点呢是没有 4 欧做得好所以他才不是第一名嘛但是他有他好的地方然后我觉得他和真的有一个人在那里写代码其实是有区别的这两个是不一样的还是要分开来看我一开始有一种错觉是误以为好像我聘请了一个很聪明然后知识很渊博但写代码经验比较薄弱的一个实习生在帮我写代码我一开始错觉是这样后来发现不是的
为什么呢因为这个实习生在我不喊他干活的时候他是真不干活他没有自驱力他没有 OKR 给他定 OKR 对如果你真的请了一个人这个人你叫他干活你就给他下命令嘛那剩下的就他就去干活了但你现在请的是一个 AI 你不跟他讲话他就不动了所以这个没办法所以这个今天说贾老师啊今天我干点啥呢
我做的这个行吗就过来主动有点你的这个感觉那你说我们现在看来这些 AI 全部都是被动输入式的就没有那种像早期 QQ 消息在右下角突然弹出来了这样的主动式的找我的这种 AI 我买一个订阅服务然后我跟那订阅服务说你每天去看看世界上的这些新闻以及我感兴趣的领域然后来启发我给我发消息哦再见
你说的这个也不需要他做因为他们做的都是一些基础这个你现在就能实现了你买他的 API 然后你就让 Cloud 3.5 帮你把代码写好然后告诉他服务每天跑一次每天晚上 9 点钟发条消息到你手机里面去不就完了那就这样每天早上我的 iPhone 上就会有一条 push 推送然后他过来说了说王总好我总结了一下最近发生的大事情发给你您过目啊
奉天承运皇帝诏曰对对对在家做皇帝的感觉可以可以这个实现起来也不难然后你就用 Cloud 3.5 然后他帮你打通那些 API 帮你打代码都写了你的代码永远停留在 1.0 好吧你就永远停留在 1.0 这样的好处就是我不用老想着我要让他干嘛每一天对吧你得告诉我我可能想干嘛你能干嘛启发我启发你
但是你如果只是看新闻的话只举个例子新闻只是个例子就是我不知道我今天要想些什么你反正每天推我吧我不知道该想对你作为我带的一个实习生你不应该主动一点吗自屈一点吗但他有一个问题他现在只能够做那种有限输入集合的事情他没有办法自动根据这个有限输入集合去推理出一种新的就是探索新领域他
它是不如人类的你比如说你培养好了一个实习生这个实习生他自己具备这个能力之后他会去探索更多的我就举个例子我们现在把 Pro.hung 拉过来 Pro.hung 上面的新东西也是我们的新灵感的输入来源之一然后我再把其他的几个站也拉过来我每天就去分析这个很简单你用 Cloud 3.5 API 一实现或者 GPT API 一实现就完了但是问题是但是只是聚合
对你就只有这几个了然后你跟他说你有没有发现新的他还真不一定会告诉你有但是实习生可能真的会有比如说我在 B 站有发现一个新的他会去刷 B 站对这就是人类和现在这个大模型之间的区别
人类去发现新领域的东西还是相对来说更容易的但大模型现在要解决这个自动的自驱的探索新领域的能力我觉得还是比较欠缺我觉得就模拟我就好了呀在服务器上挂一个进程然后比如挂一个定时任务每一
五分钟就会去刷一下推再过五分钟去刷一下小红书把我反正能够访问到的所有的然后从这些里面去找到新的对然后去找然后告诉我那你这个输入的话有一种可能是样本可能不是很够可能得培养比较久然后培养的过程需要比较多的你的大量人工参与如果你愿意花这个时间然后你确实培养的挺好的那它确实有可能像你一样能够自动帮你过滤筛选
我举个例子啊你现在实现的这个服务它不仅能够自动帮你聚合已有的新闻对然后呢你自己每一天在刷推的那个习惯你也把这些数据都给他了对这样你就能训练他你这个刷推习惯不能是说我点了赞了才刷开丢给他你得是我刷着刷着停下来了我的眼睛看某一条推嗯
我对它感到震惊然后我点了一下回复按钮思考了三秒钟之后我决定不回复了这些他都得知道如果这个前提成立的话他可以帮你准确的筛选出哪些是你感兴趣的哪些是你想要的哪些是你要的探索新领域的东西那这个东西应该比算法推荐还要屌 AI 推荐
对当然现在这个做不到是的但现在做不到下一个风口但未来可以就是我们现在流行创业领域不是那种可穿戴设备吗嗯可穿戴设备其实是一个非常好的一个可开拓的市场对眼镜如果做得到的话
他其实就能做到我刚才说的这些因为他每天就我看到什么他就看到什么那我拿着手机出来打开推特现在我不需要推特授权我干什么了我也不用你推特 API 了我的眼镜就能帮我解决这个问题我看到他打开了就是一个推特他刷了哪些东西点赞了什么他把某个人发的一张照片放大了哎呦他可能感兴趣对不对哎呀还滑了哎呦他可能感兴趣对不对还有还隐藏了哎呦
哎呦那这心情有点微妙对然后想点赞不敢点赞这个小手哎呦所以就有点像黑镜的那个剧情了就是回溯你的一生对吧他是在同谋里面去植入了一个这种摄像机的东西对但是黑镜的那个他仅仅只做记录不做推荐但如果你这个东西技术成熟了他真的是可以作为你的一个很
很可怕的一个间谍他就是一个 spy 一个病毒在你的脑子里对你想想现在像抖音他不是你的 spy 他仅仅是 spy 了你在抖音里的所有的行为他都能给你推出一些对吧让你有点成名的感觉到我内心深处的一些东西是的对然后淘宝就开始给我推我想买的那种
东西淘宝对有那个感觉那现在如果你真的带一个具备我刚才说的能力的可穿戴设备整天 24 小时带着他到处跑这个不得了那他太了解我了那他真的就可以成为我的他可能会发现很多你自己都不知道的你自己的阴暗面月之暗面
而且关键是它这么小的一个东西它不能够本地分析它只能把东西都传到服务器上这个一泄露不得了那就要看我们苹果是不是搞一个这种离线模型再加一个独立芯片来处理隐私问题了又是这样的一个趋势又回到之前说 Ultraband 带宽足够它传输到手机上是的
那这样好歹好歹那些偶像哥哥们他房还可能他的没那么快除非手机被偷了对吧前有陈冠希电脑被偷现在是手机被偷就全部人家没了
OK 扯远了好的反正我们今天主要聊的就是 AI 生成代码然后确实是一个不错的工具然后我用下来也挺好的并且我们也提到了一些扩展用法我觉得像 Cloud 3.5 或者是 4 欧这种他们各有所长 Cloud 3.5 比较擅长你限定一个前提条件他就给你一个相对准确的输出我觉得非常好以后可以利用它做很多事情不仅仅是用来写代码写代码只是他目前比较好用的其中一种
另外我们畅想了一下这个 AI 的未来畅想的有点多有点离谱不会的未来来看这期节目其实不离谱我们早先其实对于 AI 写代码也并没有这么看好对吧可能也就几个月半年吧对对对但现在 AI 写代码确实至少我会用了而且我感觉有点离不开它了这种感觉我离不开它是有原因的对我也给我的团队配备了这个每个人都配备了至于他们用不用我这个我真的管不了
对啊要用的好也不容易我只能这么说得跟他磨合得好好分辨一下他的代码哪些写的不对哪些写的对而这个其实对于使用这个 AI 的人其实也有比较大的这个考验来的也不是那么容易就能够实现的对但如果掌握了这个能力至少在 AI 这一波里面你的焦虑我觉得会少一点吧把你把它当做一个工具我从来没焦虑过呀因为你掌握了这种能力我从来就不曾焦虑过呀
没有说你我是说我们其他的一些程序员朋友们啊 okok 我觉得大家也不用焦虑吧就你只要在这一行干的好的话也没那么容易被取代的真的哈哈哈哈 ok 如果在某一行很容易被取代的话那也许这一行并不是特别适合对换一行不容易被取代的呗天下那么大 36 行行行出状元吗
OK 可以可以行那我们希望最近的这个出节目的效率能有所提高加油路吧这期节目对我们的后期小姐姐最近请假了就看她什么时候回来再帮我们把这期节目给剪了然后希望我们这个后面什么时候 AI 能帮我们剪节目了呢 AI 剪节目啊对啊我们把前面的节目的原文件和
对我们把工程文件喂给他然后他来帮我们剪甚至不需要工程我说现在其实有 autocad 因为他想知道我的一些剪辑习惯哪些不想要哪些留下来现在我们的后期小姐姐对我们的那个作用就在于她是一个人类
就是你如果仅仅是想要把这一期节目做到就是把那些没用的评论然后 P 给去掉那这个 AI 胜任完全没问题但是如果你想要把这一期本来你觉得没聊好的节目剪好了之后居然还可以这个真的我们的后期小姐姐是可以不可求对对对好了后期小姐姐不用焦虑了暂时替代不了哈哈哈哈
什么暂时我觉得这个要替代还是真的很难的好吧我感觉有一点像是做电视节目的时候的那个导播其实有点像有一些短视频就是人剪出来一些短视频它是很有梗很微妙的对对对你机器生成的这个东西它就是缺点什么对吧机器能帮我们解决的一种场景就是比如说今天已经快 11 点了我们觉得今天聊完要在 12 点就立刻把它发出去那 AI 可以好行 AI 可以
AI 现在就能做了就是之前李牧开源了一个 AI 的仓库叫做 AutoCAD 它的原理就是把你的所有的画剪出时间轴然后呢自动的把那些没用的东西给咔嚓咔嚓掉最后拼成一个巨大的所以它是依据时间轴的时间戳来剪的啊
那你只要有时间戳就好了无论你是什么项目他都能剪他是用来剪视频的他能剪视频当然就能剪音频所以这个是能做得到的只是说他这个剪法只不过就是把你本来没念好的磕巴磕巴的那些话给拼成了连续的话而已我觉得还是等我们后期小姐姐回来好
好的 OK 好今天就到这吧就到这我们后面还会出更多的节目的然后也会尽量出多一些比较轻松的闲聊的节目可以请大家多多期待 OK 那么以上就是本期节目的全部内容了如果你觉得我们的节目还不错的话请不要忘了给我们点赞转发收藏我们下期节目再见拜拜拜拜