各位听众朋友晚上好我是梁周欢迎收听今晚的梁周令今天这期节目我们是想系统性的聊一聊跟 AI 有关的一系列问题因为最近 DeepSick 也非常的火爆所以本期节目呢我们会从两个方面来聊一聊跟 AI 有关的一些主题一是浅层的聊一聊有关 AI 的技术问题
例如像 chatgpt, dipstick, clued 的一些很相对比包括他们在架构和模型上的一些区别这个部分呢我们也会请到我的好朋友阿老师
让他来给大家做一些技术上的科普第二个部分呢会偏实用性一些我们会系统性的去聊一聊普通人如何利用 AI 辅助去进行不同类型的写作承担类似私人助理身份以及如何通过 AI 建立自己的工作体系与料库这些问题
然后今天我们请到的嘉宾呢依旧是我的好朋友阿老师之前他也上过我们的播客节目他毕业于同济大学的土木工程学院从所谓的天坑专业自主转码做到多家上市公司的 CTO 好大家好也是非常高兴能够再次来到梁祝琳的节目
本期我会和梁老师一起来聊一下当前最火的一个 AI 工具 DeepSeek 并且讨论在 AI 变节化的背景下普通人是如何掌握并利用好这一类工具这段时间 DeepSeek 非常的火二是能不能从业内人士的角度来介绍一下 DeepSeek 它火出圈
的一些原因以及这款 AI 工具的独特的特色好这个问题其实可以从行业内的从业者角度然后另外是从一些行业外包括使用者的角度这两方面来看先谈一下行业内的一些从业者的角度 DeepSeek 从 VR 的一个版本大概是在 24 年 5 月的时候发布的时候就已经在圈内的小范围内开始传播
因为当时吸引我们的一个是它和传统的 Transformer 类型的架构它是不同它采用的是叫 MOE 架构就是 Mixture of Experts 一个混合专家的一个模型
它这样做的好处就是说当一个每次请求的 token 的时候它不需要激活所有的参数因为我们知道像 DeepSeeker 它这一次的 V3 的版本差不多是有 671 币的参数一个币就是一个比例就 10 亿就相当于它有 6710 万亿的这个参数
如果说每一个请求它都要经过这么多参数的话一个是能耗另外一个响应时间都非常的慢所以它采用的混合专家的模式就是相当于把任务已经做了一些分解然后每一个子任务可能只需要一到两个专家这样去处理然后大家可能会要问那么既然 MOE 框架这么好为什么当时别的国外的一些 AI 的工具为什么会不会采用
因为这还是从原理上来说因为把任务分拆解成不同的子任务然后在最终再要拼接在一起的话这在负载均衡上面可能当时是一个比较大的一个挑战因为不同的专家权重会导致额外的一些性能的一些开效显然从这一次 12 月底的 DeepSeek V3 版本以及后续的一个 R1 版本 DeepSeek 它已经通过了一些技术手段包括像一些层级路由啊
等这些方案解决了这部分负载均衡上的一些问题所以才会在速度和响应方面其实都已经还包括它的一个这个性能开销就它的成本其实是相对来说是非常便宜的一个成本然后本次这个 V3 还有它的这个推理版本叫 RE 版本它在这个模型这块它其实也是开源的而且支持到一个本地的一个部署
并且它还比较贴心的就是放出了像是这个不同权重的一个版本有可以比较简陋的盖中盖板的一个比如说只有支持 1.5 个 billing 的一个模型然后包括可能有一些中间档位的像 7 币的模型或者 70 币的模型然后包括它有一个最终的一个满血版本
将近 6710 万亿的一个模型然后这对行业内的从业者来说也是一件非常利好的一个事情像我的一些朋友可能已经在春节时间已经把这些模型跑了一些本地的一个部署基本上只要 8 台像苹果的 Mac mini 就已经可以把完整的一个 671 币的一个模型可以跑起来
这其实是对未来的一些工具包括像一些 AI 助理像 AI agent 的一些发展可以打下一个比较好的基础然后如果说是从行业外的一些我们普通大众的一些使用者的角度上来说我觉得这一次可以算是像是这种推理的大模型首次以免费的方式出现在大众的事业当中
像之前 ChatGPT 其实倒是推出过这种 OE 的一个产品但是它是有使用的限制而且仅针对 Plus 用户哪怕是 Plus 用户它其实每个月也是有一定的限额所以它还没有说真正的可以在大众视野面前去真正的去使用
但这次阿一的一个出现呢就是我觉得是有一个比较大的一个突破而且阿一的这些用户我相信大家如果使用过的话就最大的感受的话他应该就是说是非常的自然语言也就是说说人话嘛举个例子比如说我们以前对于一些指令型模型的话我们要去写一份产品的一个推广方案然后你可能需要告诉他非常多的一个提示词比如说我需要告诉他我的产品类型是什么我的目标用户是谁
这些其实都是叫 promotion
我们的这些 promote 的提示词会就掌握比较多行业内部其实有个玩笑就是说可以把这个 promote 比成在这个试魔法的时候要说的咒语你要掌握非常多的咒语你才能把这个语法掌握之后你对着 AI 去说咒语它才能完成你想要的东西但对于推理型的一个模型来说只要使用在日常对话的一些方式同样是一个产品的一个推广方案可能我们更多的只需要说如何针对对吧竞品
我现在也可能有竞品然后呢我的这个市场也比较趋于饱和的一个情况下让他来列出一个产品的一个推广方案可能就是比较自然语言的一种方式阿姨就可以给到我们一个相对来说还比较完善的一个方案而且比较难能可贵的是他其实在做这一些操作的情况下他会展示他的整个的推理过程
它是怎么去收集一些竞品信息然后对比我方和竞品之间的一些优劣然后还会列出一些目标用户的它的需求然后一步一步一步把这些内容综合思考进去之后然后推出整个的推广吧并且我们可以根据它的这个思考的这个顺序
在这个基础上我们可以来进行一些微调然后不断的一些训练最终得到我们想要的一个结果而且这些推理的一个过程相对来说就是说看最终的结果我们其实更看重它的一些推理的一些过程
因为这些推理的一些过程可以在补充我们平时的一些决策思考当中想到的一些问题的一些角度我来总结一下阿尔是刚刚讲的核心的观点因为阿尔是刚刚说了非常多专业的术语在我的理解里 Deep Seek 这期的书圈是有几个非常重要的原因像阿尔是前面讲的
它的这个 MOE 的混合专家模式它在每次处理的时候不需要激活所有的参数而且这个东西呢 DeepSync 它通过了层级路由这个方案解决了部分的问题我
我姑且的把它理解为它是不是可以说成是一种降本增效的模式就让它在处理的过程里不会导致性能开销的损耗非常高但是同时它处理这个信息的速度或者说它的效果会变得更好说白话就是这样对我其实省略了很多其他的一些术语其实它不光是有参击路由它还有很多其他的一些方案比如说它的一些精度方案它可能降低更多的一些精度
原先像 ChatGPT 或者 Cloud 它可能最早的一些训练方案它的数据的精度可能都就打个比方我可能要算一样东西我可能要算到小数点后的大概 4 位或者 6 位才能完成
可能对于大多数场景来说我们可能只要小数点后的两位就可以完成这样的话它的精度的下降但其实并不太影响日常的一些使用我可能只有在比如说我要算一个天文学上的一个行星轨道的时候我可能才需要非常高的一个精度但对于我们日常来说只保留两位的一些精度就已经足够了就类似这样的一些
一些手段它其实因为它在训练精度的时候都采用 FP8 的一个方案来算所以在阿尔斯说的降本增效这块其实做出了非常多的一个在工程学上的一个非常好的一个示范是 我觉得这一点 DeepSync 的确是做了一个非常大的突破因为其实对于我们普通人来讲也许是在未来就是大规模会去使用 AI 的普通人来讲我们其实并不需要那么精确的一些结果
我们在日常使用 AI 最多的场景其实就是询问它一个问题把它当作一个搜索引擎来使用或者说把它当作一个工作上的辅助性的工具去使用就是我觉得在大部分的人在使用 AI 的时候其实它还是很少的场景会需要它有非常高精度的一个结果
DeepSick 在这个事情上确实是做得非常成功的而且包括像阿尔刚刚讲的我觉得 DeepSick 在这一次它传播里非常爆火的一个很重要的原因就是因为它会有一个深入思考的功能它会展示它的一个推理过程比如
比如说他如何去收集信息然后如何深度的思考列出目标用户的需求以及他是怎么一步步推导出他最后的结果的我们也可以在这个深度思考的这个过程里看到他推演的这个结果然后再根据他的推演结果去
对他给到我们的这个最后的成品进行一些重新二次给出指引然后让他给我们一个更好的训练以后的东西是的其实在这地方我还有一个问题是想问就阿尔在前面有提到就是说
现在可以利用 Gipsy 然后进行一些模型部分的本地部署然后这个东西它是可以给未来个人 AI 助理的发展打下很好的基础的就这个部分你可以延伸展开聊一聊吗其实现在我已经看到就是春节之后已经有非常多的厂家包括国内国外的
厂家其实都已经在他们自己的这个云服务上来部署了这个 DeepSeek 的服务嘛然后像国内这个金山好像已经介入了然后国外像那个
亚马逊和微软云上也都已经提供了就是说他们自己本地的一些部署的 DeepSleep 的服务但是这是分两方面来说一方面就是说这个部署呢一就是说比如说我是一个垂直行业的一个比如说我是省级搞省级的
包括我在小红书上也看到有人已经在他们公司的服务器上也在部署这样的一个方案一方面就是说这个是可以根据你自己的一个行业内部可以去投位语料来进行训练因为我可能并不需要其他的一些功能我只要在这个行业上来进行深耕
相应的我只要把模型跑起来然后语言的一些训练语料的一些模型的一些投位就可能是我有办法能够解决我不知道那么高我可能只需要比如说一个 30B 或者 70B 的一个模型其实就可以能够完成了
这个其实我觉得是对垂直行业来说它是一个巨大的一个利好因为原先我可能如果要部署一个完整的然后投位比较多的语料那可能我入场券就要买个 100 张 H100 的显卡或者 1000 张 H100 的显卡那个成本就会比较高然后这个如果说它的私有化部署然后你的语料投位又不是那么的范我可能只是一个垂直行业
而且语料我自己能够搞得定那它的这个训练成本就大大的下降我觉得是对于一些中小企业来说是一个比较大的一些利好阿老师刚刚有提到就是对于像一些审计这种公司对因为它的规则相对来说是固定的
审计它的一些规则比如说我的一些审计方案或者说我可以把以往的审计的一些案例全都能够整理出来然后很好的电子化然后它的审计规则相对来说又是比较固定的一些东西像这样类型的一些公司它直接去投位之前的一些预料那它能够起到一个很好的一个效果像审计这个公司它可能就像阿老师讲的因为它有一套比较中规中矩
或者说是固定的比较能够模式化或者能够提炼出来就有一套比较模式化的这种流程的这种工作它其实完全是可以到 AI 去做的因为 AI 它在计算上或者说是在推演这些这样固定的
流程化的工作上它肯定是给它一张显卡或者说是只要它有足够的算力它就可以 24 小时不停地去做这些工作这个它其实是可以让人从这个生产中解放出来的但是其实包括像我在内的很多人我们都会有相同的一种
担忧就是如果说比如我们用 DeepShip 它这个模型部分进行本地部署就像我以我为例子我现在下一个 DeepShip 然后呢我让 DeepShip 去代替我做很多规律的工作这部分工作可能是查一些资料然后比如说我让它去
搜索现在大众的网民到底在关心什么样的热点事件然后呢我给他一套完备的指令他每天就是比如我规定他在八点到九点这个时间去复盘过去的二十四小时中国的互联网上面大家最关心什么样的事情然后我希望他根据这些热点事件去采写编写一篇有关的文章然后在我起床的时候我就可以看到他写了一篇文章给我那么
我会觉得可能在这个过程里面我的工作我自己从生产力中这个生产线上解放了出来但是与此同时我也会担忧说我在这个过程里面我似乎就不再是那个核心的创作者我变成了一个编辑我变成了一个去审核他做的工作是否达标的那个检验者那么
在这个过程里我会担忧的是如果有一天这个模型它已经足够的精炼或者它足够的优秀它甚至可以把检验的这一部分的工作也自带掉那么就像我们这些创作者或者说是在生产线以前工作的创作者
他肯定会答应的是我们还需要在这个链路里面承担哪一环的工作呢目前其实我觉得大家的担心稍微有那么一点早你说的这种情况未来会不会发生现在不好说因为可能自从两年前 CHAT GPT 火的时候大家就已经开始在担心这个问题了对吧在 23 年我记得这个 CHAT GPT
V3 V3.5 的这个版本出来的时候大家都已经在讨论这个我们会不会未来会被机器取代这个问题你前面举的这个例子其实单纯的以目前本地部署的这个方案来说还不能完全能够真正运行起来因为本地部署它是要你投位语料来训练的而且就是说本地部署其实是一个断网的一个环境它还不是真正的联网环境你看到现在的这个联网环境是后期需要
需要代码去实现的就是我怎么去抓一些我想要的比如说我可能只看抖音或者只看镜头条这些类型的一些文章或者抓知乎的这样的一些文章这个我还是依然需要去建立一些不同的子任务然后再去抓就是它的联网功能要自行开发或者说你要用官方的一些功能如果
如果你是单纯的本地部署它是没有一个联网功能当然这个你有开发能力写一些爬虫也能做但单纯的你说这个就是说它完全能够代替你现在就八小时的这个工作目前来看还担心的稍微有那么一点点早因为 AI 你看它的这个推理它还不是说能够百分之百做到非常的准确这么说吧就是说 AI 你给它发的一个指令它会把它拆解成不同的一个 token 然后呢
我的训练模型说到本质它其实是对文本的一个处理然后每一段文本其实会拆成不同的 token 文本和文本之间也就是 token 和 token 之间是产生关联然后再去做一些推断所以举个最简单的例子就是说有很多人类能够一眼看穿的一些东西大模型倒不一定能够正确地回答就比如说之前一直吵得沸沸扬扬说这个 1.11 和 1.9 肥大
人类可能直接一眼就能看穿就不管你后面几位 1.9 肯定第二位肯定是 1.9 大但对于很多很多的大模型来说它就比较不出它就容易算错本质上对于它来说它其实不是理解你的火
他并不理解你说你给他的这个指令到底是什么意思他是把不同的指令去把它拆分拆解出来然后再转化成 token 然后 token 和 token 之间也就文本和文本之间会有一定的关联性他根据文本之间的关联然后再做合理的一个推断和预测
这其实是大模型它的一个本质吧它在说拆解的时候它其实是会改变一些文本原先的一些那个意思所以它才需要你不断地去投位新的一些语料你不断地训练它它才能逐渐逐渐逐渐掌握你这个说话的规律你给它下问题的一些规律
然后
然后我当时在论文章里面有写就是说其实科技改变人的生活但是它在很多时候它是不改变大部分人之于生产资料的掌握权的就对于普通人而言科技给每个人带来的便利它背后可能是很多人的心酸且伴随着时代的代价像技术的进步它在带来便利的同时一定会伴随着职业的消亡
而这种消亡的代价它会不断地作用在不掌握核心的生产资料的人们的生活处境上就像电灯嘛它在出现并广泛地使用以前英国有一种叫灯符的职业然后当时在烟灰降临的时候这些灯符他们就会拿着火把然后爬上梯子为城市点亮万千灯火嗯
我当时在收集资料的时候就看过很多关于登夫的记载当时有些登夫说这种职业其实在过去它一度是被称为传说中永不失业的铁饭碗然后直至电灯出现以后
就是成然电灯的发展它会使得人类的生活变得更加便利而且其实我们现在站在 21 世纪去回头看 19 世纪 18 世纪我们很难再想象没有电灯的社会然后有一群像灯符这样的职业从业者他们每天需要去点亮万家灯火就拿着火把爬上梯子
就是对于掌权者而言其实电灯发明前后的夜晚里他们的福迹都是灯火长明的唯一的区别是过去他需要一个水位然后由专人点灯现在这个取消了我明白我明白怎么说呢我可能
相对来说是一个在技术上我可能是一个进步派吧当然我能够理解梁老师的那个这个举的例子的含义啊你前面说那个登夫的这个故事嘛其实我记得这个历史书或者有很多这个书籍上更早之前在在
这个机器第一次出现就蒸汽机第一次普及的时候也是英国英国当时有一个非常著名的一个运动叫卢德派他们的口号就是打碎所有的机器因为觉得机器抢了人类的饭碗所以他们的阻止就是卢德派就是要捣毁所有的机器然后要重新回到也不说男耕女织反正就是回到纯手工的年代
我觉得第一就是这说明机器还没有普及到就前面您说的这个所有制的这个问题也是一样的就机器还没廉价到所有人都用得起所以才会有这样的一个事情如果人人都是这个技术发明的使用的这个普及者就是说如果说像 AI 或者说今天的移动互联网一样的
就是说至少能够所有人或者 90%95%的人都能够非常简单然后可以说是非常小的一个代价大家都能使用的话那其实就相对来说可以把这个就是说您前面说的这个问题能够降到大家都能够接受的这个范围而且人人都能受益我的观点可能是有这样的一个不同啊嗯
我明白老师讲的其实这个是一个技术壁垒的问题在现在看很多人他恐惧 AI 的原因是我们并没有找到就是在生产资料它不变的情况下我们应该站在这个生产电路上的哪一环我们担忧的是 AI 它出现以后它把人给优化掉了但是我们
在视角面目中失去了自己的位置我们可能处于现在一个就是变革时期之中所以非常多的人在焦虑就是说因为我没有掌握这个技能或者他觉得他掌握的这个技能还没有完全能够覆盖到对于 AI 能够产生更多的一个优势
所以才会觉得说因为我没有完全能够掌握到这门技能或者是 AI 如果做这个他又 AI 不需要休息 AI 只需要算力和电对于自己的未来可能会产生这样一定的一个迷茫我觉得人人都会有这样的一个迷茫但是如果说是因为迷茫所以不去发展 AI 我觉得有点稍微有点因噎废食的这种感觉我
我们所能做到的可能就是第一就是降低 AI 的使用门槛让人人都能够运用在 DeepSeek 刚开始出来的时候我其实就跟梁老师聊过这个话题因为我当时也比较兴奋就是觉得至少它能够把一些像使用的一些成本之前的如果要使用 GP 的话你要用它的一个推理模型的话使用的成本门槛是相当的高对
普通人非常难以去触及到他的 OE 的模型但是这次二一模型出来之后整个业界内包括其他的一些普通用户去使用它的话就说是破圈了真的是一个破圈的行为所以我觉得至少有非常大的一个可能就可以把普通人去使用 AI 的门槛就降得比较低了就包括春节的时候
我把我妈也教会了让她怎么去使用一个模型因为她可能在一些场合上的确也会用到阿老师刚刚讲这个东西的时候我突然就想起来了我之前看了一篇文章是一个加州大学带我一次分校的经济史研究专家
然后他叫格里高利克拉克他当时其实有写过一篇文章我印象非常非常深刻他写的一篇文章叫做为什么工业革命前科技越进步民众的生活水平越低然后他在那篇文章里面其实有讲几个不同的时间节点我觉得特别适用于我们今天讲的那个主题他当时
他当时就说到在公元前一千年到两千年这个几个不同的时运节点他所呈现的就是人们的生活水平以及当时的科技发展的水平对于人们的生活产生了什么具体的影响我记得他在文章里面有说就其实
公园 1800 年是一道分水岭因为那个时候第一次工业革命开始了 1840 年 族民反杀接着出现然后当时就是很多国家的人均收入直线的上升
而造成这一切的原因就是
因为实际时代的采集者他们可以通过从事少量的工作就满足物质的所需但是现在的人发现 1800 年的英国人他们可能要拼命一辈子才能够得起骑马的舒适
从物质消费的种类来看其实它消费的像衣食住行它的种类它并没有增加一般采集者的饮食和工作生活它远比 1800 年的典型乌龙工人丰富多彩尽管当时英国人的餐桌上多了茶叶胡椒和糖这种博来品但是呢
我们回到狩猎的采集社会它当时其实是一个平等的状态然后各成人之间的物质消费量它是相差无几的
我记得我当时第一次看这个文章的时候我特别敬意他讲的这个观点因为他就是说其实工业时代的这种进步带来这种技术上的便利的同时他会发现说大众的收入它其实并没有增加然后我们在享受性的这种消费其实看似增多了但是它其实种类也没有增加那对于大众而言它可能
生存条件其实并未好过他们在非洲草原吃剩裸体的祖先然后当时还讲了一个观点就是说如果依照最广义的物质生活标准人们的平均福祉从实际时代到 1800 年他甚至不禁反馈 1800 年代他单凭低技术性劳动力为生的穷人若回到狩猎采集社会
日子说不定会过得更好那么我们为什么会需要工业革命来就是引发一次又一次的技术革命然后呢让我们的技术进入下一个先进的时代
他在这个文章的结尾提出了一个我认为非常能够宽慰到我的观点克拉克他在他的文章里面说前工业时代的英国会被称之为不断向下流动的社会因为在过去非常缓慢的技术进步它其实会被人口的增长所抵消富裕人家它也会随着时代的洪流所分别就是像我们经常讲的一句话说富不过三代嘛
然后他会依次的不断的离开权贵地方然后往下社会下层去寻找这个机会手工业工匠的儿子他可能过了几代之后他会变成普通的工人大商人的公子他会变成无足轻重的小贩大地主的子女会变成小地主而原本就生活在底层的居民生存空间则一再被挤压这个原因是因为这个社会他们在不断的向下流动
他们没有产生新的真的非常先进的科技让整个社会非常蓬勃地流动起来这个流动是非常重要的每一次的工业革命它带来的最大的发展其实并不是在我们回顾历史的时候它聚焦在非常个体的像享乐或者说消费包括说在当时的一些有关工作的更替上它其实是对时代有一种大的前沿性的发展
然后包括说我当时第一次看到这个文章的时候我就在想说
时间现在来到 2025 年了然后我们站在当下的时间节点去回望这 2000 年的历史我们会发现说工业革命以前的人类世界它其实在过去的 1000 多年内它几乎是可以称得上是浸入止水因为其实人类的真正的工业发展它就是从 1800 年那个时间阶段开始到这之后的 200 多年
我们的社会我们的工业时代发生了翻天覆地的改变如果对我们从当年的真理访杀机看今日的 Chad G.B.T 可能我们能够得出相关的思考就是科技对于普通人作用它到底是什么像阿尔是刚刚讲的如果有一天 AI 它的技术壁垒不像是现在这样子就是我们对于 AI 的恐惧是它会让我们从生产线上被优化走
那其实这个恐惧和当年的人们 1840 年的人们第一次看到《真理法》二级的时候它的恐惧其实是特别相似的当时的人们和我们有特别相似的恐惧就是因为我们作为人类我们在重复性的工作这点上面是一定不可能比机器更强的那么今天人工智能同样的它非常擅长的去做重复性的工作这也是很多白领甚至是高级白领感到有危机的原因就包括像律师维利
我们强调以创新对抗进步的科技文明的时候律师医生这些职业它都是依据严格预调或者病理所工作专业这种工作它会更加的有危机感因为 AI 它可以非常容易的去重复这种有规律的就像二老师前面讲的
它既然有规律的这种固定的模式它就非常容易被 AI 的大模型去学习然后所去运用再去真正的执行到日常的工作里把人从这场线上解放出来但是其实我觉得我们站在 200 多年之后的平平相教授说的克拉克他所在文章里提到的这个观念是我们可以看到的
如果有一天 AI 它下放到每一个民众,就像过去的仿杀机,今天我们每个人都在用的电灯一样,当这个技术壁垒完全被打破,像 DeepSick 它现在做的让大部分人都可以运用的时候,我觉得每个人都在用它,那可能我们每个人就可以在这个 AI 往前走的这个时代潮流里面找到自己的位置。
其实我们刚刚聊的这些话题它更多的是有关 AI 它对于人的这种威胁性然后阿老师也讲到就是关于 AI 的一些技术壁垒问题现在我们也可以进入到我们今天要谈的第二部分就是说普通人我们如何利用 AI 的工具来辅助性地进行一些自己的工作
包括说在这个部分阿尔是可以跟我们聊聊 GPT 和国内外其他工具的区别然后以及我们作为普通人应该如何去使用这些 AI 模型可以怎么样更好的发送指令让它帮助我们完成我们的工作好目前来看就是像国内外基本上有像 ChatGPTCloud 然后像 Google 的 Gamini 然后
然后国内其实更多之前有六小龙目前来看就是市场上比较成熟的产品其实他们都有各自的一些专长像 ChatGPT 就不遑多让它目前来看它依然是一个领先者甚至说它是目前这个领域唯一的一个开疆拓土的这样的一个类型我觉得其他所有的 AI 工具基本上都是一个追赶者的一个角色只有它还是目前来说是唯一的一个开疆拓土的这样的一个角色
而且它应对的也比较快像 DeepSeek 出来之后它在 2 月 2 号它把自己的 O3 Mini 已经开放出来了而且是免费的一个试用不过依然是会有一定的次数的限额然后应该是在昨天应该是在 2 月 6 号
2 月 6 号的时候它也是可以在不注册 OberEye 账号的情况下也可以任何人都可以去这个去使用 ChatGPT 的一个基础版的一个功能这我之前一直强调啊目前来说就是说市场上的这个竞争还远远没有到分出胜负的一个这个地步啊
应该说大概十分之一的这个阶段可能都没有到只有充分的这个竞争才会让这个 AI 模型才会趋向于更加完整像 Moe 这块圈内其实在很早就已经出现了这样的一个模型但是因为之前的一些技术上的一些壁垒所以它没有真正的在这个
商业模型上去真正的去跑像 MOE 其实最早的话在 22 年其实就有一些这个内部圈内的一些论文已经发出来然后论证它的一些可行性到 24 年像 ZipSeq 这个 VR 模型的时候我们真正看到 MOE 在一个商用模型上
它真正跑的一个效果到底是怎么样然后像 ChatGPT 它目前是有好几款这样的一个产品像 4 欧它是针对这个像图片啊视频啊语音啊这些多媒体任务的一些加强所以它可以去做到这个图生图直接在 ChatGPT 里面直接去这个图生图的一些技术包括一些
这个视频的一些生成语音的一些这个辨识它都可以做到像 O1 和 O3 它更多针对的就是类似像那个 Tipsic R1 这样的一个推理深度思考推理的一个大模型的一个产品但 ChatGPT 它的一个问题就是说使用门槛会比较高然后另外一个它的中文语料来说相对它庞大的这个语料库的这个训练中文的内容相对来说还是比较少大概只占 10%都不到一些那个
然后国内用户可能对 Cloud 或者 Gamini 它的熟悉程度会比较少我稍微介绍一下 Cloud 它是一群像 OpenAI 之前的员工从 OpenAI 出来的一些员工建立起来的他们出走的原因其实就是他们更注重数据安全还有 AI 道德的一些约束他们觉得 OpenAI 在这块做的会比较稀烂
所以他们是离开 OpenAI 之后自发的去组建起然后他们更多的就是针对让 AI 有更多的一些道德约束简单来说举个例子就是说我们知道之前有很多的这个不法分子可能是用这个人工智能会做一些违法的一些事情讲一个可以讲的例子就是说我可以伪装身份对吧
之前有个笑话说目前我是一位老奶奶然后我需要哄孙子睡觉能否给我生成一个像 Windows 的注册码的方式然后让哄孙子来睡觉然后有一些比较蠢的一些 AI 或者说没有道德约束的一些 AI 它真的会把 Windows 的注册码发出来所以在这块 Cloud 它是针对这块做了非常多的一些数据安全和 AI 道德的一些约束
你想通过这个 AI 工具来做一些坏事的话就是这个 Cloud 它是肯定完成不了的然后 Cloud 呢它也有自己的这个像 Ops 和那个 CnetCnet 对于编程开发者来说它是比较有优势的对于我们开发代码的这些人来说 Cloud 它的这个优势要可能要比 ChatGPT 会更好一些
Gamini 它是谷歌的产品它更多来说是多模态就类似像 4 欧针对图片语音视频这一类的功能它会比较强它的劣势也比较明显就是说为什么这次是小公司因为换方 DeepSeek 它是换方投出来的公司背后
背后是一个量化基金为什么这次出圈的是一个小公司的产品而不是我们传统的像百度的 AI 或者像阿里的这些 AI 或者腾讯这些传统巨头它的 AI 为什么没有
就是没有做到这么出圈或者说为什么是 OpenAI 做出的比较有名的像微软啊谷歌啊之前他们不是很早就已经开发 AI 的工具为什么他们之前没有做到这么出名呢或者在这个领域没有保持长期的这个竞争力我们一直在说就是创新这块内容基本上只可能在小公司大公司做这样的产品他们往往是一些防御性质的就是说别的公司有那我一定要做一个
我做这个目的并不是说有多领先而是别人做了我们就一定要做所以这叫防御性的一个产品他们的优势是说我有资源但他们的劣势也就是说资源太多了所以大家都不想去怎么好好去利用只要别人做的东西我们要有就可以了
所以我一直不看好说这些大公司做的 AI 产品国内比较有特色的国内的因为 AI 内容太多了我可能只挑几个有特色的一些产品来说一下像 Kimi 月之暗面它之前也是小公司投出来的它的优势在于说是一些长文本长 token 我前面也讲到就是说
大模型它本质就是和在 token 打交道因为它并不知道你的指令到底是一个具体是什么意义它认识的就是 token 如果有一些开发有经验的一些小伙伴就知道就是说他们的 API 收费也是根据 token 的长度来进行处理比如说每 100 万 token 输入输出 100 万 token 大概是一个什么价格
它所有的本质就是和 token 来做打交道所以大模型在处理 token 的时候它是有一个上限一般来说你让它书一个写一个 800 字作文它可以做那你让它直接写一篇 10 万字的小说那基本上很少有大模型直接能让你输出非常长的一个小说的这种类型比如你让它写 10 万字那肯定为难它 Kimi 在这块呢就是说是相对来说是比较出色的这样的一个产品
因为它不论是输入和输出的这个 token 的这个上限都是非常的高而且大模型在处理 token 的时候它会遗忘它突然之间就是前后文之间因为我前面也讲了就是说在做文本预处理的时候其实就是文本和文本之间内容和内容之间然后会产生关联如果你一下子输入非常多的这个文字内容的话它之间的关联关系就变得非常复杂
表现出的行为就是他会忘了你之前说的内容明明你输入了可能大概一万个 token 然后他可能只记住了你前面 20%的内容后面 80%的内容可能忘记了他其实在处理的时候他溢出了或者说他处理的时候把有一些内容就舍弃掉了那 Kimi 呢他基本上可以能够做到将近是 200 万 token 左右上下的数据输出
所以目前来说在这块是比较有特色的唯一的遗憾就是说它目前它基本上都是指令式的一个模型目前没有推出相应的就是说那个推理的这个模型之前豆包的这个广告也投的比较火嘛在一样的就是它和谷歌的产品也是一样的道理它 Gamini 的也是一样的道理就是说背靠大公司它是往往是都是有比较好的一些资源但是
但大公司呢它的这个思维想法基本上都是一个防御性的产品谈不上它有多坏或者谈不上它有多好应该来说只能说就是别人家公司有的东西就我们大公司一定要有一个东西没有这个市场上采报上可能就觉得不好看了而且它的这些内容来说它的内容采集更多的也是自家的一些产品听你基本上是内容采集呢基本上都是像
头条啊抖音啊这些产品会比较多一些然后所以内容上比较偏娱乐如果你要去正儿八经的去做一些那个学术上或者编程上这个内容你要去参考他的话他的这个语料库就没那么丰富所以专业性上是比较大打折扣的 OK 这基本上就是目前讲了一些一些国内和一些国外的一些大模型的一些区别吧
我也看了一下微博上的一些内容大家可能感兴趣的内容就是觉得很多人觉得 AI 工具挺好我也知道 AI 工具也挺好但是我可能就是本身就是电脑小白或者我也不是一个理工科出身的人我怎么去使用这些工具呢然后针对这个问题我可能是稍微讲一下一般来说你如果说要去认真学一个工具的话只有说这个工具能够给你带来收益或者是利益的前提下
我觉得人才会去主动学习并掌握这样的一个工作所以基本上可以从这几点入手我的建议是说你先可以从最最最最简单的一些效率提升这个角度可以去着手很多打工人可能每天他们对吧要去写日报啊然后每周的周报啊然后到一些项目总结啊然后会议的这个记录生成啊所以从这块其实大家就可以去生成去入手吧
像这种日报周报其实它也是有一定的格式的要求啊就是说规律性会比较强的一些内容其实像这块的内容其实完全可以交给这样的这个 AI 工具来做到生成还包括项目总结这块然后会记录也是一样的会记录我觉得丁丁目前的一些注射的一些打个广告了变成丁丁的一些那个 AI 的一些工具其实也做得挺好然后另外一个角度呢你可以从你的兴趣入手比如愿意去做一些
尝试烹饪去做饭的一些这个朋友可以去让 AI 去帮你去生成一些菜谱列出这个制作的一些过程
如果说你有一些旅行计划节假日有一些旅行计划出行的话告诉 AI 你的预算目的地的旅行时间让他去列一些这样的一些旅行规划原本我可能要去查小红书你把你的预算这些方案全都告诉 AI 让他来给你出一些动态的一些旅行规划比如说有一些亲人或者朋友生日你也可以告诉 AI 你朋友的一些喜好你自己的一些预算让他来出一些选礼物的一些创意我觉得
可以从很多的生活的一些细节出发去着手在任何场合从效率着手或者从你的这个收益这个角度上去我还看到过直接拍张图让 AI 去判断一些水果水果的一些成熟度然后帮你去挑水果然后避免有些这个西瓜太深或者太熟带来的这个问题这其实也是一个方案也是一个场景就是我们生活当中有非常多的一些场景
都可以去使用这些工具来能够做到当然如果说你有更深次的一些商业的需求或者个人的一些需求我的建议还是说你可能稍微有一定的计算机基础
去做一些前面的 AI 就前面梁周就举了个例子比如说我可能希望 AI 能够去帮我去定向抓取一些文章啊或者说在一段时间内网上出现的各种一些新闻的一些热点这个东西就是它不是一个现成的内容如果你有一定的这个开发的基础的话你可以去构建自己的一个 AI 就 AI 的这个代理的这样的一个模式现在这一块呢也是整个
未来的一个发展的一个方向就 AI agent 这块就它不仅仅是直接使用工具比如说你我下一个 APP 或者我直接在网页上去提问它是把你的整个的计划呢做做一个任务分解作为任务分解然后任务和任务之间会有一些关联你要把这些关联全部创建起来让 AI 去帮你逐步分解任务然后每一条任务的完成然后再汇总
把这些内容能够构建在一起了我们的行业内称之为叫 AI-Agent
这块其实是整个 AI 目前的一个热点还有一条就是说所有 AI 提出的这个建议我建议你们还是要多多交叉的验证因为梁州昨天其实也写了一篇文章叫这个 AI 幻觉这也是非常重要的一条因为目前来说产生 AI 幻觉的这个机制会有很多最大的问题可能就是 AI 会因为现在的人类的高质量的语调在训练的时候基本上就已经耗尽了所以为了这个训练
下一代 AI 的情况下很多时候各家公司就是会产生叫合成数据这样的一个问题就让 AI 自己去写一些东西然后再自己喂给自己然后再重复训练这样的话就是会产生一个什么问题呢就是 AI 会把自己一些没有经过证实的一些内容在这个基础上再进行推断就非常容易变成这个胡说八道我俗称我们叫胡说八道就是
学名叫 AI 幻觉 AI 可能在一个非常陌生的领域然后又缺乏一个经过检验的一些数据
轻而易举地得出一些新的推论在这些基础上就会造成非常多的 AI 幻觉所以我觉得你们在使用 AI 工具的时候还是要一个是交参验证另外就是说不能说 100%的完完全全地信任所有 AI 的提出的一个建议最终拍板的还是你们自己 AI 只能提供一个建议和参考的一个理解
其实我个人感觉就是现在很多朋友开始用 AI 但是大家并不知道让 AI 怎么样为自己创造真正的就是超出它日常使用应用率之外的生产力
说的笼统一点就是其实我们大部分人在用 AI 的时候还是陷于日常问它一些问题但是要怎么样真正的把它转化为我们的生产力让它变成可以就是帮助我们的工作甚至让我们赚更多钱的一个工具才是我觉得下一阶段大家更应该考虑的问题就我自己而言
我和我们的博客制作人咸宇我们都有一个相同的观点就是如果说在使用 AI 的这个过程里他教会我最重要的事情就是从一个写作者然后他开始转换身份变成一个编辑一个管理者一个像丘吉尔一样懂得发号施令的领导
因为其实咸鱼他之前写的一篇文章就是叫做像丘吉尔一样写作然后每次向周围的作者朋友安利 AI 的时候我都会提到他咸鱼他当时说丘吉尔一辈子写了一千多万字还凭借六卷本的超级大补头第二次世界大战会一路拿了诺贝尔文学奖
他能写这么多当然不是因为他勤奋一个每天中午十一点起床一天要扣掉一整瓶香槟抽掉十军学家的贵族老爷他怎么可能勤奋呢邱绝尔他之所以能够写这么多是因为他的写作方法和我们不一样他不用纸笔来写作也不自己敲键盘而是口述给打字员打字员把他的口述内容变成文本之后还有秘书来帮他润色
最终形成能正式发布的作品这样他一辈子才能写一千个万字实际上《盲乐大人物》基本上都是这样写作的就包括现在的一些企业家和著名的学者他们写书也不是自己一个字一个字敲键盘他们会有一个大概的思路然后告诉秘书或者是枪手由他们来细化逻辑并根据大人物的工作资料把内容整理成合意正式出版的作品
像闲鱼他就会认为感谢 AI 现在普通人也能像出血一样洗脑但是在我的观念里其实我认为
像邱毅尔一样的写作这个东西它给我最大的启发是对于普通人而言其实到底什么东西它是真正能够转化为有用的生产资料的呢每一个人就是当 AI 它可以让每一个普通人像邱毅尔一样去写作就承担大部分的撰写彩写编写的工作的时候对于人来说
我们的核心竞争力到底是什么其实就是我们的创造力人类最重要的品质就是创新这种拼搏的勇气和灵光的逆向的这种奇思妙想呢
它是最重要的因为我们让 AI 去创造一个文本的时候最重要的其实是我们给予它的思路和我们到底要它做什么也就是我们给予它的这个咒语才是最重要的比如说我现在是一个自媒体博主然后我想写一篇能够在小牧师上面有 1000 点赞甚至 1 万点赞的报文
我要如何让这 GPT 去创造一篇所谓的报文呢就我们肯定不能说给他一个指令这个指令是你现在帮我写一篇能够在小龙设计用 1 万点帮的报文那么他给你的这个结果能够转换成实际性的 1 万点的报文的基础是非常非常低的因为其实在我看来现在的 AI 它还是不够了解或说它的算力无法支撑它去完成
完全撰写一篇能够在人类社交平台取得巨大共鸣的文章
像 Deep Seek 刚出来的时候很多人非常震惊他写的诗尤其是当时很多人会觉得说比如说你要让他创造一首跟东北有关的现代史你会发现他写得非常好非常的工整他对于梗的拿捏也很好但是你让他写得多了以后你会发现说他的确在模仿文本上因为他有非常强大的中文语调库他在文笔上写得非常好但他就是空心的 A
AI 它的确具有强大的用不停歇的执行力同时它的模仿能力信息检测能力也是人类难以触及的
在熟练使用 checkgpt 的这两年,我会认为说当下的 AI 它至于我而言,它的确是一个非常强有力的伙伴,它可以是信息探测器,帮助我们从大量的数据中找到精准的信息,但同时它也会骗人,所以它对你交叉验证能力是需要你更加的加强。
同时它也是我的内容知识表达的触手比如说 DeepSeek 它有了这种深入思考的功能之后我认为它可以通过生成语言然后帮助用户表达和扩展他们的想法
包括在不断下达指令的过程里,我也会认为说 AI 它在锻炼我的思维,如果更快捷,简短地发号指令,如果在更短的时间之内,更加高效地检索、判断、编辑 AI 所给予我们的信息。所以我会认为说,在这个人类和 AI 共生的时代,我们所保有的
最大的竞争力就是在于人类永不停歇地探索遗忘或许 AI 它能够效仿人类写出一篇跟张爱玲有着相似文笔的文章但是它永远不会懂得说张爱玲她当年坐在窗前然后看着窗外的月亮去想说这个每次下雨她想要的并不是下雨
而是因为下雨了这个人他可能会晚十分钟来那在等待他这十分钟里他要多想这个人十分钟
我觉得这种共鸣是人所独有的包括说这种永不停歇的探索意望会驱动着我们不断地进化让文化历史在时间的沉淀中绵延不绝人类它至于美的这种意义的追寻是超越国别种族和时间的共识就像我们在欣赏国外的电影或者文学作品的时候我们会发现说我们至于美的
这种共识基于一些美好的事物的这种同样的通感它就是跨越所有的国民种族和时间的这种共识它就是人类独特的通感所在我之前写过一篇文章就讲说纵使 AI 它可能可以极尽精巧地模仿人类的理念和文学但它的模仿在当下仍然局限于人类所给予它的
框架也即是他强大的从互联网上搜寻到的医疗库但是他看山终究就只是山他哪怕说我们可以通过拍张照片让趁机可以识别每一片叶子的形状和结构但他没有办法看山川而见日月见天地见苍生见过去和未来就正是因为耳内他拥有超越具体事物的想象力和风感
所以我们的文化才能够跨越千年持续地伸展因为我们看见的山它不仅仅是山而是承载了无数历史还有未来与意义的象征这个是我认为的人类创造力和 AI 无法跨越的本质的差异至少我相信在当下人类的想象力它仍然是 AI 无法复制的引擎对于这件事情我仍然是抱有很强的信心
对目前来说算力应该还达到不了就像我前面说的因为对于 AI 来说它其实它没有创意它所有的一切都是关联 token 之间的关联文本和文本之间的关联你给到它的语料的内容越详细规则整理好然后它可以在关联的基础上然后进行扩展对它来说它不知道什么是山水或者之类的这个含义对它来说就是一堆文字之间的关联
i wanna i wanna have you more when you
i don't know why i doso won't you give
i wanna have it all with youi wanna have it all with youopen your eyesby your sidei wanna have it all with youi wanna have it alli wanna have it allcause your love is biblicalit's biblicalso won't you get to know
Publica