cover of episode 模型进化其实在加速,来个近期盘点

模型进化其实在加速,来个近期盘点

2025/3/27
logo of podcast AI产品黄叔

AI产品黄叔

AI Deep Dive Transcript
People
(
(未提及姓名)
Topics
多个发言人:近年来大模型发展日新月异,多个模型的更新迭代速度不断加快,例如DeepSync v3在前端生成和审美能力上取得了显著提升,利好国内AI编程工具;DeepSeek持续演进,并与千问等模型持续开源,推动了整个模型市场和生态的快速发展。Gemini 2.5 Pro模型在翻译等方面表现出色,其免费API和超长上下文窗口使其在复杂场景中具有显著优势,并对OpenAI等公司造成了一定的压力。此外,Cloud 3.7在代码能力和前端审美能力上也有大幅提升。模型的快速进化带来了新的特性和挑战,需要我们不断学习和适应,并预判未来的发展趋势,才能在竞争中保持领先优势。目前,模型能力已达到能够影响世界的水平,新的生态位(如AI编程、多模态应用等)开始出现,为我们提供了更多机会。

Deep Dive

Shownotes Transcript

感觉确实模型在加速进化我说一下朦胧的一些思考最近其实没有深度的花时间去研究整个大模型市场的一个趋势我就讲最近我看到的很浅显的一些闪点的串联

这两天其实有大量的新的东西出来第一个是 0324 的 DeepSync v3 大家都被震撼到说它的前端生成和审美能力在 Cloud 3.5 和 3.7 之间这是一个非常显著的提升我们也觉得是极度利好于像国内 AI 编程 coding 工具 Tree 这样的产品因为大家不用翻墙就能够很快的

去做出一些就是能力更强的东西了但这个背后呢其实还有是 DeepSeek 它持续的在演进对吧我们知道说 12 月份发的 V3 然后到现在发了新 V3 还有像 1 月份发的 R1 然后后面还肯定会持续在发 V4 R2 那它会带着国内的整个生态和市场会去跟进

包括昨天晚上千万也开源了一个新的小尺寸的多么泰的大模型是 2.5 的 O mini 然后早上我也试了一下它是可以视频通话的响应速度肯定在一秒以内可能大概有 600 到 800 毫秒之间响应就非常快了你几乎觉得说你说完它

很小很快的思考一下马上就给你答复所以我觉得包括千问它也在开源它是很多尺寸都在开源千问和 DeepSeek 两家在持续开源的它会对整个模型的市场和生态会带来极大的拉动作用到国外的话我们首先

要讲的第一个模型是什么其实我想讲的不是 Cloud 3.7 而是 Gemini 大家如果去谷歌 AI Studio 的话会发现它有很多个模型都是免费的提供给用户去用的包括最近刚上了 Gemini 2.5 Pro 这是一款

已经很厉害的模型昨天我用它做了一个什么 case 呢我把之前我看了一本书叫十倍比两倍更容易这本书有 268 页的英文 pdf 我全部丢给他我只跟他说了一句话提词词叫做请帮我进行全文翻译不要遗漏任何内容然后他总共花了 20 分钟中间间断了一次我就说了一下继续然后他就完成了所有文字的翻译并且我抽查了几个地方我发现

内容没有遗漏并且翻译的质量跟过去去年年初我用 GPT-4 加一段比较两段比较复杂的提示词相当于是先让他按字面进行翻译然后再进行优美的意义

使得他阅读体验更趋向于国人嘛我觉得那种提词词还是比较厉害的然后也符合实际翻译的工作流但现在 Gimli 2.5 Pro 用就一句非常简单的提词词它的效果就已经跟那个

去年 GPT-4 的效果各有千秋我觉得阅读体验已经非常好了几乎是没有什么可以挑剔的地方它翻译质量肯定是到了 80 分以上你不用想了

更别提它之前 2.0 有一个模型是可以用 chat 来进行图像的生成以及继续修改的就是 chat to peek 对吧那这个也是挺强的

所以 Gemini 这么一搞之后因为 Gemini 它是 2C 是完全免费的 API 个人的话有一些限量限速但是也是免费的你可以去购买它的商业版也很便宜然后它有超长的上下文对吧一兆的 token

那你像其他最长的像 Cloud 3.5 3.7 就也只有 200K 嘛是它的五分之一所以超长上下文它就能够在很多复杂的场景或者说长上下文的场景很好用像我刚刚说的翻译我们说这个 268 页的英文 PDF 翻译只消耗了 20 只消耗了 200K 的上下文窗口就它它总共是一兆嘛所以其实还有

还可以翻译四本书这样的长度就在一个对话轮次里面所以它是非常厉害的它的出来其实我觉得昨天 OpenAI 也发布了 SOSO 也是这种 chat 去改图的逻辑但是它生成图片的质量变得非常的高了其实相当于

OpenAI 它也被这些开源的或者 2C 免费的模型和产品倒逼它要快速的去做应对是吧 DeepSync R1 到 Gemini 2.5 Pro 它都是要仓皇出来应战相当于

这些大厂和开源公司的存在和持续往前推进它也会让这些闭源的厂商非常的就是非常的得用尽全力去冲才行所以你会发现模型市场现在在持续的快速的演进而且 4 欧的出现其实昨天让不少人开始进入一种恐慌的状态因为

4 歐這個

深途的能力已经非常非常的强了他强到说原来大家可能需要用 config ui 去搭一个复杂的工作流才能够出的一些东西现在一句话人家模型就给你搞定了也就是说你过去你所有想在原有模型能力上面通过复杂的这种工程化的手段去搭出来的提高它的模型效果的事一下子就被模型能力本身的进化

全部给吞掉了这个事情是让大家非常恐慌的就昨天我看到了很多同学包括这些球啊包括龟上啊橘子啊都都在说这个事啊那它其实会确实是一种挺可怕的变化然后说回到模型市场呢其实除了这两家之外还有 Cloud 对吧

很说配个的这个 cloud3.73.7 的出现其实代码能力我个人评估是只比

Sonnet V2 去年 12 份发布的版本代码能力上提高了 20%但是前端审美能力上面提高了百分之百是非常的夸张的就像你让他去生成用 HTML 渲染出来的图片你都会觉得很惊艳所以出现了像国内 Meta 这样做的这种互动式网页

当然他肯定没有办法用用 Cloud 但是像我们说的 V3 已经部分的达到那个效果了对所以你会发现现在哇这段时间我就觉得有点忙得慌嗯对吧国外除了是三巨头还有 Glock 我都没说呢哎呀所以你会发现如果单纯跟的话肯定是跟不过来就是模型性特性它是一种

让人眼前一亮甚至说会有点震惊的这种持续的在涌现那对我个人来讲如果说模型的快速进化带来的各种新的特性你去落地有点应接不暇的话那到底我应该如何去沉淀自己在这个市场里面的一些领先的优势认知

这一点是很关键的以及说你如何去预判下一个风口可能是什么并且在那个风口上面提前做准备这个也是非常的重要的这个事情它会非常的影响你自己个人在整个生态里面的位置

反正我现在越来越觉得说一个人很难持续的去构建这种优势就是你会疲于的被各种东西所干扰所影响你的判断但这又是极其难去守住自己基本盘的一个时代那怎么样来应对呢

这其实是一个非常好的问题我也在思考但最近我也会着力去跟进一下预判一下趋势然后提前做出一些判断这一点是极其重要的

好吧今天就聊这么多其实主要想说的是模型的进化并不是在放话而是在加速以及说你可以认为模型如果说从 GPT4 当时可能 60 分其实到现在已经完全变成了 70 分到 80 分的水平它已经到了一个不需要 GPT5

也能够影响整个世界的一个阶段了所以这个时候各种生态位就开始出现了比如说 Air Coding, MCP 对吧各种 Agent 就开始涌现了这个时候就是它的模型能力已经到了一个非常不错的位置然后在上面会有更多的上层建筑开始出现

我觉得已经进展到这个阶段了所以大家要想清楚想清楚到底我们可以在这个时代做什么做什么就我绝对不会说只是啊对不多说了好今天就聊这么多拜拜