cover of episode GPT-5戳中DeepSeek弱点?微信接入R1有意义吗?-Vol64

GPT-5戳中DeepSeek弱点?微信接入R1有意义吗?-Vol64

2025/2/16
logo of podcast 脑放电波

脑放电波

AI Deep Dive Transcript
People
N
Nixon
托马斯白
李楠
Topics
托马斯白:我们想讨论DeepSeek在面对竞争对手(尤其是即将发布的GPT-5)的反击时,AI模型和应用端接下来的趋势与机会点。DeepSeek的突起引发了AI领域的新一轮竞争,各家公司纷纷推出应对方案,其中OpenAI的GPT-5备受关注。本期节目将深入探讨DeepSeek爆火的原因,并分析其相较于GPT-5的不足与挑战。 李楠:DeepSeek的强大之处在于它首次向所有人展示了模型的思维过程,这使得它在开源项目中脱颖而出,提供了大量可复现的成果。DeepSeek的开源协议MIT对商业应用几乎没有限制,这促进了其商业化部署。GPT-5的发布实际上是追着DeepSeek的弱点打,尤其是在语音交互和多模态方面。DeepSeek需要尽快完成多模态甚至原生多模态的进化,才能应对GPT-5的挑战。DeepSeek之所以选择彻底开源,是为了构建周边生态,与其他开源模型玩家形成对比。DeepSeek的成功实际上是开放与封闭之争,不应让OpenAI一家独大。 Nixon:在DeepSeek发布后,各大科技公司纷纷做出反馈,GPT-5的发布受到了R1的压力。GPT-5将集成推理模型和各种多模态能力。Cloud 4的核心预告是具备高级推理模式和普通模式两种模式,并且能够混合使用。Publicity在照抄ChatGPT-01和DeepSeq-R1的表现,并且免费提供。主流厂商都将关键词压在推理模型的结合以及集成多模态能力上。

Deep Dive

Shownotes Transcript

大家好看到标题先把刀放下我们稍微有一点标题党相信大家在经过了春节到现在这一个月左右的时间应该已经被 DeepSeek 全方位 360 度的轰炸过一遍了我们更想聊一聊 DeepSeek

接下来要面对的来自所谓帝国的反击我们已经看到在 DeepSeek 发布之后来自美国的竞争对手们纷纷推出了自己的应对的产品或者是应对的方案那我们在其中看到最抢眼的就是来自 Sam Altman 的一条推特

他们将发布 GPT-5 并且讲了一些关键词我们想聊一聊 DeepSeek 的这些强悍的对手们

他们接下来会出什么牌以及里面有哪些真东西跟真功夫今天刚好是 DeepSick 大火之后大概两周我们看到所有的关键对手都把自己的牌给出明白了所以我觉得今天是一个很及时的一个时机为了更好的聊这个话题所以我们今天又请到了我们的老朋友李南对 所以这次不是假的就是黑暗面

的绝地武士来了 openair 的 GPT-5 看起来很强在聊 GPT-5 之前我们先叠个假实际上 DeepSeek 它的强大我觉得在过去的这段时间里面大家已经看到各种各样的角度我觉得大家可以分别讲一下其实 DeepSeek 是全球第一个把模型的思维给

所有人展现出来的模型应该说这种思维过程是 OpenAI 跟 DeepSeq 两者分别独立发现的因为 OpenAI 既没有开源也没有把思维过程展现出来所以如果认为让模型可以自己先思维一下然后再做回答这件事是一个重大的发现的话那么 DeepSeq 跟 OpenAI 都应该同时拿诺贝尔而且 DeepSeq 还更重要一点

其实 DeepSeq 作为一个开源项目它很快就看起来是超越了过往所有的开源项目其实很大的一个点就是它提供了非常多的可复现的东西基本每两天就能看到哪个大学又复现了 DeepSeq 的一些工作我们在后面会附一个列表如果大家还没有体验过 DeepSeq 能力的话我觉得大家可以好好体验一下真的是一个我们认为这种推理模型这个维度

它生成的内容我们认为是真正可用的一个逆转点同时用更低的成本实现了这一点而且 DeepSeek 很重要的一点是它的开源协议是 MITMIT 对于商业应用几乎就没有限制非常的宽松 MIT 基本上仅仅是要求你告诉所有的人我用的是你而已所以这个应该是很大度的一个开源协议而且现在你告诉所有人我用了你

几乎是一个流量密码恨不得用最大的声音说我用了你对所以它在商业化的这个部署上几乎可以说毫无障碍我想补充一个误区 DeepSeek 无想要已经变成了一个梗但是呢因为 DeepSeek 是 MIT 的开源协议所以说其实 DeepSeek 是没有义务提供一个集中化的非常响应良好的

访问的 deepseek.com 的网站呢所以这个大家继续开源理解一下其实很多人还是在用 deepseek.com 的那个服务我看到他那个服务响应的比例在国内已经是第一了为了 deepseek 好我提倡大家用第三方部署的是为他省点钱吧关于 deepseek 的讨论我们先告一段落后面我们可能会再提到那今天我们想跟大家更多聊一下的是 deepseek 面临的这些竞争啊

因为我们看到在 AI 这个领域实际上遥遥领先的这些美国的科技公司他们在过去两周里把他们手里的牌出了一遍我们能看到各家都在针对 DPC 做出了自己的反馈我们可以请尼克森来给大家介绍一下

对 GPT 首先是 Sam Altman 出来发推特大概的意思就是说我们本来有一个 GPT-5 但是达不到自己的训练预期它命名为 GPT-4.5

在过去接下来两个星期发布出来的我觉得主要还是因为有 R1 的这个压力这个命名得取点心思他预告了 GPT-5 将来接下来几个月发布 GPT-5 上最大的创新呢就是把推理模型和各种多模态的能力啊它都完全集成在一个模型里面了我们会单独展开去讲啊

那除此之外之前被很多开发者和用户认为是最好的语言和编程模型的 Cloud 来自 Anthropic 的这家公司呢预告呢也是针对它的最新模型 Cloud 4 它的核心的预告呢也是说我具备高级推理模式和普通模式两种模式而且我还能够混合的去使用这个点待会儿也会展开讲然后呢呃

我们能够看到现在全世界最理先的 AI 搜索引擎 Publicity 就在今天我们录制当天自己就发了一个 Deep Research 的能力完全就是在照抄 ChatGPT-01 和 DeepSeq-R1 的表现而且是免费提供最后最后还有几个小厂商反正也都在开始预告自己的事情

比如说 GoogleGoogle 重点说多模态能力和推理能力的整合然后来自 Elon Musk 的 XAI 它的模型名字应该叫做 Grok 差不多也是一两周之内就发布了叫做 Grok3

大部分人都认为它的暗示就是说它这个 Gorax 3 会达到 R1 的水平最后我们看到一个主流玩家是来自于中国的百度他是直接做到了免费和开源这两个事情就是我们常见的文心一言这个 APP 所以基本上来说中卖所有的大模型和大模型应用的主流厂商这一次其实都把关键词压在了同一件事情上我要做推理模型的结合

以及少量厂商呢开始非常强调说我会把多摩泰和各种能力都给你集成进来对吧所以呢这个是目前总结市场上的一个所有反馈吧嗯这我觉得 GP5 一个嗯有点鸡贼的地方就是其实他是追着 Deep Six 的弱点打的嗯然后我们大概过一下啊

三胞他们说的 GP5 的能力第一个是语音交互自带了大家可能没意识到虽然 DeepSeq 很好使但是 DeepSeq 是一个纯语言母型它不是多么态的而且它没有实时语音接口所以这明显是 DeepSeq 的弱点很有意思第二个 GP5 的功能是画布画布的话

大家可能听名字不太理解然后呢有一个 AI 用的叫 FlowViz 然后呢可以用一下然后呢其实它就是画布的 AI 你可以理解为把 tasks 就是把一堆单次思维的那个任务全都组合到一起然后它就形成一个流目前也没有人给 DeepSkip 开发然后呢网页搜索其实 DeepSkip 具备了但是这个其实不需要太大的工程量嘛所以

OK 网易搜索是一定要支持的然后最后一个 GPT-5 它提到功能是深度研究而深度研究的话实际上 Publicity 用 GPT-1 也做到了但是 GPT-5 在这上面会再次加强我们可以认为除了网易搜索这个谁都必须得完成的功能之外剩下那几个功能都是目前 GPT-6 比较弱的地方然后唯一的一个疑问是 GPT operator 这个实际上 GPT-6 也不行

会不会跟 GP5 一起发布病例加强而且免费在这里我们单独解释一下深度研究这个事情深度研究这个事情恰好跟着别人拼车一个 200 美金一个月的 GPT Pro 的账号我确实是有惊为天然的感觉大家今天如果用 DeepSeq 打开深度研究它会给你吐一堆东西然后

然后你可能大概看到一分钟左右的时间这个模型在给你思考就是他展示他的思维链对吧然后给你一个很好的结果

但是就 GPT-01 的这个深度研究确实是我用下来确实还很坦诚的说确实要高一个 level 一个问题给了他他思考了十分钟然后最后吐出来的结果是我截止目前我用了这么几年 AI 下来我见过的最好的一次结果非常丰富的这个信息源非常好的这个语言组织几乎是可以替代我要干半天的这么一个状态 OpenAI 官方给的说明是说一般这种深度研究需要进行五到三十分钟

然后他会给你一个很深度的反馈他用这个模型去更深度的思考你的话题包括他可能中间在做各种各样的一些搜索和事实校准最后给你一个非常非常可靠的一个结果所以这个确实是非常厉害的一个产品吧但是 GBT 用了满美金的这个最高级的会员把它挡在了付费墙里面所以说大部分人对这个东西的体会并不是非常的深刻嗯

对因为 GPT-1O 它用的人也不多所以其实今天 GPT-2O 出了之后我们可以反向跟大家解释一下 GPT-1O 是一个什么东西实际上它是一个思维能力跟 GPT-2O

类似甚至更强有四维链的同时它是多模态的 Deep-Seek R1 所以 GPT-5 有可能会真的更强这个多模态其实之前我们讲过这个语音 Pro 的会员就 200 美金一个月你在手机上是可以把摄像头打开的

它其实是可以看到视觉上的东西的但它最高级的 O1 模型暂时没有这个能力它可能因为算力确实是算不过来因为刚才提到了其实更多的是推理的模型其实如果大家有关注我们之前的节目其实我们在 DeepSeek 爆红之前整个 AI 的生态里面大家的热词其实不是推理本来大家在预测 2025 年的 AI 的方向是什么的时候

一个是多模态这个刚才已经提到了我们其实在 2024 年已经看到了很多优秀的多模态模型从谷歌的 Gemini 到 OpenAI 的 4O 它是原生多模态的模型它有很好的语音的 API 你可以通过几乎实时的方式跟它对话

然后它有这种视觉的视频的这种对话的模式第二个叫 agent 大家都把 2025 年被称为是叫 agentic era 就是所谓的智能体时代模型就应该往智能体的这个方向去发展过去是

营师做副接下来他可能要干一些活对吧要把工作做了我们不客气的讲 90%的白领的工作 DeepSeek R1 生成的东西是已经能够完成了就是领导交给你一个问题领导通常会提一个问题你把什么给我做了你只需要把他那句话 copy paste 到大部分的 DeepSeek R1 的对话框里面你多试几次他基本上就会给你一个你可以交 60 到 80 分的这种稿子了

这是 DeepSeq R1 很厉害的地方但是回过头来说在 agent 这个领域调用工具的能力除了它除了能联网以外我们看不到其他的可能性但是我觉得开源社区我们等一下会讲我们觉得开源社区在这件事情上应该要出点力才对所以说我觉得 DeepSeq 目前面对 GPT-5 的挑战它必须要尽快完成的第一点就是它得尽快完成多模态甚至原生多模态的进化

刚才我们其实讲到这两个点因为 GPT-4O 在多摩泰和 Agent 能力上都有比较强的体现多摩泰不说了 Agent 它其实有个产品叫 operator 它已经能够实现网页端的一些自主的操作刚才李南也提到在 GPT-5 的预告里面它没有提到 operator

DeepSeq 明确的落后于 OpenAI 的 GPT 的地点是它不是多么太的但是 Sam Altman 强调说 GPT-5 将有更强的推理能力实际上他是在承认我 O1 领先不多了 GPT-5 是推理能力我针对 DeepSeq 我也得加强所以这是 GPT-5 针对 DeepSeq R1 我必须要再次领先的东西也就是说我们今天看到的 DeepSeq R1 更像是一个在单点上

做得非常出色的而且用很低的成本实现了的单点突破的这样的一个模型但如果从模型的综合能力来看我们觉得 GPT-5 可能会在 2025 年带给我们比较多的震撼我也是在这一天学习的过程当中我必须要解释一个问题之前很多媒体把 DeepSeek 为什么要去

要去开源这件事情呢他把它渲染的特别烂漫然后甚至呢很多媒体他会翻出截止去年深度求索的 CEO 梁文峰接受采访的一些稿子吧然后故意的截取一些梁文峰讲的很有烂漫心态的一些话最终得出一个结论就是说

DeepSeek 为什么要开源因为这就是一帮纯粹的好奇心的研究者他们是一个量化基金的一个背景可以去供养他们所以他们可以一时无忧地去投入科研然后最后他们把这个成果送给全世界这个理由肯定是其中一个但是我自己尤其是在很认真的学习 DeepSeek 的开源协议之后我发现在加上今天我们提到跟 GBT-5 的对比其实我自己的一个推论就是说我觉得

DeepSeek 之所以要这么彻底的开源其实它也是一个从模型的竞争它要去构建周边生态的一个需要因为刚才李南提到了 DeepSeek 用的是一个 MIT 协议你随便商用你随便修改我无所谓的对那其实我们可以很容易的对比这个世界上最大的两个开源模型玩家一个叫 Tommy 千问一个来自 Meta 的 Lama 你会发现说

通信签问和 Lama 其实开源就相对没有那么彻底比如说通信签问呢一些特殊的版本或者是一些截止目前性能最好的版本它是没有开源的然后像 Lama 的话呢

他从法律上来说他就做的特别不好的一个点是他会禁止任何人用拉玛的数据去训练他的所谓的竞争模型但是这个竞争模型怎么定义呢他又说的语言不详的反正大概的意思就是说如果你用所有人都会担心说你用拉玛做了一个比拉玛更厉害的东西 Meta 会不会来告你对吧他有

大公司能顾得起这么多律师团所以呢从这个点上来说呢 DeepSick 确实是开源的最彻底然后的话其他人能够附现简单说就是为什么 DeepSick 如此彻底的开源有浪漫主义因素但是还有一个非常现实的问题 GPT-5 的发布已经把这个问题摆到桌面上了就是

实际上我们是在追赶 OpenAI 以 O1 而言活太多了一个公司干不过来对的我们可以排一下这些活然后第一是 GPT-5 的思维能力会再次加强那么

Deep Seek 要追赶这个只能 Deep Seek 自己干对第二个呢是 Deep Seek 本来就原生多门泰了那这个模型像多门泰也得 Deep Seek 自己干对那实施云接口是不是我就别干了让别人干对吧然后画布

或者叫做 task 那我就别干了 让别人干然后网页搜索 大家的确都已经干完了无论是 paypalct 还是 nami 搜索但是深度研究是不是我也就别干了让别人去干所以这样的话你会发现我们落后 OpenAI

但这几个点就被分工了 operator 是不是也有别人可以干了最终 DeepSeek 就可以聚焦在模型的推理能力以及多么泰这两个最重要的地方然后其他那些东西让别的公司上这里其实确实就是开源的意义因为我记得 DeepSeek 爆红的第一时间杨立坤他出来发了一个推特他特别好他说 DeepSeek 的成功

或者说 DeepSeek 这个话题呢其实不应该是中美的模型之争它实际上是开放跟封闭之争然后其实我们回头看 DeepSeek 虽然我们刚才提到了像这个有很多大部分的比如 OpenAI 是领先的必然公司嘛对吧

开源公司之间还是会互相借鉴很多能力的就比如说 DeepSeek 的它的这个 MOE 模型最早其实也不是它原创的它也是从开源生态拿到了这个 MOE 的这个原始的方案并且做了优化

然后 DeepSeek 的第一版 MOE 模型它的第一版模型几乎跟 Lama2 的工作一模一样的做了它的最开始的那一版的机座模型所以就像李南刚才说的 DeepSeek 今天已经把如此优秀的 DeepSeek V3 和 DeepSeek R1 的模型完全开源甚至他写了一篇非常好的论文在论文里面他的训练过程也非常没有保留的展现出来这就是为什么中美都有很多团队复现了他的一些结果

那其实这里面除了浪漫主义当然就是希望大家能够群策群力在开放生态里面一起去打败这个封闭生态把至少不要让 OpenAI 变成一家独大因为这个其实你从任何的意义上讲一个币源公司

商业机构掌握了星球最强的 AGI 这件事情本身就是挺可怕的所以现在 DeepSea 发布了这么久之后大家除了潮流量

之外然后到底谁真正干了什么活其实我们可以仔细看一看就网页搜索实际上是 Publicity 跟纳米干了所以老周也不是纯粹的蹭热度虽然他很大程度上在蹭热度听说纳米搜索最近几天带什么送汽车拼多多砍一刀是吧好像这个事还

对但是开源社区至少贡献给在 DeepSeek 的聚合上贡献了网易搜索这个额外的功能那语音交互谁在干我们猜测有两拨人一定在干第一拨人是把 DeepSeek 接入车机的人嗯

嗯因为在车机里面语音是必须的嘛所以他们肯定是在干嗯那我们期待他干了之后也开源对吧比亚迪好像宣布在在在接 DeepSync 嗯对那他一定得搞定实时语音接口嘛对然后嗯那还有一部分人就是阿里巴巴应该也在干因为他们要支持 iPhone 嘛然后那花布其实没有人干嗯深度搜索其实没有人干对

operator 其实没有人干对所以那个其实 deep sea 很牛逼冲上去了

本来还落后 OpenAI 的情况之下插了这么多活回头一看没人就这个是比较尴尬的地方对 是的我还能补充几个这几天看到了一张晚上流传的合影大概就是任正非他见了几个国内的优秀企业家那照片里面其实好几个都是所谓的

DeepSeek 生态的人中间还会有一个小新闻就是华为跟归基流动合作全部都部署在了一个华为自己的国产的计算卡上就不依赖任何的来自海外的计算卡那这个确实是挺厉害的一个工作你说的是那个部署 DeepSeek 对吧归基流动通过那个华为的生腾的服务器

完整部署了 DeepSeek 的 R1 的满血的模型我自己试了一下它的速度和效果都还是不错的起码在推理这一块我们不会被美国封锁至少我们自己的模型加上自己的卡是可以跑完整的 DeepSeek R1 的但是我想提的是什么呢至少在目前人家时间还很短就是说这些被炒的满天飞的新人

然后模型推理的部署其实这两件事很简单

就是说开源社区并没有干很难的事他们现在还是处在摘桃子的阶段模型的推理其实部署上并不是很难真正难的是什么呢华为为 DeepSeek 提供一个万卡或者十万卡的生腾集群让他可以训练生腾应该是几个月之内会发布不知道是多大规模的集群能不能训 DeepSeek

因为我们其实也看了一些研究 DeepSeek 为什么会在工程上做这么多的优化其核心原因还是因为没有卡确实这个训练集群上被卡脖子这件事情导致当然也客观上推动了 DeepSeek 在这些工程上的优化才诞生了这样的一个从工程上来讲既便宜又好用又大碗的这样的一个优秀的模型

对 DeepThink 是没有卡而且它有的卡很杂它甚至做了一些绕过 CUDA 的一些非常因为我这个技术细节我不太懂但我看到它说甚至用了一些汇编语言在搞在写一些代码就相当于是显卡的汇编语言它就是 CUDA 生成了一堆的相当于汇编的东西它直接控制显卡

但它还不是显卡的汇编它是显卡汇编上面一层的抽象这里面库达利用这个语言做了一些限制对中国的算力限制所以 DeepSeek 应该是重写了其中的某些库绕过库达重写的这一切原因都还是因为这个

算力的封锁吧如果华为能解决这个问题它其实确实是一个非常重要的一个里程碑短期之内其实 DeepSeq 其实目前是获得算是获得了主流的就是开源软件的一些认可吧比如说截至我们今天录制的时候我们能够看到微软就开源了一个类似于 operator 的智能助手就运行在这个 Windows 系统上能够去自动的去操作

那像这样的海外的主流的方案呢原来呢它可能是核心是围绕着这个 GPT4O 这样的一些模型来去运作但是这一次呢我们能够看到说 DeepSeq 甚至是千问这样的大模型其实都会被前沿的开源方案所支持对吧或者是前沿的开源工具项目所支持那其实这个是一个比较好的一个事情对也是 Agent 方向的一个突破嘛因为它是一个自动化的

基于电脑的这样的一个识别界面并自动操作的这样的一个程序那不就等于 operator 有人做了

对但是我认为一般这种商业公司开源出来的东西一般不会最好的状态对它肯定微软这种公司它最好的东西一般都是留着自己用对某个研究小组它自己做了个 operator 预测应该是不够好用所以它先把它开源出来让大家先用的我猜想这个 operator 没有在 GPT-50 被提及也是因为它现在也就是一个半成品的状态嘛

那 operator 它不仅是有一个 200 美金的付费墙而且它只在美国地区能用我猜测因为全球不同国家的网页的布局和一些操作的习惯确实是天差地别

所以他可能只做好了针对美国的一些常用主流网站的一些优化中文你像网页上京东它都有那种像 APP 一样的小糖窗美国模型看到这个东西肯定会傻掉如果说 DeepSeek 的开源和他的论文实际上跟美国贡献了很多

微软开源一个 operator 虽然不好用也算是给中国一些回馈 DeepSeek 的进一步的完善对标 GPD5 的这些东西还得中国公司上现在有希望的在开源里面有 reputation 的其实就是阿里了阿里算是 DeepSeek 火了之后回头看我会发现阿里的很多工作确实是非常前沿核心还是因为说 DeepSeek 它 4 到 5 个阵容的模型

大部分都是帧流的签问的这个模型我们这里解释一下就是帧流模型它的主语比如说 DeepSeg 帧流了签问主语还是那个签问的那个模型我们发现说为 DeepSeg 帧流之后的签问的那个模型它还是可以有一个以小博大的性能比如说被帧流的一个 30 多币的一个模型但是它就可以对比被帧流过的这个 Lamadon 的模型可能是两到三倍的这个参数量但是它依然有相同的这个表现

所以千万这一次确实是算是又被带了一下带火了一下我觉得这是应该的因为其实阿里常年在开设区有很多不错的项目比如说那个 Double 是一个 Java 的 RPC 框架之类的所以

我们还是比较期待阿里能在 GPT 和 G 主制上把 GPT5 将发布的那些功能一个一个都完善并且完善了之后阿里巴巴我相信还是会开源的其他人未必了对其他人有一些变化的可能是百度吧因为百度公开场合说过必源是肯定优于开源的

但是最近是有所松动文心演的下一个版本转向开源真的是开源在摇旗呐喊然后打动了一些公司或者是生态在逐渐的开放这是一个非常值得点赞的地方我觉得 Deep Seek 用一己之力在推倒一些币源的围墙

所以这里要批评的大家知道 OpenAI 肯定需要批评了伊隆马克一直在骂就是说你 OpenAI 你跟这儿避怨对其实在中国有几个也需要批评了阿里巴巴当然是贡献很大其实华为也贡献很大

这都是好的开源的巨头但你发现腾讯在哪里他们赚了很多很多钱但他们对整个的移动互联网或者未来 AI 能否在开源领域内做出足够的贡献还很可疑今晚有 rumor 出来说腾讯的微信里面的 AI 搜索会接一个

加了 DeepSeek 的所谓的叫深度研究的一个版本感觉还是在享受低成本的红利大概就是这样对还在摘桃子对而且你很少看到微信这么快的跟进一个热门的东西因为微信的迭代它是非常慢的它的一个简单的功能它可能都要花好久磨磨叽叽最后才更新但是在 DeepSeek 这个事情上它都可以

快成这样大家可以看得出来这个事情对这些大厂的冲击是有多大这里正好开了题就可以重点讲一下就是 DeepSeek 对于所谓的我们接下来一到两年之内开始能够看到的一些 AI 模型和一些 AI 应用其实这几天我觉得有一些很好的苗头其实已经呈现出来了一个就是推理的能力另外就是还有一个点其实过新闻的时候过到就是像 GPT-5 它是普通模型和推理模型是融合的

然后 Cloud4 其实也是融合的

那为什么会有这样的模型融合呢其实有一个很明确的痛点其实今天你用那个 DeepSeek 其实你肯定会遇到这样的问题就是你开了那个深度研究之后它现在经常服务器不稳定经常繁忙它那个繁忙的概率会更高很好理解嘛因为这样它需要输出更多的这个 token 的结果在 OpenAI 上的话这个事情就体现得更明确就是我们在开始之前我们有一段特别搞笑我们在开始之前我们对这期节目要聊什么的时候我们发现好几个模型的名字它一会儿是 4 欧

然后一会就 O1 一会是 O3mini

然后呢 OE 它还有一个 Pro Mode 对吧那个 Pro Mode 它还可以叠加一个深度研究的能力整个的模型的型号加上一些所谓的能力它真的是完全能把你搞晕掉我是大概是花了两天左右的时间我去深度使用我才这些东西去搞明白那为什么会有这样的原因呢一个理解呢就是说普通的模型和在 GBT 里就是数字开头的模型和这个字母开头的模型就是个推理模型它需要的这个算力是完全不一样的

所以作为模型提供商它就更倾向于说你按照不同的模型去选择合理的能力对吧你有合理的算力和合理的反馈时间但是事实上给消费者现在造成了非常大的一个困扰我用 GPT 的所谓最高级会员我用下来我没有很快的去分清楚就不同的模型到底能怎么样而且我还要讲一个就是看过 V3 和 RE 的数据报告你会发现说

R1 什么东西都看起来很好但 R1 唯独有两个点看起来有问题一个是 R1 的这个文字表达能力它是不如 V3 的就是然后第二个呢就是 R1 的这个指令遵循能力也是不如 V3 的

然后这一点的解释是说强化学习强化太猛了导致于说这个阿姨她的正常的文字表达她就不太好做了或者是说阿姨你给她一个指令因为她是有自己很长的思维链她就不一定要去倾向于去遵循你说的那个指令了包括我今天下午认识到一个项目叫做 Deep Cloud 这个 Deep Cloud 是干什么呢就是说她让 Deep Seek 来去吐那个思维链就是思考的过程她用 Deep Seek 的结果

然后具体写文字他用 Cloud 来去做因为 Cloud 写的比 DeepSync 的幻觉会更少意思就是说他把 R1 的推理过程 copy 下来再 paste 到 Cloud 里面去生成最后的结果然后我见了一些媒体作者他们对这个东西很高评价就是说这个东西确实是当下是最好用的一个东西聊回 GPT-5 因为 Sam Altman 在他那条 X 里面

同时提到了 4.5 和 5 他就说这个 GPT-4.5 将是他们最后一个非四维链的模型也就是说我们看到的 GPT-5 就是一个所谓的深度推理和普通模型结合的这样一个模型用 Sam 的讲法就是说这个模型它可以使用工具它可以知道什么时候需要长时间的思考所谓的 deep research

什么时候可以用这种相对低廉的 token 去解决一些基础的问题那就是基本上我其实还蛮期待这个模型的就是说它系统会分析你这个事到底有多难它知道我在处理这个 task 的时候我到底要出多少力我是做个大活弄一个年度策略还是解决一个非常简单的方案而不是说我每次都要用同样的成本去做每一件事情那这个就是 GPT-5 它能够做到的这个事情

如果说 GPT-5 是一个机座模型能力远远超过 GPT-4O 的这样的一个多模态模型的话其实我们确实要面对一个非常强大的模型如果说我们用 DPC-R1 来做对比的话

他不光是在多模态在 agent 能力上完全没有无法对比他在他的推理这件事情上可能也要面临一个非常强劲的对手其实 DeepSeek 的推理是非常接近 O1 的甚至你可以认为推理能力才文字纯文字的推理能力才是这个核心

模型的核心职能的话那很明显三八特曼的意思就是说那个

我 O1 不必差但是呢我 GP5 会在这个核心智力上更强而且对于用户来说它会极大的简化用户那个时候就面临一个模型就好了我看到 Cloud4 就想彻底的做成这种形式甚至你用户都可以调你到底这个时候想深度一点呢还是浅度一点呢那除此之外呢还想讲一下就是说这几天看到的接下来模型都变成了都混合了推理模式然后呢呃

以及加上了这个联网搜索功能以及就是成本降低了之后其实我目前这几天我看到非常多的一些可能性吧第一个其实刚才我们提过了就是微信的 AI 搜索据说是会接入 DeepSeek 还会有一些更好玩的项目比如说这几天看到的一个项目飞书有一个表格产品叫多维表格

它这个多维表格我仔细的看了一下它的实际案例我觉得很厉害 DeepSync 不是写视频的脚本和分镜很厉害吗所以就有人做那种批量的视频脚本和分镜生成为什么跟这个东西跟表格有关系呢因为飞书那个多维表格你可以在那个表格的每一格里面运行那个程序所以它就变成就是说有一格是你批量化的输入 Trump 然后中间又有一列它是来批量化的就跟你吐我的思维过程

然后最右边又有一个链呢我是批量化的把你的这个把你想要生成的这个视频脚本给你生成出来然后飞书这个表格产品他还加了自动化的工作流那他就可以做到说我把所有吐出来的这个视频的脚本都给他喂到一个视频生成的一个模型里面去然后这个视频生成的模型就开始给你生成无数段你想要生成的这个画面

然后一下子就你等等这不就是画布吗这个没有 Flawless 那么好看但它不就是画布吗对是你从这个角度来说也可以这么理解是 Excel 版本的画布对 Excel 版本我看到他们在社区大概组织了几场这种线上直播然后也有一些公众号去详细的讲解他们这个过程我觉得非常厉害就很多自媒体创作者他就可以批量化的生成一些东西了但我觉得这个东西可能最有利的还是所谓的流量工厂

我一开始看这个我觉得有点看段子我今天见了一个在媒体工作的一个朋友这家媒体还是国内挺挺领先的一个媒体平台吧他现在所有的这个稿子都可以用标准化的 prompt 去写了那个账号你每天看到一天两到三段视频每一个视频的脚本然后包括脚本背后的事实核查其实都是有他固定好了 prompt 的提示词之后都可以实现了

所以你就可以想象就是说现在其实我们每天看到有大量内容其实已经是 AI 生成的了但是接下来的话呢我们可以因为成本更低我们就可以做更加极致的可能是优中选优对吧可能是同时生成五六七八段东西然后我们就挑一个最好的那一段出来所以就等于是那个 GPT-5 这样发布的原生画布功能已经被黑书多维表格跟 GPT-2.1 提前发布了

对有点这个意思只是说他们没有这种国际化的影响力然后这几天我在用 Publicity 的时候我有一个很深的感觉就是因为 Publicity 有点像要把自己变成一个 UGC 的新闻平台的一个感觉它有一个 Tab 叫做发现 DiscoveryDiscovery 你点进去之后你会发现说它是用卡片的形式然后结合你的喜好把你可能关注的一些新闻给它推给你

但是那些新闻你一点进去之后呢他是用他的这个 AI 搜索能力抓取了不同网页的新闻然后给你做了一个专题策划比如说我们今天关注这个 Cloud 发布了一个新模型那他就会首先说这个 Cloud 发布的新模型在不同的渠道他都说了哪些话给你一个综合

然后接下来呢给你把什么把类似于 reddit 之类的类似海外贴吧吧之类一些反应也给你抓取一个网页也给你贴在后面然后最后呢他还会有一些深度的分析

就是说这个事情可能是被认为是回应 DeepSeek 然后 DeepSeek 最近做了什么跟这个有关系最后呢他还有几个这种问题列在那想不想追问一下克劳德这家公司的这个策略他为什么是这样能不能给我更多的技术细节之类的你就发现说一旦这个模型的成本被打下来了之后你现在连看新闻都能变成是一个互动式的一个东西我觉得这个是我这几年

读严肃媒体或者是说经求证过的信息的媒体这是最近非常让我脸前一亮的这些东西我觉得这里我想插一个观点 DeepSeek R1 出来之后 Bidia 当天跌了一个 20%左右说因为 DeepSeek 的这个训练成本跟推理成本都大幅下降这代表

NVIDIA 的故事可能讲不下去了因为 NVIDIA 讲的故事就是说我们对 AI 的算力的要求极高 AI 要 scaling law 所以大家都要买几万张卡凑一个巨大的阵列推理也很好算力训练也很好算力所以它的股价才可以变成这个世界 top3 的这个市值嘛

但是呢 DeepSeek 带来的这种成本的大幅下降绝对是利好整个 AI 的生态的因为成本的下降所以才会有这一夜之间冒出来的这么多五花八门的这些应用因为我们想象一下这个世界如果到现在仍然只有 GPT-4O GPT-01 这样的一流的推理模型但是它是一个躲在付费墙之后的这样一个服务只能用很贵的 API 来提供包括我们刚才提到的语音多模态

原生多模态的这种语音模型 GPT 早就有了为什么没有人提供这样的服务呢其实就是因为它太贵了所以 DeepSeek 把推理模型的价格打下来了我们看到了五花八门的应用因为它成本下来了我们可能就可以拿到这样的应用了

但是呢确实在这个录制前非常生气的怎么其他维度没有人做这样像 DVC 这种把成本打下来的开源的事情呢对吧尤其是在音频这个多模态这个这个维度就因为他没有所以现在大家的这个所谓 AI 硬件体验都没有那么好嘛对吧

DeepSeq 并不是跟英伟达的暴跌有直接的因果关系美股就积累了大量的风险巴菲特一直说指数已经失效了所以整体就高因为它是中间最重要的一股力量所以它也高在这种情况之下大家需要一个回调的机会 DeepSeq sale on news 它只是给大家了一个 timing 而且因为

DeepSeek 导致了训练需要的算力没有那么高尤其是后训练的数据的质量高的确对英会杂是一个利空 DeepSeek 说明训练需要的算力可能没有那么夸张但是推理所需要的算力是极其庞大的其实你刚才说的所有的应用都是推理的应用那问题就来了就是推理所需要的加速算力

只有英伟达能提供吗那就不是了对因为 DeepSeek 的完整模型的部署除了英伟达我也可以部署到 7 个 Mac mini 上面未来我们相信除了英伟达之外推理算力的大爆炸会有很多家供应商对这里我可以提供一个旁证就是在 DeepSeek 这件事情上高通的态度是非常积极的

高通在上周刚刚写了一本白皮书

这个白皮书就是在讲 DeepSeek 带来的端测推理时代的到来他直接讲了一个叫端测推理的时代的到来就非常兴奋过去可能 NVIDIA 把所有的光环热点全部都抢走了但是在 DeepSeek 之前我们看到一些 7B 的端测模型包括深入到 3B 之后到现在为止都没有特别强的端测应用但是我们在 DeepSeek 上看到了这个

这个很好的前景啊对所以如果我们说到端侧模型的话就 DeepSeek 的能力以及它蒸馏之后的那个 70 币的效果其实还可以那我觉得中国消费者是最幸福的消费者之一是其实今天此时此刻我们就可以体验到真正的端侧模型的效果就是比如说

理想的车机它在智能架枪里面就有一个端侧模型它可以用非常模糊的描述帮你打开做研磨或者调整空调风量所以 DeepSeek 大家看到新闻大量的车机在接入 DeepSeek 所以我们可以首先在智能架枪里面体会端侧模型的效果然后我有一辆 Meta 所以其实我个人评价

Mega 车机的那个理想同学的智力超越 iPhone series100 位然后刚才李南说中国消费者很幸福主要是因为中国新能源车智能化程度实在是太高了对吧所以尤其在算力这种基础的能力上对真正的 LM 就是端侧模型就

可以购买的可能真的就是电车因为端侧模型的规模太小了它傻嘛所以目前部署一个比较大的端侧模型的情况之下需要端侧有更好的算力和电力嘛那车实际上是比笔记本更合适的然后笔记本又比手机更合适所以这个模型应该是从车开始普及

然后一步一步的到手机以至于更小的设备上都会上顿测这里我想好下体从这个点上来看其实所有跟 AI 相关的应用在国内市场的发展其实这一次都是被极大利好的之前很坦诚的说中国消费者用到的产品形态甚至是模型聪明的程度

其实一直都是和美国消费者有代差的这个点我记得李南还原来发过一个微博就是讲说分析为什么智能眼镜在国内没有获得同等的消费者的喜欢很大一个程度上是因为国内消费者你用 GPT 或者甚至是用上 Lama 其实都没有那么方便然后我们看 DeepSeek R1 就是它所谓的联网搜索和包括深度研究同时开的能力

其实它也是有个原型的就是 Pipelacity 包括即便到今天 Pipelacity 我自己用下来它的整个给你消费者的那个体感还是要比 DeepSeq 好一些的比如说它能够直接你问他一个问题他框框给你写个公式然后他调一个 Python 的代码出来他帮你真的跟他算然后他甚至还能实时的告诉你说我在阅读哪几个信息源一点一点给你加出来然后同时还能搜那个图片和视频

就这些东西中国消费者过往因为先进的模型它不在中国这个市场分发这个原因其实一直是受到一个代差的但是这一次当 Dipsea 给大家示范了怎么样低成本的做这种推理的这件事情之后一下子又变成了就是说中国消费者你会发现说中国消费者的手里面普遍有最好的硬件

然后普遍有最好的最有创意的开发者群体所以我觉得这个是一个 DeepSick 对于应用生态来说的出现来说尤其对中国消费者接触到的应用生态一下子彻底真的是一个彻底的反转我给你量化一下数据就是说 Meta Glasses 作为一个 AI 引进然后在美国是疯抢的状态其实它只能用 Lama3

因为实际上美国经历了真正的 GPT 时刻 3.5 发布之后这两年时间各种牛逼的模型出来大家一次一次的被震惊被教育所以那个 Metalasys 出来之后我不搞一个我不吃潮人有这种感觉然后 300 万条那中国呢目前胆子最大的小米将要发布 A&M 它只敢背 30 万条但中国的人口是美国的差不多四倍吧

所以 DeepSeek 对整个的 AI device 一个巨大的贡献就是 GPD 时刻实际上在美国发生了但在中国网络上很多人说噱头骗钱然后资本游戏但 DeepSeek 给中国带来了一个类似于当年 GPD 3.5 的中国的 GPD 时刻所以对我们可以期待对小米也敢备货 300 万条

对这个破圈程度确实我觉得大家都有体感了就是春节回家家里的长辈甚至都在聊这个话题对这个真的太夸张了而且我还要讲一下今天还发生了一个事情就是 DeepSick 官方对外放了一个指导就说如果你要部署我的 R1 模型你要用什么样的 setting 和什么样的系统提示词你是能复现我的这个表现复现的最好的

然后他提到了他里面给了两个指导第一个是你模型的温度温度是什么东西温度你就可以理解是模型回复的叫做随机程度或者是它的自由程度它是 0 到 1 的一个系数

然后呢第二个呢就是 DeepSeek 说了我官方的系统提示词是什么你把那个东西写到你的那个 APIAPI 的这个默认提示词里面这样它能够标准的附现我最精准的这个 R1 的这个表现其实我一下子就想起来说为什么我一开始用 R1 的时候我没觉得这么惊艳我一开始是在第三方平台上用的很多第三方平台它的 temperature 那个温度的设置和它的系统提示词因为它没有跟

DeepSeg 官方是一模一样的所以导致于说很多 DeepSeg 官方能用出来的一些效果你就用不出来

所以你就没有那个感觉所以说那你再往回看几年你会发现说我们过去用了非常多的所谓的套壳的切的 GBT 套壳拉玛的模型那为什么那些模型在美国它会变成一个消费者都很看重的一个东西我上个月在美国我看到那个大街上都开始投那个 AI 模型的广告就是苹果和谷歌的那个手机

我说哇天哪这个美国消费者好好先进这个这个他们都能在大大马路上就能看到这种广告中国消费者对于 AI 的认知你还没有到说你能在公交站牌看到

AI 广告的这个程度但是我现在理解了为什么会在那待查因为中国消费者你用到的东西就是经过什么套壳或者是说你虽然是开源你虽然你部署了 Lama 但是你可能中间各种各样的设置用的不对对吧所以导致于你就没有那个原生的像那个海外消费者或者美国消费者那样的一下子就全民用上一个很厉害的一个 AI 的那个感觉 DeepSeg 这一把就是它不只是原来那种我们这种科技爱好者

然后我们有一些特定的所谓的上网能力和支付能力他能用上这个原生的东西现在就变成全民他都能用上了大众对于 AI 的这个认知和认可一下子就有点打开心智的这个感觉对所以我想强调的是如果我们真的就是想在 AI 这场战争中获胜或者是哪怕是不输吧因为实际上美国已经有人把这种通向 EDI 的竞争叫做核竞赛了那

一个火月的市场真的非常的重要就像黑神话在中国卖的火那它的第二代就确定性会研发然后讹扎在中国卖的火那讹扎三就确定会拍得更好一样所以那个

中国消费者非常踊跃的支持 DeepSeek 相关的硬件会让 DeepSeek 的模型能力更强的同时也让相关的 API 的开发开源社区的建设以及硬件产品的研发更顺更好所以我们还是要非常客观的承认就是的确存在这批时刻并不是资本噱头而

Deep Seek 让所有中国人去掉了那种反帝国主义的滤镜之后更加客观的看待的确我们有这么一个 Deep Seek 时刻而且这是真的通向一界之路

最后跑跑题我们聊一聊刚才遗漏带的两个东西一个是我挺想聊的新闻一个是阿里其实他现在被所谓被 iPhone 选中了嘛也是在录制这一天吧蔡中信他今天在一个海外的一个活动上他承认了正式会跟苹果合作这个 Siri 版入华然后苹果苹果 Siri 版入华之前大家非常担心就是说呃

如果只跟百度合作会做得非常不好而且确实有 the information 之类一些重磅媒体他会爆出来说跟百度的合作不是特别顺利那这一次阿里的同意签问被选中其实很大程度上我看分析也有人说是因为签问长期的这种开源社区的这种贡献以及他在他的这种多模态之类的一些非常全面的一个能力表现吧

对于苹果的这家公司来说选择千万一方面模型能力有保障另外一方面阿里这家公司还算是国内最大的云服务厂商对吧整个云服务也能扛得住或者也能跟得上这里其实我们也可以讲一讲和他合作的苹果其实苹果我们在做这次选题之前我当时都跟托马斯

在想说要不要做一个选题就讲一讲苹果最近一两年是怎么样往下滑的因为最近一年苹果的这个在中国的这个数据确实是很糟糕 iPhone16 对比 iPhone15 是跌了 40%个点对吧那这是单款机型的那总体来说我们看到 24 年环比 23 年整体是降了接近 20%个点左右然后呢在 20 年第二个季度吧甚至都跌出了中国智能手机市场的前五了

我们在和李南的第一次对谈里面其实李南是提到说苹果有两个救命稻草第一个是拥抱开源第二个是资源芯片我觉得其实苹果现在为什么拥抱开源其实苹果现在有两个层面的程度算是可以拥抱开源一个层面是苹果选签问就是他把签问从开源社区获得的很多东西会开始整合到自己的 servi 上

那第二个事情呢是大家还记不记得苹果所谓 Apple Intelligence 的那个架构里面其实苹果是有一个云端自己的模型的对吧那当市面上出现了非常好的非常优秀的这个开源的这个模型之后其实苹果完全可以把这个东西集成到自己的云端模型里面去那这样的话呢它能够降低对于 ChatGPT 这样的就是外部模型的依赖其实对于它增强它自己的竞争力是非常有帮助的

苹果这样就是说我说的苹果拥抱开源不是它开源它的云端模型说实话苹果的云端模型开源了也没人用我拉玛三肯定比你好对吧然后我今天 DPC 更好所以苹果拥抱开源它应该开源自己的更多的本地的东西然后哪怕它不是代码它应该

开源更多的本地 API 给他的 AI 合作伙伴包括美国的 OpenAI 或者中国的阿里巴巴因为手机上的 Sphere 之所以那么傻一个是本身它不是大模型它没有智能另外一个是别人没办法替苹果改进因为

别人没有苹果 iOS 自带的这些接口我比较期待的是苹果在如此惨痛的下跌的市场压力下然后它跟阿里巴巴的合作它有更大的野心然后它能给阿里巴巴开放更多 iPhone 本身的接口对这样的话阿里巴巴的无论是云端或者端凸步数的模型对于资源源的理解会更

深刻和更清楚的同时它能直接替我们执行手机的一些功能

我可能没有李楠这么乐观在 iPhone 这件事情上在苹果公司这件事情上我认为就是以他的公司体量和他目前的行业地位尽管他下跌了 20%但他仍然是这个行业里面 80%利润的获取者他基本上算是一个绝对的 leader 尽管现在外界看起来他已经不行了但是这种公司内部的这种

内部的所谓的骄傲他自己的这种减防我认为他是不会尤其是不会首先对中国公司去开放他的太多的东西让中国的这种大模型工具深度的介入他的手机的这种 API 的所以我其实不太乐观在这件事情上对所以我给你推演一个未来发展的一个可能的路径它会面临两个问题第一个问题是

智能电车以及智能驾舱在中国的普及率越来越高那就意味着中国消费者会在电车上面真心体验到端侧模型的能力我说太热了然后他就知道调空调类似这种他不用特别精确的关键词你非常模糊的表达就可以包括今天我在理想设计跟理想同学的对话

中国消费者会通过电车意识到 Siri 是个傻子第二个是什么第二个是我们也看到中国一堆的安卓手机厂商在接入 DeepSeek 虽然今天只是给手机用户带云端部署但是蒸馏之后的手机的端侧部署慢慢他们也会做的时候一旦 DeepSeek 的端侧部署

确定了那么他们开始接入自己自研的安卓的 API 那 Siri 就变成了一个傻子中的傻子所以苹果牛逼就不开放那中国市场它会被电车品牌跟中国的手机品牌捶得非常非常的惨我觉得这个反而有可能是我们会看到的一个可能性的未来因为苹果在 AI 上的落后

在最开始大家觉得他一定有大招一定有大招尤其是我们这些所谓的打引号的果粉啊直到今天我们看到苹果是真的没有大招但是呃苹果还有一个嗯绝境附身的是不有人在七个 Mac mini 上面跑起了 DeepSick R1 嘛对吧然后所以 M-SickUltra 那个版本在 MVP 或者 MBA 上面跑一个 DeepSick R170 币的蒸馏说不定是可以的他在这个

处理器上的能力还是非常强的因为苹果刚好是统一内存架构最适合在端侧跑大模型的然后 DeepSync 刚好又把大模型的内存要求因为它有一些压缩上下纹窗口 FP8 之类的一些创新 DeepSync 又把能用的模型的门槛往下够一够所以它们俩有可能是能 match 上然后又会有一个比较好的结果但是短期来看的话我觉得

这个 match 可能更多还是收益在笔记本和台式机这种产品线上还有就是加速算力中心没有人能自己部署 GPT 但是呢 DeepSeq 实际上是一堆的字部署了无论是 Publicity 还是中国的纳米等等等等这些所以就意味着所有这些重复部署的 DeepSeq

是需要加速算力的这个加速算力现在当然是来自于主要来自于英伟达集群但是实际上苹果的 M 芯片改一改其实也完全可以去加速算力中心跟英伟达集群抢推理算力爆炸的红利这里帮大家回顾一下就是苹果其实是它在发布 Apple Intelligence 的时候它是建了大量的自己的这个

计算机房的而且呢它虽然没有对外公布但是呢我们了解的情况就是它在逐步的在这个机房里面放越来越多的它的 M 系列芯片然后呢降低这个英伟达芯片的这个比例而且谷歌的 TPU 也在做同样的事情而且那个虽然 Elon Musk 的 ICI 搞了一个 10 万卡的英伟达集群但是 Elon Musk 也在准备类似的事情是

对我觉得还有一个可能性啊聊到这里我觉得苹果呢当然不会开放他的这个很多他开源他自己的 API 或者他的接口

但是呢他一定会把这些开源的模型的一些架构和做法引入他现在自己的这个并不很弱的这个现有的所谓的自研模型的体系里面去但我觉得他不会接 DeepSeek 这个里面确实有很多地缘政治的原因可是 DeepSeek 反过来不管是蒸馏还是 Inspire 的下一代的 Lama 比如 Lama5 啊他一定会把这种

我们今天看到 DeepSkill 的这些低成本啊很强的推理能力啊等等优化到他自己的那个架构里面去嘛因为这就是开源的好处嘛大家可以互相应用这个很有意思就是我觉得苹果可能在模型上面越来越聪明了

为什么这么说呢因为正常而言 DeepSea 在国内那么火对吧然后他的那个 iPhone 的那个模型合作伙伴他为什么不选 DeepSea 因为 DeepSea 是一个那个思维能力很强的纯文字模型的时候你会发现阿里现在那个所有的能力跟 DeepSea 是互补的就是阿里是有时是云接口的阿里有多么太爱对吧然后呢

那其实因为 DeepSeek 如此开放的开源我们可以期待阿里的模型很快会具有 DeepSeek 类似的能力哪怕它不是 DeepSeek 是的那一旦 Q1 拥有了这种级别的能力的时候就说诶 实时语音接口现成的多么太现成了然后甚至 DeepSeek 5 的一些能力阿里巴巴那也是现成的所以其实苹果选择 DeepSeek 当然是音量最高的选择但是

苹果选择百度当然是最傻逼的选择苹果选择阿里巴巴实际上等于选择了阿里巴巴加 DeepSeek 今年 WWDC 还有四个月关于 Apple Intelligence 这块肯定有大更新对 但是我们对单层模型不抱太大期待的主要的原因是因为 iPhone 17 这代主打的产品是 Air 而这个超薄版意味着它

它的电力是非常受限制的对但是本地模型的功耗还没有彻底解决的情况之下所以这个模型的本地能力不会太激进端匀结合是必然的但是呢本地模型会越来越大能力越来越强对系统功能的了解越来越深入那就意味着其实

第一本地模型的功耗要下降这个既依赖于那个芯片的优化又依赖于模型本身算法的优化对第二呢是 iPhone18 大概率会上折叠了是的现在有这个消息对而且 iPhone18 有一个巨大的折叠 12 寸吧我记得 12 寸对然后那如果是这么大的折叠屏它的电力不受限制

所以你可以期待在那上面有一个能力很强的本地模型我们可以一起来拭目以待一下最后给几句实操的建议就是直到今天估计很多人用到的 DeepSeek 可能是一个第三方的版本我看小红书上还有人因为搜 DeepSeek 在搜索引擎里面被骗进去骗了好几十块要求退款的还有一部分人是

很错误的用到了 DeepSeq 的所谓的小参数的版本或者是蒸馏版其实这个对于大家体验 DeepSeq 来说还不是一个特别好的事情我们在文稿里面会附几个我们现在已知的 DeepSeq 都已经接入的服务商然后大家可以去用一下虽然稍微麻烦一点可能你得自己接个 API 之类的总比一些靠谱的一些平台然后它可能改了各种 DeepSeq 的设置

然后你用不到最好的那个效果我觉得是要稍微好一些的然后第二个点呢就是我看清华大学有一个团队他针对性的对比了 V3 和 R1 的这个测试然后他

他给了一个比较完整的分别用这两个模型的一个指导吧我也把它放在文稿里面他最核心的一个点呢是提到说对于 V3 和 R1 你需要使用的提示词是完全不一样了就 V3 呢你还是需要给很多分步骤的指令但是 R1 的话呢如果你给他更过多的指令甚至是在阻挡他做一些正确的自己就该做的一些推理所以

我觉得这个也是一个大家作为用户需要重新开始适应的一个阶段吧就是怎么样去更好的用不同的推理模型和正常的普通模型对所以这个是最后的一些 tips 推理这个事情还蛮有意思的就是

我们通常认为自己足够聪明对吧我们比大模型还是要聪明一些的所以在用过去的模型的时候非推理类的模型的时候我们习惯于给它更多的 prompt 上下文策略建议它先怎么思考再怎么思考大家都觉得自己很会推理对不对但实际上它是一个你并不是很了解的一个领域的一个问题你只能提出很有限的几句话的疑问的时候这个时候你最好就是

不要去加那些所谓的推理的那些指导尤其是这种 R1 这样的模型它会比你更懂推理我觉得我们要理解这件事情包括一些我们以为我们很熟悉的领域我们加了很多推理词它其实反而限制了就像刚才 Nixon 讲的它其实那个 performance 跑出来其实更差了原因就是这些推理词其实反而限制了它模型更完整的这种思考链

带来的这种结果所以我觉得那个技巧是技巧但是其实我们理解了之后很简单你读一下 DeepThink R1 的那个思维因为它都输出出来了嘛

然后你读十个左右然后你就慢慢的知道为什么彭博特斯会不一样对于四位链模型我们的彭博特斯我也不认为可以很简单我认为我们的彭博特斯的最重要的任务是描述清楚我们的目的然后但非四位链模型我们在描述清楚我们目的之外

我们要给模型说明好就是怎么去达成这个目的嗯然后所以你可以认为那个我们无论如何都是要说清楚我们的目的和我们的达成目的的方式的但是呢对于碎链模型达成目的的方式这一派我们可以略过对对因为他表现的更好因为我看过很多他的推理过程其实比我想的要完整所以我我必须承认这一点这个

这个模型真的在这点上我觉得这也是因为反过来讲为什么它能够获得如此爆炸的效果

真的跟他把推理的过程展现出来是有很强的关系的因为这个其实就是所谓 AI 的可视化 AI 的显性化思考过程展现出来之后我产生了一种自叹不如的感觉就是他聊得太好了完全没有他那么缜密的思路因为人在人实际上是用两种方式来思考问题的一种方式是基于逻辑事实和常识的方式那种方式我们经常我们搞直觉对对对

然后直觉我并不排斥直觉的同时其实很多情况之下你那个直觉是偷懒是系统系统二吧就是那个思考概念的概念对但 DepthR1 的那个思维过程推理过程你看它的输出你会发现它从来都不偷懒是的非常勤奋对跟人很大的区别好吧最后我们要不要总结一下我们的观点

OK 我总结一下就是说 DeepSeek 是一个中国给全世界贡献的非常重要的通向 EDI 之路的一步而且这一步是独创性的然后价值很高的但是我们必须得承认 OpenAI 还是走在 DeepSeek 前面而且 OpenAI 很快将会再往前大大的迈一步就是 GPT-5 的发布

从目前我们聊到的东西会发现 DPT5 是会进一步领先 DPT 很多很多的那接下来我们的追赶过程

我相信 DeepSeek 会在推理能力多么太等等这些方面做出更多的贡献而其他的人必须得在类似于画板然后实际语音接口然后还有长思维深度搜索等等这方面去帮助 DeepSeek 走得更快

否则开源其实还是落后的我们期待和呼吁开源社区接下来和 DeepSick 更多的互动吧和 DeepSick 更多的补强吧阿里站出来然后头条站出来

追赶 openAI 不能 drop dipstick 一个人大家也一起出点力对吧我们出力就我们做眼镜看谁能把便宜的实时语音接口先做出来对吧对我们的眼镜就有接口用了好的我们本期的节目就到这里谢谢大家拜拜好谢谢大家

感谢收听脑放电播欢迎在苹果播客小宇宙喜马拉雅等播客客户端搜索脑放电播找到并关注我们如果你觉得这期内容对你有所帮助欢迎你在评论区留下反馈这对我们非常重要