大家好 欢迎来到周欧基金播客我是今天的特邀主持人 若清
在这里你关注的好奇的困惑的投资理财问题就是我们想聊的话题新年一时 DeepSick 成为了搅动科技领域的鲶鱼给全球大模型市场带来了性能价格开源的三重冲击不仅在短短一周内登顶全球应用商店下载榜这场技术地震更是搅动了资本市场一度引发了美股巨头的股价大跌而 A 股港股的科技板块则是在春节后迎来了一波上涨
那么透过事件背后国产大模型的发展究竟走到了哪一步 DeepSeek 的出现将如何影响全球的 AI 产业链真正值得我们去关注和把握的投资机会又有哪些呢今天很高兴请到了中欧基金的科技研究团队负责人杜厚良一起来聊聊这个话题杜老师是深耕科技领域的研究十多年对科技的全产业链有着非常深刻的洞察欢迎杜老师大家好
杜老师能不能请你用最简单的方式来介绍一下 DeepSync 究竟是什么因为 DeepSync 是一个公司也是一个模型就是用刚刚的话它是一个人才密度算力密度使命然后追求比较专一的这样一个人工智能公司它算一个火炬的传递手就是在前任的基础上通过前任的一些智慧
不管是在数据级的采集上面包括模型架构的优化上面其实是以一个更低的成本让我们广大的老百姓能去用到这个最先进的 AI 模型我觉得这个是可能 DeepSeek 给这个社会不只是包括我们中国了
可能给整个世界带来的这样一个最大的恭喜对于我们很多普通人来说我感觉 DeepSick 的出现有点像孙悟空从石头里蹦出来一样横空出世那对于像你们长期关注这个行业的人来说这个是一个非常意料之外的事件吗
我觉得这件事情是不突兀的但一定是令人惊讶的我觉得分开讲它为什么不突兀如果大家最近关注网上的一些采访情况的话 OpenAI 的 CEOSam Altman 包括 Anthropic 的 CEO 其实都提到了按照大模型正常的发展规律来讲的话
算力成本是每年下降 10 倍的那我们对比 Cloud 3.5 和 GPT-4 的话大概 Cloud 3.5 晚了 15 个月它的算力成本降了 10 倍那 DeepSeek 的 V3 呢相当于比 OpenAI 的 GPT-4 晚了 22 个月它的成本下降 30 倍所以如果考虑这个成本下降的斜率来讲的话这件事情是不突兀的
但是这件事情由 DeepSeek 做出来又变得突兀了为什么这样理解你在任何一个领域做到全球第一这一定是一个令人振奋的事情这件事情做的人又是一个中国相对来说比较小的团队我觉得这个是比较值得骄傲的也是令人振奋的
确实啊这两年我们看到整个大模型是非常的火热甚至有了所谓的签膜大战但为什么刚刚你其实也提到像 DeepSick 这样的一个有开创性的产品它出现了一家小公司而非在大厂里那对于这个结果你意外吗
我觉得要分两个角度来讲人类社会的进步其实包括科技的进步是一样的它永远是一步一个脚印的后人很多的成长是在前人的基础上的 DeepSeek 也是受到了之前众多开源大模型的启发包括拉玛然后包括国内的
Q1 或者怎么样一些大模型其实它第一个实现的或者说对这个社会最大的创新就是用开源的方式去复现了 OpenAI 的 O1 把强化学习的底层逻辑带到了广大人民面前我觉得这个是比较重要的
DeepSeek 确实是一个较小的团队但是它能做出来也是有很大的契机的如果我们去分析整个行业的话其实从我们跟踪 DeepSeek 的 V1 模型其实就已经做得很好了然后在我们考量的维度真正能做出大模型其实它有两个主要的要素一个是人才密度一个叫算力密度
从人才密度来讲的话网上很多介绍 DeepSeek 有 140 人非常高质量的专业的 AI 人员这样一个团队这是第一第二从算力密度来讲其实大家会有人知道其实它的背后是换方换方是在 AI 之前
在国内少数不多的有万卡算力集群的这样一家公司所以其实他们对算力集群或者说对 GPU 集群的理解对底层的一些调教和一些优化其实是比别人有优势的这也是为什么我说这个事情让大家惊讶也不惊讶的这样一个原因就是他们具备了人才密度和算力密度两个最主要的核心要素所以其实也是一个厚积薄发的对其实
其实刚刚你已经提到了整个 DeepSick 它一个创新的优势包括它之前有一些储备的能力但是 DeepSick 的出现确实是打破了这样的一个认知他们做到了极致的降本甚至有说他们用不到 600 万美元干成了硅谷巨头花费数十亿美金的 AI 的模型当然这个说法我看到已经被证实是不够严谨的但是
也说明了它这个降本的效果给大家带来的一个震撼所以它降本到底降到了一个什么样的水平我觉得这两个维度的比较基准不太准确因为如果我们考虑比如说 500 多万美金它这个成本其实是包括单次训练成本
但如果以几十亿美金这个标准的话其实它包括了人才的成本包括了算力采购的这样一个成本然后包括在数据级的标注优化等等一些成本我觉得它是一个全成本如果我们用一个可比成本去比较的话之前的公开资料也提到过大概 GPA4 在当时它整个的模型的训练成本单次大概在 1 亿美金通过硬件的优化我预估现在成本大概在 2000 到 4000 万美金
所以说真实的 DeepSeq 的降本我觉得大概在四到六倍左右我觉得这个是一个比较客观的情况其实我们看到整个科技的发展它就是一个不断降本在前任的基础之上不断降本增效的一个过程但具体到 DeepSeq 这一次它的
能够实现这样高水平的训练效率和极低的训练成本主要是因为哪些方面的创新和技术改进呢第一我觉得这个是比较重要的我们不要去夸大或者说去贬低这个事实就是 DeepSeek 是全球第一家用开源的方式去复现了整个强化崛起或者说我们讲在 Post-training 领域去做 skill 的这样一个模型那在开源的基础上给整个社会带来的好处就是
全球所有的模型能力会迅速提升到类 GPT-4 或者说类 GPT-1 这个能力上面我觉得这个是对整个社会的最大贡献那其实从成本的优化来讲它确实是做了很多创新我觉得这些创新是来源于
DeepSeek 或者是换方整个团队对算力卡的理解对模型架构的理解我觉得举几个例子吧就比如说可能它通过一些 FP8 低精度的这样一个调用去替代 FP16 在文字模型这样一个领域用低成本
实现了相同好的效果还有有个公开报道说 DeepSeq 是在 H800 这个集群去做专门训练的 H800 这个集群其实它的通信的能力是相对比较弱的但是 DeepSeq 用了一些架构的优化去提升这个能力此外比如说一些 MOE 的模型的调用比如说可能 CHPT 它一次调用大概可能 3000 一个参数但 DeepSeq 优化到一次只调用 371 个参数这样肯定也是一定程度进行大幅降本
说到 DeepSeek 的创新和技术改进我最近在看相关的报道时会经常看到一些高品质一些专业的概念比如模型蒸馏数据压缩能不能请杜老师跟大家科普一下它们是什么意思
这是两个概念第一个叫模型的蒸馏第二个叫数据压缩模型蒸馏实际是把一个机座模型比如说我去实现它 60%到 80%的能力但是用一个较小的参数然后去能部署在端侧
那其实这里面呢我觉得又要和另一个概念放在一起了就是数据我觉得 DeepSeek 做的还有一个很大的创新其实它减少了人工标注减少了模型的这样一个微调那这个其实在以前的模型训练中是要花费很大的成本的但是它为什么能减少呢也是因为在强化学习的这样一个架构下包括
OpenAI 的 TradePT-01 其实生成的数据级的质量是非常高的当数据级的质量非常高那模型的幻觉自然就会减少其实它是通过减少 SFT 也进行了在模型蒸馏阶段大幅的降本主要是这个逻辑吧比如说可能如果我们再去教小朋友数学的时候就可以
两种方法我们第一种方法是穷举法我们可以叫一加一等于二二加二等于四一加二等于三我们知道我们要给小朋友输入的数据集是比较庞大的那什么叫数据压缩呢就是我们用几句话能提炼出
社会的真理或者说体炼出一些客观规律比如说我们教加法我们说加法就是从前往后数减法就是从后往前数这个就是数据压缩就是你把现实世界的数据规律本质压缩到几个定理其实大模型的本质也是这样就是大模型的本质其实就是对数据的极致压缩
如果每句话都是真理的话其实确实是对于大参数模型是有挑战的或者说在训练的过程中是不需要那么大参数的模型其实我在看一些报道的时候也有提到就是像模型蒸馏蒸馏技术其实是在大模型行业里非常常见的一种手段但是呢
也是因为可能 DeepSick 受到的关注太高了所以现在市场上也有一种质疑的声音是说他其实是站在了军人肩膀上所以才能那么短的时间内有这样的成果他并不是真的足够强那你怎么看待这种观点因为
因为我研究这个行业我研究 AI 其实我的立场是能不能推动人类科技的进步和人类 AI 的发展我觉得在这个结论上 DeepSeek 对人类科技进步是做出巨大贡献的我举个这样一个例子比如说一个数学奥赛金牌的老师培养了一个数学奥赛金牌的学生那这个数学奥赛金牌的学生有没有价值那一定是非常有价值的但是他是不是
完全横空出世或者说不靠别人的一些助力或者贡献所以我觉得我们要客观地去看待这个问题或者说为什么这个世界有开源为什么模型要追求开源实际本质就是为了推动人类社会或者说推动科技能够更好更有效地发展你刚刚说那个老师教学生的这个例子还是很生动的一下就能抓住这个要点了
其实你刚刚也提到一个词就是开源我们也知道现在全球主要大模型公司其实它有的是采用的开源的方式有的是闭源的方式那能不能给我们科普一下究竟这个开源和闭源指的是什么它们有优劣和高低之分吗嗯
最简单的解释就是币源它的程序的源代码包括它的一些核心技术是对外保密的开源的话其实就是公开的可以对全世界共享的就是谁都可以去看谁都可以去学我觉得这个就是用一个通俗的解释办法
然后为什么有些企业选择开源选择避源呢我觉得每个企业去选择开源和避源一定是结合了企业价值社会价值包括可能甚至到后面对国家的价值甚至于在当前的背景之下就是 DeepSeek 说不定后面会变成避源模型
如果再有更进一步的创新就我们不能去界定开源一定好或者说避源一定好或者说哪天如果 DeepSeek 真正避源的话或者说会提高用户的使用成本的话我们去负面的评价它我觉得这样也是不客观的所以它还是要根据不同的发展阶段和不同的应用场景而定那你是怎么看现在这个开源和避源之争然后以及它的结果呢
我觉得 DeepSeek 出来的最大贡献就是在 PostString 我稍微说的专业一点因为如果大家去看科普文章都会有就是原来其实大模型的演变来讲更多是在 PrintString 就是根据 Skating Law 在 Transformer 这个架构之下去堆更多的参数和更多的数据集
然后 post-train 包括 time test 是什么呢就是在我牺牲时间我慢推理我在每步去做自回归比如说我可能原来我推理一个结果比如说是五步但是原来的话就是很直接我一下子把这五步推理出来然后我模型能力越强那可能推理的结果更
接近真相但现在呢在强化学习这个方法论之下它其实是牺牲了时间我每一步做一个自我监督自我检测比如说如果我第一步返回的是错误的那我就再算一遍去返回正确的然后每步有一个监督但牺牲了时间去大量的提升了这个结果的准确率这个叫 Post-train 的这样一个
过程所以说其实 DeepSeq 最大的贡献就是在 Post-Trend 这个领域完美地去给大家附现了这样一个情况所以我觉得就是它的出现让各家大模型在 GPT-4 这个水准上面我觉得能力是大幅接近的比如说可能苹果去采用了阿里的通一千万去作为可能
苹果在中国的这样一个基础大模型我觉得这个通缉纤维能力的提高在最近肯定是跟 DeepSeek 息息相关的但是呢在大模型的发展和探索上我们永远知道还有一条未知的路还有一条更新的路更新的路是什么呢就还是在追求下一代基础大模型的能力就是我们讲的叫 GPT-5-like 就是更多的
参数更大的数据集或者说更多模态这样一个模型的能力在这个模型的能力的探索上其实也是因为 DeepSeek 的出现我觉得竞争反而是加剧了因为其实本质上 AI 的世界是划分原来互联网世界的市场的那作为原来存量的互联网世界的巨头来讲的话肯定是想
在 AI 的世界里去滑到更多的用户使用时长希望每个用户去配更多的 up 值所以我觉得对于先进模型的追逐的话这个领域是一定没有停滞而且目前看对于先进模型的追逐的路径在 Transformer 这个架构之下还是比较一致的就是
Skyrim Now 依然成立只不过它是多维度的我们可以在 Print Stream 在 Post Stream 在 Time Tester 领域都会去做就刚刚你在说的时候我在想现在大家也在积极地讨论都非常的期待下一代全世界最先进的所谓的版本到底是什么时候出现会出现在哪里但是可能对像我这样的普通人来说我们其实有点感受不到不同版本的
迭代它主要体现在哪里然后能不能跟我们讲一讲其实我们刚刚讨论的时候你已经说到了一点我觉得是比较准确的你说现在 DeepSeek 的能力越来越像人了嘛我们惊叹它一点的话其实本质上就是它返回东西的准确率在逐渐提高我觉得这个是对文字模型能力的定义就是我们怎么去定义一个文字模型的好坏第一它返回的准确率是很高的第二它更像人
另外一个维度去评价大模型能力我们叫多模态最终如果真正的大模型能成为我们助手的话其实我们是希望它在文字语音图片视频等等模态去进行比较流畅的转化的我相信很多人都期待这一个场景就将来的话其实我们
随便说一句可能我们一个旅行目的地然后大冒险可以自动帮我们去订机票订酒店然后订行程这个是对于普通老百姓来讲一个所谓的 AI agent 的最终形态考虑这个维度的话那一定是现在大冒险的机构能力还是不够的我在使用 DeepSick 的时候其实让我非常震惊的一点就是它给我的
回答其实充满了情绪感觉更有人味了这个可能是跟之前截然不同的一种感受它不是一个生硬的回答那现在呢我们说中国人给了世界很大的一个惊喜但是它大概是接近于 GPT-4 的一个水平说现在全球大模型最显眼的版本是什么那我们在跟海外的技术相比的时候有多大的差距呢
因为这个差距不太好量化但是我接见所谓的专业人士的评论大概在 7 到 12 个月为什么说不太好量化呢因为其实真正去追逐前沿大模型的厂商那几家其实都没有去开源其实本质底层的下一代大模型其实就是类似于 GPT-5-like 就是它有多么太能力然后它返回的结果更加准确然后它能处理更多更复杂的问题
然后刚刚也提到了时间点的问题或者说比较关注的厂商的问题还是从那两个维度出发的话我们讲叫人才密度和算力密度就目前人才密度和算力密度最好的两家公司一家当然是 OpenAI 另一家可能大家比较意外我觉得是特斯拉的 XAI 因为它有全球最大的这样一个算力集群我觉得如果我们去期待下一代大模型什么时候落地的话可能这两家的可能就会大一点
然后这个时间点的话我粗拍拍大概是在 25 年下半年到 25 年年底
杜老师有其实提到一个我也很关注的一个话题就是你反复说到这个算力因为这个可能也是我们这几年在讨论大模型的时候大家关注度最高的一块就感觉算力可能决定了很多能力和事情但是随着 DeepSick 崛起大家对于算力的观点其实是产生了一些分歧的有的观点是说可能以后不需要那么多的算力了但是也有说法是它可能会带动
更多算力的需求你是怎么看当 DeepSeek 刚开始出来的时候其实很多人就第一个反应就是好像用非常低的成本可以去训练那么前沿的大模型是不是算力的需求崩塌了也因为这个其实全球的股市有一定的震动
当我们去冷静分析的时候就明白这个结论是错误的那后来其实有越来越多的论据去论证我们这个结论我觉得第一个论据就是海外大厂的一个资本开支因为基本我们可以看谷歌 Meta 然后亚马逊其实他们宣布资本开支的时间都是晚于 DeepSeek 的但是当 DeepSeek 出来之后其实他们的资本开支是上修的这是第一
我觉得第二个可以跟大家分享的就是当 DeepSeek 出来之后这个可能没有公开报道但是国内大厂对于算力的需求也是激增的不只是对于海外算力包括国产算力那这个背后的逻辑是什么呢就其实我刚刚去讲的时候也提到过因为
从算力的投资来讲或者说从 AI 的演变发展来讲我们可以理解成它是两条路径第一条是对先进基础大模型的探索在追逐先进基础大模型这个路上面目前看到的还是要 skill up 就是用更多的参数更多的数据量那我们在 print train 在 post train 在 time test 等等维度去做 skill up 需要更多的卡去把这个模型堆起来那因为 DeepSeek 的出现之后呢让
让更前沿的厂商产生了危机感所以这个动作是提速的这是第一个维度第二个维度就是我们要考虑现有模型的降本怎么能让更多人去使用它当更多人去使用它的时候其实它的推理需求有很大的增加那推理需求其实也是一个对算力有很大带动的这样一个板块然后甚至从未来我们去算的维度来讲的话
它的整体的需求的量级是远超现在预训练的这样一个需求的量级所以我们看到的情况就是当 DeepSeek 出来之后我们老百姓对 DeepSeek 的调容因为它很快日活突破了 3000 万包括中小企业其实都有很多新闻去接入其实这个对算力的需求是非常非常巨大的
从目前的角度来讲它一定是没有满足这个算力需求的因为我们在体验的过程中也会发现我们每天两三个问题它就会它就会提示几个字然后崩溃那可能这几个字就是目前它最缺的东西了解了对 确实我现在感觉非工作时间可能稍微好一点对但是如果是工作时间的话就很容易出现服务器繁忙的迷失对对对对对
那刚刚呢我们是聊到了 DeepSeek 对 AI 产业链是带来了不小的影响那后续相关的投资布局又会发生怎样的变化呢在展开讨论之前啊我想请杜老师来给我们科普一下整个 AI 产业链的情况它是怎么划分的它的全景图又是怎样的
因为考虑到第一是从产业链的逻辑第二是考虑中美现实的情况其实我们在投资和研究的过程中是把 DeepSeek 这个产业链分成四块主要的逻辑去分析的第一块我们叫海外的算力第二块叫国内的算力第三块叫端测然后第四块叫大模型和应用就是我们从投资和研究的花费上一般是分成这四个主要的领域
这个好像跟我之前看到对上游中游下游这样的产业链的划分不太一样对也可以去按上游中游下游这样的划分但是其实因为它不是一个完整的制造业我觉得那样划分不太准确我们再说一说现在 DipSeq 出现之后整个 AI 产业链是面临比较大的一个变化能不能再跟我们具体的聊一聊
对整个大算力板块其实它分为几块我们讲叫比如说芯片然后大家关注度比较高的是光波块服务器目前看到一个比较明确的变化就是刚刚我们也聊到了就是大家在对算力芯片的需求上因为 DeepStick 的出现不管是在国内和海外都出现了一个增加的情况
那对于光模块这个行业来讲的话我觉得除了算力的总盘子之外其实还有一个变量去影响这个行业就是连接方式是否发生改变那从理论上来讲的话其实我们去做预训练和推理的连接方式是可以改变的其实在推理端其实整个的连接速度和连接要求对集群的规模的要求其实没有预训练那么高的只不过就是在当下的阶段因为
它处在一个算力非常紧缺的阶段在企业的行为上来讲其实是没有去做这个划分目前我们没有看到这个影响但是后面我们会关注这方面的变化所以这样的变化也会带来相关领域的一个投资逻辑的变化对
还有就是也是一个大家比较关注的问题就是现在市场都预期 AI 应用的落地将进一步的提速那在你看来首先是不是会提速还有就是哪些细分领域或场景会更快的落地对我首先先明确的回答提速这个结论一定是正确的但是呢我觉得其实我刚刚讲的有一个逻辑我相信大家也听到过就是真正
AI 应用或者我们讲叫端册的爆发它是有两个必要条件的第一个是机座模型的能力第二是降本我刚举了几个场景比如说老百姓最想的比如说 AI agent 这种其实目前看到就是机座模型的能力是不太足的如果降本的话其实确实是 DeepSeek 在这一代的模型的基础上尤其是文字模型是实现了比较大幅度的降本
但是其实目前文字模型的能力也是受到部分场景限制它只能提升少部分场景的落地然后我们目前在应用领域最看好的还是在一些比如说对于企业的一些本地部署就是企业可以去更好的利用自身的数据去完成企业管理和营销的行为我举个例子比如说我们中国基金想去做这方面的部署的话
我们可以解决一个问题就是比如说我们对某个股票或者说某个行业我们可以在内部的资料库中去搜索我们过去的观点的变化那原来实现这个路径的话我们要自己去把可能研究员写的每篇报告去找出来然后去读一遍但是现在的话如果有 DeepSeq 我们可以通过 DeepSeq 去简单的实现这个功能
所以你这个对企业的运营管理包括投资决策的效率是有一个较大幅度的提升的那还有一个我讲的就是营销如果有用户和数据的企业其实它的内部的数据库是很有价值的但是怎么能够去更好的利用这些数据怎么能让这些数据能够更好的去做用户转化
在历史上都是一直想追求或者说解决的问题我觉得有 Deep Seek 之后可以帮助企业在这个行为上去转化的概率或者说能更好的去利用数据这个可能性是大幅提升的所以从方向来讲我们更看好企业服务这个领域
然后包括一些文字的处理的这样一些领域比如说教育比如说法律等等我们觉得可能这些领域是率先爆发的机会那我能不能理解就是它推动了可能 AI 大模型在 B 端的
一个落地应用包括商业化对那 C 端呢 C 端的话就是可以实现一些场景比如说 C 端个人的不管是工作性质还是日常的需求它跟文字墙相关的那我觉得这一块肯定是包括 DeepSeek 出来之后也是 3000 万的日活我觉得是加速了调用然后包括其实可能有普通的老百姓包括一些中小的青年
企业它其实可以以更低的成本去调用了一定程度是促进了创新其实我们不知道真正的创新在哪因为创新是靠人类的智慧的我们可以看到的是更多的可能性但是如果我们能想象到的比较远期的场景还是比如说 AI 的助手 AI 的助手又依赖下一代机座大模型包括一些多模态的能力我觉得可能这个要再去等一等
刚刚在开始的时候要跟您聊这个 DeepSick 出现之后我感觉这个世界变化好像更快了现在感觉是一个量变的一个过程那什么时候能到一个质变 AI 出来之后其实已经有一个质变的东西就是大模型的出现尤其是 Chatbot 我们叫聊天模型的出现实际上是大幅的代替了搜索其实在全球的角度来讲是一块巨大的市场
我们算下来大概是 5000 亿美金的市场其实已经是指数级爆发潜力你想 DeepSeek 出来这么短的时间就 3000 万日活这个在人类历史上其实是没有发生过的如果我们再期待下一轮的指数级潜力的话我觉得可以去看 2627 年我个人判断还是在 25 年下会有下一代机座大模型能力的提升那在下一代机座大模型的基础上肯定是会涌现更多的创新的可能性嗯
就是你刚刚在说的时候在回忆好像我现在确实用大模型的产品和工具替代了以前的搜索的功能其实它在不知不觉间已经改变了我们很多的方式和生活方式那这段时间我还有一个很直观的感受就是 DeepSick 的出现以及它在技术上的创新突破是极大的振奋了中国的 AI 产业的士气你怎么看接下来的 AI 国产化未来会发生哪些新的变化呢
我觉得国产化这个角度要分两个维度去讲一个是硬件就是算力一个是软件那硬件的话肯定是对国产算力的带动是比较巨大的那这个巨大是建立在两个维度第一个因为是 DeepSeq 模型的出现能产生更多的应用降低了推理的成本从客观的角度来讲确实国内的算力卡
不管是单芯片能力还是集体性能力是脚海外卡是脚弱的那如果在预训链的阶段替代的难度是比较难的但是在推理的阶段其实是有很大的替代空间的因为现在很多的模型都是用多集体人的推理因为推理需求的暴增带来的对于国内算力的市场空间是变得更大了我觉得这是第一个纬度
第二维度呢就还是要考虑中美关系我们预计呢后面其实从国内的厂商来讲去购买海外算力的难度是在不断增加的而且可能会是陡增所以我们预计可能从今年下半年开始更多的采购会偏向国内我觉得在这两个逻辑的加持下我觉得国内的
国产化这一块不管是算力芯片还是存储还是制造我觉得都是有非常大的机会这个是从硬件的角度那软件的角度呢我觉得 DeepSeq 最大的贡献就是拉近了国内的大模型厂商和海外的差距然后我们也看到了苹果接纳了阿里包括其实我们看腾讯的包括豆包的模型其实最近也在积极发论文因为 DeepSeq 出现带来模型能力的大幅提升了
我觉得这个是不管是从硬件侧还是从软件侧都是一个比较大的振奋吧我们也看到春节后 A 股和港股的科技板块也是有了一波上涨也是被这个事件的带动那接下来呢中国的科技资产会不会迎来新一轮的定价逻辑我觉得是要这样看一个问题在一个产业发展的时候其实大家去定价的本质逻辑就是第一产业的未来市场空间有多大第二就是这个产业的
爆发的可能性有没有持续在提高我觉得 DeepSeek 出来之后最本质的改变的问题就是这个产业爆发的可能性的确定性在迅速的提高了因为 DeepSeek 大概一个月左右的时间就积累了 3000 万以上的日活
这个爆发的写律师我觉得是投资者比较喜欢的所以因为这块的确定性提高我们不能讲叫资产定价的重估我们讲其实我们在算不管是从定价模型 DCF 来讲它其实是有可能性的这可能性的概率我觉得是大幅度提升的我们在去年到前年其实我们去跟海外聊的话其实海外一直把 AI 这个行业定义成未来十年甚至几十年这样一个行业
我觉得国内的慢慢的其实是同步到这个认知我觉得这块的投资热情有很强的持续性目前 AI 加医疗 AI 加金融等领域的机会大概是处于什么阶段哪些是从 0 到 1 哪些是从 1 到 10
OK 我觉得 AI 加医疗和 AI 加金融目前可能都是在一个从零到一的领域 AI 加医疗主要的帮助在三块第一个就是在疾病的早期发现上面那你通过大模型的应用的话对于疾病的早期发现其实是有比较大的目前用比较多比如癌症筛查
癌症筛查的准确率是大幅提高的我觉得这是第一块那第二块呢就是对蛋白质包括细胞结构的探索其实大家一定听到过一个很专业的名词叫靶点为什么我们很多病还没有用准确的药去治疗就是因为细胞的结构是非常非常复杂的它的可能性是非常多的就如果我没记错的话其实从
细胞结构来讲的话它好像有 19 亿种可能性人类原来都是试着去探索就是用手工探索可以这样理解其实只探索出几十万种可能性用 AI 的话其实是可以迅速地加速探索的如果界定从 0 到 1 和从 1 到 10 可能还不准确但是我自己判断如果给我们 10 年的时间人类的大部分疾病都会被解决
那本质逻辑就是在对于细胞结构的探索上面这个效率是迅速的提升的那第三块的话我觉得是 AI 的医疗就是机器人这个领域机器人这个领域我今天分享的比较少这个是跟那个居生智能这个大模型有关的这个可能我今天就不多分享了但是大家可以想象的就比如可能后面有更多机器人去做手术啊然后包括机器人问诊啊我觉得这一块也是一个很大的市场所以
在产业发展的时候我不太喜欢定义从 0 到 1 还是 1 到 10 但是如果去给个时间维度的话我觉得未来十年我们会看到所谓的 AI 加医疗是会应用到各个领域的然后第二个就是 AI 加金融 AI 加金融又比较复杂因为我们知道金融是一个非常大的行业有像我们这样的基金公司有券商有银行有保险每个金融机构所承担的责任和需要实现的目的是不同的
我觉得如果通俗来讲的话 AI 加金融可能最先去实现的还是在企业内部的管理因为金融的话有很多的内部数据库这部分数据库其实是价值量非常高但是因为隐私的要求也是很高的
但这些高质量的数据在原来都没有得到很好的应用,不管是在企业内部管理上还是在对外营销上,我觉得其实 AI 给了所有的金融公司一个最大的工具,就是怎么样能把这些数据能够更好的应用,然后能对企业内部管理,包括对客户的营销上能带来极大的促动,因为换方它本身就是一个量化的公司嘛,
就如果 AI 家计算其实对投资来讲我觉得也是有帮助的但是可能前提要解决的还是整个数据库的标准化包括怎么样把非标准的数据尽量的尽快的同步到模型里面嗯
其实顺着这个问题啊就你刚刚的回答我也想追问一下比如说 AI 加金融其实你提到不同的金融机构它对 AI 的利用包括跟自己业务结合是不一样的那我们现在很明确的能看到他们在企业内部管理包括智能客服
对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对对 对 � 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 类 �
对于不同的金融机构来讲目前都在加速开会了其实我们自己内部的话周五下午有一个战略会怎么去部署本地模型可能就是解决您刚刚说的问题第一个是企业内部管理第二是对客户的营销第三个怎么能对投资包括整个资产配置有更强的帮助和指引作用我觉得都是在进程中了但是
我们要明确的是在远期的 AI 的场景的假设中 AI 本质上其实还是一个越来越强有力的工具
就如果完全代替人我觉得可能在可见的未来甚至十年二十年都比较难但是呢它会让有想法有能力的个体能力和覆盖范围得到大幅度的提高我就借用 OpenAI 的老板 Sam Altman 的一句话吧就是十年之后一定会看到一人一币的公司一币的意思就是一个人的公司它的估值值十亿美金我觉得 AI 对我们来讲只是一个更强力的工具
是很难去代替最有能力的那批人所以感觉现在还是要抓紧的拥抱变化拥抱 AI 现在的 AI 板块的估值会太贵吗投资的话我们是自上而下和自下而上相结合我觉得从板块的估值来讲其实我们不太去评估这个事情
但是在一些细分领域我们会去评估投资不管是估值水平还是长期的投资价值我觉得在我刚刚提到的几个领域其实我们都觉得立足当下的话展望未来还是有比较大的投资价值的包括短期的海外算力可能国内算力包括可能我们觉得在端测的话比如说 AI 眼镜这种东西在 2026、2027 年也会迎来一个比较大的暴涨
然后应用的话估计在那个时间也会引来大的爆发我觉得 AI 的投资它是一个软件周期和硬件周期的迭代但这个投资的时间维度可以持续非常长所以我觉得个人投资者的话其实是推荐买一些比较优秀的科技的产品这样的话就可以去帮助
客户能够更好地去把握这个投资浪潮它不是一个比如说我可能在这个板块中去随便配置都会有比较大的收获我个人觉得大概率不是这样还是有比较强的专业度的
现在网上有很多在本地部署 DeepSig 的这个攻略可以让他使用更流畅然后也可以给他为自己相关的一些资料职业相关的一些资料让他的回答质量很高这会成为一种趋势吗
您提的问题我觉得主体是个人今天我看了一个文章应该是在小红书上面还挺火的就是一周自动放弃本地部署 AI 大模型为什么呢其实背后逻辑很简单就是本地部署大模型的目的是因为第一你的数据足够有价值而且你的数据是要实时更新的就是你
每天要更新有价值的数据就是有价值的数据或者说私有的数据占你整个数据的比例是要很高的第二
我们对数据的私密性要求极高其实大家用手机就可以去体会我们真正在本地存的资料是非常有限的或者说我们内心去追求只能在本地存的资料是比较有限的很多其实现在都是存在云上面的我觉得其实对于个人也是一样而且我们本地部署的模型很难部署我们叫满血模型满血模型是 671 币的美金
模型如果去本地部署的话其实不考虑 API 调用的话这个成本可能要在 200 万左右这个成本是比较高的但是本地部署的大部分是 8B 和 32B 的模型那 8B 32B 的模型其实只能实现它满血模型可能 50%到 60%的这样一个能力大家用起来可能觉得好像没那么好用目前对于普通的那个个人来讲我觉得
放着一个云端的那么好用的满血模型不用去花费那么大的精力去部署一个蒸馏出来的一个本地的模型我觉得是价值不太大所以他其实如果要让他在本地实现一个满血的状态还是对这个
设备包括对很多方面是有很高的要求的对就类似于我们我们会考虑去部署本地的满血模型因为我们数据的保密性要求是比较高而且数据的迭代是比较快的我觉得对于这种很多类似于我们这种企业是比较有价值的但是对于个人来讲确实不管从成本还是编辑的收益我觉得可能目前来看都不是特别强的
杜老师最近提到 DeepThink 的时候还有一个话题的讨论度特别高就是它的出现加快了科技平权包括 AI 普惠的实现你是怎么看这个趋势
我觉得 DeepSeek 对整个科技的最大的贡献,当然更多的个体,包括一些中小企业其实能去接触到大部分的能力,那这个能力确实会对大家的日常的学习,生活,工作是有比较大的帮助的,比如说他本身不是一个专业的科技领域的人员,
它是写一些比如说董事会报告的但是通过 DeepSeek 这个工具的话让它的工作效率其实是得到了一个比较大的提升的我觉得通过大模型之后确实是让每个人在信息获取或者说在针对性的学习上这个维度是平选的但可能还有一个角度就是因为其实个体本质上还是有差异的我们把大模型更多是看作一个工具
那我们再去调用这个工具的能力其实是因为个体的差距是有不同的所以其实对于很多人来讲会把他的个体能力会略微的放大
就是说理论上大家都有了更平等的去接触到新知识或者是新事物的一个渠道但是呢你能不能更好地去利用这些工具或产品其实是还是存在很大的差异的好多人其实举过这个例子就是我们在比如说对小朋友的教育或者说未来的教育形式的这样一个讨论
因为其实原来的教育的形式更多是一个信息的输入理解和掌握但我觉得后续的教育形式可能会更关注在第一是创新想法第二是更好的掌握和利用工具我觉得这样讲可能会比较准确就是对人类所需要的具备的能力跟原来的要求是不同的
它是不是会让更多有艺术天分或者是有创意类型的这种天赋的人极大的释放他们的这个天赋对 我觉得艺术是创意的一种但是其实我们在科学探索对吧 在一些比如说
金融的投资或者说在各行各业其实都是一种创新的探索如果你要超越其他人的话我可能艺术是一个表象吧但我觉得在各个赛道都是一样就是具备有创新精神的能更好的利用工具的人都会在各个领域去做得比原来更好
你在说的时候我也在想就是你提到了对这个 AI 工具的一个使用能力其实在未来会变得越来越重要但这个会不会加剧大家的另外一种焦虑如果说可能不是所有的人都有这个能力或者是兴趣去
跟进这么快的一个技术的迭代啊或者是对这些 AI 工具的一个使用它会不会带来另外一种技术焦虑我现在就时常会有一种感受就是看到铺天盖地的这种关于 DPC 关于 AI 的一个讨论的时候有的时候会很慌就感觉如果我不能很好地用它或者是我不能改上这辆车我可能会错失很多机会
我个人的建议确实是要学起来要拥抱不能排斥历史的发展其实就是这样如果我们去 back in the days 去回顾比如说蒸汽电的时代如果
如果你不拥抱蒸汽机不用电的资源去创造更多的工具那还是在传统人类社会的时代还利用火把那你一定是会被时代所淘汰的之前每一个阶段技术的迭代或者是突破性的渐进式的一个发展它是有一个缓冲期的就是我们有更多的空间和时间去适应它带来的改变
尤其它是在过年期间嘛这个事爆发出来瞬间就是大家所有的话题都在这个上面对我能感觉到是有一种兴奋中国的产品中国企业做出来的产品对但另外一种我就有一种隐隐的焦虑就是我必须得了解
它是什么相关的信息就是可能我们在坐车在很多休息的时候我就忍不住的会去刷相关的消息但当我静下来的时候我就会觉得这种好状态是不是并不是特别好就是它带给我了其实更多的焦虑对我觉得这可能也不是一个
非常快的变量也可以去慢慢地把这个事情做好在我理解其实 AI 的能力如果按照时间轴去划分的话它分为三种能力而且这个三种能力在时间轴上是连续的第一个我们讲叫 AI 自身的能力就是 AI 的水平发展到哪里比如说可能文本模型本身的推理能力或者说文本模型的数学能力或者说多模态模型这是第一位的能力第二位的能力就是 AI 能赋予人的能力
其实从 AI 的能力来讲其实人要更好的利用它是要结合场景和工具的所以可能在这个磨合中其实也是需要时间然后第三个能力是人怎么能更好的利用 AI 这个工具的能力这个是三个维度的能力它其实不是会在一天或者几年之内去整个颠覆人类社会但我觉得如果以
更远的视角来讲它确实是会给我们方方面面带来很大的帮助吧很多时候要正面看这个事情一个很积极的例子就比如说我自己预期可能 10 到 15 年之后所有的疾病都会被解决然后人类的寿命都可以大幅被延长因为这个促进了我自己的改变就是我自己增加了日常的运动量开始去跑步啊健身啊更积极的心态去拥抱下一个时代了
我最近有朋友也跟我说了这个观点就是说以后可能有更多的一些工作内容
比如说可能文字向的或者是整理向的工作会被 AI 替代之后呢那大家有了更多的这个时间或者是精力去向内求就是去追求自己真正感兴趣的事情或者是去享受生活发展兴趣爱好我觉得这个想法是对的其实 AI 就是在可见的未来它一定是解放一些比如说
需要低思考的一些劳动或者说一些重复的这样一些工作然后能大量的去优化每个人的时间结构让每个人更好的去分配时间做自己更喜欢做的事情我觉得这个一定是一个比较重要的趋势吧或者说 AI 这个工具能给人类社会带来的这样一个推动和进展
我们其实是要跟上这个节奏就是去学习使用拥抱 AI 的这个能力但是现在我发现获取相关信息或者是专业信息理论上是渠道更多了但是呢好像真正的能获取高质量的渠道或者是高质量的内容反而变得更困难了就是因为网上的噪音非常多
所以这个趣味存珍的过程其实变得越来越难了不知道杜老师你平时会从哪里去获取这样高质量的信息像我今天为准备这次的播客其实我在看了很多资料包括不管是文字的视频的直播的但是我发现信息密度最高的内容质量最高的是在播客上
这也是一个很有意思的变化对不管是播客还是视频还是文字其实它是一种形式 AI 可以帮助优化的部分就是它可以在一定程度的去根据网络的信息去检索如果网络的大部分信息是正确的话其实它的倾向性结论就是正确的答案但如果网络上
虚假的或者说夸大的信息比较多的话它可能检索的结果是会有误的但是就像我们刚刚讨论的我觉得在任何一个专业的领域我们确实是可以去关注我们认为在这个专业领域比较专业的一群人这群专业的人背后蕴含的意义就是他在这个专业领域去付出的时间足够多所以也顺便插个广告就如果说大家想去关注
AI 产业的进展或者说可能 AI 相关的投资的一些情况就可以去关注我们的公众号不是说我们比大家要聪明而是说其实因为我们在 AI 的发展 AI 的产业 AI 这个领域的专注度上面或者说
花的时间上面是比其他人要更多的因为你花的时间多你自然而然的就会在这个领域产生一些趣味存真的这样一个能力所以我觉得可能还是要把专业的事情交给专业的人去做吧其实最近因为我是媒体行业所以最近也讨论很多就是因为利用了 AI 的工具其实我们收藏内容
变得更容易了当然生产优质和专业内容其实它还是有很高的门槛的但这个就带来一个问题就是说可能以后这个信息爆炸的这个程度可能会更夸张对吧因为我们有大量的工具可能以前要花很多时间去准备的一个视频或者是一篇文章那现在通过 AI 的工具我可以更轻松地生产出来更高效地生产出来那这个会不会带来
更可怕的一个信息爆炸就是我们在互联网时代已经说这个信息爆炸其实带给了很多人困扰或者说是不适应的但是那以后的话这个情况会不会更加的严重包括现在有很多人也在可能有一些反感我们被算法网架了我们在一个信息减防里面那未来的话这种情况是不是也会变得更加的严重
我觉得未来还是两种并行的吧主动去探索信息的维度还在就是主动去满足个人的一些需求或者说通过检索去满足个人需求这个需求还在所以我觉得可能类似于小龙珠这种还是对整个社会有很大的价值但是呢就像您说的可能在某些
通识化的或者说不需要那么多专业读的或者说没有办法有那么多高质量那种的领域其实通过 AI 的 summarize 其实是可以帮助我们简化很多过程的比如说就是搜索这个环节好了其实以前我们去
百度检索的时候很多时候是比较困扰的我们其实是很难去瞬间的抓住比较关键的信息甚至在对一些比如说哪些是广告哪些是有什么目的实际是比较难去甄别的但其实 AI 对于这种信息的话是帮助我们做了第一层或者说很大的一个维度的筛选和处理的
从这个维度来讲对于这种信息的趣味存在的能力我觉得是大幅增强的也提高了其实整个人的不管是工作效率还是学习效率但是就像您说的人的价值其实包括获取信息的价值永远是期望能够去看到更专业的信息和更高质量的信息但是我相信目前来看更专业和更高质量的信息一定还是由人来提供的可能这个就是
在未来的社会分配中或者说在未来的这样一个世界里人的价值就是提供更有深度更专业更有创造力更有创新性的这样一些意见看法或者价值就是当 AI 能够解决一些基础的重复性的工作的时候可能更有创意更有价值的东西反而会被放大会凸显出来对
我感觉收获很大相信未来很长一段时间 AI 技术的创新以及它所带来的改变都会是一个非常重要主流的叙事就我们也期待未来有更多关于这些话题的交流感谢杜老师好 谢谢大家欢迎大家收听我们的播客基金有风险 投资需谨慎以上内容仅供参考不预示未来表现也不作为任何投资建议