美股言报解读 财经信息 交易逻辑欢迎来到左兜进右兜亲爱的听众朋友们大家好 这里是左兜进右兜我是你们的好朋友左兜今天是 2025 年的 3 月 16 日星期日欢迎收听本期的宏观周普盘本周五还好啊 大规模的反弹要不然又是痛苦的一周每一次经历痛苦都应该得到一些经验咱们不能让痛苦白白的溜走啊
好了,进入正题,本周宏观周复盘的主要内容有,第一,美股市场的回顾,第二,美股宏观数据及重点事件,第三,红海的业务反馈,第四,解析 AI 算力军备竞赛,第五,测算推理下的硬件需求。
先来看一下市场回顾近 5 个交易日纳斯达克指数涨幅负的 2.43%标普 500 涨幅负的 2.27%道琼斯指数涨幅负的 3.07%罗素 2000 指数涨幅负的 1.51%沸腾半导体指数涨幅负的 0.67%重点事件方面本周美国宏观经济数据和事件总结如下先来看一下宏观的经济数据
就业市场方面,美国的 2 月份新增就业岗位 15.1 万个显示就业市场稳健,截至 3 月 23 日的一周内,首次申请失业救济人数为 22.1 万人,略低于市场预期的 23 万人。通货膨胀方面,2 月的生产者价格指数 PPI 环比上涨 0.4%,略高于预期的 0.3%,核心 PPI 环比上涨 0.3%,也超过了预期的 0.2%。
米歇根大学消费者信心指数初值是 64.7 高于预期的 63.2 显示消费者信心略有回升制造业和服务业方面 2 月份的 ISM 制造业指数为 50.3 较上月的 50.9 有所下降但仍处于扩张区间服务业指数则继续
白宫周五的时候为发布相关的关税信息美国政府关门危机解除风险情绪改善周五的时候美股全面反弹澳元和纽元成为计时的最佳而瑞朗和日元等避险货币承压美元略显疲软然而美国消费者信心数据远低于预期通胀预期飙升显示经济基本面仍存隐忧
三月的密歇根大学消费者信心指数创造了两年的新低长期的通胀预期创造了 1993 年以来的最大升幅消费者对于财务状况预期也降至了有记录以来的最低
受风险情绪改善和通胀预期飙升的影响,周五的时候美债收益率普遍走高,分析称这份报告再滞胀不过了。关税政策反复长,大规模的政府裁员,高利率环境均令消费者心心受挫。降息的预期降温,目前市场预期下周美联储 97%概率不会降息。
地缘政治潜在缓和,普京称俄美关系已经有所进展,泽连斯基呼吁美国对俄罗斯施压,推动停火特朗普宣称实现乌克兰停火的可能性较高下面我们来看一下鸿海的业务反馈鸿海的 Q1 财报可以说是冰火两重天,iPhone 拖累了净利下滑 13%,而 AI 业务却迎来了爆发式的增长
25 年的 3 月 15 日,全球电子代工巨头鸿海精密发布了第一季度的财报财报显示,受中国市场 iPhone 需求疲软的拖累公司的净利润意外的下滑了 13%,到达了 463 亿新台币,约 14 亿美元远超分析师预期的 2.3%的增长幅度
但是作为伊维达核心供应链的伙伴,他们的 AI 服务器业务却迎来了爆发式的增长本季度 AI 相关收入预计同比翻番,为全年增长注入了强心剂先来看一下 iPhone 销售遇冷重创利润财报显示红海的传统优势的智能手机业务利润率被严重侵蚀了
这主要源于中国市场的 iPhone16 系列销量低于预期市场调研机构 Counterpoint 数据显示 2025 年的第一季度苹果在中国的市场份额已经降至了 12.3%是近三年以来的同期最低鸿海的 CFO 在业绩会上坦言消费电子行业正在经历结构性的调整我们主动缩减了低利润订单导致本季毛利率成压
再来看一下鸿海的 AI 业务可以说 AI 引擎全速启动与手机业务形成鲜明对比的是鸿海深度参与的 AI 产业链呈现了井喷的态势作为英伟达 HGX-H200 超级计算机的独家组装商公司已经获得了英伟达 2025 年全年服务器订单的 45%的份额根据供应链人士透露鸿海位于新北的 AI 工厂目前是 24 小时满负荷运转
三月单月的 AI 服务器出货量已经超过了 2024 年的全年总和鸿海的董事长刘洋伟预计本季度 AI 相关收入将突破 800 亿新台币全年占比有望提升至 22%公司正在追加 300 亿新台币的投资用于扩建高雄 AI 研发中心和越南的智能化产线
值得注意的是,鸿海已经初步地切入微软谷歌的 AI 基础设施供应链,形成了多元化的客户布局。行业分析师的观点,瑞银正片指出,鸿海正在经历新旧动能转换的阵痛,虽然 iPhone 的业务拖累了短期的业底,但是 AI 业务的爆发性增长将重构估值体系。
根据数据显示,鸿海的 AI 服务器业务毛利率已经高出了手机代工业务的一倍,成为了新的利润增长级目前,鸿海的股价在盘后交易中逆势上涨 2.3%,反映了市场对于其 AI 战略的认可而随着英伟达本周宣布扩大 H200 产能,这家代工巨头或将在 AI 浪潮中迎来更大的结构性机遇
接下来我们来看一下瑞穗深度解析 AEI 算力军备竞赛 CASP 资本开支迎来了结构性的转向也是在 25 年的 3 月 15 日在东京召开了全球的科技产业电话会电话会上瑞穗证券首席分析师斋藤建一郎
以生成式 AI 时代的通信基建革命为题系统拆解了大模型迭代对于通信服务提供商就是 CSP 资本开支的深远影响这场涉及 127 家国际机构的闭门会议首次披露了 CSP 在 AI 算力布局上的三重变走下面我们来详细的解读一下
第一就是参数军备竞赛 GPU 需求的抛物线是增长最新数据显示模型在大规模多任务语言理解也就是 MMLU 基准上的得分与参数量呈强正相关当参数突破 5000 亿级每提升 1%的准确率需要追加 12%的算力
这直接推动了 CSP 在 2025 年 Q1 的 GPU 采购量同比激增了 217%其中英伟达的 H20 占比达到了 68%这就是 MMLU 基准的残酷法则那么说到 2027 年的算力天花板
瑞穗测算,按照当前的参数膨胀的速度,主流的 CSP 的单体数据中心将在 2027Q2 触及散热极限中国的移动研究院也已经证实,他们建在张家口的质算中心也预留了液态制冷升级空间第二,来看一下推理革命,从训练红海到推理蓝海
先是新模型的算力杠杆通一千万 Q1-72B 推理板 DS-21 等新架构将单 token 推理能耗降至了训练的 1/10 但是爆发的应用场景比如说智能客服实施的 AIGC 却使推理负载呈现了指数级的增长而且 2025 年 2 月的 AI 推理调用量环比激增了 4100%然后就是 CSP 的双轨投资
瑞穗监测到头部的 CSP 开始将资本开支向推理优化倾斜 AT&T 计划 2025 年投入 38 亿美元升级边缘的推理节点德国电信在 15 个城市部署了专用的推理集群
这种转变使 GPU 需求结构升变 H20 推理效率比 A100 提升 40%那么推动其订单占比从 2024 年的 12%跃升至了 2025 第一季度的 39%第三再来看一下国产算力的突围成本和性能的博弈先来看一下升腾 910A-C 的破局
瑞穗获得的产业链数据显示,搭载升腾 910C 的服务器成本较 H20 低 52%虽然在复杂推理场景下性能波动是 18%的上下但是在视频转码、语音识别等垂类场景已经达到了 H20 的 92%的水平中国移动 2025 年的集彩中,升腾机型的重标率已经达到了 35%
再来看一下英伟达的护城河 H20 在混合精度推理的稳定性优势还是明显的某头部云厂商测试显示其 7 乘以 24 小时连续推理故障率仅为升腾的 1%这种差异导致金融医疗等行业对于稳定性敏感的 CSP 仍然坚持 100%的英伟达方案
第四,我们来看一下供应链的重构,28%的墨西哥选项关税阴影下的产能迁徙瑞穗独家掌握的物流数据显示 2025 年的 Q1 美国 CSP 采购的服务器中 28%是由墨西哥蒙特雷工厂生产鸿海、伟创等代工厂正在将英伟达 H20 组装线向墨美边境转移以规避潜在的 25%的进口关税
CSP 的隐性成本这种转移使单台服务器运输成本增加了 420 美元但是换取关税豁免后的综合成本下降了 18%威瑞森的首席采购员在会上披露已经与墨西哥政府达成了电力优惠协议确保 AI 服务器集群 PUE 维持在 1.25 以下再来看一下资本开支新周期 CSP 的 AI 优先战略
瑞穗预测,2025 年全球的 CSP 在 AI 相关的资本开支将达到 1270 亿美元其中推理基础测试占比首次超过训练这种转变直接影响产业链台积电 Cowos 产生中 65%已被推理芯片计算键键单锁定而内存厂商美光专为推理优化的 LPDDR5X 出货量同比激增 670%
翟腾建业郎强调我们正在见证通信基建从管道思维向算力枢纽的泛始迁移 CSP 的 AI 资本开支将呈现训练饱和到推理爆发到边缘渗透的三阶段演进建议重点关注具备推理芯片定制能力如英伟达 B100 和边缘算力布局思科等厂商最后我们再来看一下测算推理下的硬件需求
第一是 DeepSeq 优化技术降低算力需求的原理与计算核心技术方面 MLA 多头潜伏注意力通过压缩关键特征项量减少计算 token 数降低对 HBM 内存消耗缓解 KVCash 储存压力那么 MTP 多 token 预测方面一次预测多个 token 减少数据的传输量还有就是 Sparse MOE
吸输专家混合方面,动态激活少量专家,提升计算效率,减少冗余的计算。算力需求测算方面,假设的条件,中国有 9 亿城镇常住人口,1%使用 AR,聊天机器人,那么 DAU 并发数为 9 亿乘以 1%就是 90 万个。
未优化的场景英伟达 H200 在 LP16 精度推理时 token 的吞吐量是 464 tokens/s 那么 DeepSeq 官方输出速率是 20-22 个 token/s 单卡/s 处理是 464/21 约等于 22 个并发 90 万并发虚优化后的场景 DeepSeq 优化后 H800
Token 吞吐量是 1850 tokens/s,单卡/s 处理 1850/21,约等于 88 个并发,90 万并发虚,较为优化方案需求减少了约 75%。第二,我们来看一下 Mineus 智能体推升算力需求的逻辑与计算。
需求增长逻辑方面,minus 处理复杂任务需调用视觉大模型等,平均 token 输出速率约是 200chokens 每秒,且任务处理时间是 20-30 分钟,远长于 chatbot 4-5 分钟,用户并发比例更高。
算力需求测算方面,假设条件中国的白领人口 2 亿为 DAU,那么 AI 智能体并发比例 5%。计算的过程就是,假设每张优化后的 H800 支持 9 个并发,那么 1000 万并发需,叫 DeepSeek 的 Chatbot 场景 10 万张 H800 需求增长近 10 倍。
综合结论方面,DeepSeq 优化算法虽然使大模型推理算力需求下降了约 75%,但是 Manas 代表的 AI 智能体因为任务复杂性、高并发等特征揭示了未来推理算力需求将增长约 1000%。那么整体来看,AI 算力需求仍然会大幅增长,且乐观的预期中国将会快速迭代出普及的 AI 智能体爆款应用。
好了本期内容就到这里这里是左兜进右兜期待下周的修复行情我们下期再见拜拜