cover of episode DeepSeek 开源周 | 全景解读与我们的思考,开源加速 AI 创新

DeepSeek 开源周 | 全景解读与我们的思考,开源加速 AI 创新

2025/3/7
logo of podcast AI炼金术

AI炼金术

AI Deep Dive AI Chapters Transcript
People
任鑫
徐文浩
Topics
徐文浩:我认为DeepSeek开源的意义在于展示其强大的技术实力,形成良性循环,最终巩固自身在AI领域的领先地位。开源并非简单的技术分享,而是通过展示自身的技术优势,吸引更多人才和资源,最终推动自身技术和生态的进一步发展。DeepSeek开源的代码量表明其优化并非耗费大量人力和时间,而是通过巧妙的策略实现的。DeepSeek的开源策略,旨在通过计算换带宽,解决模型推理延时过长的问题。FlashMLA和FlashAttention的核心思路都是用计算换取带宽,减少数据搬运。DeepGEMM是一个优化矩阵乘法的计算库,旨在提高计算效率,并解决了FP8精度问题。3FS是一个分布式文件系统,旨在通过使用更廉价的存储设备来提高模型训练和推理效率,其核心思想是通过巧妙的工程设计,用更廉价的硬件设备达到与高端设备相近的性能,从而提高ROI。DeepSeek-V3/R1通过增大batch size、隐藏通信延迟和执行负载均衡来提高推理吞吐量和降低延迟。总而言之,DeepSeek的开源策略,不仅能降低服务成本,提高速度,扩大生态,还能吸引更多人才,最终形成良性循环。 任鑫:DeepEP是一个专家并行通信库,用于优化MOE模型的通信效率,降低模型推理延迟。其核心思想是通过动态路由和资源分配,最大化地利用GPU计算单元,从而提高模型的推理速度。DualPipe优化流水线并行策略,提升模型训练和推理效率,其核心思想是将正向传播和反向传播的计算重叠进行,从而减少流水线中的空闲时间,提高GPU利用率。EPLB是一个专家负载均衡器,用于提升模型性能,其核心思想是根据不同专家的负载情况,动态地调整资源分配,从而提高整体的计算效率。通过阿里钉钉的AI agent,可以实现AI赋能线下调研,提高效率。我认为DeepSeek开源对整个产业是有利的,它降低了成本,提高了效率,最终受益的是掌握企业级场景的公司,例如阿里巴巴的钉钉。因为钉钉拥有大量的用户和场景,可以更好地利用这些开源技术,从而提升自身的产品竞争力。

Deep Dive

Chapters
本节深入探讨了 DeepSeek 开源周第一天发布的 FlashMLA,解释了它如何通过优化多头潜在注意力机制(MLA),减少 GPU 内存读取次数,从而提升计算性能。并用通俗易懂的比喻解释了其原理,以及与其他类似技术的区别。
  • FlashMLA 优化了 DeepSeek 自有的多头潜在注意力机制 (MLA)
  • 通过减少内存读取次数来提升计算速度
  • 利用计算换取带宽,在模型推理中提高效率

Shownotes Transcript

大家好,欢迎来到新一期的AI炼金术。本期我们聊聊 DeepSeek 的开源周——从2月24日到3月1日,六天里他们带来了令人惊喜的技术发布。 DeepSeek这样的中国团队正在全球AI技术竞争中展现出强大的创新实力,通过开源战略不仅推动了AI领域的技术突破,还降低了开发门槛和成本,让全球AI社区能够共享技术成果并加速创新。 与此同时,"杭州七小龙"等创新集群正在崛起,宇树科技等新锐企业不断开拓疆土。阿里钉钉则凭借To B领域优势,将AI无缝融入日常办公场景,让用户真切感受到AI带来的效率提升。 这些中国力量的崛起,正在重塑全球AI产业格局,开源浪潮也在加速整个AI行业的竞争与洗牌,为各类应用开发者创造了前所未有的机会。让我们一起走进 DeepSeek 开源周的精彩内容。 时间线:** 02:18 DeepSeek发布会Day 1:FlashMLA 大幅提升GPU的内存带宽和计算性能 17:07 DeepSeek发布会Day 2:DeepEP 专家并行(EP)通信库,降低模型推理延迟 23:00 DeepSeek开源策略及其对生态的影响 28:16 阿里:AI模型竞争下,规模和场景成为护城河 33:34 钉钉:AI在日常办公的应用潜力 39:14 DeepSeek发布会Day 3:DeepGEMM 大模型计算优化矩阵乘法库,提高计算效率 47:09 DeepSeek发布会Day 4:DualPipe 优化流水线并行策略,提升模型训练和推理效率 55:57 DeepSeek发布会Day 5:EPLB 专家负载均衡器,提升模型性能 1:01:02 DeepSeek发布会Day 6:DeepSeek-V3/R1 专家咨询(EP)增大batch size、隐藏通信延迟、执行负载均衡,提高推理吞吐量和更低延迟 1:12:14 DeepSeek开源战略对AI行业的影响 提醒:本期涉及观点不构成任何投资建议,投资需谨慎。 欢迎订阅「AI 炼金术」的播客,以及同名公众号、视频号  「AI 炼金术」是一档由徐文浩和任鑫——两位多年老友、AI 领域的资深从业者——打造的播客。这里是探讨 AI 和创业的理想聚集地,我们会邀请一线创业者、产品产品和科研学者,深入探讨 AI 如何重塑行业、变革生活,以及如何从 0 到 1 打造 AI 原生产品。 我们的讨论会涵盖多个话题:从 AI 如何改变世界的未来,到如何找到 AI 创业的 PMF;从如何利用 AI 降本增效,到怎样将 AI 技术融入日常生活……如果你对 AI、产品、创业感兴趣,这里有满满的干货和一线实战经验,欢迎关注并推荐给你的朋友,共同探索未来的无限可能! 商务合作:公众号 「AI炼金术 」菜单栏中【商务】获取联系方式 节目主理人:* **徐文浩:**某AI创业公司联合创始人,正在面向全球市场开发AI应用。连续创业者,参与过多家创业公司,拼多多早期员工。广告科技公司MediaV的算法和数据负责人,后被360收购。离开后加入成立不到1个月的拼多多。后创办了基于AI的海外客服聊天机器人公司BotHub. AI和 海外社交电商平台 Bukito 都宣告失败。2023年再次下场创业。 **任鑫:云九资本合伙人,主要在投资和孵化面向全球市场的 AI 应用。之前是连续创业者,曾经打造“今夜酒店特价”用移动互联网应用特价销售酒店尾房;被京东并购后内部创业“京东到家”开展本地即时零售业务;2015 年再次创业 Get 探索对话式人工智能助理成为先烈;2021 年出售公司,2023 年重新回到 AI 世界。 BGM: 片头:**Shortwire - Reconfig 片尾:**Forester - The Flood