We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 花旗研报:DeepSeek模型对中国互联网的影响

花旗研报:DeepSeek模型对中国互联网的影响

2025/2/13
logo of podcast 左兜进右兜

左兜进右兜

AI Chapters Transcript
Chapters
花旗发布研报,分析 DeepSeek AI 模型对中国互联网的影响。DeepSeek 的低成本、高效能开源架构令人惊喜,其在克服硬件限制方面的技术优势尤其突出。研报预测 DeepSeek 将加速全球 AI 应用开发,或引发 2025 年 AI 普及拐点。
  • DeepSeek 低成本高效能开源架构
  • 克服硬件限制的技术优势
  • 加速全球 AI 应用开发
  • 2025 年 AI 普及拐点

Shownotes Transcript

美股言报解读财经信息交易逻辑欢迎来到左兜近右兜亲爱的听众朋友们大家好这里是左兜近右兜我是你们的好朋友左兜今天是 2025 年的 2 月 13 日星期四欢迎收听本期的节目春节期间全球的目光都聚集到了 DeepSeek 上 25 年的 2 月 3 日花旗发布了一份报告具体分析了 DeepSeek AI 模型对于中国互联网领域的影响

花旗认为 DeepSeek 的低成本高效能的开源架构给业界带来了惊喜报告中指出 DeepSeek 在克服硬件限制方面展现出了独特的技术优势并且强调中国互联网巨头比如阿里巴巴、腾讯还有百度在 AI 和大型语言模型方面的努力被投资者低估了报告预测了 DeepSeek 模式将加速全球 AI 应用的开发可能会引发 2025 年 AI 普及的拐点

此外,报告也讨论 DeepSeq 可能面临的地缘政治审查并且将其与其他中国 AI 助手进行了比较比如说字节的豆包最后,报告详细介绍了阿里巴巴、腾讯还有百度在 AI 领域的最新进展包括他们各自的大型语言模型和应用生态系统下面我们来看一下言报的具体内容言报的主题是 DeepSeq 模型对于中国互联网的影响

主要有这几方面内容首先是 DeepSync 的崛起及其影响 DeepSync AI 应用在农历新年之前登顶了美国应用商店的下载宝引起了行业的广泛关注尤其是因为它的低成本高性能的开源 MOE 的架构报告认为中国互联网公司在 AI 投资和大型语言模型发展方面的努力被投资者们严重提估了

报告还预测 DeepSync 和其他中国模型的高效率低成本的模式将加速全球 AI 应用的开发可能在 2025 年引发 AI 采用的拐点花旗对于中国公司 AI 能力的排名是阿里巴巴大于腾讯大于百度然后就是 DeepSync 的技术创新为了克服硬件限制 DeepSync 绕过了昂贵的 CUDA 基础设施直接针对的是 PTX 进行了优化

DeepSync 采用了 Moe 的架构,具有 6710 亿参数和 370 亿激活参数通过结合 Moe、MLA、MPT、Auxiliary Loss Free 和 FP8 等技术 DeepSync 模型更加高效,占用更少的内存,并且降低了训练和推理的成本

DeepSick 通过技术创新,降低成本,引发了对于未来 AI 驱动硬件需求的质疑下面来看一下中国互联网巨头的 AI 布局报告中强调阿里巴巴、腾讯以及百度都在 2024 年推出了 Moe 的方法阿里巴巴方面阿里云发布了最新的 Kuron 2.5 Max 这是一个拥有超过 20 万亿 Token 的开源 Moe 模型

通一大模型家族覆盖了从语言到图形,从视频到音频腾讯方面,腾讯云的魂元 LLM 通过全站产品套件助力企业提高运营效率和数字化水平新一代的魂元 Turbo 模型基于更高效的 Moe 结构,成本降低了 50%

百度方面,百度认为 MOE 方法可能是 AI 采用的未来趋势通过整合不同的模型大小,帮助开发者在成本和速度之间取得平衡还有就是地缘政治因素 DeepSeek 的快速发展可能会引发一些国家的审查限制他们在某些市场上的使用比如说意大利和爱尔兰已经宣布阻止在其市场下载该应用程序

下面来看一下 AI 助手应用的竞争报告预测呢在 2025 年越来越加剧竞争的应该是 TOC 就是面向消费者的 AI 聊天助手我们应该关注的是是否会出现有 AI 聊天机器人助手能够去覆盖现有的移动互联网时代的超级应用

然后就是重要的观点及事实方面 DeepSeq 的成本优势公司声称该模型的成本仅仅为 560 万美元每百万输入 token 的费用是 0.14 美元比 OpenAI 的 250 万美元便宜了大概 94%还有就是 DeepSeq 绕过了 CUDADeepSeq 绕过了英伟达的 CUDA 技术直接针对的是 PTX 进行的优化

还有梁文峰对于 DeepSeek 的愿景就是 DeepSeek 将保持开源并且目前没有近期筹集 web 资金或者 IPO 的计划他还希望 DeepSeek 能够成为技术创新和领导者而不是依赖他人创新然后建立强大的应用

阿里巴巴的 Q1 模型数据呢阿里云在 1 月 29 日发布了最新的 Q1 2.5 MAX 这是一个拥有超过 20 万亿 Token 的开源的 MOE 模型还有腾讯在于混元上的投入腾讯的管理层表示该公司已经为混元大模型投放了超过 3000 亿元人民币的研发资源

百度表示了对于 MOE 的看法,百度指出他认为 MOE 方法可能是 AI 采用的未来趋势,因为大多数的经营程序将基于多模式。最后看一下对于这份研报的结论,这份报告表明 DeepSeek 的崛起对中国甚至全球的 AI 行业都产生了重大的影响。

DeepSync 低成本高效的技术创新可能会加速 AI 的普及还有应用同时中国互联网巨头在 AI 领域的布局也不容忽视他们都在积极的开发和应用大型语言模型尽管如此地缘政治因素也可能会限制 DeepSync 在某些市场上的应用此外 AI 助手应用之间的竞争也会愈演愈烈新的超级应用可能会随着市场发展慢慢出现

好了本期内容就到这里感谢大家收听这里是左兜右兜我们下期再见拜拜