We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Vol.345 | 大模型如何发展?百度、华为都想“开”了

Vol.345 | 大模型如何发展?百度、华为都想“开”了

2025/7/1
logo of podcast 第一财经

第一财经

AI Deep Dive AI Chapters Transcript
People
A
AI应用从业者
九章云集内部人士
分析人士
华为
华为内部人士
华为技术专家
周静仁
李彦宏
百度
邦尼李七
无相关信息。
Topics
邦尼李七:我认为开源已成为推动人工智能技术进步和产业发展的重要力量。百度和华为也顺应趋势,宣布最新的开源动作,但这背后也存在竞争和挑战。 AI应用从业者:我分析认为开源是人工智能发展的必然趋势。 李彦宏:我曾经坚信商业化的闭源模型在激烈的市场竞争中更具优势,但现在市场环境发生了变化。 华为技术专家:我认为盘古7-2B模型是行业用户利用人工智能改造业务的最佳选择。只有更加开放,才能让大模型及应用走出实验室。 周静仁:我很高兴看到国内企业积极加入开源阵营,开源对人工智能产业是绝佳的事情,在模型基础上进行二次创新至关重要。 九章云集内部人士:我认为未来业界对英伟达的依赖将会逐步转向多元化选择。 华为内部人士:我认为开源虽然带来诸多好处,但也可能导致与华为内部业务产生竞争。2B项目的成败与软件是否开源关系不大,本质上取决于厂商的能力。

Deep Dive

Chapters
本文探讨了百度和华为转向开源大模型的原因,以及这一转变背后的战略考量和市场竞争。文章指出,开源已成为推动AI技术进步和产业发展的重要力量,百度和华为的开源行动反映了巨头们在市场竞争中的战略调整。
  • 百度和华为在2025年6月30日宣布开源其大模型
  • 开源成为推动AI技术进步和产业发展的重要力量
  • 百度和华为的开源行动反映了巨头们在市场竞争中的战略调整

Shownotes Transcript

10 分钟 邦尼李七一个正在发声的商业逻辑关于大模型如何发展这条路任正非李彦宏都想开了各位听众大家好欢迎收听本期的一财播客去年此时业界讨论开源必源路线之争时业界都还在发力底层大模型究竟哪种模式更好还没得到真正充分的验证但很快 DeepSeek 阿里等已经用事实说明了开源成为推动 AI 技术进步和产业发展的重要力量

比如阿里早已通过一系列有竞争力的开源大模型摩达社区布局 AI 开源生态腾讯会员此前也开源了 MOE 混合推理模型会员 AE3B 以及 3D 生成模型等一位 AI 应用从业者对此分析说开源的趋势早就已经摆在这了关于大模型如何发展这条路任正非李彦宏也都想开了就在 2025 上半年的最后一天也就是 6 月 30 日

两家公司各自宣布了最新的开源动作本期我们就来看看这两家公司的开源动作有哪些看点是什么让百度和华为想开了这场集体开源行动背后有着哪些较量和挑战商业价值体现在哪里你是用过百度和华为的开源模型了吗怎么样欢迎在评论区留言我们先来看看百度华为两家公司最新的开源动作

6 月 30 日,百度一口气开源了文心大模型 4.5 系列的 10 款模型涵盖 47B、3B 激活参数的混合专家 MOE 模型与 0.3B 参数的稠密型模型等并称实现预训练权重和推理代码的完全开源华为则宣布开源盘古 70 亿参数的稠密模型盘古 Pro MOE 720 亿参数的混合专家模型和基于生腾的模型推理技术

可谓是大阵仗的开源动作折射出了巨头们战略考量的转变和市场焦虑

在过去很长一段时间里,李彦宏都是币源大模型的坚定拥护者去年夏天的一场对话中,他直言开源其实是一种智商税他给出的理由是,开源大模型学术研究、教学领域等特定场景下有存在的价值但并不适用于大多数应用场景他表示,当你处在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低这时,商业化的币源模型是最能打的

半年后,当黑马 DeepSeek 以低成本高效率的开源模型突袭并引发全球关注搜索已经成为 AI 工具、AI 助手标配的背景下,百度变了今年 2 月,百度宣布从 4 月 1 日起文心一言全部免费,上线深度搜索功能紧接着又宣布在未来几个月中陆续推出文心大模型 4.5 系列,并将在 6 月 30 日开源

同样,在华为内部,对于开源也经历了许久的权衡与纠结例如,从业务层面,基于升腾下的军团以及正企业务线板块的算力买卖或面临着一定的压力但最终,华为站在了开源大军的队伍里华为内部的一位技术专家曾在 5 月对记者表示盘股 7-2B 是坚固性能与推理成本的黄金尺寸,最适合行业用户用 AI 改造业务

华为以前很少对外发声,谈股也没有开源,所以大家对升腾算力具体的情况不是特别了解,对模型的情况也不了解,外界就充满了猜疑,甚至认为升腾训练不出来先进的大模型,但实际上目前的升腾算力已经具备了训练出世界一流大模型的能力。

从两家公司披露的开源模型情况看,其中,文心大模型 4.5 开源系列针对 MOE 架构提出了一种创新性的多模态依构模型结构适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上显著增强了多模态理解能力,其优越的性能主要得益于多模态混合专家模型预训练、训练推理框架和针对模态的后训练等关键技术点

百度援引数据显示,文心多模态后训练模型支持思考、关闭思考在多个多模态基准测试中达到 SOTA 水平其中,在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中用于必然的 OpenAIoE 在轻量模型上,文心 4.5-21B-A3B Base 文本模型效果与同量级的千问三相当

华为此次开源则选择了两款用量相对较多的模型其中 70 亿参数的稠密模型部署门槛较低在智能客服、知识库等多种场景中均可应用而盘古 ProM-OE 720 亿参数的混合专家模型更适合处理相对复杂的任务

华为此前披露,盘古 Pro MOE 大模型在参数量仅为 720 亿,激活 160 亿参数量的情况下,通过动态激活专家网络的创新设计可以实现以小打大的性能,甚至可以达到千亿级模型的性能表现。华为技术专家表示,只有越来越开放,才能让大模型及应用走出实验室。

而竞争对手的速度也并不慢从 2023 年至今阿里通一团队已开源 200 多款模型对开源模型竞赛始终保持着高度投入例如今年春节 Bitsy 爆火期间阿里云就曾连续三个凌晨开源三款大模型一位接近阿里云的人士表示目前阿里云的大模型已基本全部开源所有开源模型均免费使用

从阿里云了解到,目前,通义千问衍生模型数量已突破 13 万,超越美国 Lama 模型。通义千问在全球下载量超过 3 亿,在 Hottingface 社区 2024 年全球模型下载量中千问占比超 30%。

对于百度、华为等的开源举动,阿里云、CTO 周静人在接受采访时说,非常欣慰看到国内很多企业都在积极加入到开源的阵营里。开源大模型的发展对开源社区、整个产业来讲是绝佳的事情。

在周静仁看来 在模型基础上 怎么做二次的创新对 AI 产业的发展至关重要今天任何一个模型 要直接去解决当前业务的问题都仍有距离模型的开源和开源社区的发展 被视作推动 AI 产业创新的重要驱动力华为今日也表示 此举是华为践行生腾生态战略的又一关键举措推动大模型技术的研究与创新发展 加速推进人工智能在千行百业的应用与价值创造

从成本角度来看,业界推测,百度、华为之所以在此时选择将相关大模型开源意味着两家公司已经将成本降得足够低此前李彦宏称大模型推理成本正以每年 90%的速度递减开源的最终目标仍然是实现商业价值的转化尽管开源了大模型,开发者还可以选择使用百度、华为智能云的算力服务来进行模型训练、推理和部署

这意味着大模型厂商们仍然可以通过提供高级的企业级解决方案和定制化服务 API 接口和云服务等方式实现商业闭环对于开源闭源两种路线也有分析人士指出开闭源并存的路线共同构成了人工智能领域竞争与共生的多元环境开源趋势会促进和推动行业在这之上的商业化快速迭代快速试错共创共担但与此同时业务场景用户触达不能只靠开源

币源模型核心逻辑在于能够构成商业闭环有大量的用户反馈在固定的渠道里形成壁垒假设最终其能找到真正击中用户痛点的地方且通过用户的反馈能够去提升能力就能站住一个赛道进行商业化变现打出开源牌的背后对百度而言应用才是未来对华为而言开源与追赶英伟达 CODA 生态密不可分

九章云集的一名内部人士对记者表示,未来在 AI 算力领域,业界对英伟达的依赖或将逐步转向多元化选择,这种转变不仅体现在推理环节的技术替代,更将延伸至训练场景的全链条能力重构。

开源也半生挑战有接近华为人士表示开源虽带来诸多好处但也意味着其他企业和开发者可以基于盘古模型进行二次开发可能会出现一些与华为内部业务竞争的产品或解决方案这意味着华为内部业务线需要持续地进行技术优化从而保持自身的竞争优势而对于同时拥有开币源模型的百度来说也有着类似的挑战

还有华为内部人士认为 2B 项目的成败跟软件是否开源实质上关联不大本质上还是看厂商产品能力交付能力以及对客户需求的理解但无论是谁都无法忽视开源的力量而业界围绕场景落地的较量才刚刚开始

好了本期节目到此就结束了你用过哪些开源模型对比下来哪个好用关于几家公司开源模型的较量你有什么想说的欢迎在评论区留言喜欢我们的节目欢迎转发分享我们下期再见