We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 阿里又抖出猛料 新模型效率爆表?

阿里又抖出猛料 新模型效率爆表?

2025/3/6
logo of podcast 涨乐早知道

涨乐早知道

AI Deep Dive AI Chapters Transcript
People
播音员
主持著名true crime播客《Crime Junkie》的播音员和创始人。
Topics
播音员: 阿里巴巴最新发布的推理模型QWQ-32B在市场上引起了巨大的反响,其320亿参数规模远小于其他同等性能的模型,例如拥有6710亿参数的DeepSick RE模型。这一突破性的成果使得阿里巴巴的股价上涨超过8%。QWQ-32B的成功之处在于其在性能和成本之间取得了极佳的平衡,其性能成本仅为DeepSick RE的十分之一。 QWQ-32B的卓越性能主要归功于其采用的大模型强化学习方法,以及阿里团队在冷启动基础上开展的分阶段强化学习训练策略。这种方法使得模型能够在较小的参数规模下实现卓越性能,为未来通向通用人工智能提供了可行路径。 此外,QWQ-32B的另一个亮点是大幅降低了部署使用成本,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中。阿里巴巴已经将QWQ-32B模型向全球开源,进一步推动了AI技术的普及和发展。 QWQ-32B的发布与阿里巴巴近期宣布的AI战略高度一致。阿里巴巴计划在未来三年投入超过3800亿元建设云和AI硬件基础设施,这表明阿里巴巴对AI领域的长期投入和决心。 QWQ-32B的成功也印证了阿里巴巴在AI领域持续发力的成果。阿里巴巴在模型开源方面动作频频,例如近期开源的视频生成模型“万象2.1”也受到了开源社区的广泛欢迎。阿里通义团队自2023年以来已开源200多款模型,涵盖多种模态和尺寸,展现了阿里巴巴在AI领域的强大实力和技术积累。 机构认为,阿里巴巴在AI领域的持续投入将加速AI应用落地,带动算力需求爆发,并引领中国AI产业加速发展。QWQ-32B的成功,标志着阿里巴巴在AI领域取得了显著的突破,其在AI基础设施、基础模型平台和AI原生应用等方面的投入,将进一步巩固其在AI领域的领先地位。

Deep Dive

Shownotes Transcript

各位投资者早上好您正在收听的是掌乐全球通早间资讯播客节目掌乐早知道今天和大家聊聊阿里新发布的推理模型 3 月 6 日阿里再度给市场带来了点小小的震撼或者说这波是在给其他大模型上难度

阿里同意千文大模型团队推出最新的推理模型 QWQ32B 据同意千文大模型团队介绍这是一款拥有 320 亿参数的模型其性能可与具备 6710 亿参数的 DeepSick RE 媒该模型公布当日阿里股价上涨超过 8%

QWQ32B 是谁的部将竟然如此勇猛为什么能以不到 1%的小参数拼美 DeepSick RE 性能成本仅是后者的一成这表明 QWQ32B 在性能和成本之间取得了很好的平衡我们浅浅说一下他们的工作原理

尽管 DeepSync R1 创新性地使用了新的架构和机制这使得 DeepSync R1 实际干活时只需要动用一小部分力量能够做到节省资源、高效完成任务而 QW-Q32B 的卓越性能主要归功于其采用的大模型强化学习方法

阿里团队在冷启动基础上开展了分阶段强化学习训练策略相比这款模型为什么这么强市场更关心的是它在这场科技盛世中能发挥什么作用能为阿里带来什么

业内人士分析 QW-Q32P 的成功将强大的基础模型与大规模强化学习相结合能够在较小的参数规模下实现卓越性能这为未来通向通用人工智能提供了可行路径

此外 QW-Q32B 的另外一个亮点是大幅降低了部署使用成本开发者和企业可以在消费级硬件上轻松将其部署到本地设备中目前阿里已将 QW-Q32B 模型向全球开源

其实 AI 在经历了一段时间的飞速发展后也陷入了迷茫期尤其在 DeepSeek 的出现强势击碎了算力至上的信仰但 DeepSeek 也为 AI 提供了一个新开端随着模型参数规模的增长已经进入瓶颈期如何在现有参数规模下进一步提升模型能力成为业界关注焦点 QWQ32B 的突破或将引领新一轮 AI 技术发展方向

进一步推动从大力出奇迹向精巧出智慧的幻视转变阿里这款大模型用实力证明 RLHF 路线还能玩出花打破了一些人对 GTP4.5 撞墙后的过度悲观用中等规模却拿到高级性能给开源界注入了强大信心也不必搞那种天价设备和超大规模有机会跟国际巨头同场 battle

QWQ32B 的发布与阿里近期宣布的 AI 战略高度一致据报道 阿里集团计划在未来三年投入超过 3800 亿元建设云和 AI 硬件基础设施总投入将超过过去十年总和

阿里的 AI 战略已经取得了初步成效最近阿里在模型开源方面动作频频就在 2 月底阿里才宣布全面开源旗下视频生成模型幻象 2.1 模型这款模型同样基于 Apache 2.0 协议支持纹身视频和图身视频任务

万象模型开源仅不到一周的时间同意万象 2.1 模型就受到了开源社区的极大欢迎 3 月 3 日开源社区最新榜单显示阿里万象大模型已返超 DeepSick R1 登顶模型热榜模型空间榜两大榜单成为近期全球开源社区最受欢迎的大模型

阿里通益团队一直坚持开源路线从 2023 年至今阿里通益团队已开源 200 多款模型包括大圆模型千问及视觉生成模型万象两大基模系列开源囊括文本生成模型视觉理解和生成模型语音理解和生成模型纹身图及视频模型等实现了全模态全尺寸大模型的开源

机构认为阿里在 AI 领域持续发力践行了其 AI 驱动战略随着其后续投入的逐步提升相关成果有望加速迭代相关成果或将汇集相关产业链加速 AI 应用落地进一步带动算力需求的爆发

同时随着阿里在 AI 基础设施基础模型平台及 AI 原生应用现有业务的 AI 转型等三方面加大投入或将引领中国 AI 产业加速发展阿里这一通操作让阿里系的大模型家族成功躋身世界前列阿里说句优势在我也不为过对 AI 重点投入大力刻金的战略已经开始见成效阿里在这一波属实上大分

以上就是今天掌乐全球通掌乐早知道的全部内容期待为你带来醒目的一天祝您在投资中有所斩获我们明早再见