We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 2025-01-29 | Hugging Face 宣布启动 Open-R1 项目开源复刻 DeepSeek-R1 模型

2025-01-29 | Hugging Face 宣布启动 Open-R1 项目开源复刻 DeepSeek-R1 模型

2025/1/29
logo of podcast Hacker News

Hacker News

AI Deep Dive AI Chapters Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
主持人: 谷歌开源 Pebble 智能手表操作系统代码,旨在支持社区和志愿者维护这款设备。虽然开源版本中去除了部分专有代码,但这为旧设备的开发和维护带来了新的可能性。这次开放,能够促使曾热爱 Pebble 的用户和开发者携手,为这款不再生产的设备带来新的生命。 Facebook 禁止讨论 Linux,理由是此类内容被标记为“网络安全威胁”。此举立即引起了广泛讨论和争议。用户发现,他们即便在尝试分享关于 Linux 的基础链接后,也会遇到帖子被审查或移除的情况。这一惊人决定在信息安全界引发了不同的解读,有观点认为这可能是误报造成的乌龙事件。讽刺的是,Linux 本身广泛应用于 Facebook 的基础设施。 DeepSeek-R1 模型通过动态量化技术实现了令人惊叹的 80% 大小缩减,带来了一种以 1.58-bit 运行的版本,不仅缩小至 131GB,而且在性能上有显著表现。这一优化让更多用户能够以较低的硬件配置试验大型模型,同时也为小型团队提供了用本地应用支持低延迟代理的机会。但批评者则认为,其在速度和重复性问题上仍有挑战,尤其在过于简单的量化处理下可能产生无限循环。不过,将选定层保留为高精度并采用混合专家(MoEs)的方法被认为是非常巧妙的设计。 在全球最大公司中,Nvidia 公司因投资者对中国 AI 初创公司 DeepSeek 的担忧,引发股价暴跌,市值蒸发创纪录的 5890 亿美元。DeepSeek 的低成本模式引发了市场对巨头投入过多资金于 AI 开发的担忧,展示了与 OpenAI 及 Meta 不相上下的性能却价格远低。 DeepSeek-R1 是最近 AI 发展的重要节点,引起了机器学习研发社区的广泛关注。这个模型开源了权重,并且提供了精简版本,同时它还反映了一种可以重现类似 OpenAI O1 的推理模型的训练方法。这使得 DeepSeek-R1 在解决数学和推理问题方面表现出色,其独特之处在于生成解释其思维链的思维标记。 卡耐基梅隆大学最新开设的课程“Machine Learning in Production”以其前沿的MLOps技术和实际应用深受关注。课程不仅教授模型的构建,更重视其在生产环境中的实际部署和维护。课程采用Kafka、Docker、Kubernetes等行业标准工具,还探讨了模型的解释性、公平性和监控的重要性。然而,一些评论者认为课程内容较为初级,对大规模网络训练的优化和推断管理关注不够。 在 Google 开源 Pebble 操作系统的背景下,Rebble 宣布一系列发展计划,准备加速生产新硬件。Rebble 社区将转型为非盈利组织,以便更好地实现其开放平台的长期愿景,同时宣布即将开展 RebbleOS 黑客松活动。众多开发者和 Pebble 爱好者对此感到兴奋,并期待这一新的软件和硬件发展将如何影响智能手表市场。 Hugging Face 宣布启动 Open-R1 项目,旨在完全开源复刻 DeepSeek-R1 模型。尽管该项目已开放了模型权重,但仍缺乏数据集和训练代码,引发了社区的广泛关注和讨论。评论者们对开源模型的透明性、数据集的获取以及训练流程的开放性提出了许多问题与建议。 在尝试使用 Zopfli 压缩器减少 NPM 包体积 5% 的过程中,作者尽管最终未能如愿,但提供了详细回顾和见解。响应者指出,这项优化虽然在技术上可行,但并未获得足够的支持与认同。不过,该提案过程为作者提供了宝贵的经验。

Deep Dive

Chapters
谷歌开源了 Pebble 智能手表操作系统代码,为这款已停产设备的未来带来了新的可能性。这一举动受到了社区的广泛欢迎,许多人希望能够通过开源社区的力量,让 Pebble 重新焕发生机。
  • 谷歌开源 Pebble OS 代码
  • 社区志愿者维护 Pebble 设备
  • 部分专有代码被移除

Shownotes Transcript

大家春节快乐 欢迎收听黑客新闻中文日报在今天的节目中 我们将带来几个激动人心的科技故事首先 Pebble 智能手表的复兴之路一支小团队正通过开源 PebbleOS 打造新款智能手表 旨在继续 Pebble 的传奇紧接着 我们将揭秘 Google 近期将 PebbleOS 原代码开源背后的故事及其对科技社区的潜在影响

最后,但同样让人兴奋的是,关于 Facebook 禁止讨论 Linux 的争议,看看这背后隐藏着什么?这些都是今天内容的一小部分,现在就让我们深入了解吧 Google 近日将 PableOS 的源代码开源,这是一款曾经颇受欢迎的智能手表操作系统 Pable 最初通过 Kickstarter 众筹平台推出,其创造性的设计和使用功能迅速吸引了大量支持者

尽管在 2016 年 Pybo 被 Fitbit 收购,随后 Fitbit 又被 Google 收购,但 Pybo 的硬件和软件支持服务已经于 8 年前停止。现在,Google 的这一决定使得 Pybo 的独特功能和应用有望得到社区和志愿者的重新维护和发展。值得注意的是,一些专有代码已从代码库中移除,这意味着当前发布的代码无法直接编译。

这个举动收到了社区成员的广泛赞扬,许多人对 Google 的这一决定表示感激,并有意重新唤起 Pyber 的生命力。评论区中的网友普遍对这一消息表示欢迎,他们认为这是重振 Pyber 社区的重要一步,同时也是对科技爱好者的巨大礼物。最近,Facebook 被爆出禁止讨论 Linux 的行为,这件事情在黑客新闻中文日报上引起了不小的轩然大波。

一个网友通过他的闲置 Facebook 账户实验发现仅仅是发帖提到 Linux 链接到几个 Linux 系统下载页面结果在几秒钟之内就被 Facebook 给删帖并发出警告声称帖子可能使用误导链接或内容欺骗人们访问或停留在某个网站这件事情让人大跌眼镜毕竟 Facebook 的服务器大部分都是运行在 Linux 上的这不仅仅是对 Linux 社区的不尊重也让人对 Facebook 的内容审查政策产生质疑

其他用户也分享了他们类似的经历,有的甚至指出 Facebook 过去三年里就已经时段时序地封锁了 DistroWatch 网站。能在 Facebook 上讨论 Linux 的相关话题,现在看来变成了奢望。不过,这也促使 Linux 社区的用户寻找新的沟通渠道,如 RSS 订阅和 MasterDyn 社交网络,继续分享和讨论有关 Linux 的内容。

针对这一情况,社区内部的反应则是一种既失望又讽刺的情绪,很多人对 Facebook 采取这样的政策表示不解,并指出这种做法的自相矛盾之处。DeepSeek R1 的动态 1.58 位版本对技术圈来说是个大事件,它将 DeepSeek 的 671B 参数模型大小缩减了 80%,从原始的 720G 减少至仅 131G,同时保持了良好的功能性。

这是通过对特定层进行选择性量化,留下如 GPT-4 中使用的大多数 MOD 层专家混合为 1.5 位实现的。尽管如此,若过分简化地对所有层进行量化,模型将完全崩溃,导致无线循环和乱码输出。

通过对 1.58 位动态量化版本进行测试,其速度可达每秒 140 个令牌,显示了在双 H100 上运行该量化模型的惊人效率。不过即使如此,其适用性仍有待论证,因为如此巨大的模型尺寸和处理速度仍然不够普罗大众使用。

从评论区的互动来看,社区对于 DeepSeek R1 的优化和应用前景表现出了极大的兴趣,虽然有些人对其实际效用持保留态度,但大多数评论者对能够看到如此技术突破表示赞赏。NVIDIA 的市值因为 DeepSeek 的市场冲击而暴跌 5890 亿美元,创下了美国股市历史上最大的单日跌幅记录。

这罕见的大幅度下挫不仅是因为投资者担心中国人工智能初创公司 DeepSeek 提供了一种成本更低的解决方案而且因为 DeepSeek 的最新人工智能模型被广泛视为与 OpenAI 和 Meta Platforms Inc 的产品竞争 DeepSeek 由量化基金首席梁文峰创立其低成本方法引发了人们对美国大公司在人工智能发展上可能投入过多的担忧

尽管 NVIDIA 作为在 AI 领域内芯片设计的最大受益者,投资者可能会开始对那些未能展现出足够投资回报的公司持谨慎态度。评论区的朋友们提出各种观点,有的人担心 DeepSeek 的进步是否会颠覆当前依赖高端芯片和大量计算能力的 AI 商业模式,也有人讨论这对 NVIDIA GPU 的需求和 AI 技术的未来发展意味着什么。

总的来说,虽然有关技术和市场的深入分析,但也有声音指出,理解技术并不直接等同于能正确评估市场和股价。Deep Sea Car 一推出后在 AI 研发社区引起强烈反响,主要因其开放权重模型较小,更精炼,并分享了创造类似 OpenAIOE 的推理模型的训练方法。

Deep Sea Car 一通过长链推理 SFT 数据训练,使用一个中间质量较高的推理大语言模型 LLM,但在非推理任务上表现较差作为基础,再通过大规模强化学习 RL 创建出具有高质量的推理模型。其中,一个特殊的创新点是使用少量标记数据与大规模 RL 训练相结合,生产出在解决推理问题上表现卓越的模型。

这在技术上展示了超越前任模型的新方法和优化特别是在处理数学和推理问题上 DeepSeek R1 通过生成思考代币解释其思维链条从而能够花更多时间处理问题评论区的网友们对于 DeepSeek R1 的评价褒贬不一一些网友表示对 DeepSeek R1 的表现不太印象深刻他们认为其思考充满了常见的大语言模型的盲点并且认为在生成内容方面并没有突破实质性的限制

而另一些网友则对于 DeepSeaCar 一背后的技术和创新表示赞赏特别是它在训练过程中对数据的特殊处理和模型架构的改进显示出对 AI 和机器学习研究者有着重要的启示和价值

卡内基梅隆大学推出了一门重点介绍,如何将机器学习模型部署到生产环境中的课程,该课程不仅涵盖了从原型机器学习模型到完整生产系统部署的整个生命周期,还包括负责任的 AI 使用,包括安全性、安全、公平性、可解释性和 ML Apps。

对于有一定数据科学背景,例如已经学习过机器学习课程,使用过 Skern 酷和基本编程技能,例如基本的 Python 编程和酷使用,能够使用 UNIX 校的学生来说,这是一门非常适合的课程。这让我想到评论区中很多听众的反应,他们也注意到了课程在实际应用工具和概念上的实用性,如 Kafka,Docker,Kubernetes 和 Jenkins 等行业标准工具的使用,以及对 ML Ops 的关注。

不过,一些评论者提到了他们对课程难度层次的疑问,以及对所使用一些工具长期相关性的担忧。总的来说,这个课程为那些希望在生产环境中部署机器学习模型的软件工程师和数据科学家之间架起了沟通的桥梁,但对于经验丰富的从业者来说,它的难度可能会显得有些基础。

谷歌将 Pable 操作系统开源,为 Rebo 社区带来了巨大的振奋,这标志着 Rebo 在推出新硬件上的努力将大大加速。Rebo 之前一直在独立开发替代固件,虽然进展缓慢,但有了 PableOS 原始源代码,我们的开发之路将更为顺畅。

除此之外,Rebo 正在转型为非盈利实体,这不仅确立了社区及所有者的理念,还强化了其长期目标及教育公众作为教授嵌入式系统的平台,保留这个古怪平台的历史,并为公共利益构建开源软件。评论区的网友们普遍对这一新闻表示兴奋和期待,他们特别赞赏 Google 对开源社区的支持以及 Rebo 社区的坚持和创新精神,相信这将为 Pable 爱好者和开源世界带来正面的影响。

OpenR 一项目旨在全面复现 DeepSeaCar1,提供一个开放的重现平台,以便研究和工业界构建类似或更优秀的模型。尽管 DeepSeaCar1 模型的权重是开放的,但是用于训练模型的数据集和代码并未公布。

OpenRE 的主要任务是填补这一空白,通过三个步骤,复现 RE Distill 模型,通过纯粹的强化学习过程复制 RE0,并展示如何通过多阶段训练从基础模型过渡到特定任务的深度学习模型。这一过程不仅限于数学数据集,也试图探索代码以及医学等科学领域,旨在通过共享研究成果、训练方法和数据集,促进基于推理的模型的发展。

对于这一努力,网友的评论主要集中在如何贡献力量,是否可以通过重包方式协助项目,以及对于项目开放程度的讨论,显示出人们对于贡献和开放源代码项目的热情。在最近的一个尝试中,一位开发者试图通过改进压缩方法,将所有新发布的 NPM 包的大小减少约 5%。他采用了 Sub-Flee 压缩算法,这种算法与 KZIP 兼容,但可以创建更小的文件。

尽管 Zupfi 的压缩效果比标准 Xip 更好,它的缺点在于压缩速度显著慢于 Xip,大约慢了 28 倍。这个提案经过几个月的讨论后最终被拒绝了,但许多人认为这是一个正确的决定。尽管这个尝试没有成功,但它引发了关于如何优化存储成本和提升性能的进一步思考。

评论者们对于这一尝试有着不同的见解,一些人认为即使这种方法提供了一些优势,但在实际操作中可能遇到诸多挑战,如较慢的发布过程和潜在的兼容性问题。然而,也有评论者称赞这种尝试,认为尽管没有成功,但任何旨在改善现状的努力都是值得鼓励的。

非常感谢您收听今天的黑客新闻中文日报我们希望您喜欢这些关于科技界最新动态的分享如果您对我们的内容有所启发不妨订阅我们的播客并与朋友们分享期待您的持续关注让我们共同见证科技的力量祝您今天过得愉快明天再会