We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 2025-06-27 | Google 正式发布 Gemma 3n,专为移动端打造的大语言模型

2025-06-27 | Google 正式发布 Gemma 3n,专为移动端打造的大语言模型

2025/6/27
logo of podcast Hacker News

Hacker News

AI Deep Dive AI Chapters Transcript
Topics
主持人:数学家团队制造出一种特殊的四面体,它总是能自动翻转到同一面朝下。这个四面体内部的质量分布不均匀,底面集中了大部分重量。这项成果展示了科学实验和数学理论的结合,并启发了工程师考虑将其应用于自动翻正的月球着陆器设计。 网友:我认为这个造型虽然看起来不平衡,但实际上非常稳定,平衡有时候靠的不是对称,而是质量的巧妙分配。我开玩笑说,是不是应该用这种外形做月球探测器?把一个60年前的想法变成现实,这才是真正数学迷人的地方。

Deep Dive

Chapters
数学家证实了一种新型四面体,无论从哪个面着地,都能翻转到同一面朝下,刷新了人们对平衡的理解,并可能应用于航天器设计。
  • 新型四面体无论从哪个面着地,都能翻转到同一面朝下
  • 这一发现刷新了人们对平衡的理解
  • 可能应用于航天器设计

Shownotes Transcript

大家好 欢迎收听黑客新闻中文日报今天的节目里 我们将关注 AI 领域的最新突破和科技产业的重大动态 DeepMind 推出新一代基因组 AI 工具 AlphaGenome 不仅解锁了基因变异预测的新能力更为医学和生物学研究带来新可能 Anthropic 刚上线了一项创新功能让你在 Cloud 里描述想法就能生成 托管并分享真正可用的 AI 应用极大降低了开发门槛

还有 Google 发布了全新的移动端多模态大模型 Gemma 3N,支持本地音视频与文本处理,为端测智能应用打开了大门。让我们一起打开今天的科技新鲜事。数学家团队最近首次制造出一种特殊的四面体,这个形状每次放下去都会自动翻转到同一面朝下,证实了 60 年前 John Conway 的一个猜想。

这个四面体最大的特点在于它内部的质量分布是不均匀的底面集中了大部分重量主体则是用轻质的碳纤维和高密度的碳化物来制作整体重量要精确到十分之一克实验中这个模型不管从哪个面放下最后总是稳稳地落在同一面上这项成果展示了科学实验和数学理论结合的力量也启发了工程师考虑将类似原理应用到能够自动翻正的月球着陆器设计中

有网友评论,这个造型虽然看起来不平衡,但实际上非常稳定,大家也感叹平衡有时候靠的并不是对称,而是质量的巧妙分配。有人还开玩笑说,是不是应该用这种外形做月球探测器?还有人觉得,把一个 60 年前的想法变成现实,这才是真正数学迷人的地方。

1982 年,Lisa 软件团队正在全力冲刺准备上线,有些管理层提出用每位工程师每周写了多少代码形数来衡量工作进展,他们甚至专门做了表格,每周五让大家填写本周新增的代码形数。当时 QuickDraw 作者,主要负责用户界面的 Bill Atkinson 觉得这种用形数衡量生产力的方法完全不靠谱,他的目标其实是写出简洁且高效的程序,相反,用代码数量来衡量只会激励大家写出又冗长又容易出错的代码。

那段时间他刚好在重写 QuickDraw 的区域计算功能优化后让相关操作速度提升了将近 6 倍还顺带删了约 2000 行多余的代码轮到他第一次填写管理表格时在代码行数那栏他思考了一下直接写了个-2000 虽然没人知道管理层看到后的反应但几周后他们就不再让 Build 填这个表了

很多网友在评论区分享了自己删除大段代码,反而大幅提升系统效率的故事还有人吐槽到现在,还有些公司还在按代码数量来评判工程师工作这种做法已经被不少开发者证明没什么意义 RS Technica 最新的实测显示,Valve 的 SteamOS 3.7 系统在 Lenovo Legion Go S 这类掌上游戏设备上的游戏运行速度比 Windows 11 更快

在同样的硬件下,SteamOS 对比 Windows 11,四款最新的 3D 游戏表现出了明显甚至显著的帧率提升,仅有 Borderlands 三两个平台几乎打平甚至部分低画质下,操作系统的不同直接影响到能否流畅游玩而用官方自带的 Windows 驱动时,部分游戏性能会比 SteamOS 的 8%到 36%即使更新到新版的 ASUS 驱动,也只能追上 SteamOS 的成绩,整体上还能落后一些

Valve 通过不断优化 Protein,使得原本需要翻译运行的 Windows 游戏也能在 SteamOS 上高效运行,再加上系统本身较少的后台负担,这可能是 SteamOS 表现突出的重要原因。值得注意的是,SteamOS 还不适配所有 PC 硬件,比如部分 Intel CPU、NVIDIA 显卡和新款 AMD 芯片,所以暂时不适用所有设备。

评论区不少网友表示,亲身体验 SteamOS 后,发现帧率稳定性明显提升,有人希望主流游戏开发商能优先适配 SteamOS,并指出只要解决反作弊和顶级 3A 游戏支持的问题,完全有可能抛弃 Windows。也有人提出微软应该考虑推出专为游戏定制的精简版 Windows,减少不必要的系统负担。

Google DeepMind 推出了 AlphaGenome 这款人工智能工具,可以帮助科学家更全面和精准地预测人类基因组中单个变异或突变对各类生物学过程的影响 AlphaGenome 能处理长达 100 万碱基对的 DNA 序列,并且能对不同细胞类型中的基因启动和终止、剪接位点、RNA 产量、DNA 可及性和蛋白质结合等多种分子特性进行高分辨率预测

相比于之前的基因序列模型,AlphaGenome 不但能一次性分析更长的序列,还能实现每个碱基级别的预测,综合覆盖了基因调控的多条通路。这款模型的架构融合了卷积层和 Transformer 技术,训练只用了 Informer 模型一半的算力和 4 小时时间。AlphaGenome 目前已通过 API 预览向非商业科研开放,未来还计划进一步发布。

该工具能帮助研究者更好地理解基因组功能,罕见遗传病变的致病机制,并为药物研发和疾病激励研究带来更多线索。在网友评论区,有人担心模型没有开放权重,只能通过 API 调用,限制了科研用途,也有网友期待能有突破性的细胞层面仿真工具出现,进一步推动生物学发展。还有人评价 DeepMind 在 AI 应用领域表现突出,不仅技术强,宣传也很到位。

Hentix 近期展示了一款采用高温超导体的新型电动机原型,这种电动机被设计用于电动飞机,目标是能达到 5-10 兆瓦的功率输出,有望驱动区域极客机相比传统技术,团队提出了独特的冷却方式,把小型自带冷头直接安装在转子上,冷头随转子一起高速旋转,无需复杂的外部冷却流体系统,大大简化了结构和维护

该电动机的转子线圈用高温超导材料制成,通过热传导连接冷头,系统整体安置于真空腔体内部。这样的设计克服了传统超导机组在传热和可靠性上的关键难题,同时还能兼顾极高效率和较低的体积重量比,预计连续功率密度达到行业领先水平。Hantix 首选应用场景是航空领域,但也考虑将来应用于船舶推进等高扭矩、大功率领域。

评论区有用户表示这种创新冷却方案很具颠覆性也有人担心长期运行下小型冷头的可靠性以及进一步产业化面临的工程挑战还有网友认为即便效率提升 4-5 个百分点对电动航空来说意义巨大 Let's Encrypt 正在准备上线为 IP 地址签发证书的新功能这项服务目前只会在 Short-Live 的配置文件下开放有效期为 6 天而且这段时间内景线白名单用户参与暂时还没有面向所有用户开放的具体时间表

开发团队已经发布了测试环境下的样本证书,其中既包含 DNS 名称,也包含 IP 地址作为 Subject Alternative Name,工程师还特别介绍到 IP 地址出现在证书的 SAN 字段里,这和以往只用域名申请证书有所不同。此外,目前申请 IP 证书只能通过 HTTP 或 TLSALPN 的方式验证,DNS-01 挑战不被支持。

官方也在征集用户的反馈,测试浏览器对于相关证书的兼容性,后续将继续优化实现细节,比如速率限制和规模扩张等问题。评论区里有网友提出,这种 IP 证书对于经常变更 IP 的云服务或 ISP 管理来说挑战很大,证书滞留可能带来安全隐患,也有技术用户关心浏览器厂商和 CA 的接受度。还有人期待以后能支持 ASMAM 电邮证书,真正提升网络安全体验。

Anthropic 推出了在 Cloud 应用里直接创建、托管和分享 AI 驱动应用的新功能,用户只要在 Cloud 里面描述想要的 App,Cloud,就能帮忙写出真实的代码,并且可以直接运行起来,不需要繁琐的部署流程。开发者制作好应用后,别人只需用自己的 Cloud 账号登录,所有 API 使用费用都算在他们各自的订阅内,开发者自己不用掏钱,也无需管理 API 密钥。

社区里已经有人用这个功能做出了 AI 游戏,个性化学习工具,数据分析助手和写作助理等,Cloud 还能不断根据用户反馈调试,完善代码,支持直接用 React 等构建丰富的界面,但目前还限制不能调用外部 API,也没有数据持久化。

不过很多人认为这是 AI 驱动应用走向简单分享化的小步尝试,讨论区有网友觉得这种方式可能会动摇 SaaS 市场,也有人担心依赖单一平台会带来风险。还有人表示现在还只是玩具,但未来如果开放更多接口,会激励开发各种小型创新应用。Libxman2 的维护者最近明确表示,未来将不再为安全漏洞设立保密期或延迟公开修复的时间。

Libxml2 是一个被广泛使用了 25 年的 XML 解析库,被众多开源项目、商用软件和政府机构采纳,但项目的维护基本靠志愿者免费投入。当前的维护者 Wenhofer 表示,他每周花大量时间处理各种安全事件,感觉负担越来越重,但实际收到的资金支持非常有限,比如过去几年 Google 只捐助过 1 万美元。

他提到,许多安全报告并非来自真实用户,而是出于刷声望,甚至根本没有提供修复方案,导致本已稀缺的维护者时间被过度消耗。面对这种情况,Wilhelmhofer 宣布以后会将安全漏洞与普通 bug 一样公开处理,不再配合所谓的保密期,并强调,如果大公司真的重视安全,应该主动协助维护工作,否则安全问题将直接公开,哪怕还没修复。

他同时辞去了 Libxload 的维护工作,坦言没有继任者愿意接棒。评论区很多人同情维护者,认为部分安全研究文化存在只重发现不重修复的问题,也有声音指出,企业广泛免费使用开源,却很少反哺社区,才是造成维护困境的根源。还有开发者认为,开放透明反而有助于推动上下游合作,而不是要求无偿志愿者一味加班背锅。

Google 正式发布了 Gemma 3N,这是一款专为移动端打造的大语言模型,具备强大的多模态能力,支持图片、音频、视频和文本的输入,并能输出文本结果。Gemma 3N 在设备端运行时可以只占用很小的内存空间。5B 和 8B 参数版本实际运行时所需的内存容量分别和传统 2B、4B 模型类似,最低只需要 2G 或 3G。

新的 Mapformer 结构让模型像套娃一样内含小版本,支持灵活推理和自定义精度而 Per Layer Embeddings 机制允许开发者将部分参数加载在 CPU 上,减少对显存的要求此外,Gemma 3N 在支持 140 种语言的文本处理,35 种语言的多模态理解,数学推理和代码生成等方面,相比前一代模型有明显提升

E4B 版本的 LM Arena 得分突破 1300,是首个参数规模低于 100 亿但达到这一基准分数的模型。新模型内置的音频和视觉能力,可以本地实现高质量语音识别、语音翻译,以及支持最高 60 帧每秒的视频内容理解和实时交互体验。

评论区有网友表示,Gemma 3N 的兼容性很好,能直接用现有的 Gemma 相关工具与脚本进行微调和部署,同时对模型命名和与 Gemma 9 的区别还有不少疑惑,也有开发者指出新架构在实际推理中对显存的优化,效果明显。感谢您收听今天的黑客新闻中文日报,希望这些最新的 AI 与科技资讯能够为你带来启发和思考。

如果你喜欢我们的播客欢迎订阅并分享给朋友祝你拥有美好的一天我们下一期再见