大家好 欢迎收听黑客新闻中文日报今天的节目我们会聊到一项让大语言模型体积骤减推理能力大提升的无损压缩新方法看看它如何可能改变 AI 工程团队的工作方式还有 研究人员刚刚曝光能绕开几乎所有主流大模型安全防线的新型提示注入攻击这将把 LLM 安全对抗推向怎样的新阶段
最后一辆极简主义风格,人人都能 DIY 改造的纯电动皮卡进入美国市场,一改你对智能电车的固有印象。精彩内容马上为您呈现。美国初创公司 Slate 推出了一款售价不到 2 万美元的纯电动皮卡,这辆车只配备了最基础的功能,没有车载音响,没有中控大屏,车身只有灰色可选,连油漆都省去,音响和多媒体系统都要用户自己动手加装。
续航大约能跑 150 英里车厢虽然只坐两人但后面的车斗足够装下一整块标准尺寸的加板
Slate 选择用一体成型的塑料材料做外壳,既省掉了昂贵的金属冲压和喷漆工艺,也让维修成本更低整辆车强调极简风格和高自由度,用户可以通过 DIY 升级套件,随时加装 SUV 模块,甚至改装内饰,生产制造也尽可能简化,只生产一个版本,后续功能升级全部靠加装
为了减少车辆科技故障,内饰只保留了最基本的物理按键和一个小仪表屏,连音响和收音机都没有,为的就是让每个用户可以按照自己的需要自由改造。除了购买门槛低,后续保养维修也推广自己动手解决,一些更换配件和基础保养可以在 Slate 的在线视频和指导下完成,后续全国范围还会合作连锁维修门店。
评论区很多网友觉得这类极简车型在美国市场很稀缺认为高价格的电动车让普通人难以接近也有人担心设计过于简陋实际使用会有许多不便有人觉得如果没有车载娱乐和智能管理 APP 会很难习惯但也有不少人直言这才是他们理想中能随改随修花最少钱买到的纯电工具车美国威斯康星州密尔沃基一名地方法官 Hannah Duggan 因被控协助一名男子躲避移民局而于上周五被 FBI 逮捕
据法院文件,事件发生在法庭预审期间,移民执法人员带着行政令计划逮捕一位名为 Edwardo Flores Ruiz 的墨西哥籍被告。Dugan 法官在得知移民局人员在走廊等待后,将被告和其律师从法庭的陪审员通道带到非公开区域并引导他们进入公共区域,使其避开移民局。Dugan 随后在法院现场被联邦执法人员带走,后获是但面临妨碍执法和隐匿他人以阻止逮捕的指控。
该案件引发了对联邦与地方权力分工的激烈讨论,有网友表示,移民局仅凭行政令并不能在未获司法授权的情况下进入非公开法庭区域,也有人质疑执法部门是否过度反应,批评这种方式像是一场作秀,甚至会让证人和受害人在法庭感到不安和恐惧。更有声音指出,类似案件可能会影响到人们对法治和司法独立的信心。
一位技术作者在 substack 上写一篇关于 DNS 解析的文章时,意外发现只要编辑器内容中包含像 ETC,hosts 或 ETC,password 这样的常见 Linux 系统路径,编辑器就会爆出网络错误,导致无法自动保存草稿。但是如果稍微改写一下路径,比如写成 ETC,H0STS 或 HS 就能正常保存。
通过开发者工具查看发现,每当出现这些特定路径时,保存请求就会被 Cloudflare 拦截并返回 403 Forbidden,这实际上是后台 Web 应用防火墙在起作用。
WAF 主要是为了防御路径便利和命令注入等攻击因为黑客经常会尝试访问这些敏感文件不过这种一刀切的安全策略也带来了问题例如技术写作者在正常讨论系统配置时就会被拦截社区评论一方面表示很多 CDN 和云服务默认的安全规则会误伤技术内容导致使用体验很差另一方面也有人吐槽这样既没有提升安全性还影响了正常用户的创作
还有网友建议,安全策略应该更智能一些,至少在技术文章编辑场景下,给技术词汇留出空间。Tina 在一篇题为《A Love Letter to People Who Believe in People》的文章中,分享了自己从小到大被他人鼓励、支持的故事。她回忆自己 8 岁时就在瑞士小镇贴出手绘海报,邀请大家加入粉丝俱乐部,重点其实不在于具体支持什么事物,而是在于把热情、乐观和信任带给身边的人。
Tina 认为真正改变人生命运的往往是那些相信你为你加油鼓励你勇敢追梦的人从母亲到第一位老板再到自己女儿还有朋友合作者这些人的支持让她变得更加勇敢并持续传递这种正能量她创办的 Creative Mornings 也因此成为一个充满善意彼此鼓励的社区许多评论者都提到在当下网络环境下真诚的支持比冷漠的批评来得更珍贵
一位网友说拥有这样的粉丝哪怕只有一两个也可能彻底改变自己对世界的信心还有人表示这种单纯的热情和乐观往往是最稀缺也最有感染力的品质一项新的研究提出了一种名为 D-Float11 的无损压缩方法可以将大语言模型的体积减少 30%但模型的输出和没压缩之前完全一致
D-Float 11 的原理是利用大语言模型权重数据的低伤特性,通过动态长度的编码方式,对不常用的数据节省空间,实现接近最优的信息压缩,同时保持计算精度不变。研究团队还专门为 GPU 开发了快速在线解压的定制内核,解决了传统压缩在推理阶段带来的性能瓶颈。
在实际测试里,包括 Lama 3.1,Quant 2.5 和 Gemma 3 等主流模型都能实现约 30%的模型体积缩减,推理结果与原模型逐位一致。相比将超大模型部分切到 CPU 执行,D-Float 11 在 GPU 上能够带来最高近 39 倍的吞吐提升,在同样显存预算下,模型一次可处理的上下纹长度也能提升 5 到 13 倍。
最值得一提的是,过去仅用 8 张 80G 显卡就可以完整无损运行 Lama 3.1405B 这样超大模型评论区里有网友指出,这种技术将给科研和创业团队带来极大便利降低了前沿模型推理的门槛,也让模型部署更灵活同时也有技术人员补充,Dfloat11 有望解决以往量化方法影响效果的难题提升 Agent 应用的性能性价比
还有人讨论一旦权重格式标准化,相关硬件也会更加高效地支持这些新方法。1979 年发表的论文 Notation as a Tool of Thought 探讨了符号表示对于思考和发现的深远影响。作者认为,符号和记号不仅仅是表达思想的方式,更是一种促进新想法和突破的工具。
许多伟大的科学发现往往都伴随着新的符号系统诞生这些符号为人们打开了全新的思考角度也帮助解决了之前难以攻克的问题不过论文也指出数学符号的通用性仍然存在缺陷同一个符号在不同情境下可能有着完全不同的解释方式这会增加理解的门槛
一些社区用户谈到了 APL 等语言曾因键盘输入不便和更流行的电子表格软件出现而逐渐退场但 APL 所提倡的精简符号与直接操作数据的思路仍然被部分开发者和教育者所推崇还有网友提到创新的记号方式也许同样能带来对建筑音乐等创意领域的全新表达模式
部分评论认为,虽然符号表达确实可能简化复杂度与促进创造,但复杂和统一的符号体系有时也会限制个体的独立思考和探索自由。科学家们开发出了一种新型人造树叶装置,可以直接用阳光将二氧化碳转化为有价值的化学品。
这项技术由美国能源部劳伦斯伯克利国家实验室联合多家科研机构合作完成,团队设计了一种油盖钛矿和铜材料组成的装置,可以把二氧化碳变成 C2 类化学品,这类原料被广泛应用于日常生活中的塑料、聚合物和航空燃料等领域。
这个实验成果借鉴了植物叶片中的光合作用,通过仿照叶绿素的结构,利用无机材料中的千基钙钛矿吸收光能,并把铜做成类似微小花朵的电催化剂,有效提升了耐用性和稳定性整个系统大约只有油票大小,完全靠太阳能驱动,从二氧化碳一步生成 C 二分子目前研究团队正致力于提升能效并扩大人造树叶的尺寸,以便未来可以规模化应用
在评论区有网友表示,用无机材料模仿自然光合作用是一种很可能带来巨大改变的安静突破,也有人关心这种方式的能效对比直接用太阳能发电在合成化学品的问题,还有人讨论了这种技术对减少碳排放和推动能源转型的潜力。
安全公司 HiddenLayer 的研究人员公布了一种全新的通用提示词注入攻击方式,命名为 Policy Puppetry Attack,这种方法能同时绕过目前主流大语言模型的安全对齐措施,包括 OpenAI 的 ChatGPT,Google 的 Gemini,Microsoft 的 Copilot,Anthropic 的 Claude,Meta 的 Lama,DeepSeek,Quen 和 Mistral 等等。
研究团队采用了自研的策略型提示技术结合角色扮演和变换编码等技巧可以突破模型在化学生物放射和核 CBRN 等高微话题下的内容屏障生成本应被严格禁止的有害内容此外通过这种方法还可以提取出模型的系统提示词对模型的安全机制构成威胁
Hidden Layer 强调,仅靠 RLHF、人类反馈强化学习等当前训练和对齐方法,很难彻底防住这类跨模型的攻击,建议部署额外的安全检测和监控工具加强大语言模型的防护。
评论区有网友认为,AI 安全其实本质上是内容监管过度,AI 就像图书馆书籍一样,工具本身不等同于危险行为也有人提到每次有新防护就会出现新的绕过手段,感觉当前的安全限制更像是在管用户而不是管技术还有人表示这一攻击其实和过去的提示词伪装类似,但现在方法更简洁高效,凸显了 LLM 安全对抗的长期挑战
Eurorack Knob Idea 这个项目提出了一种新型模块合成器旋钮设计,利用磁性编码器和嵌入磁铁的插头,让普通的 3.5 毫米插孔机能插补丁线,也能直接当旋钮操作,从而实现旋钮和插孔一体化。这种设计的核心在于,通过 AS5600 磁性编码器芯片来检测插头中磁铁的角度和存在,从而输出相应的模拟电压,实现按需设定数值或用线缆补丁信号。
作者自己用 3D 打印件和 DIY 材料完成了圆形制作和电路设计,最后的实际测试效果良好,但他也坦言这种方案成本较高,难以广泛应用到实际产品中。评论区的不少网友讨论了接口与旋钮合并的实际意义,有人提到现在很多热门 Eurorack 模块都集成了旋钮和插孔,只是体积较大,开发上很难兼顾小型化,扩展性和直观操作。
还有网友建议,如果加上能调整物理阻尼的功能,可能更适合现场表演和操控体验。整体看,大家觉得这个点子有趣,创意十足,但真正实用推广还需要更多工程优化和成本的突破。
感谢您的收听,这就是今天的黑客新闻中文日报。如果这些科技焦点对你有所启发,欢迎订阅,分享我们的播客。每一天和我们一起关注技术变革,见证创新浪潮。我们明天再见。