We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 2025-07-01 | 决定智能体好坏,不再是单纯的 prompt 设计,而是上下文工程

2025-07-01 | 决定智能体好坏,不再是单纯的 prompt 设计,而是上下文工程

2025/7/1
logo of podcast Hacker News

Hacker News

AI Deep Dive AI Chapters Transcript
Topics
我了解到一些恶意软件会通过检测硬件信息来判断是否运行在虚拟机中,从而逃避分析。为了应对这种情况,我通过修改虚拟机的SMBIOS配置,伪造了一个CPU风扇设备和温度探针,使得虚拟机系统误以为存在真实的CPU风扇。具体来说,我在Zen环境下通过添加和修改SMBIOS的Type27和Type28条目实现了这一点。对于QEMU或KVM用户,只需指定smbios参数即可。这种方式让虚拟机对硬件检测更加逼真,并使依赖硬件判断的恶意软件失效。不过,我也意识到安全防御和攻防是一场持续的博弈,这种硬件模拟只是一种手段,更深层的检测措施可能会出现。 社区里有人提到,检测冷门API本身容易被安全软件识别,甚至被标记为恶意行为。所以,这种方法可能只对初级的恶意软件有效。总的来说,这种硬件模拟对研究人员来说是实用手段,但需要不断更新和改进。

Deep Dive

Chapters
本部分探讨了通过伪造虚拟机SMBIOS数据,模拟CPU风扇等硬件信息来欺骗恶意软件检测的方法。该方法有效地提高了恶意软件分析的效率,但也引发了关于攻防对抗持续性的讨论。
  • 通过修改虚拟机SMBIOS配置,模拟CPU风扇等硬件信息
  • 许多恶意软件通过检测Win32_Fan等硬件信息来判断是否运行在虚拟机中
  • 该方法可以欺骗部分恶意软件的检测,但更高级的检测方法可能仍然有效

Shownotes Transcript

大家好,欢迎来到黑客新闻中文日报。今天的节目里,我们将带你看看虚拟机如何通过模拟硬件巧妙绕过恶意软件的检测屏障,这对工坊研究有怎样的启示。接着,我们要分享一个关于人工智能领域最新理念,Context Engineering,为什么大语言模型的实际能力已经不只是写 Prompt 这么简单。

还有,AI 研究的一大突破,数据比模型结构更关键,下一个改变游戏规则的数据源,或许就在大家意想不到的地方。精彩内容,马上开始!有开发者通过修改虚拟机的 Symbias 配置,让虚拟机系统自己以为装有一个真实的 CPU 风扇。

原理是一些恶意软件在启动前会检测系统硬件信息比如通过 WMI 查询 WIN32 下划线 FAN 类来判断自己是不是运行在虚拟机里面因为大多数虚拟机都没有这种风扇硬件信息这就被恶意软件利用来逃避分析作者在 Zen 环境下通过添加并修改 Symbias 的 Type27 和 Type28 条目手动伪造了一个风扇设备和关联的温度探针再把生成好的二进制文件配置到虚拟机的启动参数里

最终在 Windows 虚拟机里用 5M 工具能顺利查询到 CPU 风扇的存在对于用 QEMU 或 KVM 的用户设置就更简单只要指定 somebias 参数加在自定义的二进制数据无需打补定这种方式让虚拟机对硬件检测更加拟真也让部分依赖硬件判断的恶意软件无效

评论区不少人分享了类似实践,比如有人伪装虚拟机的电源或者温度传感器,还有朋友提到其实检测这些冷门 API 本身很容易被安全软件识别,甚至会被标记为恶意行为。整体看,这类硬件模拟对研究人员来说是实用手段,不过也提醒安全防御和攻防是一场持续的博弈。

Grid for 90 是一个模块化的开源收纳系统,用户可以用 3D 打印方式制作出各种尺寸的格子收纳盒和底板,把工具小零件这些物品收拾得井井有条,也让工作台更有秩序。所有设计都完全免费,而且 Grid for 90 的设计思路是用整数倍的 42x42x7mm 为标准单位,所以可以自由扩展、适配。

这个项目最早是由 Zack Friedman 发起,后来开源给了社区,大家不断丰富和改进,已经形成了活跃的生态。

现在有很多网友会根据自己的需求自己定制和分享新的配件和工具模块方便其他人下载使用评论区有用户推荐用废旧纸板代替部分 3D 打印部件可以节省耗材还能环保也有不少人觉得开源和自己动手的乐趣是 Gridfinity 吸引人的地方当然也有观点希望未来 Gridfinity 能有量产版本方便更多用户不用等打印就能用上这种收纳方式

最近在 Hacker News 社区,有不少开发者分享了他们当前在做的个人项目和新创意。比如有一位开发者做了 Laboratory Love 这个众筹独立产品检测的平台,用户可以自己发起并资助某个商品的安全检测,检测结果会公开发布,主要是帮助大家查找食物中的内分泌干扰物等有害化学物质。

有的人则在开发新的编程语言,比如 Machi,可以高效地查询结构化数据。还有人花大量时间打磨基于体速的 3D 游戏引擎,或者发布了 YouTube 内容发现类的 Chrome 扩展。也有开发者分享了他们在技术图表、收银系统,甚至翻新老自行车方面的实践和经验。从评论区来看,大家既认可这些产品的实用性,也很尊重开发者的热情和投入。

有不少人提出了建议和鼓励,希望看到更多有创意的小工具走向应用,整体气氛非常积极和支持。AI 领域里最近出现了一个叫 Context Engineering 的新术语,意思其实就是怎么为大语言模型准备好完成任务所需要的全部信息,不只是写几句 prompt 而已。现在开发 AI Agents,决定成败的关键已经不是模型或者指令的技巧,而是你准备好了哪些上下文。

比如说,如果你只是用很基础的信息让 AI 日程助理回邮件,它也许会回答得很机械,但如果能把日历、历史邮件、联系人这些相关信息和可用的工具一起打包提供出去,那 AI 的表现就会立刻变得更像真正的助理。这和 Prompt Engineering 不同,Context Engineering 更像是在为模型搭建一个能动态获取和整理信息的环境,让 AI 在需要的时候能恰好获取到所需的数据和能力。

文章还强调真正让 AI 发挥作用靠的不是更 smart 的算法而是你能不能把需要的上下文按对的方式整理好在评论区有人提到其实魔法 prompt 本来就是对 context 的包装只不过前几年很多 AI 大师宣传的过于简单也有网友补充说和人类一样 AI 拿到的信息越多越及时解决问题就越容易还有人表示真正理解 LLM 工作原理还是得多用编程的方法去试靠蒙或者凑巧都很难有可靠的结果

美国的一项关键气象卫星数据项目即将终止科学家表示这很可能让飓风预测能力倒退几十年负责收集气象数据的 DMSP 卫星一直是美国和全球气候监测的重要数据来源帮助科学家追踪北极和南极的海滨变化也能让气象专家及时分析飓风的形成和增强过程 NOAA 在 6 月底突然通知相关人员这一卫星数据将在本月结束后全面停止接收处理和分发

虽然官方称这个调整不会影响整体预报质量但许多依赖 DMSP 的研究人员认为目前并没有可以完全替代的数据来源一些飓风和极地的研究者表示 DMSP 卫星独特的数据能让他们更早发现和预判风暴发展而现在等于是在失明状态下工作更令人担忧的是 DMSP 卫星本身并没有出现故障官庭很可能是出于政策或者管理的考虑让大家感到突然且难以理解

实际上 这一变动让一些联邦气象人员措手不及 有专家形容直接损失了一半的观测能力 面对飓风季 这无疑增加了预警风险评论区有网友提到 其实 DMSP 卫星已经服役很久 后续像 NOAA20 或 Gozal 也能提供更高分辨率的数据 只不过切换需要时间也有人讨论到大型气象项目因为政治变动而失去连贯性 并提出是否可以让私人或者多国合作来分散风险

另外,不少人对这种突然失去公开关键数据表示担忧,认为这会影响科学家和公众对自然灾害的判断和应对。2.5 万美元的新车正在变得越来越难买到,比如福特 Maverick 这款原本面向大众的入门极皮卡,4 年前定价还不到 2 万美元,但现在基础款的价格已经涨到了 2.8 万多美元。

根据行业数据,2025 年 2 月份美国市场上售价在 2.5 万美元以下的新车只占 4.8%,而 2019 年这个比例还是 23%。造成这种现象的原因有很多,首先,厂商生产高价车型能获得更高的利润,像福特 F150 这类高端车型利润率高达 20%,占公司总利润的 90%,而便宜车型利润极低,导致汽车厂商普遍不愿意生产和销售低价车型。

其次,美国消费者买车时往往依赖经销商的现车,只有大约 20%的买家会提前预定自己想要的配置,经销商则倾向于多进高价高配车型,因为这些车不仅售价高,带来的金融分成也更多。

而搭配复杂 电子化程度高的新车 也让维修和保养成本走高此外 汽车价格的上涨不仅仅是通货膨胀的结果 很多本来以性价比著称的品牌 这几年涨幅都远超行业整体平均值还有评论区网友补充说 现在美国人汽车贷款总额高达 1.64 万亿美元 贷款周期越来越长 买车成本还在增加

也有网友质疑,其实低价新车依然存在,关键在于消费观念和厂商的战略选择。更多人则认为,未来只有中国电动车品牌真正进入欧美市场,才有可能彻底改变低价车短缺的现状。这篇帖子提出了一个挺有意思的观点,认为人工智能领域的主要进步其实并不来源于所谓全新的理论,而是来源于不断找到新的数据集来训练模型。

比如说像深度神经网络 Transformers 这样的核心架构其实在二三十年前的学术论文里就已经出现过真正推动 AI 实用化发展的转折点是在 2012 年 AlexNet 用 ImageNet 数据集实现了计算机视觉领域的大突破后面又通过 Transformer 架构和爬取全网文本让大语言模型像 GPT 这样问世

进一步通过人类反馈强化学习 RLHF 让模型能明白什么是好回答再到让模型尝试推理和工具调用等能力每一次质变都是通过获取利用全新类型的大规模数据实现的虽然大家都特别关注模型结构的创新但实验结果显示哪怕是不同架构只要数据集一样效果差距其实没那么大这也意味着目前进步的主要瓶颈在于能不能收集到更多更丰富更有代表性的数据

作者还预测下一个合适的数据源可能来自视频比如 YouTube 上传的 500 小时每分钟的视频数据又或者来自大规模机器人采集的传感器数据这些都是极其丰富的多模态信息

而评论区的网友也补充了几点,有网友认为,人类智能是多通道多感官的,目前大语言模型和视觉模型其实只使用了很少一部分信息,未来如果能用到触觉嗅觉这样更加接近人类感知的数据,AI 才可能变得更聪明,也有人觉得现在的模型训练其实就是背诵数据集。

缺少主动去获得新知识的能力还有工程师表示研究社区其实一直在想方设法优化架构和算法但真正有显著提升的并不多核心还是得靠数据本身的突破一位开发者分享了如何在西语言中实现类型安全的通用数据结构比如链表不仅支持多种类型还能让编译器在类型不匹配时直接报错

他没有选择 C++,而是在西语言中用了一些巧妙的技巧,比如通过运演联合体存储类型信息,使用红和下划线下,划线 typeof 下划线下划线实现了在编译期间的类型检查。文中还对比了常见红展开,多次 include 的方法,还有用 void 指针存储但不安全的传统做法,以及在节点内连存储数据来优化性能。

他提出的最终方案用晕眼伪装出类型信息让 Lis 下话线 Prepend 这样的红记好用又可以防止类型错误

网友讨论里,有人指出晕眼和类型转换在标准 C 里其实有些不确定行为,强调要考虑不同边异器支持的问题。也有人直接建议如果追求泛型和类型安全,不妨直接用 C++。不过也有网友表示,用这种方法可以让最终的数据结构依然保持传统 C 结构的优秀可读性和优化空间。大家的看法比较多元,但都对这种探索 C 泛型方案的精神表示认可。感谢您收听今天的黑客新闻中文日报。

希望我们精选的科技前沿与实用洞见能为你带来新的灵感如果喜欢我们的内容欢迎订阅并分享给好友祝你科技灵感不断期待明天与你再会