We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 2025-07-04 | 停止盲目构建 AI agents:五大实用 LLM 工作流,提升自动化系统的可靠性

2025-07-04 | 停止盲目构建 AI agents:五大实用 LLM 工作流,提升自动化系统的可靠性

2025/7/4
logo of podcast Hacker News

Hacker News

AI Deep Dive AI Chapters Transcript
People
作者
网友
Topics
作者:我花了半年时间将 TMUX 从 C 迁移到 Rust,虽然最终实现了功能对等,但目前还处于不太安全的 UnsafeREST 状态。一开始我尝试使用自动转换工具,但效果不佳,生成的代码臃肿且难以维护,最终我选择了手动重写。在迁移过程中,我遇到了数据结构和函数声明等方面的 Bug,例如内存布局不一致和指针类型错误等问题。构建流程上,项目经历了 C 和 Rust 混编,最终将 C 作为库静态链接到 Rust 主项目。尽管我使用了 AI 编程工具,但大部分代码仍然需要手动修改和调试。 网友:我认为这种大型迁移项目虽然烧脑,但重写过程本身收获最多,对 Rust 初学者来说是很好的练手机会。这类项目能帮助开发者深入理解代码的本质,并在实践中掌握 Rust 的高级特性。同时,参与修复 Bug 和扩展新功能也是提升技能的有效途径。

Deep Dive

Chapters
本期节目关注 tmux-rs 项目,一个将 tmux 从 C 语言迁移到 Rust 的项目。作者耗时六个月,手动将 67,000 行 C 代码迁移到 81,000 行 Rust 代码。过程中遇到了许多挑战,例如内存布局不一致和指针错误,最终成功完成迁移,为 Rust 初学者提供了宝贵的学习机会。
  • tmux-rs 项目将 tmux 从 C 迁移到 Rust
  • 手动迁移约 67,000 行 C 代码
  • 遇到了内存布局、指针错误等挑战
  • 为 Rust 初学者提供了学习机会

Shownotes Transcript

大家好,欢迎来到黑客新闻中文日报在今天的节目里,我们将带你关注热门的 AI 落地实践如何影响我们日常的自动化和高效开发也会聊聊为何越来越多的 Zoom 会议参与者几乎变成了 AI 机器人的聚会以及一桩正在 Hacker News 上掀起技术热议的大型 C 代码迁移到 REST 开源项目里面不仅有对人机协作的真实体验还有不少出人意料的开发插曲精彩内容马上开启

一个名为 TMUXRs 的项目,正在把经典终端多路负用气 TMUX 从 C 语言迁移到 REST,作者经过半年左右的努力,已经把大约 6.7 万行 C 代码变成了 8.1 万行 REST 代码,现在整个项目已经全部换成了 REST 实现,不过目前还属于不太安全的 UnsafeREST。作者一开始尝试用 CRREST 这样的工具自动转换代码,但生成的 REST 代码又臃肿又难以维护,最后还是选择手动逐步重写。

整个迁移过程中遇到很多有意思的 bug,比如因为数据结构里的一个信号漏掉,导致 REST 和 C 的内存布局不一致,或者因为缺少 C 的函数声明,导致指针被错误当成整形处理,数据传递直接出错。Build 流程上,作者前期是 C 和 REST 混编,后来转换更多代码后,才逐步把 C 作为库静态链接到 REST 主项目里。

TMUX 原本用的输入解析器是 YAR 作者最后用 REST 的 LARPOP 做了一模一样的功能最终把所有 C 代码都清掉了期间作者也用过像 Cursor 这样的 AI 编程工具但发现自动生成的代码还是经常出错大部分时间还是要靠自己手改和调试现在虽然功能上全都移植过来了代码安全还没做到理想下一步就是逐步把不安全的指针和暴力控制流改成 REST 的安全风格

在评论区,许多网友很佩服作者的毅力和对细节的把控,还有的开发者分享了类似自动迁移代码难以真正表达原始意图的经历。大家普遍认为,这类大型迁移项目虽然很烧脑,但重写过程本身收获最多,对 RUS 初学者来说,修报扩加新功能也是非常好的练手机会。一款叫做 ICE Block 的应用,因为被美国司法部长班底批评,一夜之间在美国火了起来。

ICE Block 是一个 iPhone 应用,用户可以匿名上报自己在什么位置看到了美国移民与海关执法局 ICE 的行动信息,范围是方圆 5 英里,还能推送附近 ICE 活动的消息。TechCrunch 经测试确认,ICE Block 不会收集或者存储用户的任何数据。现在,这款应用已经成为美国 App Store 下载量排名前列的免费应用,特别是在洛杉矶等城市,活跃用户数量快速增加。

有网友评论说,很多人只是单纯的不想在有警察执法的地方被盘问或者预堵车,这和守法与否关系不大,也有人指出这类曝光执法信息的行为其实没有违反言论自由。此外,关于隐私安全和政府压力,讨论也非常激烈,不少人觉得像 Waze 或闪汽车大灯互通警情,这种事其实每天都在发生,ICE Block 只是把它变成了互联网工具。

Glass 3D 是一款可以帮助你快速生成高精度玻璃特效 CSS 小工具,支持在线调整各种参数,比如模糊、亮度、饱和度和色彩,以及贴图和阴影等细节,效果会直接在界面中实时预览。生成的代码用了一些 CSS 技巧,比如 Backdrop Filter 结合 Blur 和 Brightness,另外还加了 HSL 色彩和噪点贴图,让玻璃效果更有层次感。

对于喜欢深入定制样式的前端开发者来说,这类工具大大减少了实验调试的时间成本。不过,评论区有用户提到目前这种玻璃特效主要还是简单的模糊背景,远没有真正玻璃在边缘变形,光线折射上复杂,也有网友分享了用 JavaScript 和 SVG 实现更接近真实玻璃效果的方法。还有人指出,CSS 方案在移动端体验上还有改进空间。

总体来看,Glass 3D 虽然离完全模拟现实还有距离,但已经是降低门槛,快速上手的使用方案。现在在一些公司的 Zoom 会议里,AI 笔记助手的数量甚至已经超过了真人参与者。比如有一次会议,6 个真人里却有 10 个是专门用来录音、转录、总结会议内容的 AI 机器人。越来越多员工选择不参加会议,只是派出 AI 帮自己记笔记、做总结,有的机器人甚至只是静静听着,不和任何人互动。

很多人觉得,这样的发展虽然让工作更高效,但也让沟通变得越来越机械,甚至影响人和人之间的真实交流。

评论区里不少人表示,其实很多会议本身信息含量很低,就算有了 AI 总结也没什么价值。还有人吐槽说管理层可能以为员工逃会是在偷懒,但其实是因为太多无用会议,让大家无法专心做真正重要的事。也有少部分人觉得,有了 AI 工具之后,跨文化沟通会轻松不少。看会议总结,或者转录能带来不小的便利。

天文学家最近在智利的 Atlas 望远镜观测中发现了一个名为 Sun Eye Atlas 的新天体这是人类历史上第三个已知来自太阳系外的星际天体目前被认为很可能是一颗彗星 Sun Eye Atlas 进入太阳系的速度非常快约每秒 60 公里比之前发现的星际天体都要快得多

它的轨道非常特别,几乎不受太阳引力的影响,预计会在今年 10 月底最接近太阳,不过那时候地球正好在太阳系的另一边,所以能观测到的机会比较有限。这次科学家能在 Sun Eye Atlas 进入太阳系早期就发现它,所以未来几个月里有大量观测和数据分析的机会。

尽管目前大小还无法完全确定,但初步估计它的直径可能从几百米到一两公里。从 Umuamua 开始,短短不到十年,人类就观测到三个星际来客,有科学家认为像 Rubin 这种新一代望远镜将来可能每年都能发现类似的天体。评论区里有网友调侃,过去几千年人类都没发现类似天体,现在连着几年就有三颗,要么是观测能力进步太快,要么是宇宙正给我们送来一波星际石头。

还有人说,等 Rubin 望远镜正式运行后,我们或许真的能迎来更多星际访客。在作者的实际体验中,尽管当前像 MCP 这样的工具很受关注,但在大多数场景下,直接生成和运行代码依然是更高效、更可靠的选择。

作者通过一系列实验发现,像 GitHub、MCP 这样的自动化工具,往往需要投入大量上下文信息,有时比直接写代码还要复杂,而且生成过程不容易验证,中间出现的任何推理失误都可能导致结果出错。相比之下,直接让 LLM 生成脚本代码,然后对代码进行复查、测试和迭代,不但更容易发现和修正问题,还能大规模附用这些工具。

比如把一份 Restructured Text 格式的博客转 Markdown,作者选择让 LLM 写出转换代码,再用脚本自动对比转换结果,最后批量跑完验证,整个过程不仅可控,也让人放心。

在大量网友的评论中,不少人也提到了类似看法,有网友认为 LLM 的真正价值是帮助程序员和普通人用低门槛的方式去自动化重复事物,将人自己从繁琐流程里解放出来,另一些人则指出 MCP 类似工具适合特定领域,但面对复杂或需要频繁验证的情况,代码生成依然最好用。

还有网友举例,利用 LLM 和 MCP 工具结合可以提升开发效率,但真正落地时,如何平衡抽象层级,验证能力和执行效率,依然是个值得持续探索的问题。最近不少玩家和业内人士正在支持一个叫 Stop Killing Games 的倡议,核心诉求是希望游戏公司不要随意让已经购买的游戏突然停服,导致玩家失去访问权。

这个倡议并不是要求开发者永远运营服务器而是希望公司能为消费者提供一些保障比如可以在游戏商店明确标注有效期限或者在游戏生命周期结束时开放精简版服务器源码又或者允许玩家自行分析游戏程序在停服后运行属于自己的服务器还有的一些建议是直接随游戏发布本地联机用的服务器版本让大家能通过局域网或直接 IP 继续玩

在游戏行业,很多玩家对在线验证的单机游戏下线感到不满,比如 Forza 需要绑 Microsoft 账号,即便是单机也得联网才能启动,涉及到退款政策和后续支持问题时,讨论也非常激烈。还有评论举例,美国 2015 年通过法律豁免,让玩家可以在服务器关闭后用第三方补丁绕过 DRM,继续体验老游戏。

一些网友认为 这类问题其实也适用于一次性授权的软件 不仅仅是游戏 开发商在终止在线服务时应该更有责任感不过也有人质疑 法律很难强制公司无限期的维持服务 尤其是对于资金有限的独立开发者如果强行推行相关法规 反而可能对小型工作室产生压力

Overall 看下来,评论区很关注玩家的权益,也有不少技术细节和实际可行性方面的讨论,大家的共识是希望自己花钱买下来的内容不会轻易消失。Cultures 经过 5 年的开发,终于正式结束 Beta 阶段,发布了 V1 正式版。这次升级不仅优化了平台的核心功能,还推出了全新的品牌战略和首页,明确把构建一个安全、健康和活跃的沙发客社区作为目标。

新版上线了很多实用的新功能比如新的地图搜索页面完善的通知系统和语言选择功能还在安全和社区治理方面做了大量改进例如引入更严格的内容审核用户屏蔽和举报机制以及对部分行为做出了更细致的规范此外 Cultures 强调了开放源码和志愿者驱动的社区模式目前正积极招募开发者和志愿者共同推动平台发展

评论区里,不少人回忆起过去参与 Couchsurfing 的美好体验,也有人关注 Couchers 对安全和社群氛围的平衡,还有用户讨论,沙发客文化能否在今天重新走红,取决于平台如何维持开放与互信。

在 LLM 系统开发里,很多团队一上来就喜欢用 agent 方案,比如搭建各种角色,加记忆系统,设计复杂的工具集和路由逻辑,这看起来很酷,很有技术含量,但往往实际用起来各种问题频发,常常会因为流程太复杂,可控性不足导致整体崩溃。

文章作者结合自己的失败经历指出,大部分自动化需求其实用更简单的工作流方案,效果更好,比如任务链式调用,并发处理,分类路由,手动分工等使用模式,不用一开始就放权给 LLM 自主决策。他给出的建议是,除非任务特别动态,或者有明确理由需要 agent,否则还是优先考虑可控性强,易于调试的基础流程。

评论区有网友补充,agent 框架的复杂度远远高于它的实际必要性,很多时候直接用简单 API 和工作流会更高效也有人认为目前主流的 LLM 已经很强,某些高阶用力可以考虑 agent,关键还是看具体场景需求还有开发者分享,折腾 agent 很久最后发现还不如用最基础的编排思路,调试和落地都省心不少

Google 公布了自家的 Zero Knowledge Proof,简称 CKP0 知识证明相关库,并且开源这些密码学工具,目的是帮助开发者更容易地开发保护隐私的应用和数字身份解决方案。其实这个技术很实用,比如用户在访问网站时,只需要证明自己年满 18 岁,不用透露任何其他个人信息。

Google 表示,这套 ZKP 工具不仅能让普通用户在网络上更安全,更有隐私感,也方便企业利用开源方案去满足监管或者服务需求,另外开发者也可以直接基于这个代码库开发专注隐私的各种应用。欧洲的 EIDAS 法规明年生效以后,要求个成员国在电子身份钱包 EUDI Wallet 中集成类似的隐私保护技术,Google 这次提供的开源库也是希望能帮各国加快应用的速度。

从评论区来看,网友们对 Zero Knowledge Proof 在隐私和身份认证上的前景很看好,也有网友关心这种技术是不是能让我们在网上更少透露自己的信息,同时有人探讨实际应用时会不会存在一些被绕过的风险,总体来说大家很期待这套工具未来在隐私保护领域的落地效果。感谢您收听今天的黑客新闻中文日报。

希望这些最新最具启发性的科技话题能够为你的思考和工作带来助力如果你喜欢我们的节目欢迎订阅留言和分享黑客新闻中文日报我们明天再见