We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 2025-06-02 | 站长如何用 Nginx 和 Fail2Ban 全面封杀恶意爬虫

2025-06-02 | 站长如何用 Nginx 和 Fail2Ban 全面封杀恶意爬虫

2025/6/2
logo of podcast Hacker News

Hacker News

AI Deep Dive AI Chapters Transcript
People
播客
Topics
播客:Precision Clock MK4 是一款专为极致时间精度打造的时钟,它不仅拥有毫秒级显示,在高达 10 万赫兹的刷新率下也能保证数字无闪烁,即使用高速摄像机拍摄,也相当稳定。它的时间主要依赖 GPS 自动同步, 能自动根据全球定位计算时区, 并在失去 GPS 信号时用内置高精度温补精振维持低飘移。当信号丢失时, 时钟会直观地将末位数字逐步消隐, 显示当前精度, 用户一看就能知道当前时间的准确度。硬件方面, 时钟采用了分体式设计, 通过激光切割的 Dorian 转轴实现横竖两用, 满足宽显示或折叠节省空间的需求。整个时钟的驱动方案颇具巧思, 它没有使用市场上常见的显示驱动芯片, 而是用两颗微控制器加上 6 颗缓冲芯片直接刷新 150 多个显示段, 再通过可变电压控制亮度。固件采用西语言开发, 支持 U 盘方式一键升级, 不需要任何驱动, 时区数据库和世界地图等都能简单复制更新。除了时钟本身, 它的生产过程也很有看点, 作者自己用开源贴片机和回流炉完成了大批量组装, 还专门优化了 PCB 工艺和外观细节。评论区认为 Precision Clock MK4 展现了硬件极客精神和艺术品级的打磨,并提出了改进建议,例如使用 USB-C 接口或增加 NTP 网络功能。

Deep Dive

Chapters
The Precision Clock Mk IV boasts a 100kHz refresh rate and millisecond-level jitter-free display, using a unique split-motion design and innovative analog LCD driver circuit. Its features include automatic time zone detection, GPS fine-tuning, and firmware upgrades, showcasing both engineering and aesthetic excellence. Community feedback highlights its performance and precision but suggests improvements like USB-C support and NTP functionality.
  • 100kHz refresh rate
  • Millisecond-level jitter-free display
  • Split-motion design
  • Analog LCD driver circuit
  • Automatic time zone detection
  • GPS fine-tuning
  • Firmware upgrades

Shownotes Transcript

大家好,欢迎收听今天的黑客新闻中文日报在本期节目里,你将听到 AI 正在彻底改写三维渲染微软推出了新一代 Renderformer 神经渲染模型让之前需要数秒甚至数十秒的大场景秒变逼真画面这背后 Transformer 在视觉领域的突破值得期待

同时我们聚焦前端开发的进化有作者提出让 JSON 像图片一样渐进流逝加载新思路不仅加速了页面响应更让细节呈现的更平滑最后程序员们也有新惊喜数学大牛陶哲轩首次把自己的实分析正式化进了 Lin 证明器数学自动化和工程融合前所未有精彩不容错过来看最新科技浪潮里的头号焦点

Precision Clock MK4 是一款专为极致时间精度打造的时钟,它不仅拥有毫秒级显示,在高达 10 万赫兹的刷新率下也能保证数字无闪烁,即使用高速摄像机拍摄,也相当稳定。它的时间主要依赖 GPS 自动同步,能自动根据全球定位计算时区,并在失去 GPS 信号时用内置高精度温补精振维持低飘移。

当信号丢失时,时钟会直观地将末位数字逐步消隐,显示当前精度,用户一看就能知道当前时间的准确度。硬件方面,时钟采用了分体式设计,通过激光切割的 Dorian 转轴实现横竖两用,满足宽显示或折叠节省空间的需求。

整个时钟的驱动方案颇具巧思,它没有使用市场上常见的显示驱动芯片,而是用两颗微控制器加上 6 颗缓冲芯片直接刷新 150 多个显示段,再通过可变电压控制亮度。

固件采用西语言开发,支持 U 盘方式一键升级,不需要任何驱动,时区数据库和世界地图等都能简单复制更新。除了时钟本身,它的生产过程也很有看点,作者自己用开源贴片机和回流炉完成了大批量组装,还专门优化了 PCB 工艺和外观细节。

评论区很多人关心时钟的高刷显示和消除闪烁的模拟 LCD 驱动设计觉得打造物理产品并兼顾可维护性和设计美感非常难得也有人建议如果能用 USB-C 或增加 NTP 网络功能就更理想了总体来看这款时钟更多展现出硬件极客精神和艺术品级的打磨而不只是工具

在 Overreact 的 Progressive JSON 这篇文章里,作者提出能不能像 Progressive JPEG 一样,把 JSON 的传输和加载也做成渐进式的方法。传统的应用,如果用 JSON 来传递数据,客户端往往要等到整个 JSON 文件全部收到并解析后,页面才能动起来。

如果遇到评论这一块还没查好数据库响应特别慢,就会拖慢整个页面。这其实也就是我们平时常见的头组色问题。文章里举了个例子,假如我们能用流逝的方式,先把页面股价和已加债的部分先推给前端,剩下慢的,比如评论区部分后续再补,这样用户能更快看到页面不是空着的问题。

最理想的进化是广度优先式的传递比如页面顶部正文页面底部的内容可以并行传输哪个部分数据先准备好就先渲染出来慢的部分就用 Promise 占个位置后续补上 React Server Components 用的其实就是这种思路它通过 Promise 和 SysPense 机制把流逝加载和分阶段显示结合起来让 UI 的逐步显示能更自然也方便开发者精细设计等待时的站位动画和内容

评论区补充说,有网友觉得对于绝大多数应用来说,这种复杂的渐进式分片其实没啥必要,多数需求直接用多个接口请求就能解决也有人感觉 React 这套机制虽创新,可社区和开发者学习区限比较高,实际落地还是要看具体产品场景还有开发者讨论这种流逝协议,其实早在 2010 年前后业界就有人做过,只不过形式和底层技术有所不同

数学家 Terence Tao 正式推出了一份 Analysis Eye 的 Lin 版配套资料,把自己 20 年前出版的十分析教材 Analysis Eye 的主要定义、定理和习题内容逐步翻译成了 Lin 代码,让读者可以在 Lin 证明助理中动手实现证明和解题。

Tao 说,最开始写书的时候,虽然已经有一些比如 Coke,Agda 这样的证明工具,但当时并没有考虑到正式化,近年接触后发现自己在书中采用的很多朴素类型论理念,其实和 Lin 采用的依赖类型理论十分贴合,特别是对商类型的良好支持。

书里的相关章节会优先用手动方式实现一套基础的自然数、整数等数系的构造过程然后把相关引理证明内容留给 Lin 读者作为练习证明要靠自己填补 SORRY 等后面章节学习深入后内容会逐步过渡到用 Lin 官方 Mathlib 库来实现这种做法既方便了初学者也给有编程和数学基础的读者一个更系统的证明训练平台

他要鼓励大家提交反馈,也欢迎参与 Playtest 去完善配套练习,Lin 代码仓库也刚刚独立出来,有兴趣的可以去试试。从评论区来看,不少人提到 Lin 这样的证明工具能为学生带来更及时,更客观的反馈,甚至有人希望之后 Lin 的错误提示也能像 REST 编译器一样给到改正建议。

也有网友觉得这套配套资料有望让更多工程背景的人用严谨的方式学习高阶数学更方便初学者和自学者打通从教材到自动化证明的桥梁 C++ to Rust Phrasebook 这本手册专门为 C++程序员设计帮助他们学习 Rust 作者都是布朗大学的 C++和 Rust 专家他们用很多具体的代码例子和详细讨论把常见的 C++编程模式翻译成 Rust 的最佳实践

用户可以根据自己的需求查找每一章,不一定要从头到尾读完,遇到在 REST 里不太会写的功能,就可以找这里的对照。书里没有用 AI 自动生成的内容,质量把控得很严。评论区有人指出,书中有些地方对西加加的实现方式描述得不够全面,比如美举和模块,其实用现代工具这些在西加加里也很好实现。

还有人提醒,西加加和 Rust 的思维方式差别很大,一些西加加写法在 Rust 里并不适合,写代码时要注意转换思路。总体来说,大家觉得这本手册内容实用,能帮助读者了解两种语言的区别,也有网友表示,会用它来同时学习 Rust 和西加加比较两种语言哪个更适合自己。一个独立博主,最近在 LambdaCreate.com 上分享了自己用各种小工具抵御恶意爬虫的经历。

事情的起因是他的服务器突然被大量机器人疯狂抓取数据本来服务器上的站点访问量很小但最近流量莫名暴涨磁盘空间和 CPU 内存都被迅速消耗作者一开始以为是自己托管的该贴仓库配置问题后来才发现真正的元凶是一些机器人包括像 Amazon BudOpenAI Apple BudFacebook 这样的知名爬虫还有大量伪装的大公司和各种奇怪的 user agent 基本是把服务器上的所有页面和代码仓库都扫了一遍

为了应对这些机器流量,作者先用 Ninx 配置了对蚁只爬虫的 403 组织,又加了限流策略,对频繁访问的 IP,异常 user agent,建立了动态封禁规则。同时,他还用非二 ben 自动监控 Ninx 的访问日志,大批量的拉黑那些反复违规的 IP。

这样一番折腾后服务器才逐渐恢复平稳不过作者也无奈地表示如果不是自己有足够的系统管理经验和一堆工具估计早就被这些爬虫大军拖垮了

在评论区,网友们纷纷吐槽现在的爬虫根本不管 robus.txt,很多甚至伪装成主流搜索引擎,有人建议用更狠的办法,比如 robus.txt 里面放诱饵信息配合自动封禁,还有人提出是不是应该改成由网站主动提交内容给 AI 和搜索引擎,所以而不是默认让他们来爬。总的来看,如何识别和限制不守规矩爬虫,成了越来越多个人站长不得不面对的新挑战。

微软最新发布的 Renderformer 是一个基于 Transformer 的神经渲染模型它可以直接从三角网格的场景描述中渲染出带有全局光照效果的图像而且不需要针对每个场景单独训练或者微调

和传统物理渲染不同,这个模型把渲染看作一个序列到序列的转换过程,把场景里的三角形等信息转变成像素块,整个流程分为两个阶段,分别负责模拟不同的光照和视角变化,而且完全基于 Transformer 架构,不用传统的光山化或者光线追踪技术。

测评数据显示,在 A100 显卡上,Renderformer 渲染一帧只需 0.076 秒,同样的场景,Blender Cycles 需要 3.97 秒到 12 秒不等,并且两者的图片相似度可以达到 0.95,非常接近原始渲染结果。虽然在一些复杂的场景,例如高复杂度阴影或者粒子效果时还是有一定误差,但对于大部分即时预览和动画预演需求来说,已经足够快,也足够真实。

一些评论认为,如果进一步优化,未来很可能会被大型动画工作室用来制作整部电影的预览片段,极大提高工作效率。还有人提到 Transformer 在视觉领域的应用越来越有想象空间。也有网友提醒说,普通用户的显卡性能比 A100X 很多,不过即便如此,也很有机会让 Web 应用里的三维设计师体验到速度提升。

日本的高科技马桶在当地已经成为主流产品比如 TOTO 推出的带有温水冲洗功能的 WashLan 这类马桶在日本家庭和公共场所几乎随处可见根据官方数据现在有超过 80%的日本家庭都在使用类似的产品

TOTO 公司现在正把目光转向美国市场 这几年他们带有各种特色功能的马桶 在美国也越来越受欢迎比如带加热做圈 温水清洗 自动开盒 以及多种舒适体验 已经出现在不少社交媒体上的高端酒店和明星家中 TOTO 在美洲地区的房屋设备业务利润五年增长了八倍 美国越来越多正在装修新家的用户会选择带有 Bday 功能的马桶

网友们在评论区也分享了自己用日本马桶的体验比如有的人觉得回到没有这些功能的国家像回到了中世纪也有人吐槽初次使用各种喷头和按钮可能会有点手忙脚乱还有人推荐一些价格实惠方便改装普通马桶的 Bday 产品

整个 5x5 nanogram 在线协作游戏现在已经上线,这个项目的发起人用自己的程序把所有可能的 5x5 方格像素组合都跑了一遍,一共生成了 2497 万 6000 位一个不需要靠猜测,只靠推理就可以解开的谜题。在这个平台上,每个人只要解开一个谜题,所有其他人就能同步看到这个解答。

目前游戏刚上线大家已经合力解掉了 65000 多个谜题评论区里网友们觉得这种大家一起解谜的方式非常有趣不过有些人说界面还有点不好用想找还没被解开的谜题很难而且刷起来容易让人停不下来还有人建议增加隐藏已完成关卡的功能让体验更加顺畅一篇博客详细介绍了如何用梯度的方法来替代传统的区间算法帮助渲染复杂的隐世曲面模型

作者首先回顾了利用区间算法对空间进行裁剪和简化表达式的常见方式比如在渲染时把大范围拆分成更小的区域用区间运算快速判断某块区域是否一定在模型内还是外如果区间结果含有 0 就需要继续细化但如果完全大于或小于 0 就能直接得出结论

新提出的方法是基于 Lipsys 连续性,假设距离场的梯度是有上界的,这样在每个区域只需要采样中心点,并以梯度上限推算整体最大波动范围,相当于模拟出一个尾区间。这种单点采样计算量很小,尤其适合复杂模型下的交互式渲染。

不过作者也分析了几种方式的优缺点比如传统区间法运算更保守且随着变换叠加误差增大而梯度法则依赖距离场良好的性质有些模型处理不好还需要用自动微分配合皈依化再做处理后面还展示了各种实际例子和性能测试发现两种方法各有优势皈依化方法虽然多一步计算但只要关注正负号就可以放心简化表达式

评论区里有网友补充说,其实类似思想早在 90 年代用在 Taylor 模型和 Neighborhood Arithmetic 里就被提出过,也有人专门提醒皈依化步骤在某些算子下容易引发关节点的不连续问题,建议皈依化要放在 min 或 max 操作节点之前。还有人觉得这类方法在实际工程中很有帮助,同时也指出关于浮点数误差的问题,在新算法里还是得多加关注。

Nex 是一款用于 Linux 的小工具可以把任何应用程序隔离在自己的网络空间里并通过 Tor 路由流量从而更好地防止数据泄漏它的原理是用 Linux Kernel 自带的 Namespace 功能把每个应用分配到一个独立的网络 Namespace 阻断了访问系统级网络接口的可能专门通过 Nin0 虚拟网卡连入 Tor 一旦部署不当或者 Proxy 配置出错原本可能暴露的网络数据如今可以在 Kernel 层直接拦截

跟此前用的比较多的 Torsocks 工具相比,Nex 在隔离性和安全性上提升明显,因为它不依赖应用本身的库调用方式,连恶意程序都更难逃出沙箱。不过目前 Nex 只支持 Linux,刚发布还比较新,而 Torsocks 已经有十几年的开发历史。实际体验上,只要有 REST 环境就能用 Cargo 直接装好,命令行里运行 Nex 调用 Curl、Bash 等程序就行,桌面环境下甚至可以隔离图形应用。

有人在评论区提到 NX 让操作变得非常简单用户不用担心复杂的配置但也有网友提醒如果应用本身的设置没处理好比如泄露了用户名或 cookie 还是可能暴露隐私另外也有人希望未来能有西语言版本方便更多人使用感谢收听今天的黑客新闻中文日报希望这些最前线的科技故事和创新动态能带给你新的灵感和思考

如果你喜欢本节目,记得订阅分享,让更多朋友一同加入科技的探索旅程。祝你一天愉快,我们下期再见。