We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 2025-05-24 | 最强编码模型 Claude 4 发布!可 7 小时不间断写代码

2025-05-24 | 最强编码模型 Claude 4 发布!可 7 小时不间断写代码

2025/5/24
logo of podcast Hacker News

Hacker News

AI Deep Dive AI Chapters Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
作者
开发者
演讲者
Topics
主持人:Anthropic 推出了新一代 Cloud 4 模型,包括 Cloud Opus 4 和 Cloud Sonnet 4,它们在代码编写、复杂推理以及 AI Agents 等场景表现突出。OPUS 4 被认为是当前全球最强的代码模型,能够稳定处理长时间和高复杂度的任务,并胜任多轮迭代的 agent 工作流。Sanit 4 也是一次重要升级,编码和推理的精准度都得到提升,而且对指令的理解更加细致。新版 Cloud 在工具使用方面有了扩展,支持模型并行调用多种工具,同时在开发者允许访问本地文件时,模型的记忆能力也大幅增强。Cloud Code 正式上线,支持 VS Code、JetBrains 等主流开发工具,用户可以直接在编辑器里进行无缝协作,并利用 GitHub Actions 等集成实现自动化开发。新版 Cloud 带来了 API 能力升级,包括代码执行工具、MCP 连接器、文件 API 以及最大一小时的提示缓存。Opus 4 在代码质量、复杂项目管理、调试和长期任务表现都有显著提升,而 Sanus 4 则在日常开发和多功能 App 辅助开发方面表现优秀。这一代 Cloud 模型将模型思考过程的完整输出做了摘要处理,只在极少数情况下显示全部思考细节,部分深度用户对此表达了不满。Opus 4 和 Sanit 4 在多个行业基准测试中的表现已超过目前的主流竞品,尤其是在真实软件开发任务上的准确率和效率都处于领先。

Deep Dive

Chapters
Anthropic 发布了新一代 Claude 模型,包括 Opus 4 和 Sonnet 4,它们在代码编写、复杂推理和 AI Agents 等方面表现突出。Opus 4 被认为是当前全球最强的代码模型,但在模型思考过程的输出方面,一些深度用户表达了不满。
  • Claude 4 (Opus 4 and Sonnet 4) released by Anthropic.
  • Opus 4 considered the strongest code model globally.
  • Improved tool support, memory capacity, and API capabilities.
  • Concerns raised about reduced transparency in model's thinking process.

Shownotes Transcript

大家好 欢迎收听最新一期的黑客新闻中文日报今天我们首先聚焦于 AI 领域的重大更新 Anthropic 全新推出的 Cloud4 模型已经引发开发圈热议不仅能稳定处理高复杂度的代码任务还改写了 AI Agents 的协作范式与此同时 VS Code 的 PostgreSQL 扩展正式登场 AI 助力下的数据库开发和自动化体验也在快速升级

除此之外,Mozilla 宣布明年关闭 Pocket 和 Fakespot 服务,将团队重心转向 Firefox 浏览器的内容推荐与 AI 集成,这一转型背后究竟是顺势而为还是无奈之局?精彩内容不容错过,让我们一起深入了解。Anthropic 推出了新一代 Cloud 4 模型,包括 Cloud Opus 4 和 Cloud Sonnet 4,这两款模型都在代码编写、复杂推理以及 AI Agents 等场景表现突出。

OPUS 4 被认为是当前全球最强的代码模型,不仅可以稳定地处理长时间和高复杂度的任务,还能胜任多轮迭代的 agent 工作流。Sanit 4 也是一次重要升级,编码和推理的精准度都得到提升,而且对指令的理解更加细致。

新版 Cloud 在工具使用方面有了扩展,支持模型并行调用多种工具,同时在开发者允许访问本地文件时,模型的记忆能力也大幅增强,可以持续记录和提取关键信息。与此同时,Cloud Code 正式上线,支持 VS Code、JetBrains 等主流开发工具,用户可以直接在编辑器里进行无缝协作,并利用 GitHub Actions 等集成实现自动化开发。

新版还带来了 API 能力升级包括代码执行工具、MCP 连接器、文件 API 以及最大一小时的提示缓存不少企业在实际应用中反馈 Opus 4 在代码质量、复杂项目管理、调试和长期任务表现都有显著提升而 Sanus 4 则在日常开发和多功能 App 辅助开发方面表现优秀价格体系保持不变并已在 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 上线

评论区不少用户注意到,这一代 Cloud 模型将模型思考过程的完整输出做了摘要处理,只在极少数情况下显示全部思考细节,部分深度用户对此表达了不满,认为影响高级提示工程操作。同时,也有数据验证 Opus 4 和 Sanit 4 在多个行业基准测试中的表现已超过目前的主流竞品,尤其是在真实软件开发任务上的准确率和效率都处于领先。

马兹勒宣布将于 2025 年 7 月 8 日正式关闭 Pocket 和 Fakespot 服务,届时用户将无法再使用相关应用和浏览器扩展插件。Pocket 用户可以继续保存和管理文章到停服日,关停后会进入只可导出模式,用户可以在 2025 年 10 月 8 日前导出自己的保存内容,之后所有数据将被彻底删除。

此外,Pocket 的高级付费用户也会按照剩余订阅时间获得自动退款,相关操作无需用户手动申请。Fakespot 作为电商评论分析工具也一同下线。Marzella 表示,随着用户上网习惯的变化,将会把资源投入到更契合当前需求的新项目,包括 Firefox 浏览器的内容推荐与 AI 集成等方向。

评论区有不少老用户对 Pocket 离开感到遗憾,他们表示自己一直用来收藏和阅读好内容,也有用户吐槽新版的界面和广告方向导致体验变差。还有人希望 Mazilla 能回归聚焦浏览器本身,而不是不断尝试新业务再草草收藏。

美国国土安全部宣布,哈佛大学失去了招收国际学生的资格,现有的国际学生也需要尽快转学,否则将失去合法身份。该决定影响了哈佛大约四分之一的学生,直接威胁到美国最富有、历史最悠久高校的重要资金来源。

此前 哈佛与联邦政府就课程 招生和雇佣政策等问题有过多次博弈 这一决定被认为是特朗普政府对高等教育体制进行干预 推动政策立场的重大升级

外界预计哈佛方面将会再次向法院提出法律挑战评论区有网友感叹政府此举是用行政手段直接针对高校也有人担忧如果哈佛都能被这样对待其他大学将更难保护自身利益还有网友指出社会氛围的变化让越来越多的人支持类似的极端决策

微软宣布推出适用于 VS Code 的全新 PostgreSQL 扩展目前已进入公开预览阶段这款扩展专为开发和管理 PostgreSQL 数据库设计开发者可以在 VS Code 内直接完成数据库对象管理智能 SQL 查询编辑以及借助集成的 IntelliSense 和 @PGSQL GitHub Copilot Agent 获得 AI 辅助无需切换编辑器

新功能包括右键即可可视化数据库结构自然语言与数据库交互用 AI 优化查询和表结构实时代码建议等还集成了 Enter ID 认证与 Azure Database for PostgreSQL 无论本地还是云数据库都可便捷连接和统一身份管理除了支持多种连接配置和历史查询记录扩展还具备数据库对象浏览和一键创建修改表函数方案等 Sequel 编辑具备上下文感知的自动补全和语法高亮

官方表示,VS Code 上的 PostgreSQL 扩展通过与 Copilot、Chat 相结合,让数据库开发和调试流程更顺畅,功能也超越了不少传统 PostgreSQL 工具,安装简单,适合企业和个人场景。评论区有用户表示这个工具有望定为开发数据库的新标准,也有用户提到相比 JetBrains、PG Admin 等,VS Code 的组合越来越强大,部分用户也期待未来能对 SQLite 等数据库有类似支持。

一位作者在自己的博客中分享了多年来一直挂在墙上的分形画作这幅画最初是他在中学时期通过重复拼接和旋转方块手绘出来的后来随着数学知识的积累他尝试用更严谨的方法去分析这种图案的生成方式他称之为 Wallflower 并展示了如何通过地规的复制中心方块并以特定角度排列来构建整个分形用 L-System 这种地规替换规则也可以绘制出类似的形状

作者还深入探讨了分形与数字系统、线性代数和高维空间的联系,比如通过特定矩阵地规的扩展方块,使得分形在每一轮地规时都有秩序地铺满平面。文章还延伸到了在三维和四维空间中复制分形的尝试,展示了不同维度下图案的变化和数学上的难题。

最后作者总结说这段跨越多年穿插着初心和求知的旅程不仅勾起了自己对数学和编程的热情也希望鼓励大家把曾经的灵感和尝试坚持和探究下去评论区里很多网友表示对博主的用心和细致过程由衷佩服有人提出了用 L-system 自动生成图案的方法也有人被地归和分形的美巧思深深吸引还有网友实际演算并验证了文中介绍的数字系统确实能精确定位分形中的每一个方块

一篇名为《Find Your People》的演讲通过地铁的比喻,讲述了人生在上学阶段,像是在固定的轨道上不断前进,但是步入社会以后,这条轨道会突然停止,没有下一站等着你,也没人会替你安排好未来的路线。作者结合自身毕业后的迷茫经历,强调勇于尝试,主动寻找志同道合的,属于你的人,非常重要。

他提出面对人生的众多选择可以通过与不同的人交流发现那些让你觉得有趣的群体和事物进而明确自己的方向如果发现现在身边的人和环境让你不开心也要有勇气换一个圈子与此同时他提醒想要制定更有野心的计划去做不同寻常的事情就一定要学会面对拒绝和质疑不要在意别人的负面看法只要坚持自己的选择能力是可以通过后天锻炼出来的

评论区有网友认为这个比喻对刚从大学走出来的人非常有共鸣,也有人提到,和优秀的人交流会让自己提升对未来的预期,激励你走出舒适区。还有人引用 Steve Jobs 的话,鼓励大家相信自己可以改变人生,不需要被别人设定的规则束缚。Flatpak 作为一种 Linux 桌面应用分发格式,近几年在开发者和用户中都很受欢迎,很多新应用都选择通过 FlatHub 平台发布,Fedora 等主流发行版也在支持 Flatpak。

不过,项目核心开发者的流失导致 Flatpak 目前主要以日常维护和安全补丁为主,大的功能创新,进展缓慢。社区里提交的很多新特性和改进合并请求,长时间没有人负责审核,开发动力明显不足。比如有开发者提出更细腻度的设备全线管理,希望新版 Flatpak 能让应用值访问输入设备或扬声器,但实际因为不同发行版自带的 Flatpak 版本较老,导致这些新特性难以普及。

此外,音频权限也受到不少吐槽,例如 Flatpak 至今采用 PoseAudio,即便系统已切换到 Pipewire,可音频访问权限依然只能同时管控麦克风和扬声器,无法拆分管理,这类设计让不少对隐私比较敏感的用户觉得比较担心。

为了改善开发和分发体验,Flatpak 也在探索采用 OC 容器标准来管理镜像和分发内容,但安全社区对 OC 格式的安全性提出了较多质疑,认为如果不能做到类似 DM Verity 这类内核级校验,难以满足对桌面软件的更高安全需求。

很多评论者表示,虽然 flatpack 带来了桌面应用分发的一次重大进步,但技术社区对镜像格式、权限控制和安全模型等问题还存有不少争议有人支持历史包管理方式,有人更看重软件生态和易用性也有网友补充,现在 flatpack 项目面临的最大挑战,其实是缺乏持续的资源投入和维护希望社区或者大公司能为它的下一步发展提供更多支持

关于地球上是否真的存在两侧朝西龙起这个问题,许多人小时候在教科书中看到过地球有两个高高的朝西龙起,一个面向月亮,另一个位于对面。然而实际情况比这个简单图示要复杂得多。虽然月亮的引力会让地球和海水变形成类似椭圆,两端有龙起,但由于海洋的深度,陆地的分布和地球自转等影响,海水表面并不会永远出现对称的两个高峰。

真实的海洋潮汐会受到地形和其他天体引力的共同作用不同地区的潮汐变化也差异很大比如新西兰附近的潮汐就会绕着岛屿逆时针流动有网友补充说潮汐预测曾经如此重要甚至在 19 世纪出现了专门基于负理液分析和谐波分析的机械计算机而像 Thomas Young 和 George Eri 这样的大物理学家都参与过潮汐计算

评论区还有人提到,虽然理想模型有助于初步理解,但现实中的潮汐园比较科书里的示意图复杂,所以用简化模型时要保持警觉。

开发者自己用 SwiftUI 从领写了一款本地 MP3 播放器,因为在 iPhone 上播放自己收藏的音乐依然很麻烦,不仅需要付费,还受制于各种限制。他在官方和第三方应用中尝试后发现,许多第三方播放器采用了订阅制,而苹果内置的音乐播放方式功能有限,难以满足他管理和同步本地音乐的需求。

于是,他决定自己动手做一个既支持 iCard 音乐导入和管理,也拥有本地优先的体验,并用 SQLite 实现了快速的全文搜索和歌单管理。技术选型上,他从 React Native 转向原生 SwiftUI,以获得更好的 iCard 文件控制权限和性能表现,并充分利用 Swift 现代的 Async,Awake 并发处理和 Actor's 逻辑分层,最终实现了搜索、同步、对列和播放控制等完整功能。

不过,开发过程中也碰到了不少困扰,比如 Apple 的 SDK 文档不全,开发者工具体验比不上 Flutter,同时 iOS 对自定义应用的安装依然有严格限制,比如为付费开发者自编应用只能运行 7 天,App Store 之外的分发方式也不完全开放。

评论区不少网友感同身受,认为本地音乐管理需求一直存在,市面现有的应用体验普遍不理想,有人怀念 iPad Shuffle 这样的专注音乐硬件,也有人自己写播放器当作兴趣项目,还有人提到苹果对开发者的各种上架和使用门槛其实是出于商业利益,而这恰恰令人遗憾。

Ruby 3.5 带来了对象分配速度的大幅提升无论是位置参数还是关键字参数相比上一版本 Ruby 3.4.2 都能实现 1.8 倍到 6.5 倍的加速开启 YJIT 后关键字参数性能提升最为明显这一变化主要得益于 Ruby 虚拟机底层的优化尤其是内连了 classing 号弄方法让对象分配时减少了参数拷贝和函数调用带来的开销同时极大提升了内连缓存的命中率

测试数据显示,新旧版本无论在参数数量多少上的性能都全面超越,尤其对依赖大量对象实力创建的场景极为有利,不过这种优化也带来了少量内存开销和部分调用站信息变化。有开发者评论,Ruby 仍然在不断变好,非常适合新项目,也有人关心这种加速是否会直接影响 Rails 或 Active Record 的性能表现。

还有人提到 Ruby 对分配优化的思考其实也是目前各类语言不断向更加高效虚拟机模型演进的一个缩影感谢您的收听这就是今天的黑客新闻中文日报希望这些最新最热的科技资讯能够激发您的灵感也为您把握未来趋势提供帮助如果喜欢我们的节目欢迎订阅与转发让更多朋友一同加入科技讨论祝您度过愉快的一天我们下期节目再见