主持人:Anthropic 推出了新一代 Cloud 4 模型,包括 Cloud Opus 4 和 Cloud Sonnet 4,它们在代码编写、复杂推理以及 AI Agents 等场景表现突出。OPUS 4 被认为是当前全球最强的代码模型,能够稳定处理长时间和高复杂度的任务,并胜任多轮迭代的 agent 工作流。Sanit 4 也是一次重要升级,编码和推理的精准度都得到提升,而且对指令的理解更加细致。新版 Cloud 在工具使用方面有了扩展,支持模型并行调用多种工具,同时在开发者允许访问本地文件时,模型的记忆能力也大幅增强。Cloud Code 正式上线,支持 VS Code、JetBrains 等主流开发工具,用户可以直接在编辑器里进行无缝协作,并利用 GitHub Actions 等集成实现自动化开发。新版 Cloud 带来了 API 能力升级,包括代码执行工具、MCP 连接器、文件 API 以及最大一小时的提示缓存。Opus 4 在代码质量、复杂项目管理、调试和长期任务表现都有显著提升,而 Sanus 4 则在日常开发和多功能 App 辅助开发方面表现优秀。这一代 Cloud 模型将模型思考过程的完整输出做了摘要处理,只在极少数情况下显示全部思考细节,部分深度用户对此表达了不满。Opus 4 和 Sanit 4 在多个行业基准测试中的表现已超过目前的主流竞品,尤其是在真实软件开发任务上的准确率和效率都处于领先。
Deep Dive