People
Topics
我介绍了OpenAI新推出的Codex模型,它专为开发者设计,并可能对数十亿美元的收购产生重大影响。Codex的成功与否将决定OpenAI是否能成为AI领域的领导者。AI Box Playground允许用户以每月20美元的价格试用各种顶级AI模型,支持在同一聊天中与不同模型进行交流,并可以重新运行聊天以使用不同的模型。它提供了一个便捷的平台,可以在一个地方测试和使用所有AI模型,无需订阅多个服务。 OpenAI推出了名为Codex的软件工程代理,可以在云端运行,执行编写新功能或修复错误等任务。Codex旨在与Claude Code竞争,后者在设计方面表现出色,能够根据应用的整体设计风格进行调整。Codex将首先向Pro Enterprise和Teams用户开放,然后逐渐向所有用户开放。Codex由Codex One驱动,Codex One是为软件工程优化的OpenAI 03版本,经过强化学习训练,可以生成模仿人类风格的代码。用户可以通过ChatGPT侧边栏访问Codex,并通过输入提示和点击代码来分配新的编码任务。Codex可以在独立的隔离环境中处理任务,可以读取和编辑文件,以及运行命令,包括测试工具。Codex完成任务通常需要1到30分钟,但这仍然比使用人工更快。Codex在完成任务后,会将更改提交到环境中,并提供可验证的证据,以便用户追踪每一步。用户可以配置Codex环境,使其尽可能接近真实的开发环境。目前只有付费200美元的Pro版本ChatGPT用户才能使用Codex。通过ChatGPT,用户可以要求Codex编写Python脚本或将JavaScript函数转换为TypeScript。Codex可以生成代码,但可能因为缺少必要的库而导致代码崩溃。对于非技术人员来说,使用这些编码工具仍然需要一定的技术知识和学习。虽然编码工具对开发者很有帮助,但OpenAI尚未实现完全的无代码化,用户仍然需要一定的编程知识。 Codex可以由agents.md文件引导,这些文件可以告知Codex如何浏览代码库以及运行哪些命令进行测试。像人类开发者一样,Codex代理在配置好的开发环境、可靠的测试设置和清晰的文档中表现最佳。Codex One在SWE(软件开发工程师)编码基准测试中表现出色,甚至优于O3 High。Codex One优于O3 High,但优势并不显著,集成代理等功能非常重要。OpenAI的目标是建立安全和值得信赖的智能代理。Codex目前是研究预览版,这意味着它尚未完全发布,可能存在一些未知的错误或问题。OpenAI在设计Codex时优先考虑安全性和透明度,以便用户可以验证其输出。OpenAI训练Codex的主要目标是使其输出与人类的编码偏好和标准紧密对齐。OpenAI还有一个关于如何防止滥用Codex的部分,但考虑到Llama等开源模型的存在,这方面的担忧可能较小。Codex代理在云端的安全隔离容器中运行,禁用互联网访问,以防止代码泄露。禁用互联网访问是为了提高安全性,防止恶意网站窃取代码库。一些公司正在探索如何使用Codex,例如Temporal、Cisco和Superhuman。OpenAI还发布了Codex CLI,这是一个轻量级的开源编码代理,可以在终端中运行。Codex是建立在其他模型之上的微调模型。使用Codex Mini latest模型的开发者,输入token的价格为每百万1.5美元,输出token的价格为每百万6美元,并提供75%的prompt缓存折扣。OpenAI据称以30亿美元的价格收购了Windsurf,但Windsurf也宣布正在构建自己的AI模型,这使得收购是否会进行成为一个有趣的问题。

Deep Dive

Shownotes Transcript

OpenAI's new Codex model, its implications for developers, and the competitive landscape of AI coding tools.

- Try AI Box: ⁠⁠https://AIBox.ai/⁠⁠)

- AI Chat YouTube Channel: https://www.youtube.com/@JaedenSchafer)

Chapters

00:00 Introduction to Codex and Its Implications

01:51 AI Box Playground: A New Tool for Developers

02:20 Overview of Codex: Features and Capabilities

04:46 Codex vs. Competitors: A Comparative Analysis

08:50 Guiding Codex: The Role of Agent Files

11:08 Security and Transparency in Codex

13:24 Early Use Cases and Future Developments

15:19 OpenAI's Acquisition Strategy and Market Dynamics