OpenAI 内部是怎么用 Codex 的？Codex 已经在 OpenAI

OpenAI 内部是怎么用 Codex 的？

Codex 已经在 OpenAI 多个技术团队中被日常使用，包括安全、产品工程、前端、API、基础设施和性能工程团队。团队用它来加快各类工程任务，从理解复杂系统、重构大型代码库，到在紧迫的截止时间下上线新功能和处理故障。

常见使用场景：- 理解代码- 重构与迁移- 性能优化- 提高测试覆盖率- 提升开发速度- 保持工作连续性- 探索与构思

最佳实践：

- 先用 Ask 模式起步

面对较大的改动，先让 Codex 用 Ask 模式给出一份实现计划，再把这份计划当作后续执行的输入。这个两步法能让它更稳，也更不容易出错。

目前它更适合边界清楚、规模适中的任务。一个经验标准是：这件事如果交给你或同事，大概一小时能完成，或者实现量在几百行代码左右，通常比较合适。模型变强后，它能接住的任务规模也会继续扩大。

-迭代改进工作环境

给 Codex 配好启动脚本、环境变量和联网能力，能明显降低出错率。随着任务推进，可以留意哪些构建错误其实是环境配置问题，再逐步修正。虽然前面可能要试几轮，但长期收益会很大。

- 把提示写得像任务单

如果提示词长得更像一条 GitHub issue 或一次 PR 说明，Codex 的表现通常会更好。也就是把文件路径、组件名、改动差异和相关文档片段都写进去。

像“按模块 X 的方式实现这部分”这样的提示，会让结果更稳定。

- 把任务队列当轻量待办

顺手把旁支想法、半成品工作和零碎修复都丢进任务队列里，不必要求一次就生成完整 PR。Codex 很适合当成一个中间缓冲区，等你重新回到专注状态时再继续处理。

- 用 AGENTS.md 提供持续上下文

在仓库里维护一份 AGENTS.md，能让 Codex 在多轮提示之间表现得更稳定。里面通常会写命名约定、业务逻辑、已知怪癖，或是那些光看代码很难推断出来的依赖关系。

原文建议在文档里进一步说明怎样组织这份文件。

- 用 Best of N 提高结果质量

Best of N 功能允许你为同一个任务同时生成多个版本，快速比较不同思路，再挑出最好的方案。面对更复杂的问题时，也可以把几个版本里最好的部分拼起来，得到更强的最终结果。

链接：cdn.openai.com/pdf/6a2631dc-783e-479b-b1a4-af0cfbd38630/how-openai-uses-codex.pdf

泡泡资讯网