泡泡资讯网

AI编码代理战争升级:OpenAI Codex全面进化 本周AI技能工具领域最重

AI编码代理战争升级:OpenAI Codex全面进化
本周AI技能工具领域最重磅的事件,莫过于OpenAI Codex的Mac版重大更新。Codex正式上线了Computer Use功能,这意味着AI编码代理从"写代码的助手"进化成了"能操作电脑的数字员工"。新功能包括三个核心能力:其一,屏幕视觉交互——Codex能实时观察屏幕内容,识别按钮、输入框等界面元素,独立操控鼠标键盘完成操作,开发者可以直接命令它在桌面应用中完成测试、前端迭代等任务。其二,多智能体并行——多个Codex实例可在后台同时运行,一个负责调试、另一个处理界面设计,互不干扰。其三,记忆与长期任务——Codex能记住用户的偏好和技术栈偏好,支持跨数小时甚至数天的持续任务推进,即使中途暂停也能无缝恢复。同日发布的Appshots功能更进一步,Mac用户按下Command键即可截取当前窗口发送给Codex,省去手动贴图和反复描述界面问题的步骤。此外,OpenAI已将Codex接入ChatGPT移动端,开发者通勤途中也能通过手机远程监控编码进度、审批操作和下达指令。
Claude Code与Codex生态融合:跨平台协作成为新趋势
一个值得关注的趋势是,两大AI编码工具正在走向融合。OpenAI为Claude Code推出了官方插件codex-plugin-cc,让开发者可以在Claude Code的对话界面中直接调用Codex的能力。该插件提供三类核心功能:代码审查(用Codex审查未提交的代码改动)、对手挑战(让Codex从相反视角质疑设计决策)和任务委派(将调试、修复任务交给Codex后台执行)。这种跨平台协作模式背后反映的是行业共识——不同AI编码代理各有专长,互通优于割裂。与此同时,关于Claude Code与Codex的深度对比讨论也日趋热烈。技术分析指出的核心区别在于:Claude Code走"深度Agentic"路线,强调对代码库的全面理解和自主决策;Codex则强调"轻量Agent"和本地运行效率,最新版本迭代已达789个历史发布版本。GPT-5.6在Codex内部日志中被发现调用记录,预计6月正式发布,同步曝光的Codex Ultrafast Mode速度提升2至3倍,专为延迟敏感的Agent任务设计。
开源AI Agent双雄对决:OpenClaw与Hermes Agent
在开源个人AI Agent领域,OpenClaw与Hermes Agent的竞争持续升温。OpenClaw凭借"本地托管+聊天即执行"的模式已经积累了庞大的用户基础,其核心价值在于以大语言模型为大脑、以Skills插件生态为手脚,用户通过自然语言即可完成网页操作、邮件管理和文档处理等复杂任务。Hermes Agent作为后起之秀,则在三个月内迅速登顶社区热度榜单,其差异化优势包括自主学习优化、分层记忆系统和本地安全可控的部署方案。Hermes Agent的任务完成后会自动复盘并提炼可复用的技能,实现能力的自主迭代。阿里云已推出针对两者的部署方案,支持百炼Token Plan和主流AI工具兼容。此外,ClawPanel这样的可视化面板工具也已问世,支持双引擎统一管理,将Agent的配置难度进一步降低。开源社区围绕Agent工具的标准和互操作性展开的讨论,正在加速推动AI技能工具从"能用"走向"好用"的拐点。