泡泡资讯网

OpenAI高管离职背后的信号:AI主线任务已经清晰

昨天,OpenAI一口气砍掉三个项目、三位高管同日离职,转头却往一个方向疯狂砸钱——这个反常信号,你看懂了吗?先说一个听

昨天,OpenAI一口气砍掉三个项目、三位高管同日离职,转头却往一个方向疯狂砸钱——这个反常信号,你看懂了吗?

先说一个听起来有点矛盾的消息:2026年4月17日,OpenAI两位核心高管同日宣布离职。一位是原首席产品官凯文·威尔,他牵头打造的“OpenAI for Science”科研AI平台被并入Codex团队;另一位是Sora项目的核心研究员比尔·皮布尔斯,他负责的AI视频生成产品已在三月被正式关停。同一天,企业级应用CTO斯里尼瓦斯·纳拉亚南也宣布离开。

三个人,同一天,全走了。

但诡异的是——就在同一天,OpenAI却发布了Codex自推出以来最激进的一次升级:新增Mac桌面应用操作能力,让AI可以在后台“使用电脑上的所有应用”,模拟点击、输入文字、多代理并行工作,甚至能自己安排未来任务、在几天后自动唤醒执行。新增111个插件、内置浏览器、图像生成能力,配套推出按需付费方案,明显瞄准企业市场。

一边在大刀阔斧地“砍”——砍Sora、砍OpenAI for Science、砍Prism科研平台;一边在疯狂地“建”——建桌面代理、建插件生态、建超级应用。

你可能会问:这不矛盾吗?

说真的,这正是2026年AI领域最值得关注的一个信号——OpenAI在“做减法”的同时“做加法”,本质上是在告诉市场一件事:AI的“主线任务”已经清晰了,不再是遍地开花搞探索,而是把所有资源砸向一个方向——让AI真正“动起来”。

而Codex这次更新的核心,正是这条主线的一个关键转折点:AI不再只是“帮你写代码”,开始“替你操作电脑”。

一、从“代码补全”到“桌面操作”——AI代理正在拿到你的鼠标

说实话,我刚看到Codex这次更新的时候,脑子里冒出的第一反应是:这不就是Claude Code上个月做的事吗?

但仔细看完公告后,我发现事情没那么简单。

Codex这次新增的桌面代理能力,核心是几个动作:第一,它拥有了独立的系统光标,可以查看屏幕内容、识别界面元素、点击按钮、输入文字,直接操作桌面应用完成任务。第二,它支持多代理并行——你可以同时部署多个Codex代理,一个在帮你跑测试,一个在改前端界面,一个在操作Figma,而你自己还在正常写文档、回邮件,互不干扰。第三,它有了“记忆”能力——能保存你的偏好设置、记住重复性工作流,下次直接复用,甚至能根据你的历史记录主动提出工作建议。

用大白话说就是:Codex现在像个“看不见的实习生”——你给它一个任务,它自己在后台搞定,完了告诉你“做好了”,你接着干自己的事就行。

而这个能力的意义,不只是“功能变多了”那么简单。它意味着AI代理正在跨越一个关键的边界:从“只能调用API”到“能操作任何有图形界面的软件”。

你想,过去AI要跟某个软件交互,必须通过API——那个软件得专门留一个“接口”给AI调用。但现实是,大量的桌面软件、企业内部工具、老旧系统根本就没有API。Codex这次的桌面代理方案,绕过了这个限制——它不需要API,它像人一样看屏幕、点鼠标、敲键盘。这意味着它的适用范围一下子从“有API的软件”扩展到了“所有你电脑上能打开的软件”。

当然,这件事Anthropic其实更早就开始做了。他们的Claude Code已经在桌面操控这条路上跑了一段时间,在Hacker News上引发了大量讨论。有开发者评价说,这标志着AI编程代理“进入了桌面时代——模糊了‘助手’和‘同事’的边界”。不过社区里也有清醒的声音,有人指出截图驱动的方式延迟较高,做不了快速交互的任务。

话说回来,OpenAI这波不算先发,但它有自己的打法:111个插件的生态组合拳、按量付费的灵活定价、以及跟ChatGPT、Atlas浏览器整合成“超级应用”的远期蓝图。TechCrunch的标题写得很直接——“OpenAI takes aim at Anthropic”。

再看一组数据:Codex企业用户自2026年1月以来增长了6倍,而且——近一半的Codex使用已经涉及非编码任务。这说明什么?说明用户自己已经用脚投票了,大家发现AI代理的用途远不止写代码,而是任何需要操作电脑完成的工作。

你想想看,这是不是一个很微妙的变化?AI代理正在从“程序员专属工具”变成“任何用电脑工作的人都能用的助手”。

二、你不再需要“写代码”,你只需要“说清楚你要什么”

如果桌面操作是AI代理的“手”,那理解人类意图就是它的“脑”。而说到“理解意图”,2025年初出现的一个词,现在已经成了AI编程领域的热门概念——“Vibe Coding”。

这个词是OpenAI联合创始人、知名计算机科学家Andrej Karpathy在2025年2月2日的一条推文里提出来的。他描述了一种全新的编程体验:“有一种新的编码方式,我叫它‘vibe coding’,你几乎忘了代码本身的存在……我几乎不碰键盘……所有改动我都点‘全部接受’,我甚至不看代码差异了。遇到错误我就把报错信息复制粘贴进去,不加任何说明,通常就能解决。”

你听听这段话——“忘了代码的存在”。这句话要是放在三年前,任何一个程序员都会觉得你在开玩笑。但今天,它正在变成越来越多开发者的日常。

Karpathy后来还在实践中进一步验证了这个理念。他开发的autoresearch开源框架,正是基于“氛围编程”的思路——开发者通过自然语言描述研究意图,让AI自主规划、执行和迭代。这个框架已经在社区中被实际运行测试,验证了“氛围编程”在科研场景中的可行性。

那什么是“旧范式”?旧范式是你必须精确指定每一个实现细节——数据结构怎么设计、算法逻辑怎么写、变量怎么命名、边界条件怎么处理、错误怎么捕获,一个都不能漏。你用键盘一行一行敲,IDE给你自动补全,但“思考”的活儿全是你在干。

而新范式是什么?是你用自然语言描述你的意图——“我想做一个能自动整理收件箱的工具,重要的邮件标红旗,不重要的归档”,然后AI去理解你的“氛围”,帮你生成方案、实现代码、测试、调试,甚至在你没意识到的情况下修复潜在问题。你不再是一个“打字员”,更像一个“创意总监”或者“产品经理”。

剑桥大学和微软研究院联合发表的一篇学术论文对这个现象做了系统研究。他们发现,“氛围编程”的核心不是消除对编程能力的需求,而是重新分配了这种需求——从“写代码”转移到“管理上下文、快速评估代码质量、决定什么时候让AI做、什么时候自己上手”。换句话说,能力要求变了,但不是消失了。

而这个“理解意图+自主执行”的能力,在Claude Opus 4.7身上体现得更加明显。4月16日发布的这个模型,Anthropic在公告里直接说了句大实话:“这并非我们最强大的模型”。真正更强的那个Claude Mythos Preview还没全面放开。

但4.7解决了一个更重要的问题——靠谱。在衡量真实世界软件工程问题的SWE-bench Pro测试中,它的任务解决率从上一代的53.4%跃升至64.3%,单代涨幅近11个百分点。在号称最难的通用测试Humanity‘s Last Exam上,它在无工具辅助下获得了46.9%的分数,超过了GPT-5.4 Pro和Gemini 3.1 Pro。

更值得玩味的是它的行为模式。Replit负责人在测试后给的反馈是:“它会在技术讨论中反驳我,帮我做出更好的决定,真的像一个更好的同事”。Notion团队则发现了一个新行为:4.7在动手写系统级代码之前,会先自己做数学证明,验证方案的可行性。

你发现没有?AI不再只是“你说什么我做什么”,而是开始有自己的判断,甚至能跟你“讨论”、反驳你。这才是“从工具到同事”的真正含义。

那AI代理的底层到底是怎么工作的?一篇发表在arXiv上的研究论文对Claude Code的架构做了系统分析,揭示了很有意思的一点:AI编程代理的核心架构,竟然是一个简单的while循环——调用模型、运行工具、重复。真正复杂的工程挑战不在这个循环本身,而在外围系统:一个七种模式的权限系统、一个五层的上下文压缩管线、四种扩展机制、子代理委托机制、基于机器学习的操作分类器。

这个发现其实挺反直觉的。它告诉我们:AI代理的核心不是“模型有多聪明”,而是“工程系统有多可靠”。模型负责理解意图和做决策,工程系统负责确保这些决策在真实环境中被安全、可靠地执行。这套架构的设计目的很明确——让AI能够“自主完成任务”,而不是每一步都需要人盯着。

所以你看,从“写代码”到“说需求”,从“被动响应”到“主动执行”,这不是一个技术参数的微调,而是一次交互范式的根本性变化。当AI不再只是一个“工具”,而是一个能理解你的意图、主动帮你做事、甚至偶尔会跟你讨论的“数字同事”时,软件工程的定义本身就在被重写。

三、焦虑是真实的,但机会也是真实的——这可能是“编程”门槛最低的时代

聊到这儿,估计很多人心里都会冒出一个问题:那我会不会被替代?

这个问题一点都不矫情。说实话,如果你是一个每天跟代码打交道的人,看到这些消息心里不可能没有一点波动。

先看几个现实信号。Meta在2026年初进行了一轮AI驱动的大规模组织调整,公司从各业务线遴选核心工程师组建了“Applied AI”团队,推动AI智能体承担产品设计、功能验证及上线交付的关键环节,人类员工转向策略把关与质量监督。这不是一个孤立的案例,而是硅谷大厂正在发生的系统性转变。

OpenAI的动作更直接——Sora被关停时,外界估测其日均计算成本约为100万美元。当一项业务每天烧掉百万美元却无法带来清晰的商业化路径时,公司必须做选择。凯文·威尔在离职声明中写道:“加速科学进步,将是我们推动AGI进程中最令人惊叹的积极成果之一”——但即便他这样认为,团队还是被“去中心化”并入其他部门。比尔·皮布尔斯则在声明中表示,Sora是一个“唯有在OpenAI的土壤中才可能生根发芽的项目”。这些带着理想主义色彩的项目被砍,反映的是一个很现实的逻辑:资源必须聚焦到能快速产生商业价值的主线上。

但如果你就此得出结论“AI会淘汰程序员”,那就把问题看简单了。

HackerNoon的一篇分析文章里有一句话我很认同:“AI不会取代软件工程师,但有效使用AI编程代理的开发者将超越不使用的人。”这不是安慰人的漂亮话,而是正在发生的市场现实。

与此同时,Hacker News上也有开发者在冷静地指出:AI生成代码表现不稳定,依赖训练数据覆盖度,存在一定风险;AI工具对简单CRUD应用表现较好,但在复杂或非典型任务中表现参差。Reddit的ClaudeAI社区里,开发者们讨论更多的是Opus 4.7的新分词器带来的“隐形涨价”——同样的文本现在产生比原来多1到1.35倍的Token,实际使用成本在上升。这些讨论提醒我们,AI编程代理远未达到“开箱即用、完美无缺”的状态。

换个角度看,这次范式转变带来的真正机会,是把程序员从“执行者”升级为“架构师”,从“写代码”升级为“定义问题”。当AI能帮你搞定大量重复性的编码工作时,你省出来的时间可以用来思考更重要的事情:这个产品到底要解决什么问题?用户的核心痛点是什么?系统架构怎么设计才能既满足当前需求又具备长期扩展性?

这些才是AI短期内无法替代的东西——因为AI擅长在既有框架内求解,但不擅长定义“什么问题是值得求解的”。

再往大了看。OpenAI的周活跃用户已经突破9亿,个人订阅用户超过5000万。Codex的周活跃用户增至160万,较年初增长超过两倍。这些数字意味着什么?意味着AI工具正在从专业开发者群体走向普通人。“Vibe Coding”的核心——用自然语言描述意图、让AI替你实现——正在消解“编程”的专业壁垒。过去“编程”是一项需要多年学习才能掌握的技能,今天它越来越像一种“沟通能力”:你能不能说清楚你要什么,比你会不会写代码更重要。

所以,与其问“我会不会被替代”,不如问自己另一个问题:当AI能替你完成越来越多的工作时,你的独特价值是什么?

这可能不是一个有标准答案的问题。但有一点是确定的:在这个范式转变的时代,最危险的不是“不会用AI的人”,而是“拒绝理解AI正在改变什么的人”。

四、当每个人都有一个“数字同事”,人的价值锚点在哪里?

回到开头那个“砍与建”的矛盾,现在我们能看懂了:OpenAI不是在乱砍乱建,而是在做一道减法题——减去“支线任务”,把全部弹药砸向“主线任务”。

这条主线是什么?就是让AI从“能说会道”走向“能做会干”。

Codex桌面代理的发布、Claude Opus 4.7的迭代、Anthropic和OpenAI在桌面操控能力上的军备竞赛,都指向同一个方向:AI正在从一个“信息助手”进化为一个“行动代理”。它不再只是给你答案、帮你写代码,而是能像你一样操作电脑、完成任务、推进项目。2026年,我们很可能正在见证这个转折点的到来。

但这个转折也引出了一个更深的问题——如果AI能替你完成工作,那你的价值到底在哪里?

是定义问题的能力吗?AI虽然能求解,但不知道什么问题是值得解的。

是判断什么值得做的眼光吗?AI能高效执行,但不知道哪条路是“对”的。

还是那些AI永远无法真正理解的东西——人与人之间的信任、情感连接、同理心、创造力的原始冲动?

这些问题,没有一个有标准答案。但也许正是因为没有标准答案,它们才值得我们在接下来的日子里反复思考。

你觉得自己工作中最不会被AI替代的部分是什么?是那个“说不清但就是感觉不对”的直觉,还是跟同事吵架吵出来的灵感?欢迎在评论区聊聊你的看法。

如果这篇文章让你对AI正在发生的变化有了新的理解,不妨点个赞、转发给也在关注这个领域的朋友。关注我,每周用大白话拆解AI圈最重要的事,不贩卖焦虑,也不打鸡血,只说实话。