同一天里，Anthropic、OpenAI、Qwen 分别用最强闭源模型、平台级编码代理、开源本地 MoE 模型，把 AI 编程的三条路线同时摊到台面上。

别再比谁更会写代码了：Anthropic、OpenAI、Qwen 在抢你未来三年的饭碗分工

故事是这样的。

昨天晚上，一个做开发的朋友给我发消息。

他说，我刚续完 Cursor Pro，今天醒来发现 Claude 出了新模型、OpenAI 发了新 Codex、Qwen 又放了一个笔记本都能跑的编码模型。

我这钱是不是白花了？

我回他说，你现在最不该想的，已经不是“买贵了没有”。

而是另一件更麻烦的事：

这不是三家模型同日更新，而是三种开发者命运同时开价：更强单兵、更深平台、还是更可控的本地路线。

换句话说。

昨天你还在比模型。

今天这三家公司已经开始抢你未来三年的饭碗分工了。

这才是这场“AI 三国杀”真正该看的地方。

先别急着站队，先看清三家到底在卖什么

Anthropic 卖的，不是更强模型，是“更贵的单兵”

Claude Opus 4.7 的升级方向很明确：不是更快，而是更稳。

Anthropic 给出的重点不是“回复更顺滑”这种感受词，而是更适合长任务——那种“给你一个需求，你自己拆解、自己写、自己测、自己修”的复杂流程。

公开材料里，CursorBench 从 58% 提升到 70%，一个 93 题的编码测试里完成率提升了 13%；Notion 的复杂多步工作流场景提升了 14%；工具调用错误降到之前的三分之一。

说人话就是：

Anthropic 不想卖你一个更聪明的补全工具。

它想卖你一个“可以独立干活的高级工程师”。

这个赌注很狠。

因为它对应的不是“团队效率提升一点点”，而是另一个判断：

以后最值钱的人，可能不是最会配合流程的人，而是最能借助 agent 一个人吞下整段流程的人。

但这个方向还有一层更现实的含义。

如果一个人能吞下更多流程，那公司会怎么想？

很简单。

它会开始重新定义一个工程师值多少钱。

不是因为你不会写代码了。

而是因为平台会逼你证明：既然 agent 都能做这么多，你为什么还值这份薪水？

所以 Anthropic 这条路，卖给你的不是单纯的能力上限。

它卖给你的，其实是一个更残酷的职业要求：

以后你要么成为能放大 agent 的超级个体，要么就会被当成“没放大好的普通人”。

OpenAI 卖的，不是编码能力，是“平台工种”

OpenAI 这次给的名字就很直接：Codex for Almost Everything。

重点已经不是“帮你补一段代码”，而是“帮你接住一段任务”。

你把需求扔进去，它在 sandbox 里读文件、改代码、跑任务、回收结果。

这和传统 IDE 辅助的差别很大。

以前的 AI 更像坐在你旁边的助手。

现在的 Codex 更像一个被你丢进工位的执行者。

更关键的是，任务历史、运行环境和结果回收都发生在同一个平台里。

这意味着，锁住你的就不只是模型效果了。

而是整条开发流程。

这也是为什么我觉得 OpenAI 这次真正想争的，不是“谁更会写代码”。

而是谁来定义下一代软件开发的默认入口。

Latent.Space 当天那篇《RIP Pull Requests》说得很直接：当 AI agent 能持续写代码、自动跑 CI、自己修 bug、跨 sandbox 执行任务时，Pull Request 这个存在了 20 年的协作单元，可能正在过时。

你可以不同意这个结论。

但你不能忽视它背后的方向：

竞争焦点正在从“谁更会写”转向“谁来承接任务、环境和结果”。

而一旦平台同时承接任务入口、执行环境和结果回收，开发者的角色也会跟着变。

你不再只是工程师。

你会越来越像一个平台上的任务编排者、结果审计员、流程运营者。

这条路最可怕的地方不是效率高。

而是你会慢慢接受自己变成一种新的平台工种。

Qwen 卖的，不是便宜一点，是“别把控制权全交出去”

Qwen3.6-35B-A3B 的卖点不是一句“更强”。

而是一个很具体的事实：35B 参数，只激活约 3B。

意味着一台普通笔记本就能跑。

不需要 API key。

不需要付费订阅。

也不需要把代码传到别人的服务器上。

这条路最打人的地方，不是性能参数本身。

而是它给人的心理暗示：

原来顶级编码能力，不一定非得通过云端订阅才能拿到。

Simon Willison 做了一个很有传播力的测试：让 Qwen3.6 和 Claude Opus 4.7 各画一只骑自行车的鹈鹕 SVG，本地量化版的 Qwen 画得更好。

这个测试当然不严肃。

但它传递了一个更重要的信号：

开源本地模型第一次在公众感知上，显得没有那么输闭源顶级模型了。

这会改变很多开发者的预期。

过去大家默认“要最强能力，就必须把数据和工作流交出去”。

现在这个默认前提，开始被动摇了。

当然，本地路线不是浪漫主义。

它也有代价。

你拿回了控制权，也拿回了配置、维护、调优和兼容问题。

所以 Qwen 真正卖的，不是“更省钱”。

而是另一种职业姿态：

我宁可更累一点，也不把全部控制权交出去。

真正的战场，不在模型，而在你以后会变成哪种开发者

如果你只看到“三个模型谁更强”，你会错过更大的变化。

这三家公司争的根本不是同一层东西。

Anthropic 赌的是“超级个体”。

OpenAI 赌的是“平台入口”。

Qwen 赌的是“本地主权”。

表面看，三家都在做 AI 编程。

本质上，三家是在给开发者未来三年的组织位置开价。

第一种未来里，你会变成更贵的单兵工程师。

第二种未来里，你会变成平台里的新工种。

第三种未来里，你会变成更辛苦但更独立的本地派。

所以这不是一次普通的模型更新。

这是三种开发范式的正面交锋。

也是三种职业命运的正面交锋。

为什么这件事会让很多人不舒服

因为它逼你承认一件事：

你现在选的，已经不只是工具。

你选的是自己未来三年的工作方式、议价权和产能归属。

你是想成为一个越来越能独立吞下整段流程的人？

还是想成为一个深度依赖平台、但效率极高的团队成员？

还是想保住控制权，哪怕自己承担更多配置、维护和调参成本？

这三条路没有绝对高下。

但它们的代价完全不同。

Anthropic 这条路的代价，是你会越来越被要求“一个人顶更多人”。

OpenAI 这条路的代价，是你会越来越被平台锁进默认工作流，最后连经验都沉淀在平台里。

Qwen 这条路的代价，是你拿回了控制权，也拿回了运维、调优和兼容问题。

所以开发者到底该怎么选

我觉得先别问“哪家最强”。

先问三个更现实的问题。

1. 你的代码和数据，能不能离开自己的机器？

如果不能，那其实没什么好讨论的。

本地路线就是优先项。

2. 你想要的是更高上限，还是更稳的组织位置？

如果你是一个人或很小的团队，更强的单兵能力往往更值钱。

如果你是多人协作团队，平台化工作流可能更重要。

3. 你最怕的是什么：落后，还是被锁？

怕落后，就会更愿意追最强闭源能力。

怕被锁，就会更愿意为本地和开源付维护成本。

这三个问题，比 benchmark 更接近现实。

因为最后真正决定你选谁的，从来都不是宣传页上一行分数。

而是你的项目、你的团队、你的风险偏好。

<figure><img src=“images/three-routes.png” alt=“three-routes” /><figcaption>Anthropic、OpenAI、Qwen 看似都在做 AI 编程，实际上分别押注的是超级个体、平台入口和本地主权三种未来。</figcaption></figure>

<figure><img src=“images/decision-matrix.png” alt=“decision-matrix” /><figcaption>别再只比模型强弱了。真正该比的是：你的数据放哪、流程放哪、控制权留在哪。</figcaption></figure>

我最后的判断

回到开头那个朋友的问题。

Cursor Pro 的钱白花了吗？

没有。

但他真正该想的，已经不是“这周谁又强了 5 分”。

而是“我未来三年，准备把哪一段工作流、哪部分控制权、哪份职业筹码先交出去”。

因为从这一天开始，AI 编程已经不是一个“模型比较题”了。

它变成了一道更现实的题：

你不是在选模型。你是在选未来自己是单兵、平台工种，还是本地独立派。

未来被淘汰的，未必是不会写代码的人。