← 随机比特 / 所有内容

同一天里,Anthropic、OpenAI、Qwen 分别用最强闭源模型、平台级编码代理、开源本地 MoE 模型,把 AI 编程的三条路线同时摊到台面上。

2026-04-17 · 随机比特

别再比谁更会写代码了:Anthropic、OpenAI、Qwen 在抢你未来三年的饭碗分工

故事是这样的。

昨天晚上,一个做开发的朋友给我发消息。

他说,我刚续完 Cursor Pro,今天醒来发现 Claude 出了新模型、OpenAI 发了新 Codex、Qwen 又放了一个笔记本都能跑的编码模型。

我这钱是不是白花了?

我回他说,你现在最不该想的,已经不是“买贵了没有”。

而是另一件更麻烦的事:

这不是三家模型同日更新,而是三种开发者命运同时开价:更强单兵、更深平台、还是更可控的本地路线。

换句话说。

昨天你还在比模型。

今天这三家公司已经开始抢你未来三年的饭碗分工了。

这才是这场“AI 三国杀”真正该看的地方。

先别急着站队,先看清三家到底在卖什么

Anthropic 卖的,不是更强模型,是“更贵的单兵”

Claude Opus 4.7 的升级方向很明确:不是更快,而是更稳。

Anthropic 给出的重点不是“回复更顺滑”这种感受词,而是更适合长任务——那种“给你一个需求,你自己拆解、自己写、自己测、自己修”的复杂流程。

公开材料里,CursorBench 从 58% 提升到 70%,一个 93 题的编码测试里完成率提升了 13%;Notion 的复杂多步工作流场景提升了 14%;工具调用错误降到之前的三分之一。

说人话就是:

Anthropic 不想卖你一个更聪明的补全工具。

它想卖你一个“可以独立干活的高级工程师”。

这个赌注很狠。

因为它对应的不是“团队效率提升一点点”,而是另一个判断:

以后最值钱的人,可能不是最会配合流程的人,而是最能借助 agent 一个人吞下整段流程的人。

但这个方向还有一层更现实的含义。

如果一个人能吞下更多流程,那公司会怎么想?

很简单。

它会开始重新定义一个工程师值多少钱。

不是因为你不会写代码了。

而是因为平台会逼你证明:既然 agent 都能做这么多,你为什么还值这份薪水?

所以 Anthropic 这条路,卖给你的不是单纯的能力上限。

它卖给你的,其实是一个更残酷的职业要求:

以后你要么成为能放大 agent 的超级个体,要么就会被当成“没放大好的普通人”。

OpenAI 卖的,不是编码能力,是“平台工种”

OpenAI 这次给的名字就很直接:Codex for Almost Everything。

重点已经不是“帮你补一段代码”,而是“帮你接住一段任务”。

你把需求扔进去,它在 sandbox 里读文件、改代码、跑任务、回收结果。

这和传统 IDE 辅助的差别很大。

以前的 AI 更像坐在你旁边的助手。

现在的 Codex 更像一个被你丢进工位的执行者。

更关键的是,任务历史、运行环境和结果回收都发生在同一个平台里。

这意味着,锁住你的就不只是模型效果了。

而是整条开发流程。

这也是为什么我觉得 OpenAI 这次真正想争的,不是“谁更会写代码”。

而是谁来定义下一代软件开发的默认入口。

Latent.Space 当天那篇《RIP Pull Requests》说得很直接:当 AI agent 能持续写代码、自动跑 CI、自己修 bug、跨 sandbox 执行任务时,Pull Request 这个存在了 20 年的协作单元,可能正在过时。

你可以不同意这个结论。

但你不能忽视它背后的方向:

竞争焦点正在从“谁更会写”转向“谁来承接任务、环境和结果”。

而一旦平台同时承接任务入口、执行环境和结果回收,开发者的角色也会跟着变。

你不再只是工程师。

你会越来越像一个平台上的任务编排者、结果审计员、流程运营者。

这条路最可怕的地方不是效率高。

而是你会慢慢接受自己变成一种新的平台工种。

Qwen 卖的,不是便宜一点,是“别把控制权全交出去”

Qwen3.6-35B-A3B 的卖点不是一句“更强”。

而是一个很具体的事实:35B 参数,只激活约 3B。

意味着一台普通笔记本就能跑。

不需要 API key。

不需要付费订阅。

也不需要把代码传到别人的服务器上。

这条路最打人的地方,不是性能参数本身。

而是它给人的心理暗示:

原来顶级编码能力,不一定非得通过云端订阅才能拿到。

Simon Willison 做了一个很有传播力的测试:让 Qwen3.6 和 Claude Opus 4.7 各画一只骑自行车的鹈鹕 SVG,本地量化版的 Qwen 画得更好。

这个测试当然不严肃。

但它传递了一个更重要的信号:

开源本地模型第一次在公众感知上,显得没有那么输闭源顶级模型了。

这会改变很多开发者的预期。

过去大家默认“要最强能力,就必须把数据和工作流交出去”。

现在这个默认前提,开始被动摇了。

当然,本地路线不是浪漫主义。

它也有代价。

你拿回了控制权,也拿回了配置、维护、调优和兼容问题。

所以 Qwen 真正卖的,不是“更省钱”。

而是另一种职业姿态:

我宁可更累一点,也不把全部控制权交出去。

真正的战场,不在模型,而在你以后会变成哪种开发者

如果你只看到“三个模型谁更强”,你会错过更大的变化。

这三家公司争的根本不是同一层东西。

Anthropic 赌的是“超级个体”。

OpenAI 赌的是“平台入口”。

Qwen 赌的是“本地主权”。

表面看,三家都在做 AI 编程。

本质上,三家是在给开发者未来三年的组织位置开价。

第一种未来里,你会变成更贵的单兵工程师。

第二种未来里,你会变成平台里的新工种。

第三种未来里,你会变成更辛苦但更独立的本地派。

所以这不是一次普通的模型更新。

这是三种开发范式的正面交锋。

也是三种职业命运的正面交锋。

为什么这件事会让很多人不舒服

因为它逼你承认一件事:

你现在选的,已经不只是工具。

你选的是自己未来三年的工作方式、议价权和产能归属。

你是想成为一个越来越能独立吞下整段流程的人?

还是想成为一个深度依赖平台、但效率极高的团队成员?

还是想保住控制权,哪怕自己承担更多配置、维护和调参成本?

这三条路没有绝对高下。

但它们的代价完全不同。

Anthropic 这条路的代价,是你会越来越被要求“一个人顶更多人”。

OpenAI 这条路的代价,是你会越来越被平台锁进默认工作流,最后连经验都沉淀在平台里。

Qwen 这条路的代价,是你拿回了控制权,也拿回了运维、调优和兼容问题。

所以开发者到底该怎么选

我觉得先别问“哪家最强”。

先问三个更现实的问题。

1. 你的代码和数据,能不能离开自己的机器?

如果不能,那其实没什么好讨论的。

本地路线就是优先项。

2. 你想要的是更高上限,还是更稳的组织位置?

如果你是一个人或很小的团队,更强的单兵能力往往更值钱。

如果你是多人协作团队,平台化工作流可能更重要。

3. 你最怕的是什么:落后,还是被锁?

怕落后,就会更愿意追最强闭源能力。

怕被锁,就会更愿意为本地和开源付维护成本。

这三个问题,比 benchmark 更接近现实。

因为最后真正决定你选谁的,从来都不是宣传页上一行分数。

而是你的项目、你的团队、你的风险偏好。

<figure><img src=“images/three-routes.png” alt=“three-routes” /><figcaption>Anthropic、OpenAI、Qwen 看似都在做 AI 编程,实际上分别押注的是超级个体、平台入口和本地主权三种未来。</figcaption></figure>

<figure><img src=“images/decision-matrix.png” alt=“decision-matrix” /><figcaption>别再只比模型强弱了。真正该比的是:你的数据放哪、流程放哪、控制权留在哪。</figcaption></figure>

我最后的判断

回到开头那个朋友的问题。

Cursor Pro 的钱白花了吗?

没有。

但他真正该想的,已经不是“这周谁又强了 5 分”。

而是“我未来三年,准备把哪一段工作流、哪部分控制权、哪份职业筹码先交出去”。

因为从这一天开始,AI 编程已经不是一个“模型比较题”了。

它变成了一道更现实的题:

你不是在选模型。你是在选未来自己是单兵、平台工种,还是本地独立派。

未来被淘汰的,未必是不会写代码的人。

而是还没想清楚自己准备把哪段工作流、哪部分控制权、哪份职业筹码先交出去的人。