别再比谁更会写代码了:Anthropic、OpenAI、Qwen 在抢你未来三年的饭碗分工
故事是这样的。
昨天晚上,一个做开发的朋友给我发消息。
他说,我刚续完 Cursor Pro,今天醒来发现 Claude 出了新模型、OpenAI 发了新 Codex、Qwen 又放了一个笔记本都能跑的编码模型。
我这钱是不是白花了?
我回他说,你现在最不该想的,已经不是“买贵了没有”。
而是另一件更麻烦的事:
这不是三家模型同日更新,而是三种开发者命运同时开价:更强单兵、更深平台、还是更可控的本地路线。
换句话说。
昨天你还在比模型。
今天这三家公司已经开始抢你未来三年的饭碗分工了。
这才是这场“AI 三国杀”真正该看的地方。
先别急着站队,先看清三家到底在卖什么
Anthropic 卖的,不是更强模型,是“更贵的单兵”
Claude Opus 4.7 的升级方向很明确:不是更快,而是更稳。
Anthropic 给出的重点不是“回复更顺滑”这种感受词,而是更适合长任务——那种“给你一个需求,你自己拆解、自己写、自己测、自己修”的复杂流程。
公开材料里,CursorBench 从 58% 提升到 70%,一个 93 题的编码测试里完成率提升了 13%;Notion 的复杂多步工作流场景提升了 14%;工具调用错误降到之前的三分之一。
说人话就是:
Anthropic 不想卖你一个更聪明的补全工具。
它想卖你一个“可以独立干活的高级工程师”。
这个赌注很狠。
因为它对应的不是“团队效率提升一点点”,而是另一个判断:
以后最值钱的人,可能不是最会配合流程的人,而是最能借助 agent 一个人吞下整段流程的人。
但这个方向还有一层更现实的含义。
如果一个人能吞下更多流程,那公司会怎么想?
很简单。
它会开始重新定义一个工程师值多少钱。
不是因为你不会写代码了。
而是因为平台会逼你证明:既然 agent 都能做这么多,你为什么还值这份薪水?
所以 Anthropic 这条路,卖给你的不是单纯的能力上限。
它卖给你的,其实是一个更残酷的职业要求:
以后你要么成为能放大 agent 的超级个体,要么就会被当成“没放大好的普通人”。
OpenAI 卖的,不是编码能力,是“平台工种”
OpenAI 这次给的名字就很直接:Codex for Almost Everything。
重点已经不是“帮你补一段代码”,而是“帮你接住一段任务”。
你把需求扔进去,它在 sandbox 里读文件、改代码、跑任务、回收结果。
这和传统 IDE 辅助的差别很大。
以前的 AI 更像坐在你旁边的助手。
现在的 Codex 更像一个被你丢进工位的执行者。
更关键的是,任务历史、运行环境和结果回收都发生在同一个平台里。
这意味着,锁住你的就不只是模型效果了。
而是整条开发流程。
这也是为什么我觉得 OpenAI 这次真正想争的,不是“谁更会写代码”。
而是谁来定义下一代软件开发的默认入口。
Latent.Space 当天那篇《RIP Pull Requests》说得很直接:当 AI agent 能持续写代码、自动跑 CI、自己修 bug、跨 sandbox 执行任务时,Pull Request 这个存在了 20 年的协作单元,可能正在过时。
你可以不同意这个结论。
但你不能忽视它背后的方向:
竞争焦点正在从“谁更会写”转向“谁来承接任务、环境和结果”。
而一旦平台同时承接任务入口、执行环境和结果回收,开发者的角色也会跟着变。
你不再只是工程师。
你会越来越像一个平台上的任务编排者、结果审计员、流程运营者。
这条路最可怕的地方不是效率高。
而是你会慢慢接受自己变成一种新的平台工种。
Qwen 卖的,不是便宜一点,是“别把控制权全交出去”
Qwen3.6-35B-A3B 的卖点不是一句“更强”。
而是一个很具体的事实:35B 参数,只激活约 3B。
意味着一台普通笔记本就能跑。
不需要 API key。
不需要付费订阅。
也不需要把代码传到别人的服务器上。
这条路最打人的地方,不是性能参数本身。
而是它给人的心理暗示:
原来顶级编码能力,不一定非得通过云端订阅才能拿到。
Simon Willison 做了一个很有传播力的测试:让 Qwen3.6 和 Claude Opus 4.7 各画一只骑自行车的鹈鹕 SVG,本地量化版的 Qwen 画得更好。
这个测试当然不严肃。
但它传递了一个更重要的信号:
开源本地模型第一次在公众感知上,显得没有那么输闭源顶级模型了。
这会改变很多开发者的预期。
过去大家默认“要最强能力,就必须把数据和工作流交出去”。
现在这个默认前提,开始被动摇了。
当然,本地路线不是浪漫主义。
它也有代价。
你拿回了控制权,也拿回了配置、维护、调优和兼容问题。
所以 Qwen 真正卖的,不是“更省钱”。
而是另一种职业姿态:
我宁可更累一点,也不把全部控制权交出去。
真正的战场,不在模型,而在你以后会变成哪种开发者
如果你只看到“三个模型谁更强”,你会错过更大的变化。
这三家公司争的根本不是同一层东西。
Anthropic 赌的是“超级个体”。
OpenAI 赌的是“平台入口”。
Qwen 赌的是“本地主权”。
表面看,三家都在做 AI 编程。
本质上,三家是在给开发者未来三年的组织位置开价。
第一种未来里,你会变成更贵的单兵工程师。
第二种未来里,你会变成平台里的新工种。
第三种未来里,你会变成更辛苦但更独立的本地派。
所以这不是一次普通的模型更新。
这是三种开发范式的正面交锋。
也是三种职业命运的正面交锋。
为什么这件事会让很多人不舒服
因为它逼你承认一件事:
你现在选的,已经不只是工具。
你选的是自己未来三年的工作方式、议价权和产能归属。
你是想成为一个越来越能独立吞下整段流程的人?
还是想成为一个深度依赖平台、但效率极高的团队成员?
还是想保住控制权,哪怕自己承担更多配置、维护和调参成本?
这三条路没有绝对高下。
但它们的代价完全不同。
Anthropic 这条路的代价,是你会越来越被要求“一个人顶更多人”。
OpenAI 这条路的代价,是你会越来越被平台锁进默认工作流,最后连经验都沉淀在平台里。
Qwen 这条路的代价,是你拿回了控制权,也拿回了运维、调优和兼容问题。
所以开发者到底该怎么选
我觉得先别问“哪家最强”。
先问三个更现实的问题。
1. 你的代码和数据,能不能离开自己的机器?
如果不能,那其实没什么好讨论的。
本地路线就是优先项。
2. 你想要的是更高上限,还是更稳的组织位置?
如果你是一个人或很小的团队,更强的单兵能力往往更值钱。
如果你是多人协作团队,平台化工作流可能更重要。
3. 你最怕的是什么:落后,还是被锁?
怕落后,就会更愿意追最强闭源能力。
怕被锁,就会更愿意为本地和开源付维护成本。
这三个问题,比 benchmark 更接近现实。
因为最后真正决定你选谁的,从来都不是宣传页上一行分数。
而是你的项目、你的团队、你的风险偏好。
<figure><img src=“images/three-routes.png” alt=“three-routes” /><figcaption>Anthropic、OpenAI、Qwen 看似都在做 AI 编程,实际上分别押注的是超级个体、平台入口和本地主权三种未来。</figcaption></figure>
<figure><img src=“images/decision-matrix.png” alt=“decision-matrix” /><figcaption>别再只比模型强弱了。真正该比的是:你的数据放哪、流程放哪、控制权留在哪。</figcaption></figure>
我最后的判断
回到开头那个朋友的问题。
Cursor Pro 的钱白花了吗?
没有。
但他真正该想的,已经不是“这周谁又强了 5 分”。
而是“我未来三年,准备把哪一段工作流、哪部分控制权、哪份职业筹码先交出去”。
因为从这一天开始,AI 编程已经不是一个“模型比较题”了。
它变成了一道更现实的题:
你不是在选模型。你是在选未来自己是单兵、平台工种,还是本地独立派。
未来被淘汰的,未必是不会写代码的人。
而是还没想清楚自己准备把哪段工作流、哪部分控制权、哪份职业筹码先交出去的人。