← 随机比特 / 所有内容

这次 Claude 的“最大发布”真正值得看的,不只是 Opus 4.6 更强,而是 Anthropic 正在把 Claude 从一个回答问题的模型,推成一个能异步接手任务、替你操作电脑的“AI 同事”。

2026-03-27 · 随机比特

公众号版|Anthropic 这次发的,不只是更强的 Claude,而是一个开始接手工作的 AI 同事

如果你只看 headline,这次新闻很容易被理解成一句老话:Claude 又升级了。

更强的 Opus 4.6,外加几项新能力,听起来像一次正常的大模型发布。 但我看完一圈信息后,反而觉得这次最值得记住的,不是 Claude 更会答题了,而是 Anthropic 正在把 Claude 往另一个角色上推:不是聊天对象,而是工作对象;不是问答机器,而是开始接手任务的 AI 同事。

Latent Space 这期 AINews 直接把它叫做 “The Biggest Claude Launch of All Time”。这个判断我觉得不夸张。 因为如果只是模型更强,其实还不够构成“最大发布”。真正让它变大的,是 Anthropic 这次把几件原本分散的东西绑到了一起:更强模型、Dispatch、computer use,以及一个更明确的产品叙事——Claude 不只是回答你,它开始在你不盯着它的时候替你做事。

这件事,和“又一个 benchmark 变高了”不是一个量级。

真正的变化,不在模型参数表里

Anthropic 在 Dispatch 的公告里写得很直白:它可以在后台工作,而你去做别的事。 这句话看起来没什么,但产品含义很重。

过去大多数人和 AI 的关系是同步的。 你问一句,它答一句;你继续盯着窗口,补上下文、点工具、看结果。 哪怕很多 agent 产品已经能调工具、写代码、操作网页,本质上也仍然很像“更复杂的聊天”。

Dispatch 试图把这个关系改掉。 它卖的不是“更会说”,而是“更会接”。接任务、接目标、接一段时间的自主执行。 如果再叠上 computer use,这就不只是会帮你总结文档、起草方案,而是开始具备替你碰电脑、跑流程、跨界面完成动作的资格。

换句话说,Anthropic 这次不是单纯在升级 Claude 的脑子,而是在补它的手、它的工作时段,以及它和你的协作关系。

这就是为什么我觉得很多人低估了这次发布。 因为大家还习惯从“模型新闻”的角度读它,但 Anthropic 想讲的,已经更像“产品形态新闻”。

Anthropic 在抢的,其实是“委托入口”

AI 公司前两年的主战场,是谁更聪明。 接下来的主战场,我越来越觉得会变成:谁更值得被委托。

这两个听起来接近,其实差得很远。

“更聪明”意味着它回答得更像人。 “更值得被委托”意味着你愿意把一段完整任务交给它,然后暂时不看它。

后者需要的东西远不只是模型分数。 你需要它理解目标,能持续执行,能用工具,知道什么时候回来交付结果,最好还能在必要时自己操作界面。 而当 Anthropic 把 Opus 4.6、Dispatch 和 computer use 放到同一波叙事里时,它争的就已经不是聊天窗口停留时长,而是知识工作者最关键的一步:

“这件事,我先丢给 Claude。”

一旦这句话变成习惯,Anthropic 拿到的就不是一次调用,而是工作流入口。

这也是我觉得这次发布“比看起来更大”的原因。 真正难被替代的,不一定是最强模型,而是那个你已经默认会把事情交给它的入口。

为什么这比单独发一个 Opus 4.6 更重要

别误会,模型底座当然重要。 没有更强的 Opus 4.6,前面的故事就立不住。AI 同事最怕的不是不努力,而是不靠谱。模型能力是它能不能接住复杂任务的基础。

但模型能力本身,不再足以解释产品胜负了。

如果一个模型很强,但你每次都得盯着、催着、喂着、改着,那它更像一个聪明的实习生。 而如果另一个系统没强出一整个代际,却能把委托、执行、操作电脑、返回结果这一整套链路做顺,你会更愿意把真实任务交给后者。

从这个角度看,Anthropic 这次最聪明的地方,不是只讲“Claude 更强了”,而是开始把“Claude 能怎么进入你的工作日”讲清楚。

以后大家比的,可能不是“谁回答最好”,而是:

这已经不是单纯的模型赛道了,更像 AI 时代的“数字同事平台”赛道。

对普通开发者和知识工作者,真正的影响是什么

如果这个方向成立,那以后最值钱的能力,可能不是把 prompt 写得多花。 而是另外三件事。

第一,会不会包装任务。 你给 AI 的不再是一句模糊要求,而是一份可执行的委托:目标是什么,边界是什么,哪些能做,哪些不能做,结果长什么样。

第二,会不会设计验证。 AI 同事真正进入工作流以后,最危险的不是它不会干,而是它干了以后你没验。能不能设计好检查点、回传格式、验收条件,会直接决定它到底是省事还是添乱。

第三,会不会管权限。 一旦 computer use 和异步执行变成默认能力,权限边界就不再是安全部门的抽象话题,而是每个普通人每天都要面对的实际问题。它能读什么、点什么、发什么、删什么,已经不是后台配置,而是工作流设计本身。

所以这次发布真正提醒我们的,不是“Claude 又进步了”。 而是:以后会做 AI 协作的人,和只会跟 AI 聊天的人,差距会越来越大。

我对这条路最大的保留意见

我确实觉得这次发布方向很大,但我也不想把它写成一篇喝彩稿。

因为“AI 同事”这个叙事有个天然风险:它太容易让人提前交出信任。

只要产品做得顺一点、回复写得像一点、执行过程看起来忙一点,人就会很快产生一种错觉:它既然这么像一个能干同事,应该也差不多可靠。

但现实通常没这么友好。

异步代理最容易出问题的地方,恰恰是你不盯着它的时候。 它可能理解错任务、点错页面、在错误上下文里继续执行,或者因为权限过大,把本来不该碰的东西也一起碰了。

同步聊天出错,代价通常是一段废话。 异步执行出错,代价可能是一封已经发出去的邮件、一条已经提交的变更、一次已经发生的越权操作。

所以我对这波产品路线的态度是:很重要,但也很需要怀疑。 Anthropic 正在把 Claude 往“能干活的人”方向推,这当然是大机会;但任何一个想把 AI 变成同事的平台,最后都得先回答一个老问题:

如果它真的像同事一样能做事,那谁来承担它做错事的后果?

最后一句

很多发布会最后留下的,是一个更高的分数。 我觉得这次 Claude 留下的,可能是一种更大的信号。

Anthropic 已经不满足于让 Claude 当一个更聪明的聊天框了。 它想让 Claude 变成一个你会开始委托、开始依赖、甚至开始围着它重新设计工作流的对象。

这才是这次“最大 Claude 发布”真正该看的地方。 不是模型更强了。 而是模型公司,开始更认真地做“AI 同事”这门生意了。

来源