最贵的模型,不一定是最好用的工作流:为什么越来越多 AI 重度用户把 Claude Max 降回 Pro?
这两个月,我看到一个很有意思的变化。
不是大家都在往上升配,而是一些 AI 重度用户,开始反过来算账:我到底有没有必要,默认开着最贵的模型过日子?
这个问题最近在 OpenClaw 社区里被一条 Reddit 讨论讲得很具体。原帖标题叫《OpenClaw on Minimax 2.7: OMG》。发帖的人不是在做 benchmark 炫技,而是在讲一件更接近日常的事:他把 MiniMax M2.7 扔进 OpenClaw,去跑 Executive Assistant、笔记整理、Markdown 整理这类工作流,发现体验好得有点离谱,尤其是考虑到价格以后。
但同一条帖里,态度也很清楚:复杂研究、长链推理、可信度要求高的任务,他还是更信 Opus。 评论区的共识也差不多——MiniMax 这类模型,已经足够吃下 80% 的日常杂活;但复杂自动化、稳定性要求高、一步错可能整段跑歪的任务,前沿模型还是更稳。
这也是我觉得这条讨论真正有意思的地方:
它讲的不是某个模型“赢了”,而是 AI 工作流开始进入“分层使用”阶段了。
MiniMax 被夸,重点不是便宜,是“便宜到你敢默认开着它”
如果只写成“MiniMax 很便宜”,这事其实没什么意思。
真正重要的是,它便宜到什么程度,会改变你的使用习惯。
OpenRouter 的 models API 里,minimax/minimax-m2.7 现在的价格大概是输入 $0.30 / 1M tokens,输出 $1.20 / 1M tokens,上下文 204,800。你拿它去对比 anthropic/claude-opus-4,后者输入大概 $15 / 1M,输出约 $75 / 1M。就算对比 claude-sonnet-4,也还是贵一个数量级。
这意味着什么?
意味着以前你会犹豫的很多动作,现在可以直接交给模型先跑一遍。
比如:
- 把一堆会议记录整理成结构化纪要;
- 把 Markdown 文档重写成更统一的格式;
- 帮你归档笔记、提炼待办、补标题和摘要;
- 对一批重复文本做改写、分类、去重、汇总;
- 在 agent 工作流里先跑第一遍清洗和预处理。
这些任务的共同点不是“难”,而是“烦”。
它们通常不值得你自己手工做,但如果每次都开最贵模型,又会让你潜意识里变得保守:能不能少调一次?这个任务值不值得?要不我自己顺手弄了?
而一旦默认层变便宜,整个工作流心态会变。你不再把模型当成一个需要慎重按下的按钮,而是把它当成一个常驻的执行层。
这才是 MiniMax 这类模型真正改变工作流的地方。
AI 真正开始替代的,不是程序员,而是你每天那 80% 的琐事
很多人谈 AI,总爱问一个大问题:它会不会替代程序员、分析师、研究员?
我反而觉得,眼下更真实的变化没那么戏剧化。
AI 先吃掉的,不是你的岗位,而是你岗位里最重复、最耗时、最不值钱的那一层劳动。
大概可以把任务分成三层。
第一层:低风险重复活
比如整理、转写、归档、摘要、格式统一、信息抽取、批量改写。
这一层最适合便宜模型。
因为这里真正需要的,不是巅峰智力,而是:
- 上下文够长;
- 听指令别太差;
- 成本够低,可以反复跑;
- 速度和稳定性别太离谱。
MiniMax 在 OpenClaw 这次被夸,基本就是卡在这一层上。它不是把 Opus 最擅长的部分打掉了,而是把“本来不值得开 Opus 的那一堆工作”接过去了。
第二层:中风险结构化任务
比如重要邮件草拟、对外文案润色、方案整理、较复杂的信息整合、轻量研究。
这一层我更倾向于用中高端模型,比如 Sonnet 这一类。原因很简单:
- 这些任务已经开始涉及表达质量;
- 错一点不一定致命,但会影响结果能不能直接拿去用;
- 你希望它少一点幻觉,多一点稳。
第三层:高风险判断任务
比如重大决策、复杂研究、需要多步验证的推理、对事实可信度要求很高的输出。
这一层就别省了。
Reddit 原帖作者也说得很直接:复杂研究他还是更信 Opus。这个判断我完全认同。因为这类任务最贵的不是 token,而是错一次的代价。
你让便宜模型帮你整理笔记,出点小错,最多是改两分钟。
但你让它替你完成关键研究判断、复杂自动化规划、重要结论输出,一旦跑偏,后面浪费掉的时间远比省下来的钱多。
为什么“便宜但够用”,会直接改变 OpenClaw / Agent 工作流?
因为 agent 并不是只做“最难那一下”。
一个完整工作流里,真正占次数最多的,往往是大量低价值但必要的步骤:读文件、改格式、写草稿、清上下文、汇总分支结果、生成中间稿、做第一轮归纳。
这些步骤如果全都用最贵模型,工作流会天然变得奢侈,也变得克制。你会不自觉地收缩自动化范围。
但如果默认模型是一层便宜、长上下文、足够听话的底座,事情就不一样了。
你会开始愿意让 agent:
- 先把材料全整理好,再决定要不要升级模型;
- 先出一版粗稿,再交给高端模型精修;
- 先跑第一轮分类、聚类、摘要,把脏活都做完;
- 只有在出现高风险信号时,才触发 Opus 兜底。
这其实就是一个很成熟的软件思路:把昂贵资源留给真正稀缺的环节。
AI 工作流以前一直容易走向一个误区:只盯着“最强模型能不能解决问题”。
现在更值得问的问题变成了:
这个任务,到底值不值得用最强模型来解决?
这两个问题看起来很像,背后是完全不同的产品观。
普通用户怎么搭“模型分层使用”?
如果你不是天天跑 benchmark,只是想把 AI 真正接进工作里,我更建议直接照这套方式来。
1)默认层:便宜模型
把便宜、长上下文、输出还不错的模型设成默认层。
它负责:
- 会议纪要、笔记整理;
- Markdown / 文档格式化;
- 批量摘要、改写、分类;
- 工作流里的第一轮清洗和归纳;
- 那些“错了也能快速返工”的任务。
核心标准只有一句:便宜到你愿意默认一直开着。
2)升级层:中高端模型
当任务开始涉及表达质量、外部沟通、复杂整合时,再升级。
比如:
- 给老板/客户的邮件;
- 对外发布文案;
- 需要更高完成度的总结;
- 信息很多、结构复杂,但还没到高风险决策级别的任务。
这层的目标不是最强,而是稳妥地接住关键场景。
3)兜底层:最强模型
只在下面几种情况开:
- 任务明显高风险;
- 输出一旦出错,代价很高;
- 问题高度不确定,需要更强推理和更细致验证;
- 你已经让低成本层跑过一轮,但结果不够可靠。
说白了,Opus 这类模型最适合做的,不是全天候扫地,而是当最后那个需要压住质量波动的人。
所以,大家把 Claude Max 降回 Pro,真的是消费降级吗?
我觉得不完全是。
更准确的说法是:AI 用户终于开始从“模型崇拜”,走向“资源配置”。
以前大家会觉得,既然最强模型最好,那默认开着它最合理。
现在越来越多人开始意识到,最强模型当然有价值,但它真正的价值,不在于包办一切,而在于只出现在那些非它不可的时刻。
而那些每天都会发生的大量杂活,恰恰适合交给更便宜、足够好的那一层模型。
这不是 MiniMax 单点赢了谁。
这是整个 AI 工作流在变成熟。
以后真正拉开差距的,可能不再是谁总在用最贵模型,而是谁更早学会了:
什么任务交给便宜模型跑量,什么任务交给高端模型兜底。
这套能力一旦搭起来,AI 才会从“偶尔帮忙”变成“真的接管工作流的一部分”。
你现在会怎么分配自己的模型层级?哪些活你愿意交给便宜模型,哪些活你一定要最强模型上?评论区聊聊。