Claude Code 用户越来越多,为什么配额反而越来越不够用?
有个 Max 20x 用户说。 自己 5 小时的配额。 19 分钟就见底了。
另一批人更离谱。
打一声 hello。 配额立刻少了 2%。 发一条消息。 直接吃掉 3% 到 7%。
Anthropic 一开始的解释,是高峰时段需求变大。 但社区里有人不信。 他直接把 Claude Code 的二进制拆了。
这件事最刺眼的地方,不只是 bug。 而是你明明在付费,却看不见钱到底是怎么烧掉的。
先看表面现象。
从 3 月 23 日起,Pro、Max 5x、Max 20x 用户陆续开始报配额异常。
最夸张的一组数字是。 Max 20x 用户发一次提示词后,配额从 21% 直接跳到 100%。 还有 Pro 用户,3 分钟烧掉整场会话的 60%。
如果你是 API 用户,这种异常其实很容易闻出来。 因为你能看 token 用量,也能看 cache hit 和账单。
但订阅用户看不到这些。 你只会看到一个模糊的百分比条。 它涨了,就是涨了。 它为什么涨,你不知道。
然后,真相被社区一点点抠出来了。
发现者顺着 standalone binary 的行为追,最后找到两个 cache bug。
第一个 bug,出在 Anthropic 定制的 Bun fork。 它会在每次请求里找一个 billing sentinel,然后做字符串替换。
问题是,如果你的聊天记录里刚好提到 billing 相关词,替换就可能打偏。 一旦打偏,前缀缓存就坏了。 原本该走 cache 的内容,会被当成新内容重算。
社区给出的结论是。 未命中缓存时,token 成本可能高 10 到 20 倍。
第二个 bug 更直接。
只要你用了 --resume,或者继续旧会话,缓存位置就会变。
结果是,除了 system prompt,前面对话基本都要重建。
也就是整段历史再付一次钱。
这就解释了很多人的体感。 为什么明明只是接着聊,配额却像重新开了一台新机器。
更麻烦的是,这两个 bug 不是互斥的。
你可能撞上字符串替换问题,也可能同时踩中 --resume 的全量 cache miss。
叠在一起,token 消耗就会突然失控。
说白了,这不是“Claude 变贵了”。 是 Claude 在暗处重复算账。
再看更尴尬的一层。
时间线很清楚。 3 月 23 日,用户开始集中报异常。 官方先给出高峰时段解释。 到 3 月 31 日,社区已经把可能的技术根因拆出来了。
这就是这次最伤信任的地方。 不是 bug 本身。 而是账单解释权只在平台手里。
如果平台说,这是高峰时段影响。 你很难反证。 如果平台说,这是正常消耗。 你也很难核对。
你每个月付 20 美元、100 美元,甚至 200 美元。 但你没有像样的审计面板。 没有 token 级别明细。 没有缓存命中记录。 也没有异常波动提醒。
API 用户至少还能查账。 订阅用户连账本都没有。
所以这次事,表面上是 Claude Code 的 cache bug。 往下看,其实是 AI 订阅工具的透明度危机。
今天是 Claude Code。 明天也可能是 Cursor、Copilot,或者别的 agent 工具。 只要它卖的是“包月 + 模糊配额”,问题就会一直在。
因为平台不给明细,用户就分不清三件事。 到底是自己真的用多了。 还是产品偷偷调了策略。 还是 bug 把 token 吞掉了。
这三件事,对钱包的影响完全不同。 但在界面上,看起来却像同一件事。
那你现在能做什么?
先说临时办法。
如果你在用 standalone binary,可以先切到 npx @anthropic/claude-code。
第二,少用 --resume。
至少在官方修复前,尽量新开会话。
第三,盯着 GitHub issue 的后续进展。 重点不是吃瓜,而是看 Anthropic 最后给不给用户更细的用量解释。
我觉得这次最该修的,不只是 cache。 还包括一个更底层的能力: 让订阅用户看见自己的 token 到底去了哪里。
没有这个能力,所有“配额不够用”的讨论,最后都会变成信仰之争。 平台说没问题。 用户说体感不对。 中间没有证据层。
而一款按使用强度收费的 AI 工具,最不该缺的,就是证据层。
你最近用 Claude Code 时,遇到过配额突然见底,或者 --resume 后异常烧量吗?
来源: Reddit r/ClaudeAI 相关帖子 GitHub issue #41930 / #40524 / #34629 PiunikaWeb 2026-03-31 报道