跳转到主内容

Claude Code 推理深度悄降 73%:Anthropic 承认调低默认强度,API 用户 4 月 7 日已恢复

2 月到 3 月间,Anthropic 悄悄把 Claude 默认推理强度从 high 降为 medium,导致思考深度下降 73%。本文解释发生了什么、为什么,以及 API Key 用户如何在 4 月 7 日后确认自己已恢复高强度模式。

行业动态热点快报 Claude 性能 Claude Code预计阅读5分钟
2026.04.20 发表
Claude Code 推理深度悄降 73%:Anthropic 承认调低默认强度,API 用户 4 月 7 日已恢复

Claude Code 推理深度悄降 73%:Anthropic 承认调低默认强度,API 用户 4 月 7 日已恢复

如果你在 2 月底到 3 月间觉得 Claude 变笨了、变慢了、出错多了——你的感觉没有错。

一位 AMD AI 部门高级总监用 6,852 个真实 Claude Code session 的数据证明了这一点:Claude 的默认推理深度在这段时间内下降了 73%。Anthropic 随后承认,这是他们主动做出的配置变更。

好消息是:如果你是 API Key 用户,4 月 7 日起已经恢复到高强度模式


发生了什么

2026 年 2 月到 3 月间,Anthropic 悄悄对 Claude 做了三次配置调整:

  • 2 月 9 日:Claude 改为自适应推理深度——由模型自己决定每个任务该想多深,而不是固定预算
  • 2 月 12 日:UI 端隐藏中间思考过程,减少页面延迟
  • 3 月 3 日:默认 effort level 从 high 下调为 medium(85 级)

这三次变更均未在显眼位置通知用户。大量开发者发现 Claude Code 越来越难用,却不知道原因,只能在 GitHub、Reddit、X 上反复追问"是不是我的用法有问题"。


数据说话:下降有多严重

真正让这件事引发广泛关注的,是 AMD AI 部门高级总监 Stella Laurenzo 的系统分析——她对 6,852 个 session、17,871 个思考块、234,760 次工具调用进行了工程级别的诊断:

指标 1月(正常) 3月(降级后) 变化
中位可见思考长度 2,200 字符 600 字符 -73%
每任务 API 重试次数 基准 最高 +80 倍
编辑前读取文件数 6.6 个 2.0 个 -70%

读取文件数从 6.6 降到 2.0 这一条尤其值得注意:Claude Code 在改动代码之前,连依赖关系都没看够,直接导致更多错误和返工。


Anthropic 为什么这么做

Claude Code 产品负责人 Boris Cherny 公开解释:

“我们把默认 effort 降到 medium,是因为收到用户反馈说 Claude 之前消耗的 token 太多了。”

为了省 token、降延迟,牺牲了推理质量——而且没有给用户选择权,也没有明确告知。

更大的争议来自"算力紧张"猜测:同期 Anthropic 正在内部测试 Mythos 模型,有观点认为计算资源被优先分配给顶级模型。Anthropic 未正面回应。


现在怎么样了

4 月 7 日,Anthropic 官方 changelog 更新:

API Key 用户、Bedrock、Vertex、Foundry、Team 和 Enterprise 用户的默认 effort level 恢复为 high

通过 API Key 调用的开发者,推理强度已回到 1 月水平。

受影响且尚未完全恢复的是 Free 和 Pro 订阅用户claude.ai 聊天仍在 medium effort,且 session 限制规则已收紧,约 7% 的用户会更快触达上限。


对 ClaudeAPI 用户意味着什么

通过 ClaudeAPI 使用 API Key 的用户:

  • 2 月 9 日 — 4 月 7 日:请求跑的是 medium effort,复杂任务效果可能偏差
  • 4 月 7 日之后:已自动恢复 high effort,无需任何操作

如需主动指定推理深度,在 API 请求中显式传入 thinking 参数即可:

response = client.messages.create(
    model="claude-opus-4-7-20260417",
    max_tokens=16000,
    thinking={
        "type": "enabled",
        "budget_tokens": 10000  # 指定思考 token 预算
    },
    messages=[{"role": "user", "content": "你的任务"}]
)
response = client.messages.create(
    model="claude-opus-4-7-20260417",
    max_tokens=16000,
    thinking={
        "type": "enabled",
        "budget_tokens": 10000  # 指定思考 token 预算
    },
    messages=[{"role": "user", "content": "你的任务"}]
)

显式传参可以绕过默认 effort 设置,锁定你需要的推理深度。更多用法参考 Claude API Python 入门教程,或查看 Claude API 报错完全手册 排查异常。


接下来关注什么

  • Free / Pro 聊天用户的 effort 是否恢复:Anthropic 路线图未公布
  • Mythos 模型的 API 开放时间:目前仅 12 家合作伙伴可用
  • Session 限制新规:重度用户注意触达上限频率变化

常见问题

Q:Claude 变笨了是真的吗? A:是的,有数据支撑。Anthropic 在 3 月 3 日把默认 effort level 从 high 降为 medium,导致推理深度下降约 73%。

Q:我用的是 API Key,现在还受影响吗? A:不受影响。4 月 7 日之后,Anthropic 已将 API Key 用户恢复为 high effort 默认值。

Q:怎么强制指定推理深度? A:在 API 请求中传入 thinking 参数并设置 budget_tokens,可绕过默认设置,锁定推理强度。

Q:Free/Pro 聊天用户什么时候恢复? A:Anthropic 尚未公布路线图,目前仅 API Key 和企业用户已恢复。

Q:这次事件会影响 ClaudeAPI 的稳定性吗? A:不会。ClaudeAPI 转发官方 API,effort level 的恢复对所有 API Key 用户统一生效,无需额外操作。


来源


本文由 ClaudeAPI 团队出品。

相关文章