Claude API Model ID 完整列表（2026）：claude-sonnet、haiku、opus 模型名称对照表

Q: Cline 默认配置的是哪个模型？

Cline 通过 ClaudeAPI 接入时推荐使用 `claude-haiku-4-5-20251001`，兼顾响应速度和成本，适合高频 AI 编程。复杂重构任务可在 Cline Settings → Model ID 改为 `claude-sonnet-4-6`，其他配置不变。

Q: 不同 Opus 版本有什么区别？

- `claude-opus-4-8`：最新旗舰，推理最强，新项目首选 - `claude-opus-4-7` / `claude-opus-4-6`：无日期后缀的稳定在线版，行为固定适合生产 - `claude-opus-4-5-20251101`：带日期后缀的版本锁定 ID，对一致性有强要求时使用 四个版本定价相同（官方 $5/$25），按能力需求和一致性要求选择。

Q: sonnet-4-6 和 sonnet-4-5 有什么区别？

`claude-sonnet-4-6` 是当前最新 Sonnet，Anthropic 将其定位为"专为编码、代理和企业工作流打造"，多 Agent 协作和代码能力更强。`claude-sonnet-4-5-20250929` 是 2025 年 9 月的稳定版，适合已经在该版本完成调优的生产项目。新项目直接用 `claude-sonnet-4-6`。

Q: 如何查当前全部可用模型？

```bash curl https://gw.claudeapi.com/v1/models \ -H "Authorization: Bearer sk-xxx" ``` 返回的 `id` 字段即为实时可用 Model ID 完整列表，与[控制台模型页](https://console.claudeapi.com/models)一致。

Q: 哪个模型最适合 RAG 场景？

`claude-sonnet-4-6` 是大多数 RAG 项目的默认选择：200K 上下文容纳大量召回片段，指令遵循能力强，价格合理。文档块超长或需要整合多来源强推理时，考虑 `claude-opus-4-8`。

调用 Claude API 时，model 字段必须填写精确的 Model ID 字符串——填写模型昵称（如 “Claude Sonnet”）或格式错误（如 claude-sonnet4.6）会直接返回 invalid_request_error。本页汇总 ClaudeAPI 平台当前全部可用 Model ID，数据来源于 ClaudeAPI 控制台实时列表，随模型上线持续更新。

ClaudeAPI 接入参数（所有工具通用）

参数值

OpenAI Compatible Base URL https://gw.claudeapi.com/v1

Anthropic Native Base URL https://gw.claudeapi.com

API Key 格式 sk-xxx（在 ClaudeAPI 控制台创建）

以下所有 Model ID 均可直接填入 model 字段使用。

参数	值
OpenAI Compatible Base URL	`https://gw.claudeapi.com/v1`
Anthropic Native Base URL	`https://gw.claudeapi.com`
API Key 格式	`sk-xxx`（在 ClaudeAPI 控制台创建）

一、全部可用 Model ID（ClaudeAPI 实时列表）

Claude Opus 4（旗舰推理）

Model ID	上下文	官方价（输入/输出 /MTok）	ClaudeAPI 价（输入/输出 /MTok）	状态
`claude-opus-4-8`	200K	$5.00 / $25.00	$4.00 / $20.00	✅ 可用
`claude-opus-4-7`	200K	$5.00 / $25.00	$4.00 / $20.00	✅ 可用
`claude-opus-4-6`	200K	$5.00 / $25.00	$4.00 / $20.00	✅ 可用
`claude-opus-4-5-20251101`	200K	$5.00 / $25.00	$4.00 / $20.00	✅ 可用

适用场景：复杂代码重构、多步推理任务、长文档分析（合同/研究报告/代码库）、多智能体协作、高质量创意生成。

版本说明：

claude-opus-4-8：当前最新旗舰，Anthropic 最新推出，推理能力与长上下文理解最强，新项目首选
claude-opus-4-6 / claude-opus-4-7：行为固定的稳定在线版，适合已完成 prompt 调优、不希望因版本更新引入行为回归的生产系统
claude-opus-4-5-20251101：带完整日期后缀的版本锁定 ID，适合对行为一致性有强要求的场景

⚠️ 价格说明：ClaudeAPI 平台在官方定价基础上提供约 20% 优惠，实际费用以控制台账单为准。

Claude Sonnet 4（主力均衡，90% 场景首选）

Model ID	上下文	官方价（输入/输出 /MTok）	ClaudeAPI 价（输入/输出 /MTok）	状态
`claude-sonnet-4-6`	200K	$3.00 / $15.00	$2.40 / $12.00	✅ 可用
`claude-sonnet-4-5-20250929`	200K	$3.00 / $15.00	$2.40 / $12.00	✅ 可用

适用场景：日常代码生成、内容撰写、数据分析、RAG 问答、对话应用、企业工作流自动化。

版本说明：

claude-sonnet-4-6：当前最新 Sonnet 版本，Anthropic 官方描述为"专为编码、代理和企业工作流打造"，大多数项目的默认选择
claude-sonnet-4-5-20250929：带日期后缀的稳定版，适合固定版本的生产部署

如果不确定选哪个模型，从 claude-sonnet-4-6 开始，跑一段时间后根据效果和成本决定是否切换。

Claude Haiku 4（高频轻量，最低成本）

Model ID	上下文	官方价（输入/输出 /MTok）	ClaudeAPI 价（输入/输出 /MTok）	状态
`claude-haiku-4-5-20251001`	200K	$1.00 / $5.00	$0.80 / $4.00	✅ 可用

适用场景：路由判断、内容初筛、格式化处理、高并发轻量请求、Cline/Cursor 后台补全。

⚠️ 必读——最高频踩坑：claude-haiku-4-5-20251001 末尾的 20251001 是版本锁定标记，必须完整填写。缩写为 claude-haiku-4-5 会直接返回 model not found，这是新用户接入时最高频的报错。

二、Model ID 速查（复制即用）

# ── Opus 4 系列（旗舰推理）──────────────────────────────────
claude-opus-4-8                # 最新旗舰，新项目首选
claude-opus-4-7                # 稳定版
claude-opus-4-6                # 稳定版
claude-opus-4-5-20251101       # 版本锁定稳定版

# ── Sonnet 4 系列（主力均衡）────────────────────────────────
claude-sonnet-4-6              # 最新主力，90% 场景默认
claude-sonnet-4-5-20250929     # 版本锁定稳定版

# ── Haiku 4 系列（轻量高频）────────────────────────────────
claude-haiku-4-5-20251001      # ⚠️ 日期后缀必须完整

# ── Opus 4 系列（旗舰推理）──────────────────────────────────
claude-opus-4-8                # 最新旗舰，新项目首选
claude-opus-4-7                # 稳定版
claude-opus-4-6                # 稳定版
claude-opus-4-5-20251101       # 版本锁定稳定版

# ── Sonnet 4 系列（主力均衡）────────────────────────────────
claude-sonnet-4-6              # 最新主力，90% 场景默认
claude-sonnet-4-5-20250929     # 版本锁定稳定版

# ── Haiku 4 系列（轻量高频）────────────────────────────────
claude-haiku-4-5-20251001      # ⚠️ 日期后缀必须完整

三、三档模型对比选型

维度	Opus 4	Sonnet 4	Haiku 4
推荐 ID	`claude-opus-4-8`	`claude-sonnet-4-6`	`claude-haiku-4-5-20251001`
官方价（输入/输出）	$5 / $25	$3 / $15	$1 / $5
ClaudeAPI 价	$4 / $20	$2.4 / $12	$0.8 / $4
上下文窗口	200K	200K	200K
适合任务	复杂推理/长文档/多 Agent	代码/内容/RAG/对话	路由/格式化/高并发补全
响应速度	慢（最强推理）	中等	快（最轻量）
成本控制	高成本	中等	最省

选型口诀：不确定就 Sonnet，高质量用 Opus，高并发用 Haiku。

四、各工具 Model ID 填写位置

工具	填写位置	推荐 Model ID
Cursor	Settings → Models → Model Name	`claude-sonnet-4-6`
Cline	Settings → API Provider → Model ID	`claude-haiku-4-5-20251001`
Dify	模型供应商 → 添加模型 → 模型名称	`claude-sonnet-4-6`
Claude Desktop	`claude_desktop_config.json` → `"model"` 字段	`claude-sonnet-4-6`
Continue (VS Code)	`~/.continue/config.json` → `"model"`	`claude-sonnet-4-6`
Open WebUI	管理员后台 → 模型 → 模型 ID	`claude-sonnet-4-6`
Python SDK（OpenAI 兼容）	`client.chat.completions.create(model=...)`	`claude-opus-4-8`
curl	请求体 `"model":` 字段	`claude-haiku-4-5-20251001`

各工具的完整配置步骤（Base URL、Key 填写、验证）参见：→ Claude API Base URL 配置完全指南

五、Model ID 格式规律与命名解析

claude - {系列} - {版本号} [- {YYYYMMDD}]
  │        │          │             │
  │        │          │             └── 日期后缀（可选）
  │        │          │                 有就必须完整，无则省略
  │        │          └── 版本号（连字符分隔，不用点号）
  │        │              如 4-8 = 第 4 代第 8 版
  │        └── 系列：opus / sonnet / haiku
  └── 固定前缀 claude

claude - {系列} - {版本号} [- {YYYYMMDD}]
  │        │          │             │
  │        │          │             └── 日期后缀（可选）
  │        │          │                 有就必须完整，无则省略
  │        │          └── 版本号（连字符分隔，不用点号）
  │        │              如 4-8 = 第 4 代第 8 版
  │        └── 系列：opus / sonnet / haiku
  └── 固定前缀 claude

三条必记规律：

连字符，不是点号：claude-sonnet-4-6 ✅，claude-sonnet-4.6 ❌
有日期后缀就必须完整：claude-haiku-4-5-20251001 ✅，claude-haiku-4-5 ❌
不能用显示名：claude-opus-4-8 ✅，"Claude Opus" / "Claude Opus 4" ❌

六、常见错误与排查

错误写法	正确写法	报错类型	根因
`claude-haiku-4-5`	`claude-haiku-4-5-20251001`	`model not found`	日期后缀必须完整
`claude-sonnet-4.6`	`claude-sonnet-4-6`	`model not found`	点号应为连字符
`claude-opus-4.8`	`claude-opus-4-8`	`model not found`	点号应为连字符
`claude-sonnet-4.5`	`claude-sonnet-4-5-20250929`	`model not found`	点号+缺日期后缀
`"Claude Sonnet"`	`claude-sonnet-4-6`	`invalid_request_error`	不能用显示名
`claude-sonnet`	`claude-sonnet-4-6`	`model not found`	缺少版本号
已下线的旧版 ID	换本页列表中的可用 ID	`model not found`	版本已下线

排查步骤：

用 /v1/models 接口查当前可用列表，确认 ID 在列表中
逐字符对照本页速查表，重点检查：有无点号（应为连字符）、日期后缀是否完整
ID 正确但仍报错 → 检查 Base URL 是否正确（见配置指南）

七、HowTo：在 Python 中按任务分配模型

场景 A：按任务类型静态路由

场景：一个 AI 写作应用，处理大纲生成（高质量）、段落扩写（均衡）、格式整理（轻量），通过模型分层控制成本。

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://gw.claudeapi.com/v1"
)

# 路由函数：按任务复杂度分配模型
def get_model(task_type: str) -> str:
    routing = {
        "outline":   "claude-opus-4-8",          # 复杂规划，用旗舰
        "paragraph": "claude-sonnet-4-6",         # 日常生成，用主力
        "format":    "claude-haiku-4-5-20251001", # 格式整理，用轻量
    }
    return routing.get(task_type, "claude-sonnet-4-6")

def generate(task_type: str, prompt: str) -> str:
    model = get_model(task_type)
    resp = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
        max_tokens=2048
    )
    return resp.choices[0].message.content

# 按任务类型调用
outline   = generate("outline",   "为一篇关于 AI 编程工具的文章写大纲")
paragraph = generate("paragraph", "展开第二节，约 300 字")
formatted = generate("format",    "把下面的文本整理成 Markdown 格式：...")

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://gw.claudeapi.com/v1"
)

# 路由函数：按任务复杂度分配模型
def get_model(task_type: str) -> str:
    routing = {
        "outline":   "claude-opus-4-8",          # 复杂规划，用旗舰
        "paragraph": "claude-sonnet-4-6",         # 日常生成，用主力
        "format":    "claude-haiku-4-5-20251001", # 格式整理，用轻量
    }
    return routing.get(task_type, "claude-sonnet-4-6")

def generate(task_type: str, prompt: str) -> str:
    model = get_model(task_type)
    resp = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
        max_tokens=2048
    )
    return resp.choices[0].message.content

# 按任务类型调用
outline   = generate("outline",   "为一篇关于 AI 编程工具的文章写大纲")
paragraph = generate("paragraph", "展开第二节，约 300 字")
formatted = generate("format",    "把下面的文本整理成 Markdown 格式：...")

成本估算（ClaudeAPI 价格，100 万 token 内容生成任务）：

全用 Opus：100 万 × $4/$20 ≈ $12
分层（20% Opus / 60% Sonnet / 20% Haiku）≈ $3.9，节省约 67%

场景 B：按 prompt 复杂度动态路由

def dynamic_route(user_message: str) -> str:
    """
    按输入复杂度动态选模型：
    - 短 + 无复杂词 → Haiku
    - 中等           → Sonnet
    - 长 + 含推理词  → Opus
    """
    tokens_est = len(user_message) / 4
    complex_keywords = {"分析", "推理", "对比", "审查", "重构", "总结全文", "法律", "合规"}
    has_complex = any(kw in user_message for kw in complex_keywords)

    if tokens_est > 1000 and has_complex:
        return "claude-opus-4-8"
    elif tokens_est > 200 or has_complex:
        return "claude-sonnet-4-6"
    else:
        return "claude-haiku-4-5-20251001"

def smart_chat(user_message: str) -> str:
    model = dynamic_route(user_message)
    print(f"[路由] 选用模型: {model}")
    resp = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": user_message}],
        max_tokens=2048,
    )
    return resp.choices[0].message.content

def dynamic_route(user_message: str) -> str:
    """
    按输入复杂度动态选模型：
    - 短 + 无复杂词 → Haiku
    - 中等           → Sonnet
    - 长 + 含推理词  → Opus
    """
    tokens_est = len(user_message) / 4
    complex_keywords = {"分析", "推理", "对比", "审查", "重构", "总结全文", "法律", "合规"}
    has_complex = any(kw in user_message for kw in complex_keywords)

    if tokens_est > 1000 and has_complex:
        return "claude-opus-4-8"
    elif tokens_est > 200 or has_complex:
        return "claude-sonnet-4-6"
    else:
        return "claude-haiku-4-5-20251001"

def smart_chat(user_message: str) -> str:
    model = dynamic_route(user_message)
    print(f"[路由] 选用模型: {model}")
    resp = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": user_message}],
        max_tokens=2048,
    )
    return resp.choices[0].message.content

生产建议：上线初期记录每次路由结果（model、输入 token 估算、响应质量），跑 1-2 周后根据数据调整阈值。阈值设得保守（多走 Sonnet）比激进（强推 Haiku）更安全。

八、FAQ

Q：如何估算 Claude API 调用成本？

按输入 + 输出 token 数分别计费（单位：百万 token）：

成本 = (输入token / 1,000,000 × 输入单价) + (输出token / 1,000,000 × 输出单价)

成本 = (输入token / 1,000,000 × 输入单价) + (输出token / 1,000,000 × 输出单价)

常见场景估算（ClaudeAPI 价格，Sonnet 4.6）：

场景	输入估算	输出估算	单次成本
短问答（用户提问 + 系统 prompt）	~500 token	~300 token	≈ $0.00016
代码生成（含上下文）	~2000 token	~1000 token	≈ $0.00072
长文档分析（20页合同）	~15000 token	~2000 token	≈ $0.006
高并发（1000次/天轻量 Haiku）	~500 × 1000	~200 × 1000	≈ $0.18/天

精确费用以控制台账单实时数据为准。

Q：ClaudeAPI 价格和官方价格的关系？

ClaudeAPI 在官方定价基础上提供约 20% 优惠（即官方价 × 0.8）。例如 Sonnet 4.6 官方 $3/$15，ClaudeAPI 为 $2.4/$12，Opus 4.8 官方 $5/$25，ClaudeAPI 为 $4/$20。实际以控制台为准。

Q：Cline 默认配置的是哪个模型？

Cline 通过 ClaudeAPI 接入时推荐使用 claude-haiku-4-5-20251001，兼顾响应速度和成本，适合高频 AI 编程。复杂重构任务可在 Cline Settings → Model ID 改为 claude-sonnet-4-6，其他配置不变。

Q：不同 Opus 版本有什么区别？

claude-opus-4-8：最新旗舰，推理最强，新项目首选
claude-opus-4-7 / claude-opus-4-6：无日期后缀的稳定在线版，行为固定适合生产
claude-opus-4-5-20251101：带日期后缀的版本锁定 ID，对一致性有强要求时使用

四个版本定价相同（官方 $5/$25），按能力需求和一致性要求选择。

Q：sonnet-4-6 和 sonnet-4-5 有什么区别？

claude-sonnet-4-6 是当前最新 Sonnet，Anthropic 将其定位为"专为编码、代理和企业工作流打造"，多 Agent 协作和代码能力更强。claude-sonnet-4-5-20250929 是 2025 年 9 月的稳定版，适合已经在该版本完成调优的生产项目。新项目直接用 claude-sonnet-4-6。

Q：如何查当前全部可用模型？

curl https://gw.claudeapi.com/v1/models \
  -H "Authorization: Bearer sk-xxx"

curl https://gw.claudeapi.com/v1/models \
  -H "Authorization: Bearer sk-xxx"

返回的 id 字段即为实时可用 Model ID 完整列表，与控制台模型页一致。

Q：哪个模型最适合 RAG 场景？

claude-sonnet-4-6 是大多数 RAG 项目的默认选择：200K 上下文容纳大量召回片段，指令遵循能力强，价格合理。文档块超长或需要整合多来源强推理时，考虑 claude-opus-4-8。

相关文章