调用 Claude API 时,model 字段必须填写精确的 Model ID 字符串——填写模型昵称(如 “Claude Sonnet”)或格式错误(如 claude-sonnet4.6)会直接返回 invalid_request_error。本页汇总 ClaudeAPI 平台当前全部可用 Model ID,数据来源于 ClaudeAPI 控制台实时列表,随模型上线持续更新。

ClaudeAPI 接入参数(所有工具通用)
参数 值 OpenAI Compatible Base URL https://gw.claudeapi.com/v1Anthropic Native Base URL https://gw.claudeapi.comAPI Key 格式 sk-xxx(在 ClaudeAPI 控制台 创建)以下所有 Model ID 均可直接填入
model字段使用。
一、全部可用 Model ID(ClaudeAPI 实时列表)
Claude Opus 4(旗舰推理)

| Model ID | 上下文 | 官方价(输入/输出 /MTok) | ClaudeAPI 价(输入/输出 /MTok) | 状态 |
|---|---|---|---|---|
claude-opus-4-8 |
200K | $5.00 / $25.00 | $4.00 / $20.00 | ✅ 可用 |
claude-opus-4-7 |
200K | $5.00 / $25.00 | $4.00 / $20.00 | ✅ 可用 |
claude-opus-4-6 |
200K | $5.00 / $25.00 | $4.00 / $20.00 | ✅ 可用 |
claude-opus-4-5-20251101 |
200K | $5.00 / $25.00 | $4.00 / $20.00 | ✅ 可用 |
适用场景:复杂代码重构、多步推理任务、长文档分析(合同/研究报告/代码库)、多智能体协作、高质量创意生成。
版本说明:
claude-opus-4-8:当前最新旗舰,Anthropic 最新推出,推理能力与长上下文理解最强,新项目首选claude-opus-4-6/claude-opus-4-7:行为固定的稳定在线版,适合已完成 prompt 调优、不希望因版本更新引入行为回归的生产系统claude-opus-4-5-20251101:带完整日期后缀的版本锁定 ID,适合对行为一致性有强要求的场景
⚠️ 价格说明:ClaudeAPI 平台在官方定价基础上提供约 20% 优惠,实际费用以控制台账单为准。
Claude Sonnet 4(主力均衡,90% 场景首选)
| Model ID | 上下文 | 官方价(输入/输出 /MTok) | ClaudeAPI 价(输入/输出 /MTok) | 状态 |
|---|---|---|---|---|
claude-sonnet-4-6 |
200K | $3.00 / $15.00 | $2.40 / $12.00 | ✅ 可用 |
claude-sonnet-4-5-20250929 |
200K | $3.00 / $15.00 | $2.40 / $12.00 | ✅ 可用 |
适用场景:日常代码生成、内容撰写、数据分析、RAG 问答、对话应用、企业工作流自动化。
版本说明:
claude-sonnet-4-6:当前最新 Sonnet 版本,Anthropic 官方描述为"专为编码、代理和企业工作流打造",大多数项目的默认选择claude-sonnet-4-5-20250929:带日期后缀的稳定版,适合固定版本的生产部署
如果不确定选哪个模型,从
claude-sonnet-4-6开始,跑一段时间后根据效果和成本决定是否切换。
Claude Haiku 4(高频轻量,最低成本)
| Model ID | 上下文 | 官方价(输入/输出 /MTok) | ClaudeAPI 价(输入/输出 /MTok) | 状态 |
|---|---|---|---|---|
claude-haiku-4-5-20251001 |
200K | $1.00 / $5.00 | $0.80 / $4.00 | ✅ 可用 |
适用场景:路由判断、内容初筛、格式化处理、高并发轻量请求、Cline/Cursor 后台补全。
⚠️ 必读——最高频踩坑:
claude-haiku-4-5-20251001末尾的20251001是版本锁定标记,必须完整填写。缩写为claude-haiku-4-5会直接返回model not found,这是新用户接入时最高频的报错。
二、Model ID 速查(复制即用)
# ── Opus 4 系列(旗舰推理)──────────────────────────────────
claude-opus-4-8 # 最新旗舰,新项目首选
claude-opus-4-7 # 稳定版
claude-opus-4-6 # 稳定版
claude-opus-4-5-20251101 # 版本锁定稳定版
# ── Sonnet 4 系列(主力均衡)────────────────────────────────
claude-sonnet-4-6 # 最新主力,90% 场景默认
claude-sonnet-4-5-20250929 # 版本锁定稳定版
# ── Haiku 4 系列(轻量高频)────────────────────────────────
claude-haiku-4-5-20251001 # ⚠️ 日期后缀必须完整
# ── Opus 4 系列(旗舰推理)──────────────────────────────────
claude-opus-4-8 # 最新旗舰,新项目首选
claude-opus-4-7 # 稳定版
claude-opus-4-6 # 稳定版
claude-opus-4-5-20251101 # 版本锁定稳定版
# ── Sonnet 4 系列(主力均衡)────────────────────────────────
claude-sonnet-4-6 # 最新主力,90% 场景默认
claude-sonnet-4-5-20250929 # 版本锁定稳定版
# ── Haiku 4 系列(轻量高频)────────────────────────────────
claude-haiku-4-5-20251001 # ⚠️ 日期后缀必须完整
三、三档模型对比选型
| 维度 | Opus 4 | Sonnet 4 | Haiku 4 |
|---|---|---|---|
| 推荐 ID | claude-opus-4-8 |
claude-sonnet-4-6 |
claude-haiku-4-5-20251001 |
| 官方价(输入/输出) | $5 / $25 | $3 / $15 | $1 / $5 |
| ClaudeAPI 价 | $4 / $20 | $2.4 / $12 | $0.8 / $4 |
| 上下文窗口 | 200K | 200K | 200K |
| 适合任务 | 复杂推理/长文档/多 Agent | 代码/内容/RAG/对话 | 路由/格式化/高并发补全 |
| 响应速度 | 慢(最强推理) | 中等 | 快(最轻量) |
| 成本控制 | 高成本 | 中等 | 最省 |
选型口诀:不确定就 Sonnet,高质量用 Opus,高并发用 Haiku。
四、各工具 Model ID 填写位置
| 工具 | 填写位置 | 推荐 Model ID |
|---|---|---|
| Cursor | Settings → Models → Model Name | claude-sonnet-4-6 |
| Cline | Settings → API Provider → Model ID | claude-haiku-4-5-20251001 |
| Dify | 模型供应商 → 添加模型 → 模型名称 | claude-sonnet-4-6 |
| Claude Desktop | claude_desktop_config.json → "model" 字段 |
claude-sonnet-4-6 |
| Continue (VS Code) | ~/.continue/config.json → "model" |
claude-sonnet-4-6 |
| Open WebUI | 管理员后台 → 模型 → 模型 ID | claude-sonnet-4-6 |
| Python SDK(OpenAI 兼容) | client.chat.completions.create(model=...) |
claude-opus-4-8 |
| curl | 请求体 "model": 字段 |
claude-haiku-4-5-20251001 |
各工具的完整配置步骤(Base URL、Key 填写、验证)参见:→ Claude API Base URL 配置完全指南
五、Model ID 格式规律与命名解析
claude - {系列} - {版本号} [- {YYYYMMDD}]
│ │ │ │
│ │ │ └── 日期后缀(可选)
│ │ │ 有就必须完整,无则省略
│ │ └── 版本号(连字符分隔,不用点号)
│ │ 如 4-8 = 第 4 代第 8 版
│ └── 系列:opus / sonnet / haiku
└── 固定前缀 claude
claude - {系列} - {版本号} [- {YYYYMMDD}]
│ │ │ │
│ │ │ └── 日期后缀(可选)
│ │ │ 有就必须完整,无则省略
│ │ └── 版本号(连字符分隔,不用点号)
│ │ 如 4-8 = 第 4 代第 8 版
│ └── 系列:opus / sonnet / haiku
└── 固定前缀 claude
三条必记规律:
- 连字符,不是点号:
claude-sonnet-4-6✅,claude-sonnet-4.6❌ - 有日期后缀就必须完整:
claude-haiku-4-5-20251001✅,claude-haiku-4-5❌ - 不能用显示名:
claude-opus-4-8✅,"Claude Opus"/"Claude Opus 4"❌
六、常见错误与排查
| 错误写法 | 正确写法 | 报错类型 | 根因 |
|---|---|---|---|
claude-haiku-4-5 |
claude-haiku-4-5-20251001 |
model not found |
日期后缀必须完整 |
claude-sonnet-4.6 |
claude-sonnet-4-6 |
model not found |
点号应为连字符 |
claude-opus-4.8 |
claude-opus-4-8 |
model not found |
点号应为连字符 |
claude-sonnet-4.5 |
claude-sonnet-4-5-20250929 |
model not found |
点号+缺日期后缀 |
"Claude Sonnet" |
claude-sonnet-4-6 |
invalid_request_error |
不能用显示名 |
claude-sonnet |
claude-sonnet-4-6 |
model not found |
缺少版本号 |
| 已下线的旧版 ID | 换本页列表中的可用 ID | model not found |
版本已下线 |
排查步骤:
- 用
/v1/models接口查当前可用列表,确认 ID 在列表中 - 逐字符对照本页速查表,重点检查:有无点号(应为连字符)、日期后缀是否完整
- ID 正确但仍报错 → 检查 Base URL 是否正确(见配置指南)
七、HowTo:在 Python 中按任务分配模型
场景 A:按任务类型静态路由
场景:一个 AI 写作应用,处理大纲生成(高质量)、段落扩写(均衡)、格式整理(轻量),通过模型分层控制成本。
from openai import OpenAI
client = OpenAI(
api_key="sk-xxx",
base_url="https://gw.claudeapi.com/v1"
)
# 路由函数:按任务复杂度分配模型
def get_model(task_type: str) -> str:
routing = {
"outline": "claude-opus-4-8", # 复杂规划,用旗舰
"paragraph": "claude-sonnet-4-6", # 日常生成,用主力
"format": "claude-haiku-4-5-20251001", # 格式整理,用轻量
}
return routing.get(task_type, "claude-sonnet-4-6")
def generate(task_type: str, prompt: str) -> str:
model = get_model(task_type)
resp = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": prompt}],
max_tokens=2048
)
return resp.choices[0].message.content
# 按任务类型调用
outline = generate("outline", "为一篇关于 AI 编程工具的文章写大纲")
paragraph = generate("paragraph", "展开第二节,约 300 字")
formatted = generate("format", "把下面的文本整理成 Markdown 格式:...")
from openai import OpenAI
client = OpenAI(
api_key="sk-xxx",
base_url="https://gw.claudeapi.com/v1"
)
# 路由函数:按任务复杂度分配模型
def get_model(task_type: str) -> str:
routing = {
"outline": "claude-opus-4-8", # 复杂规划,用旗舰
"paragraph": "claude-sonnet-4-6", # 日常生成,用主力
"format": "claude-haiku-4-5-20251001", # 格式整理,用轻量
}
return routing.get(task_type, "claude-sonnet-4-6")
def generate(task_type: str, prompt: str) -> str:
model = get_model(task_type)
resp = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": prompt}],
max_tokens=2048
)
return resp.choices[0].message.content
# 按任务类型调用
outline = generate("outline", "为一篇关于 AI 编程工具的文章写大纲")
paragraph = generate("paragraph", "展开第二节,约 300 字")
formatted = generate("format", "把下面的文本整理成 Markdown 格式:...")
成本估算(ClaudeAPI 价格,100 万 token 内容生成任务):
- 全用 Opus:100 万 × $4/$20 ≈ $12
- 分层(20% Opus / 60% Sonnet / 20% Haiku)≈ $3.9,节省约 67%
场景 B:按 prompt 复杂度动态路由
def dynamic_route(user_message: str) -> str:
"""
按输入复杂度动态选模型:
- 短 + 无复杂词 → Haiku
- 中等 → Sonnet
- 长 + 含推理词 → Opus
"""
tokens_est = len(user_message) / 4
complex_keywords = {"分析", "推理", "对比", "审查", "重构", "总结全文", "法律", "合规"}
has_complex = any(kw in user_message for kw in complex_keywords)
if tokens_est > 1000 and has_complex:
return "claude-opus-4-8"
elif tokens_est > 200 or has_complex:
return "claude-sonnet-4-6"
else:
return "claude-haiku-4-5-20251001"
def smart_chat(user_message: str) -> str:
model = dynamic_route(user_message)
print(f"[路由] 选用模型: {model}")
resp = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": user_message}],
max_tokens=2048,
)
return resp.choices[0].message.content
def dynamic_route(user_message: str) -> str:
"""
按输入复杂度动态选模型:
- 短 + 无复杂词 → Haiku
- 中等 → Sonnet
- 长 + 含推理词 → Opus
"""
tokens_est = len(user_message) / 4
complex_keywords = {"分析", "推理", "对比", "审查", "重构", "总结全文", "法律", "合规"}
has_complex = any(kw in user_message for kw in complex_keywords)
if tokens_est > 1000 and has_complex:
return "claude-opus-4-8"
elif tokens_est > 200 or has_complex:
return "claude-sonnet-4-6"
else:
return "claude-haiku-4-5-20251001"
def smart_chat(user_message: str) -> str:
model = dynamic_route(user_message)
print(f"[路由] 选用模型: {model}")
resp = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": user_message}],
max_tokens=2048,
)
return resp.choices[0].message.content
生产建议:上线初期记录每次路由结果(model、输入 token 估算、响应质量),跑 1-2 周后根据数据调整阈值。阈值设得保守(多走 Sonnet)比激进(强推 Haiku)更安全。
八、FAQ
Q:如何估算 Claude API 调用成本?
按输入 + 输出 token 数分别计费(单位:百万 token):
成本 = (输入token / 1,000,000 × 输入单价) + (输出token / 1,000,000 × 输出单价)
成本 = (输入token / 1,000,000 × 输入单价) + (输出token / 1,000,000 × 输出单价)
常见场景估算(ClaudeAPI 价格,Sonnet 4.6):
| 场景 | 输入估算 | 输出估算 | 单次成本 |
|---|---|---|---|
| 短问答(用户提问 + 系统 prompt) | ~500 token | ~300 token | ≈ $0.00016 |
| 代码生成(含上下文) | ~2000 token | ~1000 token | ≈ $0.00072 |
| 长文档分析(20页合同) | ~15000 token | ~2000 token | ≈ $0.006 |
| 高并发(1000次/天轻量 Haiku) | ~500 × 1000 | ~200 × 1000 | ≈ $0.18/天 |
精确费用以控制台账单实时数据为准。
Q:ClaudeAPI 价格和官方价格的关系?
ClaudeAPI 在官方定价基础上提供约 20% 优惠(即官方价 × 0.8)。例如 Sonnet 4.6 官方 $3/$15,ClaudeAPI 为 $2.4/$12,Opus 4.8 官方 $5/$25,ClaudeAPI 为 $4/$20。实际以控制台为准。
Q:Cline 默认配置的是哪个模型?
Cline 通过 ClaudeAPI 接入时推荐使用 claude-haiku-4-5-20251001,兼顾响应速度和成本,适合高频 AI 编程。复杂重构任务可在 Cline Settings → Model ID 改为 claude-sonnet-4-6,其他配置不变。
Q:不同 Opus 版本有什么区别?
claude-opus-4-8:最新旗舰,推理最强,新项目首选claude-opus-4-7/claude-opus-4-6:无日期后缀的稳定在线版,行为固定适合生产claude-opus-4-5-20251101:带日期后缀的版本锁定 ID,对一致性有强要求时使用
四个版本定价相同(官方 $5/$25),按能力需求和一致性要求选择。
Q:sonnet-4-6 和 sonnet-4-5 有什么区别?
claude-sonnet-4-6 是当前最新 Sonnet,Anthropic 将其定位为"专为编码、代理和企业工作流打造",多 Agent 协作和代码能力更强。claude-sonnet-4-5-20250929 是 2025 年 9 月的稳定版,适合已经在该版本完成调优的生产项目。新项目直接用 claude-sonnet-4-6。
Q:如何查当前全部可用模型?
curl https://gw.claudeapi.com/v1/models \
-H "Authorization: Bearer sk-xxx"
curl https://gw.claudeapi.com/v1/models \
-H "Authorization: Bearer sk-xxx"
返回的 id 字段即为实时可用 Model ID 完整列表,与控制台模型页一致。
Q:哪个模型最适合 RAG 场景?
claude-sonnet-4-6 是大多数 RAG 项目的默认选择:200K 上下文容纳大量召回片段,指令遵循能力强,价格合理。文档块超长或需要整合多来源强推理时,考虑 claude-opus-4-8。
相关文章



