语言
中文
模型与计费

模型与计费

按实际消耗的 Token 数量计费,无月费、无最低消费。所有模型统一在控制台实时查看用量和账单明细。

模型价格表

以下为当前上线模型的参考价格,单位为人民币(¥)/ 百万 Token。

模型Input / 1MOutput / 1M
gpt-5.5
¥35¥210
gpt-5.4
¥17.5¥105
gpt-5.4-mini
¥5.25¥31.5
gpt-5.3-chat
¥12.25¥98
gpt-5.3-codex
¥12.25¥98
claude-opus-4-8
¥35¥175
claude-opus-4-7
¥35¥175
claude-opus-4-6
¥35¥175
claude-sonnet-4-6
¥21¥105
claude-haiku-4-5-20251001
¥7¥35
deepseek-v4-pro
¥3¥6
deepseek-v4-flash
¥1¥3
claude-deepseek-v4-pro
¥3¥6
claude-deepseek-v4-flash
¥1¥3
doubao-seedance-2-0-260128
¥46¥46
doubao-seedream-5-0-260128
¥46¥46

价格可能随上游渠道调整,以控制台实时展示为准。实际账单自动扣除 Prompt Cache 折扣。

Claude 客户端适配 标注为 Claude 客户端适配的模型(如 claude-deepseek-v4-pro、claude-deepseek-v4-flash)是专为 Claude Code、Claude Desktop 等客户端设计的别名模型。由于这些客户端只能调用以 claude- 开头的模型 ID,平台为非 Anthropic 模型提供了对应的别名,让你无需切换客户端即可在 Claude 生态内使用 DeepSeek 等模型。计费与原始模型一致。

计费模式

平台采用 Token 按量计费模型,分为 Input(提示词)和 Output(生成内容)两部分独立计价,单位为每百万 Token(¥/1M tokens)。

计费项说明
Input Tokens发送给模型的内容:系统提示词 + 对话历史 + 当前用户消息。
Output Tokens模型生成的回复内容,通常比 Input 贵 4–5 倍。
Cache Read命中 Prompt Cache 的 Token,按折扣价计费(详见下方)。

Prompt Cache 折扣

当相同的前缀内容(如长系统提示词、参考文档)在多次请求中重复出现时,平台会自动利用供应商的 Prompt Cache 机制,缓存命中部分以折扣价计费。

Claude
≈ 10%

Anthropic 官方缓存折扣约 90% off。

OpenAI
≈ 10%

GPT 系列缓存命中按约 10% 原价计费(约 90% off)。

DeepSeek
≈ 1%

DeepSeek 缓存命中折扣极低,约 99% off。

缓存折扣由平台自动应用,无需修改代码。控制台账单明细中会显示 Cache Read 和 Cache Write 的用量。

费用估算示例

以下以 claude-sonnet-4-6(¥21 / 1M input,¥105 / 1M output)为例,帮助估算典型场景成本。

场景InputOutput单次成本
简单问答(100 次/天)200 tokens300 tokens≈ ¥0.004 / 次
文档摘要(2000 字原文)1500 tokens400 tokens≈ ¥0.074 / 次
代码审查(500 行代码)3000 tokens800 tokens≈ ¥0.147 / 次
RAG 检索增强(10 段上下文)5000 tokens600 tokens≈ ¥0.168 / 次

实际成本取决于模型、输入长度和对话轮次。建议在控制台「用量」页面实时监控,设置预算告警。