HypersHub 管理控制台

模型与计费

按实际消耗的 Token 数量计费，无月费、无最低消费。所有模型统一在控制台实时查看用量和账单明细。

模型价格表

以下为当前上线模型的参考价格，单位为人民币（¥）/ 百万 Token。

模型	Input / 1M	Output / 1M
gpt-5.5	¥35	¥210
gpt-5.4	¥17.5	¥105
gpt-5.4-mini	¥5.25	¥31.5
gpt-5.3-chat	¥12.25	¥98
gpt-5.3-codex	¥12.25	¥98
claude-opus-4-8	¥35	¥175
claude-opus-4-7	¥35	¥175
claude-opus-4-6	¥35	¥175
claude-sonnet-4-6	¥21	¥105
claude-haiku-4-5-20251001	¥7	¥35
deepseek-v4-pro	¥3	¥6
deepseek-v4-flash	¥1	¥3
claude-deepseek-v4-pro	¥3	¥6
claude-deepseek-v4-flash	¥1	¥3
doubao-seedance-2-0-260128	¥46	¥46
doubao-seedream-5-0-260128	¥46	¥46

价格可能随上游渠道调整，以控制台实时展示为准。实际账单自动扣除 Prompt Cache 折扣。

Claude 客户端适配标注为 Claude 客户端适配的模型（如 claude-deepseek-v4-pro、claude-deepseek-v4-flash）是专为 Claude Code、Claude Desktop 等客户端设计的别名模型。由于这些客户端只能调用以 claude- 开头的模型 ID，平台为非 Anthropic 模型提供了对应的别名，让你无需切换客户端即可在 Claude 生态内使用 DeepSeek 等模型。计费与原始模型一致。

计费模式

平台采用 Token 按量计费模型，分为 Input（提示词）和 Output（生成内容）两部分独立计价，单位为每百万 Token（¥/1M tokens）。

计费项	说明
Input Tokens	发送给模型的内容：系统提示词 + 对话历史 + 当前用户消息。
Output Tokens	模型生成的回复内容，通常比 Input 贵 4–5 倍。
Cache Read	命中 Prompt Cache 的 Token，按折扣价计费（详见下方）。

Prompt Cache 折扣

当相同的前缀内容（如长系统提示词、参考文档）在多次请求中重复出现时，平台会自动利用供应商的 Prompt Cache 机制，缓存命中部分以折扣价计费。

Claude

≈ 10%

Anthropic 官方缓存折扣约 90% off。

OpenAI

≈ 10%

GPT 系列缓存命中按约 10% 原价计费（约 90% off）。

DeepSeek

≈ 1%

DeepSeek 缓存命中折扣极低，约 99% off。

缓存折扣由平台自动应用，无需修改代码。控制台账单明细中会显示 Cache Read 和 Cache Write 的用量。

费用估算示例

以下以 claude-sonnet-4-6（¥21 / 1M input，¥105 / 1M output）为例，帮助估算典型场景成本。

场景	Input	Output	单次成本
简单问答（100 次/天）	200 tokens	300 tokens	≈ ¥0.004 / 次
文档摘要（2000 字原文）	1500 tokens	400 tokens	≈ ¥0.074 / 次
代码审查（500 行代码）	3000 tokens	800 tokens	≈ ¥0.147 / 次
RAG 检索增强（10 段上下文）	5000 tokens	600 tokens	≈ ¥0.168 / 次

实际成本取决于模型、输入长度和对话轮次。建议在控制台「用量」页面实时监控，设置预算告警。