分组与计价

LuminaToken 采用按量计费模式。理解 Token、输入输出价格以及分组倍率后，你就能比较准确地估算成本。

Token 是什么

Token 可以理解为模型处理文本时使用的基础计量单位。通常：

你发送给模型的提示词、上下文、系统指令会消耗输入 tokens。
模型返回给你的回答会消耗输出 tokens。
一次请求的总费用，通常由输入与输出两部分共同组成。

不同模型对同一段文本的实际 token 数量可能不同，因此最终费用要以实际调用统计为准。

计费公式

LuminaToken 的核心计费思路可以概括为：

费用 = (输入 tokens × 输入价格 + 输出 tokens × 输出价格) × 分组倍率

这里有三个关键变量：

输入价格：模型处理请求内容时的单价。
输出价格：模型生成结果时的单价。
分组倍率：你所选分组对应的倍率系数。

如何理解分组倍率

分组不是“功能开关”，更像是一层业务路由与计费策略配置。常见用途包括：

区分不同模型来源或服务质量策略。
区分不同成本结构。
区分不同业务环境，例如默认、测试、团队专用等。

因此，同一个模型在不同分组下，最终费用可能不同。

分组说明

LuminaToken 的实际分组以控制台显示为准。你可以先用下面这套理解框架来判断应该怎么选：

分组类型	适合对象	典型特征
默认分组	新用户、通用场景	上手快，适合先跑通流程
性价比分组	个人开发者、日常调用	更关注长期成本控制
稳定优先分组	团队、生产用途	更重视可用性与持续性
专用分组	特定项目或企业用户	便于权限、预算和路由隔离

如果你在控制台看到多个名称不同的分组，最稳妥的做法是先看其描述，再结合自己的场景选择，而不是只看名字。

一个简单示例

假设某次调用：

输入 10,000 tokens
输出 2,000 tokens
输入价格为 $0.001 / 1K tokens
输出价格为 $0.002 / 1K tokens
分组倍率为 1.2

那么基础费用为：

输入费用：10 × 0.001 = $0.01
输出费用：2 × 0.002 = $0.004
合计基础费用：$0.014
乘以分组倍率后：$0.014 × 1.2 = $0.0168

最终应以控制台账单与消费明细为准。

如何节省成本

1. 为不同任务选合适的模型和分组

草稿生成、批量整理、普通问答，不一定需要最贵的模型。
高要求代码审查、复杂推理、重要输出，再考虑更高规格配置。

2. 控制上下文长度

不要把无关历史、长日志和大段重复文本全部发给模型。
对长会话及时做摘要，减少重复输入。

3. 降低不必要的输出长度

明确要求“简洁回答”“只返回结果”“限制字数”。
对工具调用场景，让模型只输出所需格式，避免冗长解释。

4. 不同工具使用不同 Key

把 Claude Code、Codex、脚本或服务端调用分开。
这样更容易识别哪里在消耗费用，也方便后续优化。

5. 先小流量验证，再放大使用

新项目先做小规模联调，确认模型、提示词和格式都稳定。
验证通过后再扩大调用，避免在试错阶段浪费额度。

常见误区

只看单价，不看倍率

单价便宜不代表最终一定更省，分组倍率会直接影响结算结果。

只看输入，不看输出

某些任务输出内容很多，输出费用可能会明显上升。

只看一次调用，不看长期总量

少量调用差异不明显，但在团队或自动化任务里，长期累计成本会拉开差距。

下一步

还没有余额时，请先阅读充值说明。
已经了解费用结构后，可以继续看工具部署开始接入。

分组与计价 ​

Token 是什么 ​

计费公式 ​

如何理解分组倍率 ​

分组说明 ​

一个简单示例 ​

如何节省成本 ​

1. 为不同任务选合适的模型和分组 ​

2. 控制上下文长度 ​

3. 降低不必要的输出长度 ​

4. 不同工具使用不同 Key ​

5. 先小流量验证，再放大使用 ​

常见误区 ​

只看单价，不看倍率 ​

只看输入，不看输出 ​

只看一次调用，不看长期总量 ​

下一步 ​