主题切换
分组与计价
LuminaToken 采用按量计费模式。理解 Token、输入输出价格以及分组倍率后,你就能比较准确地估算成本。
Token 是什么
Token 可以理解为模型处理文本时使用的基础计量单位。通常:
- 你发送给模型的提示词、上下文、系统指令会消耗输入 tokens。
- 模型返回给你的回答会消耗输出 tokens。
- 一次请求的总费用,通常由输入与输出两部分共同组成。
不同模型对同一段文本的实际 token 数量可能不同,因此最终费用要以实际调用统计为准。
计费公式
LuminaToken 的核心计费思路可以概括为:
费用 = (输入 tokens × 输入价格 + 输出 tokens × 输出价格) × 分组倍率
这里有三个关键变量:
- 输入价格:模型处理请求内容时的单价。
- 输出价格:模型生成结果时的单价。
- 分组倍率:你所选分组对应的倍率系数。
如何理解分组倍率
分组不是“功能开关”,更像是一层业务路由与计费策略配置。常见用途包括:
- 区分不同模型来源或服务质量策略。
- 区分不同成本结构。
- 区分不同业务环境,例如默认、测试、团队专用等。
因此,同一个模型在不同分组下,最终费用可能不同。
分组说明
LuminaToken 的实际分组以控制台显示为准。你可以先用下面这套理解框架来判断应该怎么选:
| 分组类型 | 适合对象 | 典型特征 |
|---|---|---|
| 默认分组 | 新用户、通用场景 | 上手快,适合先跑通流程 |
| 性价比分组 | 个人开发者、日常调用 | 更关注长期成本控制 |
| 稳定优先分组 | 团队、生产用途 | 更重视可用性与持续性 |
| 专用分组 | 特定项目或企业用户 | 便于权限、预算和路由隔离 |
如果你在控制台看到多个名称不同的分组,最稳妥的做法是先看其描述,再结合自己的场景选择,而不是只看名字。
一个简单示例
假设某次调用:
- 输入
10,000tokens - 输出
2,000tokens - 输入价格为
$0.001 / 1K tokens - 输出价格为
$0.002 / 1K tokens - 分组倍率为
1.2
那么基础费用为:
- 输入费用:
10 × 0.001 = $0.01 - 输出费用:
2 × 0.002 = $0.004 - 合计基础费用:
$0.014 - 乘以分组倍率后:
$0.014 × 1.2 = $0.0168
最终应以控制台账单与消费明细为准。
如何节省成本
1. 为不同任务选合适的模型和分组
- 草稿生成、批量整理、普通问答,不一定需要最贵的模型。
- 高要求代码审查、复杂推理、重要输出,再考虑更高规格配置。
2. 控制上下文长度
- 不要把无关历史、长日志和大段重复文本全部发给模型。
- 对长会话及时做摘要,减少重复输入。
3. 降低不必要的输出长度
- 明确要求“简洁回答”“只返回结果”“限制字数”。
- 对工具调用场景,让模型只输出所需格式,避免冗长解释。
4. 不同工具使用不同 Key
- 把 Claude Code、Codex、脚本或服务端调用分开。
- 这样更容易识别哪里在消耗费用,也方便后续优化。
5. 先小流量验证,再放大使用
- 新项目先做小规模联调,确认模型、提示词和格式都稳定。
- 验证通过后再扩大调用,避免在试错阶段浪费额度。
常见误区
只看单价,不看倍率
单价便宜不代表最终一定更省,分组倍率会直接影响结算结果。
只看输入,不看输出
某些任务输出内容很多,输出费用可能会明显上升。
只看一次调用,不看长期总量
少量调用差异不明显,但在团队或自动化任务里,长期累计成本会拉开差距。
