Skip to content

分组与计价

LuminaToken 采用按量计费模式。理解 Token、输入输出价格以及分组倍率后,你就能比较准确地估算成本。

Token 是什么

Token 可以理解为模型处理文本时使用的基础计量单位。通常:

  • 你发送给模型的提示词、上下文、系统指令会消耗输入 tokens。
  • 模型返回给你的回答会消耗输出 tokens。
  • 一次请求的总费用,通常由输入与输出两部分共同组成。

不同模型对同一段文本的实际 token 数量可能不同,因此最终费用要以实际调用统计为准。

计费公式

LuminaToken 的核心计费思路可以概括为:

费用 = (输入 tokens × 输入价格 + 输出 tokens × 输出价格) × 分组倍率

这里有三个关键变量:

  1. 输入价格:模型处理请求内容时的单价。
  2. 输出价格:模型生成结果时的单价。
  3. 分组倍率:你所选分组对应的倍率系数。

如何理解分组倍率

分组不是“功能开关”,更像是一层业务路由与计费策略配置。常见用途包括:

  • 区分不同模型来源或服务质量策略。
  • 区分不同成本结构。
  • 区分不同业务环境,例如默认、测试、团队专用等。

因此,同一个模型在不同分组下,最终费用可能不同。

分组说明

LuminaToken 的实际分组以控制台显示为准。你可以先用下面这套理解框架来判断应该怎么选:

分组类型适合对象典型特征
默认分组新用户、通用场景上手快,适合先跑通流程
性价比分组个人开发者、日常调用更关注长期成本控制
稳定优先分组团队、生产用途更重视可用性与持续性
专用分组特定项目或企业用户便于权限、预算和路由隔离

如果你在控制台看到多个名称不同的分组,最稳妥的做法是先看其描述,再结合自己的场景选择,而不是只看名字。

一个简单示例

假设某次调用:

  • 输入 10,000 tokens
  • 输出 2,000 tokens
  • 输入价格为 $0.001 / 1K tokens
  • 输出价格为 $0.002 / 1K tokens
  • 分组倍率为 1.2

那么基础费用为:

  • 输入费用:10 × 0.001 = $0.01
  • 输出费用:2 × 0.002 = $0.004
  • 合计基础费用:$0.014
  • 乘以分组倍率后:$0.014 × 1.2 = $0.0168

最终应以控制台账单与消费明细为准。

如何节省成本

1. 为不同任务选合适的模型和分组

  • 草稿生成、批量整理、普通问答,不一定需要最贵的模型。
  • 高要求代码审查、复杂推理、重要输出,再考虑更高规格配置。

2. 控制上下文长度

  • 不要把无关历史、长日志和大段重复文本全部发给模型。
  • 对长会话及时做摘要,减少重复输入。

3. 降低不必要的输出长度

  • 明确要求“简洁回答”“只返回结果”“限制字数”。
  • 对工具调用场景,让模型只输出所需格式,避免冗长解释。

4. 不同工具使用不同 Key

  • 把 Claude Code、Codex、脚本或服务端调用分开。
  • 这样更容易识别哪里在消耗费用,也方便后续优化。

5. 先小流量验证,再放大使用

  • 新项目先做小规模联调,确认模型、提示词和格式都稳定。
  • 验证通过后再扩大调用,避免在试错阶段浪费额度。

常见误区

只看单价,不看倍率

单价便宜不代表最终一定更省,分组倍率会直接影响结算结果。

只看输入,不看输出

某些任务输出内容很多,输出费用可能会明显上升。

只看一次调用,不看长期总量

少量调用差异不明显,但在团队或自动化任务里,长期累计成本会拉开差距。

下一步

  • 还没有余额时,请先阅读 充值说明
  • 已经了解费用结构后,可以继续看 工具部署 开始接入。

LuminaToken - 让全球顶级 AI 模型触手可达 | 客服 QQ:1580925976@qq.com