计费与用量
1. 计费维度
mixgateway.io 按 实际用量 计费,主要依据:
- 输入 token(
prompt_tokens) - 输出 token(
completion_tokens) - 合计 token(
total_tokens)
计费以上游模型返回的 usage 为准(在可获得的前提下)。
2. 定价方式
- 价格通常按 每 1K tokens 计价;输入与输出单价可能不同(以官网价格页与 [控制台](/dashboard) 为准)。
- 便于理解的关系式:
费用 ≈ (prompt_tokens / 1000) * 输入单价(每 1K)
+ (completion_tokens / 1000) * 输出单价(每 1K)
- 系统内部多以 最小货币单位 + 整数运算 记账,减轻浮点误差。
3. 流式与非流式的用量
非流式(
stream: false)
上游响应体里若带usage,网关直接据此计量。流式(
stream: true)- 上游通过多条
data: {...}SSE 推送内容。 - 最后一条数据里常带有
usage。 - 网关单独解析该
usage用于计费与统计,不改变客户端已收到的流式正文。
- 上游通过多条
4. 查看用量与账单
在 [控制台](/dashboard) 的 用量 / 账单 相关入口(具体名称以产品为准),通常可查看:
- 按 API 密钥 聚合的调用次数与 token 总量
- 按 模型 维度的统计
- 单笔调用计费明细,以及 剩余余额 / 配额(若启用预付费或配额模式)
控制台界面可能迭代,但调用量、token、费用仍是核心指标。
5. 常见问题
问:流式是不是比非流式更贵?
答: 一般不会。两者都以上游返回的最终 usage(尤其是 total_tokens)为准;把回复拆成多段 SSE 并不会因此多算 token。
问:所有模型价格一样吗?
答: 不一样,因供应商与 model 而异。请以价格页与控制台为准。
问:余额不足或超配额会怎样?
答: 新请求可能被拒绝并返回如 insufficient_quota 等错误(或以你们产品定义的错误码为准)。是否允许透支等取决于账号/商务配置。
问:是否有包月或套餐?
答: 若提供,一般由商务侧配置;可按预估用量联系销售/运营定制。