计费与用量

1. 计费维度

apiset.ai 网关按实际用量计费,主要依据:

  • 提示 token 数prompt_tokens
  • 补全 token 数completion_tokens
  • 总 token 数total_tokens

网关优先使用上游模型返回的 usage 字段作为计费依据。

2. 计费方式

  • 每千 token定价,不同模型价格不同,详见控制台或定价文档
  • 典型计算公式为:
费用=prompt_tokens*price_prompt + completion_tokens*price_completion
  • 内部采用最小货币单位(如分)和整数运算,避免浮点误差。

3. 流式与非流式的用量统计

  • 非流式(stream=false
    上游响应中若包含 usage 字段,网关直接使用其中的 token 数量。

  • 流式(stream=true

    • 上游会返回多段 data: {...} 的 SSE 帧。
    • 最后一帧通常带有 usage 字段。
    • 网关会单独解析该 usage 用于计费与统计,不影响流式输出。

4. 查看用量与账单

在 apiset.ai 控制台的用量信息中可查看:

  • 按 API Key 的调用次数与总 token 用量。
  • 按模型的用量统计。
  • 单次调用的计费明细,以及余额/配额剩余(若已开启配额或预付费模式)。

控制台界面可能随版本更新,但核心指标(调用次数、token 用量、费用)会持续保留。

5. 常见问题

问:流式调用是否比非流式更贵?
答: 不会。两种方式都按上游最终返回的 usage.total_tokens 计费,拆成多帧不会增加费用。

问:所有模型价格一样吗?
答: 不一样。不同提供商、不同模型价格不同,请以控制台或公开定价文档为准。

问:余额不足或超出配额会怎样?
答: 网关会拒绝新请求并返回如 insufficient_quota 等错误。是否允许透支取决于控制台配置。

问:是否支持包月或套餐?
答: 支持。包月或定制套餐请联系商务/运营,可根据您的预估用量单独配置。