计费与用量
1. 计费维度
apiset.ai 网关按实际用量计费,主要依据:
- 提示 token 数(
prompt_tokens) - 补全 token 数(
completion_tokens) - 总 token 数(
total_tokens)
网关优先使用上游模型返回的 usage 字段作为计费依据。
2. 计费方式
- 按每千 token定价,不同模型价格不同,详见控制台或定价文档。
- 典型计算公式为:
费用=prompt_tokens*price_prompt + completion_tokens*price_completion
- 内部采用最小货币单位(如分)和整数运算,避免浮点误差。
3. 流式与非流式的用量统计
非流式(
stream=false)
上游响应中若包含usage字段,网关直接使用其中的 token 数量。流式(
stream=true)- 上游会返回多段
data: {...}的 SSE 帧。 - 最后一帧通常带有
usage字段。 - 网关会单独解析该
usage用于计费与统计,不影响流式输出。
- 上游会返回多段
4. 查看用量与账单
在 apiset.ai 控制台的用量信息中可查看:
- 按 API Key 的调用次数与总 token 用量。
- 按模型的用量统计。
- 单次调用的计费明细,以及余额/配额剩余(若已开启配额或预付费模式)。
控制台界面可能随版本更新,但核心指标(调用次数、token 用量、费用)会持续保留。
5. 常见问题
问:流式调用是否比非流式更贵?
答: 不会。两种方式都按上游最终返回的 usage.total_tokens 计费,拆成多帧不会增加费用。
问:所有模型价格一样吗?
答: 不一样。不同提供商、不同模型价格不同,请以控制台或公开定价文档为准。
问:余额不足或超出配额会怎样?
答: 网关会拒绝新请求并返回如 insufficient_quota 等错误。是否允许透支取决于控制台配置。
问:是否支持包月或套餐?
答: 支持。包月或定制套餐请联系商务/运营,可根据您的预估用量单独配置。