计费与用量

apiset.ai 网关按实际用量计费，主要依据：

网关优先使用上游模型返回的 usage 字段作为计费依据。

费用=prompt_tokens*price_prompt + completion_tokens*price_completion

非流式（stream=false）
上游响应中若包含 usage 字段，网关直接使用其中的 token 数量。
流式（stream=true）
- 上游会返回多段 data: {...} 的 SSE 帧。
- 最后一帧通常带有 usage 字段。
- 网关会单独解析该 usage 用于计费与统计，不影响流式输出。

在 apiset.ai 控制台的用量信息中可查看：

控制台界面可能随版本更新，但核心指标（调用次数、token 用量、费用）会持续保留。

问：流式调用是否比非流式更贵？
答：不会。两种方式都按上游最终返回的 usage.total_tokens 计费，拆成多帧不会增加费用。

问：所有模型价格一样吗？
答：不一样。不同提供商、不同模型价格不同，请以控制台或公开定价文档为准。

问：余额不足或超出配额会怎样？
答：网关会拒绝新请求并返回如 insufficient_quota 等错误。是否允许透支取决于控制台配置。

问：是否支持包月或套餐？
答：支持。包月或定制套餐请联系商务/运营，可根据您的预估用量单独配置。