按量付费
模型费率- PoC 和单项目
- 上线前估算
- OpenAI 请求格式
计算器
成本 = 请求次数 × token × 单价 / 1,000,000。
Qwen3 Max:¥2.20。
模型价格、token、请求量。
低成本参考
| 模型 | 提供方 | 输入 | 输出 | 上下文 | 能力 | 适用场景 | 延迟 | 状态 | 来源 |
|---|---|---|---|---|---|---|---|---|---|
| Tongyi Embedding Vision Flash (2026-03-06)tongyi-embedding-vision-flash-2026-03-06 | Alibaba Cloud / Qwen | ¥0.121 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 | 提供方公开定价 |
| Tongyi Embedding Vision Plus (2026-03-06)tongyi-embedding-vision-plus-2026-03-06 | Alibaba Cloud / Qwen | ¥0.403 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 | 提供方公开定价 |
| Tongyi Xiaomi Analysis Flashtongyi-xiaomi-analysis-flash | Alibaba Cloud / Qwen | ¥0.164 / 1M tokens | ¥0.328 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3 VL Embeddingqwen3-vl-embedding | Alibaba Cloud / Qwen | ¥0.564 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3 VL Rerankqwen3-vl-rerank | Alibaba Cloud / Qwen | ¥0.564 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 | 提供方公开定价 |
| Qwen Flash Character (2026-02-26)qwen-flash-character-2026-02-26 | Alibaba Cloud / Qwen | ¥0.148 / 1M tokens | ¥1.23 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen Flash Characterqwen-flash-character | Alibaba Cloud / Qwen | ¥0.205 / 1M tokens | ¥1.23 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Flashqwen3.5-flash | Alibaba Cloud / Qwen | ¥0.161 / 1M tokens | ¥1.61 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |