Alibaba Cloud / Qwen生产可用
适用场景中文问答, 结构化输出, agent workflows
路由已配置
流式输出推理JSON 模式
上下文长度
对比表
| 模型 | 提供方 | 输入 | 输出 | 上下文 | 能力 | 适用场景 | 延迟 | 状态 | 来源 |
|---|---|---|---|---|---|---|---|---|---|
| Qwen3 Max (2026-01-23)qwen3-max-2026-01-23 | Alibaba Cloud / Qwen | ¥1.99 / 1M tokens | ¥7.95 / 1M tokens | n/a | 流式输出推理JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| GUI Plus (2026-02-26)gui-plus-2026-02-26 | Alibaba Cloud / Qwen | ¥1.23 / 1M tokens | ¥3.69 / 1M tokens | n/a | JSON 模式流式输出 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen Flash Characterqwen-flash-character | Alibaba Cloud / Qwen | ¥0.205 / 1M tokens | ¥1.23 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen Flash Character (2026-02-26)qwen-flash-character-2026-02-26 | Alibaba Cloud / Qwen | ¥0.148 / 1M tokens | ¥1.23 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Flashqwen3.5-flash | Alibaba Cloud / Qwen | ¥0.161 / 1M tokens | ¥1.61 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Flash (2026-02-23)qwen3.5-flash-2026-02-23 | Alibaba Cloud / Qwen | ¥0.161 / 1M tokens | ¥1.61 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Flash (2026-03-15)qwen3.5-omni-flash-2026-03-15 | Alibaba Cloud / Qwen | ¥1.80 / 1M tokens | ¥10.91 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Flash Realtimeqwen3.5-omni-flash-realtime | Alibaba Cloud / Qwen | ¥2.71 / 1M tokens | ¥16.40 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |