Alibaba Cloud / Qwen生产可用
适用场景中文问答, 结构化输出, agent workflows
路由已配置
流式输出推理JSON 模式
决策表
| 模型 | 提供方 | 输入 | 输出 | 上下文 | 能力 | 适用场景 | 延迟 | 状态 | 来源 |
|---|---|---|---|---|---|---|---|---|---|
| Qwen3 Max (2026-01-23)qwen3-max-2026-01-23 | Alibaba Cloud / Qwen | ¥1.99 / 1M tokens | ¥7.95 / 1M tokens | n/a | 流式输出推理JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| GUI Plus (2026-02-26)gui-plus-2026-02-26 | Alibaba Cloud / Qwen | ¥1.23 / 1M tokens | ¥3.69 / 1M tokens | n/a | JSON 模式流式输出 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen Flash Characterqwen-flash-character | Alibaba Cloud / Qwen | ¥0.205 / 1M tokens | ¥1.23 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen Flash Character (2026-02-26)qwen-flash-character-2026-02-26 | Alibaba Cloud / Qwen | ¥0.148 / 1M tokens | ¥1.23 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Flashqwen3.5-flash | Alibaba Cloud / Qwen | ¥0.161 / 1M tokens | ¥1.61 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Flash (2026-02-23)qwen3.5-flash-2026-02-23 | Alibaba Cloud / Qwen | ¥0.161 / 1M tokens | ¥1.61 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Flash (2026-03-15)qwen3.5-omni-flash-2026-03-15 | Alibaba Cloud / Qwen | ¥1.80 / 1M tokens | ¥10.91 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Flash Realtimeqwen3.5-omni-flash-realtime | Alibaba Cloud / Qwen | ¥2.71 / 1M tokens | ¥16.40 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Flash Realtime (2026-03-15)qwen3.5-omni-flash-realtime-2026-03-15 | Alibaba Cloud / Qwen | ¥2.71 / 1M tokens | ¥16.40 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Plusqwen3.5-omni-plus | Alibaba Cloud / Qwen | ¥5.74 / 1M tokens | ¥32.80 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Plus (2026-03-15)qwen3.5-omni-plus-2026-03-15 | Alibaba Cloud / Qwen | ¥5.74 / 1M tokens | ¥32.80 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Plus Realtimeqwen3.5-omni-plus-realtime | Alibaba Cloud / Qwen | ¥8.20 / 1M tokens | ¥49.20 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3.5 Omni Plus Realtime (2026-03-15)qwen3.5-omni-plus-realtime-2026-03-15 | Alibaba Cloud / Qwen | ¥8.20 / 1M tokens | ¥49.20 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3.6 Flashqwen3.6-flash | Alibaba Cloud / Qwen | ¥0.966 / 1M tokens | ¥5.80 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.6 Plusqwen3.6-plus | Alibaba Cloud / Qwen | ¥1.34 / 1M tokens | ¥8.06 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen3.6 Plus (2026-04-02)qwen3.6-plus-2026-04-02 | Alibaba Cloud / Qwen | ¥1.34 / 1M tokens | ¥8.06 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Tongyi Xiaomi Analysis Flashtongyi-xiaomi-analysis-flash | Alibaba Cloud / Qwen | ¥0.164 / 1M tokens | ¥0.328 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Tongyi Xiaomi Analysis Protongyi-xiaomi-analysis-pro | Alibaba Cloud / Qwen | ¥0.82 / 1M tokens | ¥2.21 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Qwen Image Edit Maxqwen-image-edit-max | Alibaba Cloud / Qwen | ¥0.41 / 每张 | 每张 | n/a | 流式输出视觉推理JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Qwen Image Edit Max (2026-01-16)qwen-image-edit-max-2026-01-16 | Alibaba Cloud / Qwen | ¥0.41 / 每张 | 每张 | n/a | 流式输出视觉推理JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Qwen Image Maxqwen-image-max | Alibaba Cloud / Qwen | ¥0.41 / 每张 | 每张 | n/a | 流式输出视觉推理JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Qwen Image Max (2025-12-30)qwen-image-max-2025-12-30 | Alibaba Cloud / Qwen | ¥0.41 / 每张 | 每张 | n/a | 流式输出视觉推理JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Qwen3 VL Embeddingqwen3-vl-embedding | Alibaba Cloud / Qwen | ¥0.564 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3 VL Rerankqwen3-vl-rerank | Alibaba Cloud / Qwen | ¥0.564 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 | 提供方公开定价 |
| Tongyi Embedding Vision Flash (2026-03-06)tongyi-embedding-vision-flash-2026-03-06 | Alibaba Cloud / Qwen | ¥0.121 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 | 提供方公开定价 |
| Tongyi Embedding Vision Plus (2026-03-06)tongyi-embedding-vision-plus-2026-03-06 | Alibaba Cloud / Qwen | ¥0.403 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 | 提供方公开定价 |
| Qwen Image 2.0qwen-image-2.0 | Alibaba Cloud / Qwen | ¥0.164 / 每张 | 每张 | n/a | 流式输出视觉JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Qwen Image 2.0 (2026-03-03)qwen-image-2.0-2026-03-03 | Alibaba Cloud / Qwen | ¥0.164 / 每张 | 每张 | n/a | 流式输出视觉JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Qwen Image 2.0 Proqwen-image-2.0-pro | Alibaba Cloud / Qwen | ¥0.41 / 每张 | 每张 | n/a | 流式输出视觉JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Qwen Image 2.0 Pro (2026-03-03)qwen-image-2.0-pro-2026-03-03 | Alibaba Cloud / Qwen | ¥0.41 / 每张 | 每张 | n/a | 流式输出视觉JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Qwen Mt Imageqwen-mt-image | Alibaba Cloud / Qwen | ¥0.0025 / 每张 | 每张 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 2500-12000ms | 生产可用 | 提供方公开定价 |
| Cosyvoice V3.5 Flashcosyvoice-v3.5-flash | Alibaba Cloud / Qwen | ¥0.656 / 每万字 | 每万字 | n/a | JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Cosyvoice V3.5 Pluscosyvoice-v3.5-plus | Alibaba Cloud / Qwen | ¥1.23 / 每万字 | 每万字 | n/a | JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 | 提供方公开定价 |
| Fun ASR (2025-11-07)fun-asr-2025-11-07 | Alibaba Cloud / Qwen | ¥0.0002 / 每秒 | 每秒 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 900-4200ms | 生产可用 | 提供方公开定价 |
| Fun ASR Flash 8k Realtimefun-asr-flash-8k-realtime | Alibaba Cloud / Qwen | ¥0.0002 / 每秒 | 每秒 | n/a | 流式输出 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Fun ASR Flash 8k Realtime (2026-01-28)fun-asr-flash-8k-realtime-2026-01-28 | Alibaba Cloud / Qwen | ¥0.0002 / 每秒 | 每秒 | n/a | 流式输出 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Fun ASR Realtime (2026-02-28)fun-asr-realtime-2026-02-28 | Alibaba Cloud / Qwen | ¥0.0003 / 每秒 | 每秒 | n/a | 流式输出 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3 ASR Flash Filetransqwen3-asr-flash-filetrans | Alibaba Cloud / Qwen | ¥0.0002 / 每秒 | 每秒 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 900-4200ms | 生产可用 | 提供方公开定价 |
| Qwen3 ASR Flash Filetrans (2025-11-17)qwen3-asr-flash-filetrans-2025-11-17 | Alibaba Cloud / Qwen | ¥0.0002 / 每秒 | 每秒 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 900-4200ms | 生产可用 | 提供方公开定价 |
| Qwen3 ASR Flash Realtime (2026-02-10)qwen3-asr-flash-realtime-2026-02-10 | Alibaba Cloud / Qwen | ¥0.0003 / 每秒 | 每秒 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3 TTS Instruct Flashqwen3-tts-instruct-flash | Alibaba Cloud / Qwen | ¥0.656 / 每万字 | 每万字 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 900-4200ms | 生产可用 | 提供方公开定价 |
| Qwen3 TTS Instruct Flash (2026-01-26)qwen3-tts-instruct-flash-2026-01-26 | Alibaba Cloud / Qwen | ¥0.656 / 每万字 | 每万字 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 900-4200ms | 生产可用 | 提供方公开定价 |
| Qwen3 TTS Instruct Flash Realtimeqwen3-tts-instruct-flash-realtime | Alibaba Cloud / Qwen | ¥0.82 / 每万字 | 每万字 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3 TTS Instruct Flash Realtime (2026-01-22)qwen3-tts-instruct-flash-realtime-2026-01-22 | Alibaba Cloud / Qwen | ¥0.82 / 每万字 | 每万字 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 400-1600ms | 生产可用 | 提供方公开定价 |
| Qwen3 TTS Vc (2026-01-22)qwen3-tts-vc-2026-01-22 | Alibaba Cloud / Qwen | ¥0.656 / 每万字 | 每万字 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 900-4200ms | 生产可用 | 提供方公开定价 |
| Qwen3 TTS Vd (2026-01-26)qwen3-tts-vd-2026-01-26 | Alibaba Cloud / Qwen | ¥0.656 / 每万字 | 每万字 | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 900-4200ms | 生产可用 | 提供方公开定价 |