文章摘要
通义千问发布Qwen3.6-Max-Preview预览版,相比Qwen3.6-Plus版本在知识理解、指令跟随和智能编码能力上有显著提升。该模型目前仍处于持续优化阶段,可通过阿里云平台体验,未来性能还将进一步增强。
文章总结
通义千问3.6-Max预览版发布:更智能、更精准的持续进化
在推出Qwen3.6-Plus版本后,我们正式发布新一代专有模型Qwen3.6-Max的预览版本。该版本在知识储备、指令遵循和智能体编码能力方面实现显著提升,目前仍在持续迭代优化中。
核心升级亮点: - 智能体编码能力显著增强(SkillsBench提升9.9分,SciCode提升6.3分) - 世界知识库与指令遵循能力优化(SuperGPQA提升2.3分,中文基准提升5.3分) - 真实场景下的智能体可靠性提升
技术特性: 1. 部署方式: - 通过阿里云Model Studio平台提供托管服务 - 即将开放API调用(模型标识:qwen3.6-max-preview) - 用户可通过Qwen Studio进行交互式体验
性能表现:
- 在六大编程基准测试(SWE-bench Pro等)中取得领先成绩
- 知识类测试(SuperGPQA等)和指令遵循测试表现突出
API特色功能:
- 支持"preserve_thinking"特性,保留智能体任务的完整思考链
- 兼容OpenAI规范的标准API接口
- 提供多区域服务节点(北京/新加坡/弗吉尼亚)
开发进展: 作为预览版本,Qwen3.6-Max仍在持续优化中。团队欢迎开发者通过官方渠道提交反馈,共同推动模型进化。完整版本即将登陆阿里云Model Studio平台。
[注:原文中的代码示例、具体分数对比及引用格式等技术细节已作简化处理,保留核心功能说明]
评论总结
以下是评论内容的总结:
模型比较的质疑
- 有评论认为将Opus 4.5与其他模型比较不够客观,因为Opus 4.6已发布较长时间(评论1)。
- 也有用户对未包含OpenAI模型表示疑惑,并质疑Z GLM 5.1的优异表现是否真实(评论3)。
实际使用体验
- 部分用户更关注性价比,如MiniMax M2.5以低成本满足需求(评论4)。
- 在特定领域(如实时路径追踪),Qwen的表现优于Claude和Gemini(评论6)。
开源与商业化的矛盾
- 担忧行业趋势从开源转向闭源,可能导致普通用户失去计算自主权(评论5)。
模型可用性问题
- 用户反映Qwen 3.6 Plus订阅困难,质疑宣传与实际可用的差距(评论7)。
工具适用性的观点
- 强调不同模型各有优势,实际表现比基准测试更重要(评论8)。
关键引用:
- "Opus 4.6 has been out for quite some time"(评论1)
- "Qwen always gave me proper, practical and correct information"(评论6)
- "The day no one releases open weights is a sad day for humanity"(评论5)
- "They brag about Qwen but don’t let people use it"(评论7)
- "Benchmarks are one thing but reality is what the modes actually do"(评论8)