文章摘要
阿里巴巴发布Qwen3.7系列模型预览版(Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview),在文本领域排名第6,视觉领域排名第5。该系列即将正式发布,敬请期待。
文章总结
【阿里云Qwen大模型3.7预览版登陆Arena平台】
阿里云Qwen官方账号宣布: 1. 最新发布的Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview两大预览版模型已登陆Arena测试平台 2. 当前排名表现: - 文本领域:阿里实验室总排名第6位 * Qwen3.7 Max Preview综合排名第13 * 细分领域:数学第7/专家咨询第9/软件IT第9/编程第10 - 视觉领域:实验室总排名第5位 * Qwen3.7 Plus Preview综合排名第16
文末以"⚡️即将正式发布Qwen3.7系列模型,敬请期待!"作为预告,并@Arena官方账号互动。
(注:原文中重复的火箭/闪电表情符号、图片链接及浏览数据等非核心信息已作简化处理,发布时间2026年5月18日保留作为时效参考)
评论总结
以下是评论内容的总结:
- 对Qwen新模型的期待与肯定
- 用户对Qwen3.7预览版表示期待,认为Qwen3.6 27B已展现良好性能 关键引用: "Can't wait to release Qwen3.7 series models!Stay tuned!" "Qwen3.6 27b is the first one that can do things and doesnt constantly loose 'it's mind'"
- 对模型迭代速度的讨论
- 部分用户认为迭代过快,也有用户赞赏快速迭代带来的竞争压力 关键引用: "I'm still trying to find the limits of 3.6 27B and they are already threatening us with a new one?" "I love the fast iteration...Putting more and more pressure on the bigger labs to perform better"
- 对开源政策的关注
- 用户赞赏Qwen的开源策略,但也表达对未来可能改变的担忧 关键引用: "Let's hope Alibaba continues to open source its models" "Worried the Chinese team will change their mind once they have parity"
- 模型性能评价
- Qwen3.6 35B被认为接近专有模型水平,视觉能力被低估 关键引用: "Qwen 3.6 35B is so good that it became standard open weights for everyday use" "Vision has become totally underappreciated, whereas I believe it brings important advantages"
- 行业比较与基准测试需求
- 用户比较不同实验室进展,呼吁更客观的基准测试标准 关键引用: "Where's Grok 4.3 on the leaderboard?" "Can someone explain what the current state of model benchmarking is?"
- 硬件适配问题
- 部分用户关注模型在消费级硬件上的运行能力 关键引用: "waiting on a smaller version of Qwen 3.6 to drop so I can run it on my Mac" "love the llmfit project for seeing what will run on your hardware"
- 对其他模型的评价
- 用户对Meta新模型表示意外,认为Grok进展缓慢 关键引用: "Today I learned Meta's new model is preferred to everything but claude" "hilarious how far behind Grok is"