Hacker News 中文摘要

RSS订阅

Qwen 3.7 预览版 -- Qwen 3.7 Preview

文章摘要

阿里巴巴发布Qwen3.7系列模型预览版(Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview),在文本领域排名第6,视觉领域排名第5。该系列即将正式发布,敬请期待。

文章总结

【阿里云Qwen大模型3.7预览版登陆Arena平台】

阿里云Qwen官方账号宣布: 1. 最新发布的Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview两大预览版模型已登陆Arena测试平台 2. 当前排名表现: - 文本领域:阿里实验室总排名第6位 * Qwen3.7 Max Preview综合排名第13 * 细分领域:数学第7/专家咨询第9/软件IT第9/编程第10 - 视觉领域:实验室总排名第5位 * Qwen3.7 Plus Preview综合排名第16

文末以"⚡️即将正式发布Qwen3.7系列模型,敬请期待!"作为预告,并@Arena官方账号互动。

(注:原文中重复的火箭/闪电表情符号、图片链接及浏览数据等非核心信息已作简化处理,发布时间2026年5月18日保留作为时效参考)

评论总结

以下是评论内容的总结:

  1. 对Qwen新模型的期待与肯定
  • 用户对Qwen3.7预览版表示期待,认为Qwen3.6 27B已展现良好性能 关键引用: "Can't wait to release Qwen3.7 series models!Stay tuned!" "Qwen3.6 27b is the first one that can do things and doesnt constantly loose 'it's mind'"
  1. 对模型迭代速度的讨论
  • 部分用户认为迭代过快,也有用户赞赏快速迭代带来的竞争压力 关键引用: "I'm still trying to find the limits of 3.6 27B and they are already threatening us with a new one?" "I love the fast iteration...Putting more and more pressure on the bigger labs to perform better"
  1. 对开源政策的关注
  • 用户赞赏Qwen的开源策略,但也表达对未来可能改变的担忧 关键引用: "Let's hope Alibaba continues to open source its models" "Worried the Chinese team will change their mind once they have parity"
  1. 模型性能评价
  • Qwen3.6 35B被认为接近专有模型水平,视觉能力被低估 关键引用: "Qwen 3.6 35B is so good that it became standard open weights for everyday use" "Vision has become totally underappreciated, whereas I believe it brings important advantages"
  1. 行业比较与基准测试需求
  • 用户比较不同实验室进展,呼吁更客观的基准测试标准 关键引用: "Where's Grok 4.3 on the leaderboard?" "Can someone explain what the current state of model benchmarking is?"
  1. 硬件适配问题
  • 部分用户关注模型在消费级硬件上的运行能力 关键引用: "waiting on a smaller version of Qwen 3.6 to drop so I can run it on my Mac" "love the llmfit project for seeing what will run on your hardware"
  1. 对其他模型的评价
  • 用户对Meta新模型表示意外,认为Grok进展缓慢 关键引用: "Today I learned Meta's new model is preferred to everything but claude" "hilarious how far behind Grok is"