Hacker News 中文摘要

RSS订阅

Qwen3.7-Max:智能代理新前沿 -- Qwen3.7-Max: The Agent Frontier

文章摘要

Qwen3.7-Max是专为智能代理时代设计的最新模型,具备强大的代码编写调试、办公自动化及多步骤自主执行能力。其核心优势在于广泛的代理功能覆盖,包括从前端原型开发到复杂软件工程的编码代理,通过MCP集成实现高效办公协作,并能保持超长流程的连贯推理(如持续35小时完成1000多次工具调用的内核优化)。该模型兼容多种代理框架,即将通过阿里云Model Studio平台发布。

文章总结

通义千问3.7:智能体技术前沿突破

核心亮点: - 全能智能体基座:Qwen3.7-Max专为智能体时代设计,具备代码编写调试、办公自动化、千步级自主执行等综合能力 - 跨框架通用性:在Claude Code/OpenClaw/Qwen Code等不同框架下均表现稳定 - 长期任务处理:创下35小时连续自主执行、1,158次工具调用的内核优化记录

关键能力: 1. 编程智能体: - 终端基准测试Terminus得分69.7(超越DS-V4-Pro Max的67.9) - 多语言编程SWE-Multilingual得分78.3 - SVG代码生成得分1608

  1. 通用智能体

    • 办公自动化SpreadSheetBench-v1得分87
    • GPU内核优化实现1.98倍加速比(96%场景优于PyTorch)
  2. 复杂推理

    • GPQA钻石级问题准确率92.4%
    • 国际数学竞赛HMMT得分97.1

技术突破: - 环境扩展训练:通过多样化训练环境实现能力泛化 - 跨框架泛化:采用任务-框架-验证器解耦架构 - 自主进化:在未知硬件平台(T-Head ZW-M890 PPU)实现10倍性能优化

应用场景: - 生产力助手:自动完成论文格式修正等办公任务 - 前端开发:实时生成Three.js交互式3D应用 - 机器人控制:通过Qwen-RobotClaw框架实现物理世界导航

获取方式: 即将登陆阿里云模型工作室,支持标准API接口和主流智能体框架(Claude Code/OpenClaw/Qwen Code)

引用信息: bibtex @misc{qwen37, title = {{Qwen3.7}: The Agent Frontier}, url = {https://qwen.ai/blog?id=qwen3.7}, author = {{Qwen Team}}, month = {May}, year = {2026}}

评论总结

评论总结:

  1. 模型对比争议(3条评论) 主要质疑为何不与最新竞品对比,而选择旧版本:
  • "I still don’t get why they don’t compare against latest competitor versions" (goyozi)
  • "super strange that all last (3?) releases they keep comparing older models" (bratao)
  1. 开源期待(1条评论) 用户期待更多开源模型:
  • "Looking forward to more open weight releases from Qwen" (tarruda)
  1. 商业合作建议(1条评论) 建议与美国云服务商合作:
  • "wish that they partnered with one of the major US hyperscalers" (tekacs)
  1. 政治审查担忧(2条评论) 关注模型的知识审查问题:
  • "Qwen models I can run censor information...Tiananmen Square" (dfansteel)
  • "can't bring myself to use any model that...sends telemetry back to my country's primary competitor" (howmayiannoyyou)
  1. 产品咨询(3条评论) 包括编码代理、云服务体验和价格信息:
  • "Any reports from people using their coding agent(s)?" (bsenftner)
  • "Any info on pricing and latency?" (XCSme)
  • "Does anyone have experience with the Alibaba Cloud Model Studio?" (esafak)
  1. 性能肯定(1条评论) 称赞非幻觉率表现:
  • "The non-hallucination rate...is SOTA, better than Opus 4.7" (goldenarm)

注:所有评论均未显示评分(None),主要观点分布均衡,包含技术讨论、商业建议和政治关切等多维度内容。