Hacker News 中文摘要

RSS订阅

Mistral Medium 3.5 -- Mistral Medium 3.5

文章摘要

Mistral推出云端远程代理功能,将编程任务迁移至云端异步执行,用户可通过命令行或Le Chat启动任务。新发布的Mistral Medium 3.5模型整合指令跟随、推理和编程能力,支持128B参数规模,采用修改版MIT许可开源。Le Chat新增工作模式,配备强大代理处理多步骤复杂任务。

文章总结

标题:Vibe平台推出基于Mistral Medium 3.5的远程智能体

核心内容:

  1. 云端智能体革新
  • 编程智能体从本地迁移至云端,支持并行运行和异步通知
  • 可通过Mistral Vibe CLI或Le Chat直接启动
  • 本地会话可无缝迁移至云端
  1. Mistral Medium 3.5旗舰模型
  • 1280亿参数密集模型,256k上下文窗口
  • 整合指令跟随、推理和编程能力
  • 开源权重(修改版MIT许可)
  • 支持4块GPU自托管部署
  • SWE-Bench得分77.6%,τ³-Telecom得分91.4
  1. Vibe远程智能体功能
  • 云端持久化运行编程任务
  • 支持GitHub、Linear、Jira等开发工具集成
  • 隔离沙箱环境,自动生成PR
  • 适用于模块重构、测试生成等重复性工作
  1. Le Chat工作模式(预览版)
  • 多步骤复杂任务处理能力
  • 跨工具工作流(邮件/日历/文档协同)
  • 研究分析与信息整合
  • 敏感操作需人工确认

部署信息: - 已在Mistral Vibe和Le Chat Pro/Team/Enterprise版上线 - API定价:输入$1.5/百万token,输出$7.5/百万token - 提供NVIDIA GPU加速端点及容器化微服务

(注:原文中的图片描述及部分技术细节已精简,保留了核心产品特性和技术参数)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

  1. 性能质疑

    • 认为Mistral模型表现平庸,不及前沿模型(评论1/2/6)
    • "after trying GPT-5.5 even the most advanced Chinese models seem depressing"(评论1)
    • "This release really reminds you of the gap between the frontier labs and everyone else"(评论6)
  2. 技术参数争议

    • 对基准测试有效性提出质疑(评论2/11)
    • "A benchmark Open-AI stopped using two months ago due to contamination"(评论2)
    • "It's funny that 128B is now considered Medium"(评论11)
  3. 性价比讨论

    • 认可其在小模型领域的价值(评论5/13)
    • "Mistral Small 4 performed well for it's price ($.15/$.60)"(评论5)
    • "Getting 80% of the frontier at 20% of the cost/size sounds really good"(评论13)
  4. 非技术优势

    • 赞赏其非美国背景和开源策略(评论4/7)
    • "Any news from non US and non Chinese models is still good news"(评论4)
    • "Model diversity is great...truly an independently trained model"(评论7)
  5. 使用体验问题

    • 指出具体功能缺陷(评论8/14)
    • "Disappointed in its bad explanations about French grammar"(评论8)
    • "Christ on a bike it's bad at drawing SVGs"(评论14)
  6. 商业前景担忧

    • 对其商业模式可持续性存疑(评论9/12)
    • "Can they make a profit with $15/month model?"(评论9)
    • "Assuming they are still burning through investor money"(评论12)
  7. API混乱

    • 对版本信息混乱表示困惑(评论10)
    • "Can't figure out if this is available in the official API"(评论10)