文章摘要
Mistral推出云端远程代理功能,将编程任务迁移至云端异步执行,用户可通过命令行或Le Chat启动任务。新发布的Mistral Medium 3.5模型整合指令跟随、推理和编程能力,支持128B参数规模,采用修改版MIT许可开源。Le Chat新增工作模式,配备强大代理处理多步骤复杂任务。
文章总结
标题:Vibe平台推出基于Mistral Medium 3.5的远程智能体
核心内容:
- 云端智能体革新
- 编程智能体从本地迁移至云端,支持并行运行和异步通知
- 可通过Mistral Vibe CLI或Le Chat直接启动
- 本地会话可无缝迁移至云端
- Mistral Medium 3.5旗舰模型
- 1280亿参数密集模型,256k上下文窗口
- 整合指令跟随、推理和编程能力
- 开源权重(修改版MIT许可)
- 支持4块GPU自托管部署
- SWE-Bench得分77.6%,τ³-Telecom得分91.4
- Vibe远程智能体功能
- 云端持久化运行编程任务
- 支持GitHub、Linear、Jira等开发工具集成
- 隔离沙箱环境,自动生成PR
- 适用于模块重构、测试生成等重复性工作
- Le Chat工作模式(预览版)
- 多步骤复杂任务处理能力
- 跨工具工作流(邮件/日历/文档协同)
- 研究分析与信息整合
- 敏感操作需人工确认
部署信息: - 已在Mistral Vibe和Le Chat Pro/Team/Enterprise版上线 - API定价:输入$1.5/百万token,输出$7.5/百万token - 提供NVIDIA GPU加速端点及容器化微服务
(注:原文中的图片描述及部分技术细节已精简,保留了核心产品特性和技术参数)
评论总结
以下是评论内容的总结,平衡呈现不同观点并保留关键引用:
性能质疑
- 认为Mistral模型表现平庸,不及前沿模型(评论1/2/6)
- "after trying GPT-5.5 even the most advanced Chinese models seem depressing"(评论1)
- "This release really reminds you of the gap between the frontier labs and everyone else"(评论6)
技术参数争议
- 对基准测试有效性提出质疑(评论2/11)
- "A benchmark Open-AI stopped using two months ago due to contamination"(评论2)
- "It's funny that 128B is now considered Medium"(评论11)
性价比讨论
- 认可其在小模型领域的价值(评论5/13)
- "Mistral Small 4 performed well for it's price ($.15/$.60)"(评论5)
- "Getting 80% of the frontier at 20% of the cost/size sounds really good"(评论13)
非技术优势
- 赞赏其非美国背景和开源策略(评论4/7)
- "Any news from non US and non Chinese models is still good news"(评论4)
- "Model diversity is great...truly an independently trained model"(评论7)
使用体验问题
- 指出具体功能缺陷(评论8/14)
- "Disappointed in its bad explanations about French grammar"(评论8)
- "Christ on a bike it's bad at drawing SVGs"(评论14)
商业前景担忧
- 对其商业模式可持续性存疑(评论9/12)
- "Can they make a profit with $15/month model?"(评论9)
- "Assuming they are still burning through investor money"(评论12)
API混乱
- 对版本信息混乱表示困惑(评论10)
- "Can't figure out if this is available in the official API"(评论10)