文章摘要
Cursor发布了Composer 2.5版本,相比2.0版本在智能水平和行为表现上有显著提升。新版本能更好地处理长期任务,更可靠地执行复杂指令,并改善了协作体验。团队通过扩展训练规模、创建更复杂的强化学习环境以及引入新学习方法来实现这些改进,同时还优化了模型的沟通风格和任务处理能力等行为特征。
文章总结
标题:Composer 2.5正式发布
Cursor现已推出Composer 2.5版本。相较于Composer 2,这一版本在智能水平和行为表现上都有显著提升,具体体现在:更擅长处理长期任务、更可靠地执行复杂指令,以及提供更优质的人机协作体验。
核心升级亮点: 1. 技术架构优化 - 基于Moonshot的Kimi K2.5开源检查点构建(与Composer 2同源) - 采用分片式Muon和双网格HSDP训练技术 - 专家权重正交化耗时仅0.2秒(1T参数模型)
- 训练方法革新
- 引入文本反馈强化学习:通过局部上下文提示修正特定错误(如工具调用失误)
- 合成数据量提升25倍:采用特征删除等动态任务生成方法
- 发现并修复了模型逆向工程等新型奖励破解行为
- 性能表现提升
- 基准测试显示全面进步
- 优化了沟通风格和任务投入度等实用维度
- 与SpaceXAI合作启动10倍算力的下一代模型训练
定价方案: - 标准版:输入$0.50/百万token,输出$2.50/百万token - 加速版(默认选项):输入$3.00/百万token,输出$15.00/百万token - 首周提供双倍使用额度
(注:原文中的10张配图链接已省略,涉及基准测试结果、训练曲线等技术细节图表)
评论总结
以下是评论内容的总结:
技术突破与成本优势(正面评价)
- 认为Cursor基于Kimi 2.5开发的Composer 2.5模型实现了SOTA性能,且成本仅为1/10
- 引用:"The model is based on Kimi K2.5...SOTA performance for 1/10th of the cost" (评论1)
- 引用:"focusing on value (latency + intelligence + cost)" (评论8)
性能质疑(负面评价)
- 用户反映实际使用体验与宣传有差距,前代产品未达预期
- 引用:"in my day-to-day usage it fell short across the board" (评论4)
- 引用:"it wasn't even close in practice...now 2.5 is supposed to compete with opus 4.7?" (评论5)
商业策略争议
- 价格结构不透明,团队计划费用激增引发质疑
- 引用:"costs seem to have sky rocketed...feels like I'm being scammed" (评论10)
- 引用:"why they'd make this 'fast' version the default, as it appears to be much more expensive" (评论17)
用户体验问题
- 对UI稳定性和功能完善度提出批评
- 引用:"Constant UI changes, half-baked features...useless AI change attribution" (评论18)
行业影响展望
- 认为可能改变AI行业成本结构,但对其宣传数据持保留态度
- 引用:"Wouldn't this compress ai revenue like 15x quickly" (评论13)
- 引用:"could be truly SOTA on coding given that their RL data is this powerful" (评论11)
合作与未来担忧
- 对加入xAI表示期待,但也担心人才流失
- 引用:"I do wish they weren't joining xAI...researchers that departs" (评论12)
注:所有评论均无评分数据,故未体现认可度指标。总结保持了正反观点的平衡,并选取了最具代表性的原始评论引用。