Hacker News 中文摘要

RSS订阅

克劳德寓言5 -- Claude Fable 5

文章摘要

Claude Fable 5是一款高性能AI模型,在软件工程、知识工作、视觉和科研等领域表现卓越。为防范滥用风险,开发者为其设置了安全限制,约5%的查询会被转至次优模型处理。同时面向网络安全专家推出了无限制版的Claude Mythos 5。开发者承诺将持续优化安全机制并提升模型性能。

文章总结

克劳德寓言5与克劳德神话5正式发布

核心内容: 1. 模型发布 - 推出Claude Fable 5:首个面向公众开放使用的Mythos级AI模型,在软件工程、知识工作、视觉、科研等领域展现顶尖性能 - 同步发布Claude Mythos 5:与Fable 5同源但解除部分安全限制,专供网络安全防御者和基础设施供应商使用

  1. 技术突破
  • 任务复杂度越高表现越优异:在5000万行Ruby代码库迁移任务中,将原需2个月的工作压缩至1天完成
  • 视觉能力显著提升:仅凭截图即可重建网页应用源代码,无需辅助工具通关《精灵宝可梦:火红》
  • 生命科学突破:自主设计蛋白质复合物,加速药物研发流程约10倍;在基因组学研究中构建跨138物种的细胞数据库
  1. 安全机制
  • 采用三层分类器防护系统(网络安全/生物化学/能力蒸馏),高危查询自动降级至Claude Opus 4.8处理
  • 实施30天数据保留新政,强化隐私保护与攻击防御能力
  • 测试显示95%的会话无需触发安全降级
  1. 应用案例
  • Stripe报告称将数月工程周期缩短至数天
  • 在金融分析基准测试中创最高分记录
  • 自主完成《杀戮尖塔》游戏通关率提升3倍
  1. 商业化部署
  • 定价:输入100万token 10美元,输出100万token 50美元(较前代降价超50%)
  • 分阶段开放订阅计划,6月23日起转为按用量计费

行业评价摘录: - GitHub:"开发者可委托其完成更复杂的长期编码任务" - 法律机构:"在盲测中其修订条款每次都能匹配或超越现有模型" - 金融机构:"我们测试过最强的金融优先模型"

延伸阅读: - 系统安全卡 - Glasswing项目进展

(注:原文中涉及的16张对比图表、7项视频演示及详细测试数据已浓缩为关键指标陈述)

评论总结

以下是评论内容的总结:

  1. 模型发布与功能讨论
  • 对新发布的Claude Fable 5/Mythos 5模型性能表示期待(评论13、15) "Opus 4.7 xhigh: 5.2% / Opus 4.8 xhigh: 13.4% / Fable 5 xhigh: 29.3%" "11% jump over opus 4.8...22% jump over gpt 5.5"
  1. 定价策略争议
  • 对订阅计划变更表示担忧(评论8、16、19) "offer, then remove...trying to get subscribers to switch to usage-based billing" "pharmaceutical method...free samples then raise price"
  1. 技术能力验证
  • 对模型实际表现持保留态度(评论7、23) "occasionally failing to interpret nuanced instructions" "don't see significant improvement over Sonnet 4.5"
  1. 行业影响
  • 关注竞争对手反应(评论26) "What will be OpenAIs answer to this?"
  1. 命名趣味
  • 对模型命名方式调侃(评论9、17) "run out of genre names...AGI handles its own naming" "joke about naming chatgpt 5.5 Fable"
  1. 使用体验
  • 报告初期使用问题(评论25、29) "got flagged already" "triggered the safety filter"

关键数据: - FrontierCode基准测试显示Fable 5性能显著提升(29.3% vs Opus 4.8的13.4%) - 企业案例显示50倍效率提升(50M行代码迁移从2个月缩短至1天)