Hacker News 中文摘要

RSS订阅

DeepSeek-v3.1 版本发布 -- DeepSeek-v3.1 Release

文章摘要

DeepSeek-V3.1发布,标志着迈向智能代理时代的第一步。该版本引入混合推理模式(Think/Non-Think),提升思考速度,增强工具使用和多步任务处理能力。API更新支持128K上下文、Anthropic API格式及严格函数调用,优化API体验。工具和代理功能也得到升级。

文章总结

DeepSeek-V3.1 发布 | DeepSeek API 文档

2025年8月21日,DeepSeek 发布了其最新版本 DeepSeek-V3.1,标志着向智能代理时代迈出了重要一步。此次更新带来了多项创新和改进,以下是主要内容:

核心功能更新: - 混合推理模式:DeepSeek-V3.1 引入了“思考”与“非思考”两种模式,用户可以通过“DeepThink”按钮进行切换。 - 更快的思考速度:与之前的 DeepSeek-R1-0528 相比,DeepSeek-V3.1 在“思考”模式下能够更快地得出答案。 - 增强的代理技能:通过后训练,DeepSeek-V3.1 在工具使用和多步骤代理任务方面表现更佳。

API 更新: - 模式区分deepseek-chat 对应“非思考”模式,deepseek-reasoner 对应“思考”模式。 - 上下文支持:两种模式均支持 128K 的上下文长度。 - API 格式支持:新增对 Anthropic API 格式的支持,并提供了严格的函数调用功能(Beta 版)。 - API 体验优化:更多 API 资源,使用更加流畅。

工具与代理升级: - 性能提升:在 SWE / Terminal-Bench 测试中表现更佳,复杂搜索任务的多步骤推理能力显著增强。 - 思考效率提升:整体思考效率大幅提高。

模型更新: - 基础模型:V3.1 Base 在 V3 的基础上进行了 840B 个 token 的预训练,扩展了长上下文处理能力。 - 分词器与聊天模板更新:更新了分词器配置和聊天模板。 - 开源权重:V3.1 Base 和 V3.1 的开源权重已发布在 Hugging Face 平台上。

价格调整: - 新价格生效时间:新价格将于 2025 年 9 月 5 日 16:00(UTC 时间)开始执行,届时非高峰时段的折扣将结束。 - 当前价格:在此之前,API 将继续沿用当前价格。

此次更新不仅提升了 DeepSeek 的性能和功能,还为用户提供了更加灵活和高效的 API 使用体验。更多详细信息可访问 DeepSeek 的官方文档和定价页面。

评论总结

评论内容总结:

  1. 模型性能与基准测试

    • 评论1指出,该模型在基准测试中表现不如GPT-5、Claude 4和GLM-4.5,但在开源模型中表现尚可。
      引用:“Looks like it doesn't get close to GPT-5, Claude 4, or GLM-4.5, but still does reasonably well compared to other open weight models.”
    • 评论3认为该模型在推理能力上落后于Qwen3 235B 2507 Reasoning和gpt-oss-120B。
      引用:“It seems behind Qwen3 235B 2507 Reasoning (which I like) and gpt-oss-120B.”
  2. 工具调用与格式问题

    • 评论2提到该模型在工具调用方面表现良好,但经常使用过时的工具格式而非标准JSON格式,推测可能是由于V3训练集的影响。
      引用:“It's good with tool calls and doesn't think too much about everything, but it regularly uses outdated tool formats randomly instead of the standard JSON format.”
  3. 价格与性能分析需求

    • 评论4建议提供一个详细的图表,展示不同模型、提示和硬件组合下的“每Token每秒价格”分析,以便更好地评估性价比。
      引用:“Unrelated, but it would really be nice to have a chart breaking down Price Per Token Per Second for various model, prompt, and hardware combinations.”

总结:评论主要围绕模型的性能、工具调用问题以及价格分析需求展开,既有对模型表现的客观评价,也有对改进建议的提出。