Hacker News 中文摘要

文章摘要

中国AI实验室深度求索发布了DeepSeek V4系列预览模型，包括1.6万亿参数的Pro版和2840亿参数的Flash版，均支持100万token上下文。Pro版成为目前最大的开源权重模型，性能接近前沿但价格更低。Flash版有望在128GB内存设备上运行。

文章总结

DeepSeek V4：接近前沿性能，价格仅为几分之一

中国AI实验室DeepSeek在2025年12月发布了V3.2系列模型后，于2026年4月推出了备受期待的V4系列预览版，包括DeepSeek-V4-Pro和DeepSeek-V4-Flash。

这两款模型均支持100万token的上下文长度，并采用混合专家（Mixture of Experts）架构。其中，Pro版总参数量达1.6万亿，激活参数490亿；Flash版总参数量2840亿，激活参数130亿。两款模型均采用MIT开源协议。

DeepSeek-V4-Pro可能是目前最大的开源权重模型，规模超过Kimi K2.6（1.1万亿）、GLM-5.1（7540亿），甚至是DeepSeek V3.2（6850亿）的两倍多。

在Hugging Face上，Pro模型体积为865GB，Flash为160GB。作者希望量化后的Flash能在128GB的M5 MacBook Pro上运行，而Pro模型或许也能通过仅加载必要的专家模块实现运行。

作者通过OpenRouter测试了这两款模型，并让它们生成“鹈鹕骑自行车”的SVG图像。结果显示，Flash版生成的图像细节更佳，而Pro版虽然自行车结构合理，但鹈鹕的造型略显怪异。

价格优势显著
DeepSeek V4的定价极具竞争力：
- Flash版：输入$0.14/百万token，输出$0.28/百万token
- Pro版：输入$1.74/百万token，输出$3.48/百万token

与其他前沿模型（如GPT-5.4、Gemini 3.1、Claude Haiku）相比，DeepSeek V4-Flash是小型模型中最便宜的，甚至低于OpenAI的GPT-5.4 Nano；而Pro版则是大型模型中性价比最高的。

高效优化
DeepSeek在论文中提到，V4系列在长上下文场景下的效率大幅提升：
- Pro版：单token计算量（FP8等效）仅为V3.2的27%，KV缓存占用减少90%
- Flash版：单token计算量降至V3.2的10%，KV缓存占用减少93%

尽管基准测试显示Pro版性能接近GPT-5.2和Gemini-3.0-Pro，但仍略逊于最新的GPT-5.4和Gemini-3.1-Pro，差距约3-6个月的发展周期。

作者期待后续的量化版本，并关注Flash模型在本地设备上的运行表现。

发布日期：2026年4月24日
标签：#AI #开源模型 #DeepSeek #大语言模型

评论总结

以下是评论内容的总结，涵盖主要观点和论据：

性能与性价比
- 多位用户认为Deepseek v4 Pro在性能上接近或优于OpenAI和Claude的模型，且价格更具优势。
  - "in terms of quality it seems more or less on par with open AIs 5.4 or opus 4.6" (评论1)
  - "at 1/10 the cost of less, there's just no comparison" (评论4)
- 具体案例显示，相同任务下Deepseek的成本显著低于Claude Opus。
  - "total cost? Just $0.09... On Claude Opus... would have burned somewhere between $9 to $13" (评论5)
使用场景与限制
- 用户多用于前端开发、代码审查等任务，效果良好，但部分用户指出其推理过程不够流畅。
  - "pages and pages of 'actually no', 'hang on'... like the model was having a breakdown" (评论9)
  - "performing quite well for basic coding, without hitting any limits" (评论6)
数据隐私与模型训练
- 有用户对数据隐私表示担忧，认为中文模型的数据使用问题被忽视。
  - "people here don't care at all about these models openly training on your data" (评论7)
折扣与长期价值
- 当前75%的折扣可能影响性价比评估，但用户仍认为其长期价值突出。
  - "the value is incredible... even without the currently discounted pricing" (评论4)
评测标准争议
- 部分用户认为现有评测标准（如"pelican"测试）已过时，需引入更复杂的挑战。
  - "The pelican is really getting old... time to add something else more novel" (评论2)
模型进步
- 与早期版本相比，V4的性能提升显著，尤其在编码任务上。
  - "V4... has completely demolished all the Flash/Lite/Spark models" (评论10)

总结：Deepseek v4 Pro在性价比和特定任务性能上获得较多认可，但存在推理流畅性和数据隐私的争议，同时评测标准需更新以反映真实能力。

DeepSeek V4——接近前沿性能，价格却低至几分之一 -- DeepSeek V4–almost on the frontier, a fraction of the price

文章摘要

文章总结

DeepSeek V4：接近前沿性能，价格仅为几分之一

评论总结