文章摘要
中国AI实验室深度求索发布了DeepSeek V4系列预览模型,包括1.6万亿参数的Pro版和2840亿参数的Flash版,均支持100万token上下文。Pro版成为目前最大的开源权重模型,性能接近前沿但价格更低。Flash版有望在128GB内存设备上运行。
文章总结
DeepSeek V4:接近前沿性能,价格仅为几分之一
中国AI实验室DeepSeek在2025年12月发布了V3.2系列模型后,于2026年4月推出了备受期待的V4系列预览版,包括DeepSeek-V4-Pro和DeepSeek-V4-Flash。
这两款模型均支持100万token的上下文长度,并采用混合专家(Mixture of Experts)架构。其中,Pro版总参数量达1.6万亿,激活参数490亿;Flash版总参数量2840亿,激活参数130亿。两款模型均采用MIT开源协议。
DeepSeek-V4-Pro可能是目前最大的开源权重模型,规模超过Kimi K2.6(1.1万亿)、GLM-5.1(7540亿),甚至是DeepSeek V3.2(6850亿)的两倍多。
在Hugging Face上,Pro模型体积为865GB,Flash为160GB。作者希望量化后的Flash能在128GB的M5 MacBook Pro上运行,而Pro模型或许也能通过仅加载必要的专家模块实现运行。
作者通过OpenRouter测试了这两款模型,并让它们生成“鹈鹕骑自行车”的SVG图像。结果显示,Flash版生成的图像细节更佳,而Pro版虽然自行车结构合理,但鹈鹕的造型略显怪异。
价格优势显著
DeepSeek V4的定价极具竞争力:
- Flash版:输入$0.14/百万token,输出$0.28/百万token
- Pro版:输入$1.74/百万token,输出$3.48/百万token
与其他前沿模型(如GPT-5.4、Gemini 3.1、Claude Haiku)相比,DeepSeek V4-Flash是小型模型中最便宜的,甚至低于OpenAI的GPT-5.4 Nano;而Pro版则是大型模型中性价比最高的。
高效优化
DeepSeek在论文中提到,V4系列在长上下文场景下的效率大幅提升:
- Pro版:单token计算量(FP8等效)仅为V3.2的27%,KV缓存占用减少90%
- Flash版:单token计算量降至V3.2的10%,KV缓存占用减少93%
尽管基准测试显示Pro版性能接近GPT-5.2和Gemini-3.0-Pro,但仍略逊于最新的GPT-5.4和Gemini-3.1-Pro,差距约3-6个月的发展周期。
作者期待后续的量化版本,并关注Flash模型在本地设备上的运行表现。
发布日期:2026年4月24日
标签:#AI #开源模型 #DeepSeek #大语言模型
评论总结
以下是评论内容的总结,涵盖主要观点和论据:
性能与性价比
- 多位用户认为Deepseek v4 Pro在性能上接近或优于OpenAI和Claude的模型,且价格更具优势。
- "in terms of quality it seems more or less on par with open AIs 5.4 or opus 4.6" (评论1)
- "at 1/10 the cost of less, there's just no comparison" (评论4)
- 具体案例显示,相同任务下Deepseek的成本显著低于Claude Opus。
- "total cost? Just $0.09... On Claude Opus... would have burned somewhere between $9 to $13" (评论5)
- 多位用户认为Deepseek v4 Pro在性能上接近或优于OpenAI和Claude的模型,且价格更具优势。
使用场景与限制
- 用户多用于前端开发、代码审查等任务,效果良好,但部分用户指出其推理过程不够流畅。
- "pages and pages of 'actually no', 'hang on'... like the model was having a breakdown" (评论9)
- "performing quite well for basic coding, without hitting any limits" (评论6)
- 用户多用于前端开发、代码审查等任务,效果良好,但部分用户指出其推理过程不够流畅。
数据隐私与模型训练
- 有用户对数据隐私表示担忧,认为中文模型的数据使用问题被忽视。
- "people here don't care at all about these models openly training on your data" (评论7)
- 有用户对数据隐私表示担忧,认为中文模型的数据使用问题被忽视。
折扣与长期价值
- 当前75%的折扣可能影响性价比评估,但用户仍认为其长期价值突出。
- "the value is incredible... even without the currently discounted pricing" (评论4)
- 当前75%的折扣可能影响性价比评估,但用户仍认为其长期价值突出。
评测标准争议
- 部分用户认为现有评测标准(如"pelican"测试)已过时,需引入更复杂的挑战。
- "The pelican is really getting old... time to add something else more novel" (评论2)
- 部分用户认为现有评测标准(如"pelican"测试)已过时,需引入更复杂的挑战。
模型进步
- 与早期版本相比,V4的性能提升显著,尤其在编码任务上。
- "V4... has completely demolished all the Flash/Lite/Spark models" (评论10)
- 与早期版本相比,V4的性能提升显著,尤其在编码任务上。
总结:Deepseek v4 Pro在性价比和特定任务性能上获得较多认可,但存在推理流畅性和数据隐私的争议,同时评测标准需更新以反映真实能力。