文章摘要
DeepSeek API提供两种模型版本(V4-Flash和V4-Pro),支持多种功能模式,按每百万输入/输出token计费。V4-Flash缓存命中时每百万token收费0.0028美元,V4-Pro优惠价0.003625美元(原价0.0145美元)。非缓存情况下V4-Flash收费0.14美元,V4-Pro优惠价0.435美元。
文章总结
以下是经过编辑整理后的中文内容:
模型与定价说明
计价单位
费用按每百万(1M)token计算。token是模型识别的最小文本单位,可以是单词、数字或标点符号。系统将根据模型处理的输入和输出token总数计费。
模型详情
可用模型
- deepseek-v4-flash
- deepseek-v4-pro
基础服务地址
- OpenAI格式:https://api.deepseek.com
- Anthropic格式:https://api.deepseek.com/anthropic
核心参数
| 功能特性 | v4-flash | v4-pro |
|-----------------|----------|---------|
| 上下文长度 | 1M | 1M |
| 最大输出长度 | 384K | 384K |
| JSON输出 | ✓ | ✓ |
| 工具调用 | ✓ | ✓ |
| 聊天前缀补全(Beta)| ✓ | ✓ |
| FIM补全(Beta) | 仅限非思考模式 | 仅限非思考模式 |
计费标准(单位:美元/百万token)
| 计费类型 | v4-flash | v4-pro(促销价) | 原价 |
|-----------------|----------|------------------|--------|
| 输入token(缓存命中) | $0.0028 | $0.003625 | $0.0145|
| 输入token(缓存未命中)| $0.14 | $0.435 | $1.74 |
| 输出token | $0.28 | $0.87 | $3.48 |
| 并发限制 | 2500 | 500 | |
重要说明
1. 旧版模型deepseek-chat和deepseek-reasoner将逐步停用,分别对应v4-flash的非思考模式和思考模式
2. 输入缓存命中价格自2026年4月26日起调整为首发价的1/10
3. v4-pro促销折扣75%截至2026年5月31日,后续将永久调整为原价的1/4
4. 并发限制详见速率限制说明
扣费规则
- 计算公式:费用 = token数量 × 单价
- 扣款顺序:优先使用赠金余额,其次为充值余额
- 价格可能变动,建议根据实际用量充值并定期查看最新定价
(注:已移除重复的URL信息及与核心定价无关的技术细节)
评论总结
总结评论内容:
1. 性能与价格优势
DeepSeek V4 Pro和Flash模型因高性价比和出色性能获得广泛认可,尤其在编码任务中表现优异。
- "DeepSeek V4 Pro: $0.87 /百万输出token,显著低于竞品"(Reubend)
- "V4 Flash在工具密集型任务中性价比最高"(gertlabs)
2. 技术优势
MLA架构降低KV缓存,推理成本更低,非单纯价格战。
- "MLA架构使KV缓存减少5-13倍,降低成本"(cold_harbor)
- "首个提供百万上下文窗口的可用模型"(bel8)
3. 用户偏好与替代
部分用户因价格和性能转向DeepSeek,替代Claude、Codex等。
- "取消Claude订阅,转向1/20价格的DeepSeek"(onlyrealcuzzo)
- "Flash免费通过Opencode Zen使用,体验极佳"(dburkland)
4. 数据隐私担忧
部分用户对中国模型的数据安全存在顾虑。
- "担心中国政府扫描聊天数据"(doctoboggan)
- "本地运行Flash保护隐私,API用于其他任务"(wolttam)
5. 商业模式质疑
低价策略引发是否可持续或意图挤压竞争的讨论。
- "中国可能通过长期低价迫使美国竞品破产"(margorczynski)
- "DeepSeek是唯一能承受归零竞赛的公司"(rvz)
6. 开源与生态支持
用户赞赏开源行为,愿意支持其发展。
- "为开源付费以示支持"(wg0)
- "开源模型并保持低价是正确方向"(alyxya)
(注:所有评论评分均为None,未体现认可度差异)