Hacker News 中文摘要

文章摘要

DeepSeek API提供两种模型版本(V4-Flash和V4-Pro)，支持多种功能模式，按每百万输入/输出token计费。V4-Flash缓存命中时每百万token收费0.0028美元，V4-Pro优惠价0.003625美元(原价0.0145美元)。非缓存情况下V4-Flash收费0.14美元，V4-Pro优惠价0.435美元。

文章总结

以下是经过编辑整理后的中文内容：

模型与定价说明

计价单位
费用按每百万（1M）token计算。token是模型识别的最小文本单位，可以是单词、数字或标点符号。系统将根据模型处理的输入和输出token总数计费。

模型详情

可用模型
- deepseek-v4-flash
- deepseek-v4-pro

基础服务地址
- OpenAI格式：https://api.deepseek.com
- Anthropic格式：https://api.deepseek.com/anthropic

核心参数
| 功能特性 | v4-flash | v4-pro | |-----------------|----------|---------| | 上下文长度 | 1M | 1M | | 最大输出长度 | 384K | 384K | | JSON输出 | ✓ | ✓ | | 工具调用 | ✓ | ✓ | | 聊天前缀补全(Beta)| ✓ | ✓ | | FIM补全(Beta) | 仅限非思考模式 | 仅限非思考模式 |

计费标准（单位：美元/百万token）
| 计费类型 | v4-flash | v4-pro（促销价） | 原价 | |-----------------|----------|------------------|--------| | 输入token（缓存命中） | $0.0028 | $0.003625 | $0.0145| | 输入token（缓存未命中）| $0.14 | $0.435 | $1.74 | | 输出token | $0.28 | $0.87 | $3.48 | | 并发限制 | 2500 | 500 | |

重要说明
1. 旧版模型deepseek-chat和deepseek-reasoner将逐步停用，分别对应v4-flash的非思考模式和思考模式
2. 输入缓存命中价格自2026年4月26日起调整为首发价的1/10
3. v4-pro促销折扣75%截至2026年5月31日，后续将永久调整为原价的1/4
4. 并发限制详见速率限制说明

扣费规则

计算公式：费用 = token数量 × 单价
扣款顺序：优先使用赠金余额，其次为充值余额
价格可能变动，建议根据实际用量充值并定期查看最新定价

（注：已移除重复的URL信息及与核心定价无关的技术细节）

评论总结

总结评论内容：

1. 性能与价格优势

DeepSeek V4 Pro和Flash模型因高性价比和出色性能获得广泛认可，尤其在编码任务中表现优异。
- "DeepSeek V4 Pro: $0.87 /百万输出token，显著低于竞品"（Reubend）
- "V4 Flash在工具密集型任务中性价比最高"（gertlabs）

2. 技术优势

MLA架构降低KV缓存，推理成本更低，非单纯价格战。
- "MLA架构使KV缓存减少5-13倍，降低成本"（cold_harbor）
- "首个提供百万上下文窗口的可用模型"（bel8）

3. 用户偏好与替代

部分用户因价格和性能转向DeepSeek，替代Claude、Codex等。
- "取消Claude订阅，转向1/20价格的DeepSeek"（onlyrealcuzzo）
- "Flash免费通过Opencode Zen使用，体验极佳"（dburkland）

4. 数据隐私担忧

部分用户对中国模型的数据安全存在顾虑。
- "担心中国政府扫描聊天数据"（doctoboggan）
- "本地运行Flash保护隐私，API用于其他任务"（wolttam）

5. 商业模式质疑

低价策略引发是否可持续或意图挤压竞争的讨论。
- "中国可能通过长期低价迫使美国竞品破产"（margorczynski）
- "DeepSeek是唯一能承受归零竞赛的公司"（rvz）

6. 开源与生态支持

用户赞赏开源行为，愿意支持其发展。
- "为开源付费以示支持"（wg0）
- "开源模型并保持低价是正确方向"（alyxya）

（注：所有评论评分均为None，未体现认可度差异）

DeepSeek将V4 Pro价格折扣永久化 -- DeepSeek makes the V4 Pro price discount permanent