腾讯云跟进下调DeepSeek模型价格，最高降幅达97.5%

北京日报客户端 | 记者袁璐

2026-06-03 10:41

经济

大模型价格战并未停歇。6月3日，腾讯云智能体开发平台下调DeepSeek-V4系列模型的价格，最高降幅达到97.5%。平台方表示，此次调整仅涉及价格变更，模型服务能力保持不变，目的是持续降低用户的使用成本。

具体来看，DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%，而“缓存命中”价格降幅高达97.5%；另一款DeepSeek-V4-Flash模型的“缓存命中”价格降幅也达90%。

所谓“缓存命中”，是指当用户提出的问题或任务，与近期已经计算过的内容相同或高度相似时，系统会直接调取此前暂存的结果，无需重新调用算力计算。由于省去了重复的复杂运算，这部分服务的成本极低，也因此有了更大的降价空间。相比之下，如果请求的内容没有命中缓存，系统就需要实时调动算力来推理，成本会高出不少。

腾讯云的这一轮降价，是对DeepSeek主动降价的快速跟进。5月22日，DeepSeek方面宣布，DeepSeek-V4-Pro模型的API价格在5月31日结束2.5折优惠活动后，正式调整为原定价的四分之一。调整价格后，百万tokens（词元）输入（缓存命中）价格将为0.025元，百万词元输入（缓存未命中）价格为3元，百万词元输出价格为6元。

词元可以通俗地理解成大模型处理文本时的最小计量单元。有短剧编剧从业者对记者表示，调整后，百万词元大约能处理六七十万汉字，已经是一部长篇小说的体量，这么一算，降价后的Deepseek，输出一部长篇小说文本的成本仅6元。

无独有偶，就在腾讯云降价前几天的5月27日，小米公司旗下的大模型MiMo-V2.5也宣布了新的定价策略，相比原始API定价，新价格最高降幅可达99%。

有意思的是，就在今年3月，不少国产大模型还因为需求火爆而多次提价。为何短短数月间，调价的方向就变了？

业内人士告诉记者，这从源头算力成本的变化中可以找到答案。对于DeepSeek的降价，一方面与该公司完成新一轮融资、资金面更加充裕有关；另一方面，很可能与华为昇腾芯片的研发进度符合甚至超出预期有关。

记者注意到，根据DeepSeek官方文档的介绍，DeepSeek-V4模型将一项名为“细粒度专家并行”（EP）的方案，同时在英伟达GPU和华为昇腾NPU上完成了验证。这相当于为大模型运行铺设了一条能够跑在国产芯片上的高速通道，使其对特定高端芯片的依赖有所降低。此外，官方API页面还透露，受限于高端算力，目前V4-Pro模型的服务吞吐仍有限，预计下半年昇腾950超节点批量上市后，Pro价格会大幅下调。

编辑：袁璐

打开APP阅读全文