2026-06-03 10:41
大模型价格战并未停歇。6月3日,腾讯云智能体开发平台下调DeepSeek-V4系列模型的价格,最高降幅达到97.5%。平台方表示,此次调整仅涉及价格变更,模型服务能力保持不变,目的是持续降低用户的使用成本。
具体来看,DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%,而“缓存命中”价格降幅高达97.5%;另一款DeepSeek-V4-Flash模型的“缓存命中”价格降幅也达90%。
所谓“缓存命中”,是指当用户提出的问题或任务,与近期已经计算过的内容相同或高度相似时,系统会直接调取此前暂存的结果,无需重新调用算力计算。由于省去了重复的复杂运算,这部分服务的成本极低,也因此有了更大的降价空间。相比之下,如果请求的内容没有命中缓存,系统就需要实时调动算力来推理,成本会高出不少。
腾讯云的这一轮降价,是对DeepSeek主动降价的快速跟进。5月22日,DeepSeek方面宣布,DeepSeek-V4-Pro模型的API价格在5月31日结束2.5折优惠活动后,正式调整为原定价的四分之一。调整价格后,百万tokens(词元)输入(缓存命中)价格将为0.025元,百万词元输入(缓存未命中)价格为3元,百万词元输出价格为6元。
词元可以通俗地理解成大模型处理文本时的最小计量单元。有短剧编剧从业者对记者表示,调整后,百万词元大约能处理六七十万汉字,已经是一部长篇小说的体量,这么一算,降价后的Deepseek,输出一部长篇小说文本的成本仅6元。
无独有偶,就在腾讯云降价前几天的5月27日,小米公司旗下的大模型MiMo-V2.5也宣布了新的定价策略,相比原始API定价,新价格最高降幅可达99%。
有意思的是,就在今年3月,不少国产大模型还因为需求火爆而多次提价。为何短短数月间,调价的方向就变了?
业内人士告诉记者,这从源头算力成本的变化中可以找到答案。对于DeepSeek的降价,一方面与该公司完成新一轮融资、资金面更加充裕有关;另一方面,很可能与华为昇腾芯片的研发进度符合甚至超出预期有关。
记者注意到,根据DeepSeek官方文档的介绍,DeepSeek-V4模型将一项名为“细粒度专家并行”(EP)的方案,同时在英伟达GPU和华为昇腾NPU上完成了验证。这相当于为大模型运行铺设了一条能够跑在国产芯片上的高速通道,使其对特定高端芯片的依赖有所降低。此外,官方API页面还透露,受限于高端算力,目前V4-Pro模型的服务吞吐仍有限,预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。