[数码] 如何看待deepseek v4 pro2.5折特价延长到5月31日？

万年历购物网址日历小说 | 三峰软件天天财富小游戏视频推荐小游戏

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页日历2025 日历2026 日历2027 日历知识 | 每日头条视频推荐数码知识两性话题情感天地心理咨询旅游天地 | 明星娱乐电视剧职场天地体育娱乐

日历软件煮酒论史历史中国历史世界历史春秋战国三国唐朝宋朝明朝清朝哲学厚黑学心理学 | 文库大全文库分类

电影票房娱乐圈娱乐弱智火研中华城市仙家六爻佛门风水钓鱼双色球戒色航空母舰网球乒乓球足球 nba 象棋体操

商业财经知识科技汽车知识工程技术知识时尚与穿搭家居与生活设计艺术知识

知识库 -> 数码 -> 如何看待deepseek v4 pro2.5折特价延长到5月31日？ -> 正文阅读

[数码]如何看待deepseek v4 pro2.5折特价延长到5月31日？

[收藏本文] 【下载本文】

刚刚vibe coding下了terminal，翻开xx就看到这个 [图片]

应该是DeepSeek发现为V4做了over-prepared，准备过度，结果V4的KV Cache命中率比预想的还要高，不得不（注意是不得不）加大流量，让batch size更大。
几天前，曾经的Google TPU架构师Reiner Pop做客Dwarkesh的博客（就是上次把黄仁勋气的红温的Dwarkesh），就详细讲解了大模型推理时Batch Size的重要性https://www.dwarkesh.com/p/reiner-pope" data-tooltip-richtext="1" data-tooltip-preset="white" data-tooltip-classname="ztext-reference-tooltip">[1]，虽然Dwarkesh在中美关系上屁股很歪，但是，他请的嘉宾水平都很高，这次Reiner也讲得很清楚，甚至都上了黑板板书。

简单说，LLM 的推理，受限更像是内存带宽，而不是纯计算。
因为，每生成一个 token，都要反复读取模型权重和 KV Cache，Batch Size 越大，就越能把一次加载模型权重的开销分摊到更多请求上，GPU 的计算利用率也更高，因此每个请求的平均成本下降。
当然，Batch Size变大，通常意味着系统会把更多请求一起处理，这会提高吞吐量，但也会让单个请求等待更久，尤其是小请求可能要等大 batch 组满或轮到执行。
总之，Batch Size大小选择就是做权衡：更大的 batch 通常更便宜，但单请求延迟更高。
理解了上面这些，再看DeepSeek延长2.5折这件事，逻辑就通了。
DeepSeek肯定为V4准备了大量推理算力，大到他们自己都没想到V4这么『省』，V4的架构优化（更激进的KV Cache压缩）让GPU计算和带宽消耗远低于预期，KV Cache命中率也高出规划。
这意味着啥呢？
意味着DeepSeek手里落下一大堆闲置推理算力（训练算力估计怎么都闲不下来）。
算力如果闲置就是纯成本，GPU不像咱自家电脑，不用刻意关掉，观点就不耗电，数据中心的GPU只要开着，不管干不干活，电费、冷却、折旧一分不少，时刻都在烧钱。
所以2.5折与其说DeepSeek是在做慈善，比如说是在给自己止血。
与其让GPU空转烧钱，不如把价格打到地板上，用低价把流量灌进来，把Batch Size撑大，这样单次请求成本越低，GPU利用率更高，平均成本就更低。
还有一个问题，为什么不直接把2.5折定为正式价格，非要只是特价延长到5月31日？
因为定价策略和成本结构是两回事。
2.5折是当前算力过剩状态下的最优定价，但DeepSeek不确定这个状态会持续多久，随着V4用户量增长，某个时刻会到达一个拐点，再往上加用户，延迟就开始劣化了，到那时候价格就该往回调了。
用『特价延长』而不是『永久降价』，给DeepSeek留了回旋余地。
说到底，DeepSeek在用2.5折告诉市场一件事：V4的推理效率高到我算力都用不完。
这不光是价格战，也是心理战。
如果DeepSeek是我2.5折可能还有利润，其他模型原价可能还在亏钱，这还怎么跟？
V4太省了，省到DeepSeek必须把价格打到2.5折，才能吸引足够多的流量才能充分利用GPU。
这可能是世界上最顶级的凡尔赛:-)
参考^https://www.dwarkesh.com/p/reiner-pope
送礼物
还没有人送礼物，鼓励一下作者吧

昨天还看见有人说都去用opus，codex，这样就没人跟他抢ds了。
我还笑这人算盘珠子扒拉的震天响。
下午就开始卡。。。多模态灰测。
于是我也想说，你们都去用opus，codex吧。这样就没人跟我抢ds啦。

缓存命中率太高导致服务器闲置超出预期，原来的定价多少有点限流的意思，既然这样不如降价把服务器跑满，还能做空对手赚钱。何乐不为。

很奇怪的连续降价策略，首先不太像是商业行为。主要就是密集的连续的调整价格，并不符合商业发展策略。不论是试探市场，还是为了抢占份额……如果放在手机、汽车这类消费领域，会被消费者称为“背刺”，会引发消费者观望心理。
算力商品和实物商品不一样，没有压库存的风险。也和软件商品不一样，运行算力需要大量的电力成本，每一个Token都是有实打实的硬成本的，也不可能无限降价——这也是现在白嫖Token这么费劲的原因。低于成本价抢市场，不如关服务器省钱……
（有些人没明白“低于成本价抢市场，不如关服务器省钱”，我解释一下。虽然卡和服务器很贵，但运行起来后，一个标准的智算中心，日常的运营成本中，电费70%，卡折旧10%、机电折旧10%、网络存储5%、人工5%。在没有需求的时候，算力并不会产生，而不是像发电机一样有没有需求一直在发电，智算中心是可以停机的，而且比云服务停机重启要简单的多。）
DeepSeek由于有个割韭菜的母公司，所以在商业上就很随性。根据那句“下半年950批量上市就降价”的标注来看，DeepSeek采用的既不是朴素的成本定价法，也不是流行的需求定价法。DeepSeek的价格不像是用来标注商品价值的，而是用来控制流量的——先开一个价试试，如果算力撑得住，就降降价把流量开大点。如果撑不住，涨价不好看，就干脆“服务器繁忙”……和水龙头开关一样~
所以第一次促销，应该是想在5.1这个使用低谷期，吸引更多人来试试，看看到底好用不好用。而第二次降价，应该是发现实际使用中的缓存命中算力消耗远远低于预期——可能是实验室场景没搭对。这一次，大概也是发现，现状下，还是可以盛纳更多需求，所以就再开打点口子试试。
只希望DeepSeek不要太随性，还是参考下市场环境。。。至少目前，对智谱和MiniMax打击可是挺大的了~

这大概是利用成本优势，给市场定价呢。
竞争对手亏本，他微利。
对手要降本就得学他的注意力机制，学他用更便宜的硬件。

[收藏本文] 【下载本文】

数码最新文章

如何评价MacBook Neo？

你是因为什么原因抵制电脑DIY成海景房+配套

小米手机毛利率跌至 8.3%，卢伟冰称涨价需理

2026 年 Q1 手机出货量：小米快被 OPPO 反超

为啥Gemini背靠google，不缺人甚至不缺显卡

现在的固态硬盘为何如此短命？

如何看待骁龙8Gen4跑分是麒麟9000s的4.5倍？

为什么仰望U7的电池135度，CLTC只有800km；

为什么现在的手机都要配手机壳？

鸿蒙电脑正式发布，今年的大一新生会不会扎

加:2026-05-03 16:21:42 更:2026-05-03 16:22:30

娱乐生活: 电影票房娱乐圈娱乐弱智火研中华城市印度仙家六爻佛门风水古钱币交流专用钓鱼双色球航空母舰网球乒乓球中国女排足球 nba 中超跑步象棋体操戒色上海男科 80后
足球: 曼城利物浦队托特纳姆热刺皇家马德里尤文图斯罗马拉齐奥米兰里昂巴黎圣日尔曼曼联

网站联系: qq:121756557 email:121756557@qq.com 知识库