万年历 购物 网址 日历 小说 | 三峰软件 天天财富 小游戏 视频推荐 小游戏
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页  日历2025  日历2026  日历2027  日历知识  | 每日头条  视频推荐  数码知识 两性话题 情感天地 心理咨询 旅游天地 | 明星娱乐 电视剧  职场天地  体育  娱乐 
日历软件  煮酒论史  历史 中国历史 世界历史 春秋战国 三国 唐朝 宋朝 明朝 清朝 哲学 厚黑学 心理学 | 文库大全  文库分类 
电影票房 娱乐圈 娱乐 弱智 火研 中华城市 仙家 六爻 佛门 风水 钓鱼 双色球 戒色 航空母舰 网球 乒乓球 足球 nba 象棋 体操
商业财经知识 科技 汽车知识 工程技术知识 时尚与穿搭 家居与生活 设计艺术知识
    
  知识库 -> 数码 -> 如何看待deepseek v4 pro2.5折特价延长到5月31日? -> 正文阅读

[数码]如何看待deepseek v4 pro2.5折特价延长到5月31日?

[收藏本文] 【下载本文】
刚刚vibe coding下了terminal,翻开xx就看到这个 [图片]
应该是DeepSeek发现为V4做了over-prepared,准备过度,结果V4的KV Cache命中率比预想的还要高,不得不(注意是不得不)加大流量,让batch size更大。
几天前,曾经的Google TPU架构师Reiner Pop做客Dwarkesh的博客(就是上次把黄仁勋气的红温的Dwarkesh),就详细讲解了大模型推理时Batch Size的重要性https://www.dwarkesh.com/p/reiner-pope" data-tooltip-richtext="1" data-tooltip-preset="white" data-tooltip-classname="ztext-reference-tooltip">[1],虽然Dwarkesh在中美关系上屁股很歪,但是,他请的嘉宾水平都很高,这次Reiner也讲得很清楚,甚至都上了黑板板书。


简单说,LLM 的推理,受限更像是内存带宽,而不是纯计算。
因为,每生成一个 token,都要反复读取模型权重和 KV Cache,Batch Size 越大,就越能把一次加载模型权重的开销分摊到更多请求上,GPU 的计算利用率也更高,因此每个请求的平均成本下降。
当然,Batch Size变大,通常意味着系统会把更多请求一起处理,这会提高吞吐量,但也会让单个请求等待更久,尤其是小请求可能要等大 batch 组满或轮到执行。
总之,Batch Size大小选择就是做权衡:更大的 batch 通常更便宜,但单请求延迟更高。
理解了上面这些,再看DeepSeek延长2.5折这件事,逻辑就通了。
DeepSeek肯定为V4准备了大量推理算力,大到他们自己都没想到V4这么『省』,V4的架构优化(更激进的KV Cache压缩)让GPU计算和带宽消耗远低于预期,KV Cache命中率也高出规划。
这意味着啥呢?
意味着DeepSeek手里落下一大堆闲置推理算力(训练算力估计怎么都闲不下来)。
算力如果闲置就是纯成本,GPU不像咱自家电脑,不用刻意关掉,观点就不耗电,数据中心的GPU只要开着,不管干不干活,电费、冷却、折旧一分不少,时刻都在烧钱。
所以2.5折与其说DeepSeek是在做慈善,比如说是在给自己止血。
与其让GPU空转烧钱,不如把价格打到地板上,用低价把流量灌进来,把Batch Size撑大,这样单次请求成本越低,GPU利用率更高,平均成本就更低。
还有一个问题,为什么不直接把2.5折定为正式价格,非要只是特价延长到5月31日?
因为定价策略和成本结构是两回事。
2.5折是当前算力过剩状态下的最优定价,但DeepSeek不确定这个状态会持续多久,随着V4用户量增长,某个时刻会到达一个拐点,再往上加用户,延迟就开始劣化了,到那时候价格就该往回调了。
用『特价延长』而不是『永久降价』,给DeepSeek留了回旋余地。
说到底,DeepSeek在用2.5折告诉市场一件事:V4的推理效率高到我算力都用不完。
这不光是价格战,也是心理战。
如果DeepSeek是我2.5折可能还有利润,其他模型原价可能还在亏钱,这还怎么跟?
V4太省了,省到DeepSeek必须把价格打到2.5折,才能吸引足够多的流量才能充分利用GPU。
这可能是世界上最顶级的凡尔赛:-)
参考^https://www.dwarkesh.com/p/reiner-pope
送礼物
还没有人送礼物,鼓励一下作者吧
昨天还看见有人说都去用opus,codex,这样就没人跟他抢ds了。
我还笑这人算盘珠子扒拉的震天响。
下午就开始卡。。。多模态灰测。
于是我也想说,你们都去用opus,codex吧。这样就没人跟我抢ds啦。
缓存命中率太高导致服务器闲置超出预期,原来的定价多少有点限流的意思,既然这样不如降价把服务器跑满,还能做空对手赚钱。何乐不为。
很奇怪的连续降价策略,首先不太像是商业行为。主要就是密集的连续的调整价格,并不符合商业发展策略。不论是试探市场,还是为了抢占份额……如果放在手机、汽车这类消费领域,会被消费者称为“背刺”,会引发消费者观望心理。
算力商品和实物商品不一样,没有压库存的风险。也和软件商品不一样,运行算力需要大量的电力成本,每一个Token都是有实打实的硬成本的,也不可能无限降价——这也是现在白嫖Token这么费劲的原因。低于成本价抢市场,不如关服务器省钱……
(有些人没明白“低于成本价抢市场,不如关服务器省钱”,我解释一下。虽然卡和服务器很贵,但运行起来后,一个标准的智算中心,日常的运营成本中,电费70%,卡折旧10%、机电折旧10%、网络存储5%、人工5%。在没有需求的时候,算力并不会产生,而不是像发电机一样有没有需求一直在发电,智算中心是可以停机的,而且比云服务停机重启要简单的多。)
DeepSeek由于有个割韭菜的母公司,所以在商业上就很随性。根据那句“下半年950批量上市就降价”的标注来看,DeepSeek采用的既不是朴素的成本定价法,也不是流行的需求定价法。DeepSeek的价格不像是用来标注商品价值的,而是用来控制流量的——先开一个价试试,如果算力撑得住,就降降价把流量开大点。如果撑不住,涨价不好看,就干脆“服务器繁忙”……和水龙头开关一样~
所以第一次促销,应该是想在5.1这个使用低谷期,吸引更多人来试试,看看到底好用不好用。而第二次降价,应该是发现实际使用中的缓存命中算力消耗远远低于预期——可能是实验室场景没搭对。这一次,大概也是发现,现状下,还是可以盛纳更多需求,所以就再开打点口子试试。
只希望DeepSeek不要太随性,还是参考下市场环境。。。至少目前,对智谱和MiniMax打击可是挺大的了~
这大概是利用成本优势,给市场定价呢。
竞争对手亏本,他微利。
对手要降本就得学他的注意力机制,学他用更便宜的硬件。
[收藏本文] 【下载本文】
   数码 最新文章
如何评价MacBook Neo?
你是因为什么原因抵制电脑DIY成海景房+配套
小米手机毛利率跌至 8.3%,卢伟冰称涨价需理
2026 年 Q1 手机出货量:小米快被 OPPO 反超
为啥Gemini背靠google,不缺人甚至不缺显卡
现在的固态硬盘为何如此短命?
如何看待骁龙8Gen4跑分是麒麟9000s的4.5倍?
为什么仰望U7的电池135度,CLTC只有800km;
为什么现在的手机都要配手机壳?
鸿蒙电脑正式发布,今年的大一新生会不会扎
上一篇文章      下一篇文章      查看所有文章
加:2026-05-03 16:21:42  更:2026-05-03 16:22:30 
 
娱乐生活: 电影票房 娱乐圈 娱乐 弱智 火研 中华城市 印度 仙家 六爻 佛门 风水 古钱币交流专用 钓鱼 双色球 航空母舰 网球 乒乓球 中国女排 足球 nba 中超 跑步 象棋 体操 戒色 上海男科 80后
足球: 曼城 利物浦队 托特纳姆热刺 皇家马德里 尤文图斯 罗马 拉齐奥 米兰 里昂 巴黎圣日尔曼 曼联
  网站联系: qq:121756557 email:121756557@qq.com  知识库