中国工程院院士与DeepSeek过了一招 AI发展路径新思考

万年历购物网址日历小说 | 三峰软件天天财富小游戏视频推荐小游戏

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页日历2025 日历2026 日历2027 日历知识 | 每日头条视频推荐数码知识两性话题情感天地心理咨询旅游天地 | 明星娱乐电视剧职场天地体育娱乐

日历软件煮酒论史历史中国历史世界历史春秋战国三国唐朝宋朝明朝清朝哲学厚黑学心理学 | 文库大全文库分类

电影票房娱乐圈娱乐弱智火研中华城市仙家六爻佛门风水钓鱼双色球戒色航空母舰网球乒乓球足球 nba 象棋体操

商业财经知识科技汽车知识工程技术知识时尚与穿搭家居与生活设计艺术知识

近日，DeepSeek的出现引发了全球科技领域的广泛关注和深入讨论。中国科协会刊《科技导报》2025年第3期刊发了中国计算机学会原理事长李国杰院士的文章《DeepSeek引发的AI发展路径思考》，探讨了DeepSeek背后所蕴含的AI发展路径问题。

李国杰是中国工程院院士、发展中国家科学院（TWAS）院士，研究方向涵盖计算机体系结构、并行算法、人工智能等多个领域。

DeepSeek的横空出世是人工智能发展史上的标志性事件。短短7天内，用户增长超过1亿，打破了用户增长速度的世界纪录。与此同时，英伟达股价单日暴跌17%，市值缩水5890亿美元，创下美国上市公司单日最大损失纪录。这表明，高算力和高投入不再是发展人工智能的唯一途径，集成电路制程优势也不再等于人工智能技术霸权。DeepSeek引领行业进入以算法和模型架构优化为主的新时期，同时高度重视数据质量和规模，并理性提高算力。此外，DeepSeek标志着中国科技公司从“追赶者”变为“规则改写者”，在全球人工智能领域展现出颠覆性创新。

全球人工智能龙头企业纷纷拥抱DeepSeek，微软最早宣布将其R1模型添加到Azure AI Foundry，亚马逊云科技（AWS）、英伟达、超威半导体（AMD）等也相继部署DeepSeek V3和R1模型。上亿用户和众多大公司根据性价比和亲身体验主动融入DeepSeek生态。DeepSeek推出的高效率、低成本推理模型和开源商业模式，引领了人工智能行业新潮流。

V3和R1模型受欢迎的原因在于其在模型算法和系统软件层次的重大创新。V3模型参数量高达6710亿，但采用混合专家模型（MoE）架构后，每次调用仅激活约370亿个参数，显著降低了训练计算成本。改进的多头潜在注意力机制（MLA）减少了键值缓存开销，将显存占用降至其他大模型的5%~13%，提升了运行效率。R1模型摒弃传统监督微调（SFT），提出群组相对策略优化（GRPO），通过强化学习激发推理能力，简化了训练流程。这些发明虽非首次提出，但DeepSeek通过努力将技术做到极致，在前人成果基础上登上新的技术高峰。

https://news.china.com/socialgd/10000169/20250303/48033569.html

更新: 2025-3-3 10:4:20