万年历 购物 网址 日历 小说 | 三峰软件 天天财富 小游戏 视频推荐 小游戏
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页  日历2024  日历2025  日历2026  日历知识  | 每日头条  视频推荐  数码知识 两性话题 情感天地 心理咨询 旅游天地 | 明星娱乐 电视剧  职场天地  体育  娱乐 
日历软件  煮酒论史  历史 中国历史 世界历史 春秋战国 三国 唐朝 宋朝 明朝 清朝 哲学 厚黑学 心理学 | 文库大全  文库分类 
电影票房 娱乐圈 娱乐 弱智 火研 中华城市 仙家 六爻 佛门 风水 钓鱼 双色球 戒色 航空母舰 网球 乒乓球 足球 nba 象棋 体操
    

中国工程院院士与DeepSeek过了一招 AI发展路径新思考

 

 中国工程院院士与DeepSeek过了一招 AI发展路径新思考

近日,DeepSeek的出现引发了全球科技领域的广泛关注和深入讨论。中国科协会刊《科技导报》2025年第3期刊发了中国计算机学会原理事长李国杰院士的文章《DeepSeek引发的AI发展路径思考》,探讨了DeepSeek背后所蕴含的AI发展路径问题。

李国杰是中国工程院院士、发展中国家科学院(TWAS)院士,研究方向涵盖计算机体系结构、并行算法、人工智能等多个领域。

DeepSeek的横空出世是人工智能发展史上的标志性事件。短短7天内,用户增长超过1亿,打破了用户增长速度的世界纪录。与此同时,英伟达股价单日暴跌17%,市值缩水5890亿美元,创下美国上市公司单日最大损失纪录。这表明,高算力和高投入不再是发展人工智能的唯一途径,集成电路制程优势也不再等于人工智能技术霸权。DeepSeek引领行业进入以算法和模型架构优化为主的新时期,同时高度重视数据质量和规模,并理性提高算力。此外,DeepSeek标志着中国科技公司从“追赶者”变为“规则改写者”,在全球人工智能领域展现出颠覆性创新。

全球人工智能龙头企业纷纷拥抱DeepSeek,微软最早宣布将其R1模型添加到Azure AI Foundry,亚马逊云科技(AWS)、英伟达、超威半导体(AMD)等也相继部署DeepSeek V3和R1模型。上亿用户和众多大公司根据性价比和亲身体验主动融入DeepSeek生态。DeepSeek推出的高效率、低成本推理模型和开源商业模式,引领了人工智能行业新潮流。

V3和R1模型受欢迎的原因在于其在模型算法和系统软件层次的重大创新。V3模型参数量高达6710亿,但采用混合专家模型(MoE)架构后,每次调用仅激活约370亿个参数,显著降低了训练计算成本。改进的多头潜在注意力机制(MLA)减少了键值缓存开销,将显存占用降至其他大模型的5%~13%,提升了运行效率。R1模型摒弃传统监督微调(SFT),提出群组相对策略优化(GRPO),通过强化学习激发推理能力,简化了训练流程。这些发明虽非首次提出,但DeepSeek通过努力将技术做到极致,在前人成果基础上登上新的技术高峰。

1
https://news.china.com/socialgd/10000169/20250303/48033569.html
  更新: 2025-3-3 10:4:20