万年历 购物 网址 日历 小说 | 三峰软件 天天财富 小游戏 视频推荐 小游戏
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页  日历2025  日历2026  日历2027  日历知识  | 每日头条  视频推荐  数码知识 两性话题 情感天地 心理咨询 旅游天地 | 明星娱乐 电视剧  职场天地  体育  娱乐 
日历软件  煮酒论史  历史 中国历史 世界历史 春秋战国 三国 唐朝 宋朝 明朝 清朝 哲学 厚黑学 心理学 | 文库大全  文库分类 
电影票房 娱乐圈 娱乐 弱智 火研 中华城市 仙家 六爻 佛门 风水 钓鱼 双色球 戒色 航空母舰 网球 乒乓球 足球 nba 象棋 体操
商业财经知识 科技 汽车知识 工程技术知识 时尚与穿搭 家居与生活 设计艺术知识
    

中国工程院院士与DeepSeek过了一招 AI发展路径新思考

 

 中国工程院院士与DeepSeek过了一招 AI发展路径新思考

近日,DeepSeek的出现引发了全球科技领域的广泛关注和深入讨论。中国科协会刊《科技导报》2025年第3期刊发了中国计算机学会原理事长李国杰院士的文章《DeepSeek引发的AI发展路径思考》,探讨了DeepSeek背后所蕴含的AI发展路径问题。

李国杰是中国工程院院士、发展中国家科学院(TWAS)院士,研究方向涵盖计算机体系结构、并行算法、人工智能等多个领域。

DeepSeek的横空出世是人工智能发展史上的标志性事件。短短7天内,用户增长超过1亿,打破了用户增长速度的世界纪录。与此同时,英伟达股价单日暴跌17%,市值缩水5890亿美元,创下美国上市公司单日最大损失纪录。这表明,高算力和高投入不再是发展人工智能的唯一途径,集成电路制程优势也不再等于人工智能技术霸权。DeepSeek引领行业进入以算法和模型架构优化为主的新时期,同时高度重视数据质量和规模,并理性提高算力。此外,DeepSeek标志着中国科技公司从“追赶者”变为“规则改写者”,在全球人工智能领域展现出颠覆性创新。

全球人工智能龙头企业纷纷拥抱DeepSeek,微软最早宣布将其R1模型添加到Azure AI Foundry,亚马逊云科技(AWS)、英伟达、超威半导体(AMD)等也相继部署DeepSeek V3和R1模型。上亿用户和众多大公司根据性价比和亲身体验主动融入DeepSeek生态。DeepSeek推出的高效率、低成本推理模型和开源商业模式,引领了人工智能行业新潮流。

V3和R1模型受欢迎的原因在于其在模型算法和系统软件层次的重大创新。V3模型参数量高达6710亿,但采用混合专家模型(MoE)架构后,每次调用仅激活约370亿个参数,显著降低了训练计算成本。改进的多头潜在注意力机制(MLA)减少了键值缓存开销,将显存占用降至其他大模型的5%~13%,提升了运行效率。R1模型摒弃传统监督微调(SFT),提出群组相对策略优化(GRPO),通过强化学习激发推理能力,简化了训练流程。这些发明虽非首次提出,但DeepSeek通过努力将技术做到极致,在前人成果基础上登上新的技术高峰。

1
https://news.china.com/socialgd/10000169/20250303/48033569.html
  更新: 2025-3-3 10:4:20