万年历 购物 网址 日历 小说 | 三峰软件 天天财富 小游戏 视频推荐 小游戏
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页  日历2025  日历2026  日历2027  日历知识  | 每日头条  视频推荐  数码知识 两性话题 情感天地 心理咨询 旅游天地 | 明星娱乐 电视剧  职场天地  体育  娱乐 
日历软件  煮酒论史  历史 中国历史 世界历史 春秋战国 三国 唐朝 宋朝 明朝 清朝 哲学 厚黑学 心理学 | 文库大全  文库分类 
电影票房 娱乐圈 娱乐 弱智 火研 中华城市 仙家 六爻 佛门 风水 钓鱼 双色球 戒色 航空母舰 网球 乒乓球 足球 nba 象棋 体操
商业财经知识 科技 汽车知识 工程技术知识 时尚与穿搭 家居与生活 设计艺术知识
    

雷军砸千万年薪,挖来95后“天才少女”

 

 雷军砸千万年薪,挖来95后“天才少女”

2024-12-27 11:16 发布于北京 《财经天下》周刊官方账号

+ 关注



曾经在AI大模型布局上相对“佛系”的小米,开始加快步调了。最近,小米砸下了高昂年薪,招揽了一位AI行业大牛加入。

12月20日,据第一财经消息,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉将加入小米,她或供职于小米AI实验室,领导小米大模型团队。

知情人士透露,雷军对小米在大模型领域发力太晚感到担忧,于是亲自下场挖人,罗福莉的薪酬水平或在千万元级别。

另据12月26日界面新闻报道,小米正在着手搭建自己的GPU万卡集群。而小米大模型团队在成立时已有6500张GPU资源。

种种迹象表明,未来一年,小米要对大模型大力投入了。

01、罗福莉何许人也?

12月初,小红书博主AI Dance就曾透露,雷军近期亲自交流或面试了多家LLM(大型语言模型)公司的CTO和核心算法人才。

被雷军重金招募的罗福莉,在大模型圈内被冠以“95后天才少女”的头衔。

罗福莉硕士毕业于北京大学计算语言学研究所。2019年,因研二在NLP(自然语言处理)国际顶级会议ACL上发表了8篇论文,其中2篇为第一作者,曾登上知乎热搜。彼时,常在知乎下场回答问题的罗福莉,也一夜成为“知乎红人”。

硕士毕业后,罗福莉顶着“ACL8篇论文作者”的光环,加入了阿里达摩院机器智能实验室。这期间,她主导开发的多语言预训练模型VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系AliceMind。此外,她还主导了AliceMind的开源工作。

2022年,罗福莉离开阿里达摩院,加入幻方量化(量化对冲基金公司)从事深度学习相关策略建模和算法研究。此后,罗福莉加入DeepSeek,担任深度学习研究员,并参与了MoE大模型DeepSeek-V2的研发。



▲图源/罗福莉官方公号

罗福莉加入小米,不仅因其过硬的技术实力,她身上“天才AI少女”“95后AI萝莉”的标签,也很符合“营销天团”小米的调性。

今年5月,在DeepSeek-V2模型发布后,罗福莉在知乎上回答了如何看待该模型的问题。她称DeepSeek-V2与GPT4的价格相比,是“性价比之王”。这样“接地气”的互动,与小米的风格,可以说颇为契合。

罗福莉将加入小米的消息,印证了小米将在大模型领域加码的传闻。

2023年4月,小米在AI实验室中组建起大模型团队。AI实验室主任王斌在同年11月接受媒体采访时,曾表示小米“不搞AI的军备竞赛”。“内部认为,轻量级模型亦有其存在的市场空间,且在某些特定任务上相比千亿大模型亦能具备一定的优势。”

当时,王斌还透露,“这个团队的目标还是通用语言大模型,第一步的目标基座模型参数在几百亿,然后会视前期爬坡结果,再决定下一步投入。”

与此相对的,是友商的步步进击。2023年11月的vivo开发者大会上,vivo发布了自研十亿、百亿、千亿三个参数量级,由5款语言大模型组成的蓝心大模型矩阵。

对于“烧钱”的预训练大模型,小米相较于其他厂商更显谨慎。

2023年年度演讲中雷军公开表示:“我们做大模型的思路可能和很多公司不太一样,我们选择主力突破的是轻量化和本地部署。”

这也是同步还在造车的小米,要优先保住“现金王”在成本上的考虑。

云侧的大模型在保证巨大算力的前提下,要根据调用付费,成本极高。而端侧大模型在本地运算,如果将大部分AI推理场景放在端侧,能够大量节约云端算力开支。

对于一贯注重产品的小米来说,小米用户在芯片性能、摄像头技术、屏幕显示等方面有着相对更高的需求。因此,尽管端侧大模型在效果上难以媲美云端,但其在隐私保护、低延迟和成本控制方面的优势,也能为其产品“性价比”提供保障。

但随着各家厂商芯片算力的不断提升,AI Agent与手机硬件的融合已势不可挡。AI Agent 在人机交互中,能更精准地理解用户需求,更高效地完成任务。

特别是,随着国产手机价格迈过4000元大关,有无AI的加持,将成为区别手机高低端的关键。IDC预测,2025年中国新一代AI手机市场出货量将达1.18亿台,同比增长59.8%,整体市场占比达到40.7%。

在这一背景下,小米手机如果不在AI上挖深护城河,其高端化战略必将面临巨大挑战。

02、小米大模型为何先发后至?

据媒体消息,这一次雷军正是出于小米在大模型领域发力太晚的担忧,才亲自下场招揽人才。看起来,雷军已经开始开始担忧,小米对大模型的“激进程度”,不及友商的决心坚定。

今年年底,各大手机厂商的旗舰机发布会上,AI能力的介绍都占据极大篇幅。vivo不遗余力地宣传蓝心大模型,荣耀CEO赵明更在发布会上,让AI Agent现场点咖啡。

小米在自家手机的AI能力宣传上,显得低调了许多。小米15的新品发布会上,其AI功能更多是常规的AI写作、AI识音等功能。在讲解上,小米也将焦点更多聚集于性能车SU7 Ultra上,对大模型和AI能力的介绍略显平淡。

这也让市场产生许多猜测:小米手机的AI能力到底够不够硬核?

事实上,小米在AI布局有天然的场景和必要性。除了手机,小米还是全球最大的IoT设备制造商,旗下有诸多设备可以连接“小爱同学”智能体,也可供信息收集和场景联动。

此外,小米还有自研系统澎湃OS,未来又面临着“人车家”全生态布局。对于小米来说,大模型的难点或不在于认清其必要性,更多在于大模型要如何与小米产品,以及不同体系生态充分融合。

事实上,小米发力AI的时间并不算晚。2023年8月的年度演讲中,雷军表示,小米从2016年7月就开始布局AI。



2017年,小米正式成立AI实验室,当时团队仅有4人,仅用4个月就上线了小米第一代语音识别系统,并公开了在电视语音交互中端到端语音识别的研究成果。彼时,小米将其定义为中文端到端语音识别技术最好的识别率,语音助手“小爱同学”也同步上线。

自此,小米在AI领域的研发投入不断加大。2019年,小米开放了人工智能平台,开发者可使用小米的AI技术,开发和发布应用程序。

2020年,雷军在小米内部信中宣布,下一个十年,小米的核心战略升级为“手机×AIoT”。

此后,小米发布了自研芯片澎湃C1、成立自动驾驶团队、小米机器人实验室,进一步深化在AI领域的布局。去年8月的年度演讲中,雷军表示,AI相关的团队已经超过3000人。

未来,随着罗福莉的进入,小米对AI的布局力度还会不断加大。

11月12日,小米大模型团队发布公告表示,小米大模型已升级至第二代。大模型在10大能力纬度上表现,相较于上一代平均提升了超过45%,同时丰富了参数矩阵,有从0.3B到30B多个参数规模,分别适配云边端各侧设备。

去年年底的“MEET2024智能未来大会”上,AI实验室大模型团队负责人栾剑曾表示,小米认为未来的设计中,云端大模型的结合必不可少。

而从第二代大模型的参数规模上看,30B量级已经能适应云端场景下的需求,具备相当坚实的zero-shot/上下文学习或一些泛化能力。小米对大模型的适配场景,也可以逐渐不再局限于端侧。

如今,随着罗福莉加入小米,也无疑将会为小米在大模型能力上,带来更多可能性。

文 | 林北

编辑 | 李不清

图片来源 | 视觉中国







查看原图 102K






免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
https://news.qq.com/rain/a/20241227A044X500
  更新: 2024-12-30 10:49:52