切换到宽版
  • 32阅读
  • 2回复

[数码讨论]95后“AI天才”罗福莉首秀:中国模型距顶尖差距从三年缩至数月 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
212384
金币
614044
道行
2006
原创
2441
奖券
3260
斑龄
41
道券
1197
获奖
0
座驾
设备
摄影级
在线时间: 46453(小时)
注册时间: 2008-10-01
最后登录: 2025-12-20
只看楼主 倒序阅读 使用道具 楼主  发表于: 前天 10:03

加入小米一个多月后,95后“AI天才”罗福莉首秀:中国模型距顶尖差距从三年缩至数月!她出身农村普通家庭,曾被雷军千万元年薪挖角

今日上午,2025小米“人车家全生态”合作伙伴大会在北京举办,《》记者现场参会。会上,小米官宣开源并上线Xiaomi MiMo-V2-Flash大模型。与此同时,记者还注意到,在这次会上,MiMo大模型负责人罗福莉首次公开亮相。这位被业界称为“AI才女”的95后技术专家,介绍了小米大模型的具体情况,并谈及自己对AI的相关看法。

每经记者 杨卉 摄

在活动现场,罗福莉的表现稍显紧张,所介绍内容以技术解读为主。罗福莉提到,研发之初主要围绕三个问题展开:智能体必须有一个高效的沟通语言,即代码能力和工具调用能力;目前智能体之间的沟通带宽非常低,该如何加速带宽;如何激发后训练的潜能。

小米“人车家全生态”合作伙伴大会

据罗福莉介绍,Xiaomi MiMo-V2-Flash是一个非常小的模型,总参数只有309B,激活参数只有15B。“我都不愿意称它是一个非常大的模型。但是它的代码能力,在我来看它已经进入了全球top 2”。

罗福莉称,Xiaomi MiMo-V2-Flash在大部分评测基准上超过了DeepSeek V3.2 和K2-Thinking,同时对比参数量减少了二分之一至三分之二,在全球大致处于相同水位的顶尖模型速度和成本象限里,MiMo-V2-Flash实现了低成本、高速度,已初步具备模拟世界的能力。

每经记者 杨卉 摄

罗福莉称,在她看来,下一代智能体系统不是一个“语言模拟器”,而是一个真正理解人类世界,并与之共存的“智能体”。Agent执行能力方面,应实现从“回答问题”到“完成任务”的转变,具备记忆、推理、自主规划、决策、执行等能力。从Omni 感知角度看,应实现统一多模态感知,为理解物理世界打基础,从而更好地嵌入眼镜等智能终端。

罗福莉还回忆了自己2020年刚刚进入大模型领域时的经验。“那时国内的开源模型距离世界顶尖的闭源模型的代差,我认为至少有三年。但是如今大家都能看到,中国像DeepSeeK、MiMo等的开源模型,距离世界的顶尖闭源模型的差距,可能只有数月了。”罗福莉称。

谈到开源的价值,罗福莉称:“我们相信,开源的价值并不仅仅是说分享了模型,分享了代码。我认为开源是实现AGI的普惠化,是确保所有人类智慧共同进化的唯一路径。”

95后罗福莉高中就读于四川省宜宾市第一中学校“清北班”。本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。求学期间,她于2019年在人工智能领域顶级国际会议ACL上发表了8篇论文,其中两篇为第一作者。

▲罗福莉 图据罗福莉微信公众号

罗福莉身上有着不少标签:保研北大、在顶会顶刊发文章、毕业进入阿里达摩院、转行跳槽知名私募公司、在DeepSeek从事人工智能研究、在知乎“一夜爆红”……她也因此被网友称为“AI才女”。

她的职业生涯始于阿里达摩院,主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作。2022年,罗福莉加入DeepSeek母公司幻方量化从事深度学习相关工作,后又担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型。

据红星新闻报道,一名熟悉罗福莉家庭情况的宜宾罗氏宗亲研究会人士告诉红星新闻记者,罗福莉出生在宜宾市某村一个普通家庭,父亲是电工、母亲是教师,妹妹现在是医生。“几年前,罗福莉的叔叔说她在做人工智能底层设计,我当时不敢相信我们宜宾罗氏有如此高精尖领域的科技人才,但我在北大校友通讯录里找到了罗福莉的名字,后来在北大官方网站见识到这位学霸,她的确是罗氏家族的骄傲。”

据了解,罗福莉出生、成长的村子有着浓郁的读书氛围,在她小时候,从宜宾市某机关退休的罗鹏远老人在村里开办了农村书屋,免费提供书籍和辅导,直到老人2020年去世。

今年年初,据《证券时报》报道,小米创始人雷军曾希望用千万年薪挖角罗福莉,邀请她到小米带领团队从事AI大模型研究,该消息一度登上微博热搜。对于雷军的邀约,报道称,当时罗福莉还在考虑要不要加入小米。

而在11月12日,罗福莉在朋友圈发文:“智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的AGI。”Xiaomi MiMo是小米首个推理大模型。这也是罗福莉正式宣布自己已经加入小米,亦是对此前传言的回应。

12月初,卢伟冰曾通过视频形式侧面回应罗福莉的加盟,表示“小米渴望并尊重顶尖人才”。

根据卢伟冰公布的小米自研MiMo系列的时间表,目前小米已经推出推理大模型MiMo-7B,视觉推理大模型MiMo-VL,原生端到端音频生成模型MiMo-Audio,端侧视觉语言大模型MiMo-VL-Miloco以及具身大模型MiMo-Embodied。

卢伟冰曾透露,小米已在AI领域启动“压强式投入”,大模型与应用进展“远超预期”,未来将聚焦“AI与物理世界的深度结合”这一核心方向。小米希望能够给优秀的人才提供好的发展平台。

记者|杨卉

编辑|程鹏 廖丹 杜波

校对|陈柯名

封面(资料图)

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
212384
金币
614044
道行
2006
原创
2441
奖券
3260
斑龄
41
道券
1197
获奖
0
座驾
设备
摄影级
在线时间: 46453(小时)
注册时间: 2008-10-01
最后登录: 2025-12-20
只看该作者 沙发  发表于: 前天 10:05
罗福莉首秀:小米MiMo大模型与AI技术突破详解
一、首秀背景与小米MiMo-V2-Flash发布
2025年12月17日,在北京举办的2025小米“人车家全生态”合作伙伴大会上,小米正式开源并上线了Xiaomi MiMo-V2-Flash大模型。这是罗福莉加入小米一个多月后的首次公开亮相,作为MiMo大模型负责人,她详细介绍了该模型的技术特点与未来愿景。此次发布标志着小米在AI大模型领域迈出了关键一步,也凸显了中国开源模型与全球顶尖水平的差距已大幅缩小。
二、MiMo-V2-Flash核心技术解析
模型参数与性能优势
参数规模:总参数3090亿(309B),激活参数仅150亿(15B)。罗福莉强调其“并非传统意义上的‘大模型’”,而是通过高效设计实现了“小而精”的特性。
性能对比:在多项评测基准上超越DeepSeek V3.2和K2-Thinking,且参数量仅为后者的二分之一至三分之二。在推理速度上,MiMo-V2-Flash比DeepSeek V3.2快3倍,成本更低;相比Gemini 2.5 Pro,推理成本仅为前者的1/20,速度相当。
核心能力:已初步具备模拟世界的能力,可实现编写操作系统、模拟太阳系运行、绘制三维图像(如圣诞树)等复杂任务。
技术创新点
极致推理效率:采用3层MTP(Multi-Token Parallelism)推理加速技术,并行Token验证机制使推理速度提升2.0-2.6倍。
面向智能体设计:针对Agent(智能体)优化,重点解决三大研发问题:
高效沟通语言:强化代码能力和工具调用能力;
加速沟通带宽:提升智能体间的信息交互效率;
激发后训练潜能:优化模型微调与持续学习能力。
三、罗福莉对AI未来的展望
下一代智能体的定义
罗福莉指出,下一代智能体不应是“语言模拟器”,而应是“真正理解人类世界并与之共存的智能体”。其核心特征包括:
从“回答问题”到“完成任务”:具备记忆、推理、自主规划、决策和执行能力。
Omni感知能力:统一多模态感知(视觉、听觉、触觉等),为嵌入眼镜等智能终端奠定基础,实现与物理世界的无缝交互。
开源的价值与意义
罗福莉强调开源不仅是代码共享,更是“实现AGI(通用人工智能)普惠化、确保人类智慧共同进化的唯一路径”。小米MiMo-V2-Flash已完全开源模型权重和技术报告,并提供API供开发者接入Web Coding IDE,旨在构建开放协作的AI生态。
四、中国AI模型的代差缩短:从三年到数月
罗福莉在演讲中回顾了中国开源模型的发展历程:“2020年时,国内开源模型与世界顶尖闭源模型的差距至少有三年。但现在,以DeepSeek、MiMo为代表的中国模型,与顶尖闭源模型的差距已缩小至‘数月’。”这一突破得益于中国在算力、数据和人才上的快速积累,以及开源社区的协同创新。
五、罗福莉的个人背景与职业历程
教育与学术成就
学历:本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。
学术成果:2019年在顶级国际会议ACL上发表8篇论文(含2篇第一作者),学术论文总引用超1.1万次,2025年单年新增引用约8000次。
职业履历
阿里达摩院:主导开发多语言预训练模型VECO,并推动AliceMind项目开源。
DeepSeek:担任深度学习研究员,参与研发DeepSeek-V2等MoE大模型,在Nature封面论文中署名。
小米:2024年底被雷军以“千万年薪”挖角,2025年11月12日正式官宣加入,任MiMo团队负责人。
成长故事:农村走出的AI才女
罗福莉出身于四川宜宾农村普通家庭,父亲是电工,母亲是教师。她成长的村庄因退休老人罗鹏远开办的免费农村书屋而形成浓厚读书氛围。尽管大学前几乎未接触电脑,但她凭借努力考入北师大,并保研北大,成为家族骄傲。
六、小米AI战略与未来规划
研发投入:小米未来五年计划投入2000亿元研发资金,聚焦硬核科技。
MiMo系列布局:已推出推理大模型MiMo-7B、视觉推理大模型MiMo-VL、音频生成模型MiMo-Audio、端侧视觉语言模型MiMo-VL-Miloco及具身大模型MiMo-Embodied。
核心方向:卢伟冰表示,小米将聚焦“AI与物理世界的深度结合”,通过人车家全生态(手机、汽车、智能家居)实现AI能力的落地应用。
总结
罗福莉的首秀不仅展示了小米MiMo-V2-Flash的技术实力,更折射出中国AI大模型领域的快速发展。从参数规模到推理效率,再到对下一代智能体的前瞻性思考,MiMo-V2-Flash的开源标志着中国在AGI探索道路上的重要一步。罗福莉作为95后技术专家的崛起,也体现了AI领域人才迭代加速的趋势。随着小米等企业加大投入,“智能终将从语言迈向物理世界”的愿景正逐步变为现实。

如何不发帖就快速得到金币道行
 
在线天人地

UID: 1627269

精华: 2
级别: 上清仙尊

发帖
296995
金币
35327
道行
40006
原创
109
奖券
147
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 36825(小时)
注册时间: 2012-09-03
最后登录: 2025-12-19
只看该作者 板凳  发表于: 前天 14:28
中国开源模型与世界顶尖闭源模型的技术差距已从2020年的三年缩短至数月。

罗福莉以小米MiMo大模型负责人身份首次公开演讲,强调中国AI模型进步速度 1。
她对比了小米MiMo-V2-Flash与DeepSeek、Qwen等模型的性能,称其代码能力进入全球Top2 9。
📊 模型性能对比
指标    XiaomiMiMo-V2-Flash    DeepSeekV3.2    Gemini2.5Pro
总参数量    309B    1500B+    2000B+
激活参数量    15B    30B    50B
代码能力    超过DeepSeek、K2-Thinking 9    -    推理速度相当但成本贵20倍 10
推理速度    是DeepSeekV3.2的3倍 11    -    相当于MiMo但成本更高 10
💡 技术突破的关键点
轻量化设计:通过MoE架构(混合专家模型)降低激活参数量,兼顾性能与效率 10。
开源战略:罗福莉认为开源是AGI普惠化的必经之路,小米已开放模型权重和API 1。
物理世界交互:下一代智能体需突破语言模拟,融入多模态感知与物理环境建模 5。
📌 建议与下一步
若需验证具体数据,可参考小米官方开源报告或第三方评测榜单。
关注罗福莉团队后续在智能终端(如眼镜)和具身大模型的应用落地进展
如何不发帖就快速得到金币道行
 
天人地
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个