数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

小米发布MoE大模型MiMo-V2-Flash,性能媲美顶尖模型,多项实测表现亮眼

2025-12-18来源:快讯编辑:瑞雪

小米今日正式发布并开源了最新一代MoE架构大模型MiMo-V2-Flash,该模型总参数规模达3090亿,激活参数150亿,在推理、编码及智能体应用场景中展现出显著优势。模型支持混合思维模式,用户可自由切换深度思考与即时响应模式,并具备一键生成完整HTML网页的能力,可与Claude Code、Cursor等主流编码框架无缝协作。

在性能测试中,MiMo-V2-Flash与DeepSeek-V3.2形成直接竞争态势。基准数据显示,该模型在数学竞赛AIME 2025和科学知识GPQA-Diamond测试中位列开源模型前二,软件工程能力SWE验证及多语言测试中更超越所有开源竞品,性能表现与全球顶尖闭源模型持平。特别在长上下文处理方面,其性能已超越K2 Thinking模型,在SWE-Bench Verified测试中解决率达71.7%,BrowseComp搜索评估得分45.4,配合上下文管理后提升至58.3。

技术架构层面,模型采用全局注意力(GA)与滑动窗口注意力(SWA)的1:5混合结构,既保持了线性注意力的计算效率,又显著提升了长文本处理能力。创新引入的多词元预测(MTP)训练技术,通过同步生成多个候选token并并行验证的方式,使解码吞吐量提升2-2.6倍。后训练阶段采用的多教师在线策略蒸馏(MOPD)方法,仅需传统方法1/50的计算资源即可达成同等优化效果,形成"教学-学习"闭环迭代机制。

实际场景测试验证了模型的多样化能力:在网页开发任务中,可生成包含商品轮播、规格选择等功能的电商页面,以及支持手势交互的3D圣诞树应用;在创意生成方面,能创作忧郁爱情故事和非虚构社会观察作品;智能体交互测试中,既可解答"是否服用长生不老药"等哲学问题,也能编写科幻悬疑剧本。不过实测发现,部分复杂交互场景(如教育类太阳系探索器)仍存在稳定性问题,需多次生成才能达到预期效果。

该模型已实现全面开源,推理代码完整贡献至开发者社区SGLang,API服务开启限时免费体验。技术文档显示,在Prefill单机吞吐50000 toks/s条件下,16K上下文长度的解码吞吐量达5000-15000 toks/s,单请求吞吐量151-115 toks/s。价格策略方面,输入token单价0.7元/百万,输出token单价2.1元/百万,显著低于行业平均水平。

此次发布标志着小米大模型研发进入快车道。集团近期宣布将AI与现实世界深度结合列为未来十年核心战略,AI业务投入连续四个季度环比增长超50%。为加速技术突破,小米同步启动全球人才招募计划,设立千万元级岗位薪酬,重点引进大模型领域顶尖人才。技术团队近三个月已密集发布多篇学术论文,并陆续开源多个预训练模型,构建起完整的技术生态体系。

苹果未来三年大布局:手机、家居、电脑等多领域创新蓝图揭晓
从万众期待的折叠屏iPhone,到彻底取消所有屏幕开孔的20周年纪念版iPhone,再到旨在重塑智能家居与个人AI助手的全新设备,这份路线图不仅预示了硬件的重大革新,更勾勒出苹果在人工智能与生态整合上的宏大野…

2025-12-17

小米短剧战略显成效:千部S级作品储备,人均消费70分钟
刘婵在演讲中强调,小米互联网已构筑起真正的全局生态,其优势在于 “多市场、多终端、多场景的深度融合”。早在今年10月,小米旗下独立短剧应用“围观短剧” 就已正式登陆其应用商城,主打 “无广告、全免费、轻量…

2025-12-17

2025年前三季度腕戴市场:华为出货量领跑全球 小米增速亮眼未来可期
2025年前三季度,全球智能手表出货量为1.2亿台,同比增长7.3%;中国智能手表市场出货4004万台,同比增长21.8%。其增长核心源于小米手环10与REDMI Watch等高性价比产品在入门级市场的成功,…

2025-12-17

具身智能新突破!宁德时代人形机器人“小墨”上岗 开启电池生产新篇章
柔性操作:在插拔柔性线束时,能动态调节力度,确保连接可靠且不损伤部件。面对多型号电池的连续生产任务,其单日工作量实现了三倍提升,且一致性与稳定性表现卓越。“小墨”由宁德时代生态企业 —— 千寻智能机器人公…

2025-12-17

小米智能摄像机持续领跑线上市场,销量份额双提升彰显强劲实力
CNMO注意到,其配图显示,小米智能摄像机连续四年线上销量中国第一。 据CNMO了解,小米凭借强大的线上销售能力,已成为摄像头领域的领头羊。特别是在京东、天猫等传统电商平台,小米自2021年起连续四年稳居销量…

2025-12-17

小米MiMo大模型发布 短剧业务持续推进 小米SU7换代升级引关注
据介绍,这是一个专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型,通过 Hybrid 注意力架构创新及多层 MTP推理加速,在多个 Agent 测评基准上保持进入全球开源模型 Top…

2025-12-17

一加Turbo系列将登场:165Hz高刷屏配骁龙8系 9000mAh电池引期待
结合此前爆料信息,性能方面,一加Turbo预计搭载高通骁龙8系平台。该平台采用4nm工艺,结合一加自研的“风驰游戏内核”进行硬件级增强,有望充分释放芯片潜力,保障高性能场景下的稳定输出。李杰指出,这一“超预…

2025-12-17

荣耀罗巍预告新机:明年视频领域或领先,欲与大疆一较高下
IT之家 12 月 17日消息,荣耀首席影像工程师罗巍今日发布“正式通知”,称今天搞定了一个极为重要的事,这事也搞了快一年了,明年荣耀的视频之王应该让友商看不到尾灯了。 评论区中有网友表示苹果视频是标杆,罗…

2025-12-17

iOS26.2与26.3Beta版体验:安卓互传来了,三方手表支持,信号也有改善
同时,iPhone自带的水平仪功能、锁屏清除所有通知按钮也都适配了液态玻璃效果,半透明的模糊质感与系统整体设计风格高度统一,点击按钮时还会伴随轻微的视觉反馈,手感更细腻。 对于拥有多款智能设备的用户来说,这一…

2025-12-17

荣耀畅玩60A新机登场:1599元起售,配置实用亮点多
值得注意的是,荣耀畅玩60A这款智能手机还拥有媒体通话大音量模式,并且支持灵动胶囊,能够实时显示通话时长、打印进度、视频美颜状态等。在参数方面,天玑6300是一款八核处理器,其中包含了2个A76大核和6个A5…

2025-12-17