数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

小米MiMo-V2-Flash新模型发布:创新架构,性能超绝性价比拉满

2025-12-18来源:快讯编辑:瑞雪

小米近日正式推出全新开源大模型MiMo-V2-Flash,凭借3090亿总参数与150亿活跃参数的规模,采用专家混合架构(MoE)设计,在性能表现上与DeepSeek-V3.2、Kimi-K2等头部开源模型形成有力竞争。该模型最引人注目的突破在于将推理速度提升至每秒150 tokens,同时将输入成本压缩至每百万token仅0.1美元,输出成本0.3美元,在性价比维度树立了新标杆。

在基准测试中,MiMo-V2-Flash展现惊人实力:AIME 2025数学竞赛与GPQA-Diamond科学知识测试均位列开源模型前两名,编程能力尤为突出——在SWE-bench Verified真实软件修复测试中取得73.4%的得分,超越所有开源竞品,直逼GPT-5-High水平。多语言编程测试SWE-Bench Multilingual中,该模型以71.7%的解决率证明其跨语言开发能力。智能体任务测试显示,其在通信类任务获得95.3分,零售类79.5分,航空类66.0分,搜索代理任务在启用上下文管理后得分从45.4跃升至58.3。

技术团队通过两项核心创新实现性能突破。混合滑动窗口注意力机制采用5层滑动窗口与1层全局注意力的激进配比,滑动窗口固定为128 token长度,使KV缓存存储量减少近6倍,却仍能支持256k超长上下文窗口。项目负责人罗福莉特别指出,实验发现128窗口大小是性能与效率的最佳平衡点,盲目扩大窗口反而导致性能下降,同时强调实施该机制时sink values的必要性。另一项轻量级多Token预测(MTP)技术则打破传统逐token生成模式,通过原生集成模块实现并行预测,实测平均接受2.8-3.6个连续token,推理速度提升2-2.6倍,有效解决强化学习中长尾样本导致的GPU空转问题。

训练阶段采用FP8混合精度技术,在27万亿token数据上完成预训练,原生支持32k序列长度。后训练阶段创新提出多教师在线策略蒸馏(MOPD),通过学生模型自主采样、多专家教师实时反馈的方式,将训练算力需求降至传统方法的1/50。该架构支持动态接入新教师模型,形成"教学相长"的闭环进化系统。智能体强化学习扩展方面,研究团队基于真实GitHub问题构建超10万个验证任务,在Kubernetes集群部署并发超万个Pod,环境部署成功率达70%,并开发多模态验证器通过视频录制确保代码执行准确性。

对于开发者群体,MiMo-V2-Flash提供256k上下文窗口支持数百轮智能体交互,可无缝集成Claude Code、Cursor等主流开发环境。模型权重已在Hugging Face平台以MIT协议开源,包含完整技术报告与推理代码。目前该模型已通过API Platform限时免费开放,所有优化经验同步分享至LMSYS博客,相关代码贡献给SGLang社区。这种全链条开源策略在国内科技企业中实属罕见,为行业技术演进提供了重要参考。

豪威科技OP03021 LCOS面板问世,助力智能眼镜迈向高分辨率宽视场角新阶段
IT之家 12 月 17日消息,半导体技术研发企业豪威科技(OMNIVISION)推出了业内首款单芯片超低功耗硅基液晶(LCOS)小尺寸面板,专为下一代智能眼镜打造。KGOnTech 公司总裁卡尔・古塔格…

2025-12-18

卢伟冰透露:小米手机全球前三地位稳固 2025年高端机销量或达1500万台
12 月 17 日消息,2025 小米人车家全生态合作伙伴大会于今日举行,小米集团合伙人、总裁,手机部总裁,小米品牌总经理卢伟冰发表演讲。卢伟冰援引 Omdia 和第三方数据表示,小米手机业务连续 21 个…

2025-12-18

NexDock 6笔记本扩展坞来袭 连接手机秒变14英寸桌面电脑
新版触控板在响应速度、防误触算法及多指手势(支持双指 / 三指操作)方面均有质的飞跃,完美适配 Android、Windows 及SteamOS 等系统。续航方面,整机由一块 38Wh 电池供电,在中等亮度…

2025-12-17

华为WATCH十周年款12月22日亮相:浅蓝配色,X-TAP智感窗助力健康监测
2025年12月17日,华为终端官微发布消息称,12月22日14:30举办的nova 15系列及全场景新品发布会上,将推出华为WATCH十周年款。表盘右侧集成被称为X-TAP智感窗的多合一压感传感器,可实现无…

2025-12-17

《鸿蒙星光盛典》12月20日启幕 共赴科技之约 见证国产鸿蒙新辉煌
该节目将在CCTV-2、CCTV-3、央视频、央视新闻、央视财经、微博、视频号、抖音等平台和账号同步播出。 CNMO注意到,《鸿蒙星光盛典》以“在一起”为主题,聚焦国产操作系统开源鸿蒙的创新与发展。盛典以“鸿…

2025-12-17

OpenAI推gpt-image-1.5:对标谷歌,提升图像生成编辑能力还降成本
Nano Banana被认为在画面质量和编辑灵活性方面全面领先gpt-image-1,并获得全球开发者的广泛采用。 对开发者而言,成本优化是gpt-image-1.5的一大亮点:与上一代gpt-image-1…

2025-12-17

AI新星罗福莉亮相小米大会 详解MiMo-V2-Flash大模型三大特性与优势
在演讲中,罗福莉详细介绍了此次开源上线的小米MiMo-V2-Flash,着重阐述了其三大显著特性。 此外,MiMo-V2-Flash还具备极致推理效率,在全球顶尖模型的速度和成本象限中,它凭借低成本、高速度的…

2025-12-17

荣耀WIN系列来袭:骁龙8系强芯搭配万mAh电池 12月26日发布
根据爆料信息,荣耀WIN搭载高通骁龙第五代骁龙8至尊版移动平台,其CPU采用2+6核心架构,性能核心频率高达4.6GHz,性能释放达到当前顶级水准。两款手机均内置一块10000mAh超大电池,并且都支持10…

2025-12-17

LifeSmart智能家居深度评测:稳定性、颜值与性价比的完美融合
如果是初次接触智能家居产品,可以选择一些基础的套餐,如智能照明系统、智能开关系统等;如果对智能家居有较高的要求,可以选择全屋智能解决方案,实现家居的全面智能化。其自主研发的CoTP™ 有线通讯协议为产品的稳…

2025-12-17