数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

小米开源MiMo-V2.5系列模型,首日适配七家芯片,测评成绩超越DeepSeek-V4

2026-04-28来源:快讯编辑:瑞雪

小米近日宣布开源其最新研发的MiMo-V2.5系列大模型,采用MIT协议,允许商业推理部署和二次训练,无需额外授权。这一举措标志着小米在人工智能领域迈出重要一步,为全球开发者提供了更强大的工具和资源。

MiMo-V2.5系列包含两款模型:MiMo-V2.5-Pro和MiMo-V2.5。其中,MiMo-V2.5-Pro是小米迄今为止最强大的模型,拥有1.02万亿个参数,激活参数达420亿个。该模型基于混合注意力架构,在通用智能能力、复杂软件工程和长时域任务处理方面均有显著提升。MiMo-V2.5则是一个3100亿参数的稀疏MoE模型,激活参数为150亿个,支持多模态数据处理。

最新公布的基准测试结果显示,MiMo-V2.5-Pro在GDPVal-AA(Elo)、Claw-eval(pass³)等多项测评中超越了DeepSeek最新开源的DeepSeek-V4-Pro模型,以及近期发布的Kimi K2.6等主流闭源模型,整体表现达到行业领先水平。这一成绩表明,小米在人工智能领域的技术实力已跻身全球前列。

在技术架构方面,MiMo-V2.5-Pro继承了MiMo-V2-Flash的混合注意力机制和多标记预测(MTP)设计。局部滑动窗口注意力(SWA)和全局注意力(GA)以6:1的比例交错使用,窗口大小为128个Token,有效减少了键值缓存存储空间,同时保持了模型性能。MTP模块采用密集前馈神经网络(FFN),显著提升了输出吞吐量,并加速了强化学习(RL)的部署。

MiMo-V2.5的训练过程分为五个阶段,包括文本预训练、投影层预热训练、多模态预训练、监督微调与智能体后训练,以及强化学习与多目标偏好蒸馏。通过这些步骤,模型逐步扩展上下文窗口至100万Token,并显著提升了感知、逻辑推理与智能体执行能力。测试数据显示,MiMo-V2.5在Claw-eval Text、Terminal-Bench 2.0、SWE-Bench Pro等多项测评中大幅超越了DeepSeek最新发布的DeepSeek-V4-Flash。

在生态建设方面,小米宣布MiMo-V2.5-Pro在开源首日已完成与阿里平头哥、亚马逊云科技、AMD、百度昆仑芯、燧原科技、沐曦、天数智芯等七家芯片厂商的接入适配。该系列模型还同步完成了SGLang和vLLM主流推理框架的Day 0适配,为开发者提供了更便捷的部署方案。

为推动人工智能技术的广泛应用,小米同步推出了MiMo Orbit计划,包含“百万亿Token创造者激励计划”和“Agent生态共建计划”。前者将在30天内免费发放总计100万亿Token权益,最高可获得16亿Credits(价值659元);后者则面向全球Agent框架团队提供专项支持,包括MiMo Token限免和AI Hackathon等共创活动。目前,小米已与OpenCode、Hermes Agent、KiloCode等Agent框架厂商展开深度合作。

此次开源和生态计划的推出,反映了人工智能行业正从“拼参数”转向“拼应用”的趋势。随着推理效率和部署成本成为竞争核心,小米的举措有望推动行业进一步降低推理成本,提升Agent真实任务完成率,为全球开发者创造更多价值。

REDMI Turbo新机电池大升级 12000mAh高硅电池或引领续航新潮流
IT之家 4 月 28 日消息,博主 @数码闲聊站 今天在微博透露: 独家信息,子系迭代线目前测试最大电池是12000mAh±,新一代单电芯高硅电池 ~ 结合博主文中暗示及评论区用户猜测,预计该机归属于小…

2026-04-28

工商业离网光伏发电系统:从构成到应用,解锁企业绿色用电新路径
这个参数是保障企业用电连续性的关键,其设计需紧密结合企业的用电曲线,特别是夜间的用电需求。系统通过智能逆变器(参数中“主机输出容量50K”)将光伏直流电或电池直流电转换为380V/50Hz的工频交流电,直接供…

2026-04-28

库克9月离任在即,特纳斯接棒,苹果10大新方向能否续写辉煌?
触屏版MacBook预测将会在今年年底或明年年初推出,是苹果首款可触屏电脑;AR眼镜可以把数字信息叠加在眼前的现实世界画面上,是AI眼镜的上位版,估计在2028~2030年推出;折叠屏iPad的尺寸可能将达…

2026-04-28