阿里巴巴达摩院近日在具身智能领域取得突破性进展,正式推出具备时空记忆与物理推理能力的RynnBrain基础模型,并同步开源包含30B混合专家架构(MoE)在内的7个全尺寸模型。该模型首次赋予机器人理解物理世界时空关系的能力,在16项具身智能评测指标中全面超越谷歌Gemini Robotics ER 1.5等国际顶尖模型,刷新行业最佳纪录(SOTA)。
传统机器人系统在执行多任务时存在显著局限,而RynnBrain通过引入时空记忆模块与物理世界推理引擎,使机器人具备任务状态记忆能力。例如,当机器人执行清洁任务时被临时要求取快递,它能精准记录清洁进度、工具位置等时空信息,完成任务后自动恢复中断的工作。这种能力突破源于达摩院独创的分层认知架构,将环境感知、任务规划与动作执行进行解耦设计。
在模型扩展性方面,RynnBrain展现出显著优势。基于该基础模型开发的具身规划模块,仅需数百条场景数据微调即可达到专业级性能,在复杂路径规划测试中超越Gemini 3 Pro等模型。达摩院同步开源的RynnBrain-Bench评测基准,首次建立包含时空细粒度任务的评估体系,填补了行业在物理世界交互能力量化评估方面的空白。
此次开源的模型矩阵包含全尺寸基础模型与垂直领域专用模型,其中30B MoE架构模型通过动态路由机制实现参数高效利用,使机器人动作响应速度提升40%,运动流畅度达到行业领先水平。配套开源的还有融合世界模型与视觉语言动作模型(VLA)的WorldVLA框架,以及首个机器人上下文交互协议RynnRCP,构建起完整的具身智能技术生态。
达摩院具身智能实验室负责人赵德丽指出,RynnBrain的成功标志着通用具身智能进入新阶段,其分层架构设计为数字大脑与物理躯体协同工作提供了可行范式。该模型已在实际场景中验证了复杂任务处理能力,包括多楼层导航、动态障碍避让等高级功能,显著缩短了人工智能从虚拟世界向真实物理场景迁移的周期。目前研究团队正持续优化模型的泛化能力,推动具身智能技术在工业制造、物流仓储等领域的规模化应用。




