数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

斯坦福博士创立Moonlake AI:用游戏开发训练世界模型 获英伟达等投资布局未来

2026-02-26来源:快讯编辑:瑞雪

旧金山初创公司Moonlake AI近日宣布,其“世界建模智能体”已进入公开测试阶段。该团队同步发布的技术博客详细拆解了保龄球小游戏的十阶段开发流程:从3D网格资产生成、刚体物理参数配置、碰撞检测算法搭建,到计分系统逻辑编写、空间音频融合及逆向运动学抓取动画实现,全程由AI自主完成。其beta版本产品能在15至20分钟内,将自然语言描述转化为具备物理反馈、可交互操作的完整游戏原型。

区别于传统游戏生成工具,Moonlake的野心不止于简化开发流程。创始人Fan-Yun Sun与Sharon Lee明确表示,该项目旨在通过游戏开发过程训练具备“世界运行规律”理解能力的AI模型。这种定位源于团队核心成员的学术背景:Fan-Yun Sun在斯坦福攻读博士期间,同时参与英伟达Omniverse项目,专注于大规模3D世界生成;Sharon Lee则深耕扩散模型与3D引擎的结合,致力于构建空间理解基础模型。两人的研究领域形成闭环——前者解决虚拟世界构建,后者赋予世界交互能力。

2025年10月,该公司结束隐身模式并宣布完成2800万美元种子轮融资,由AIX Ventures、Threshold Ventures及英伟达旗下NVentures联合领投。其天使投资人阵容堪称豪华:YouTube联合创始人Steve Chen、Google首席科学家Jeff Dean、GAN发明者Ian Goodfellow,以及来自Hugging Face、DeepMind等机构的高管均参与投资。截至近期,融资总额已增至约3000万美元,团队规模约15人,成员包括ACM ICPC奖牌得主及国际奥赛获奖者。

2025年12月发布的核心理念产品Reverie(生成式游戏引擎GGE),被团队定义为首个“可编程世界模型”。其突破性在于实现状态持久性——区别于Sora等视频生成模型仅预测下一帧画面的模式,Reverie通过绑定扩散模型与结构化3D信号,确保虚拟世界中的变化能够长期维持。例如,玩家打碎的花瓶不会在几秒后自动复原。Sharon Lee在采访中强调:“生成式世界缺失的关键是控制权,创作者需要定义变化的触发条件、持续时间及影响范围。”

技术架构层面,Reverie采用“编排者”模式而非单一模型。当用户输入自然语言指令后,系统会调用多个专业化第三方AI模型分工处理:空间布局由多模态推理模型完成,游戏逻辑依赖程序合成技术,物理交互通过模拟层实现,视觉渲染则交给实时扩散模型。Fan-Yun Sun透露,编排模型会随时间推移逐步整合外部模型能力,形成自主融合多模态数据的系统。

官方博客以赛博朋克风格保龄球游戏为例,展示系统推理流程:用户仅提供“在街机房创建半写实赛博朋克保龄球游戏”的简短描述后,AI自动完成十个开发阶段——从生成球道、球瓶的3D网格及PBR纹理,到配置摩擦系数0.4、弹性0.15的物理参数;从设计空间布局与核心游戏逻辑,到管理球体生命周期、处理边界异常、集成音频及逆向运动学抓取系统,最终通过用户反馈优化细节。整个过程无需人工干预架构设计或代码编写。

Moonlake对“世界模型”的定义显著区别于行业主流。当前多数AI项目将“world model”简化为视频帧预测,如Google DeepMind的Genie 3可生成24帧/秒的3D导航环境,李飞飞团队推出的Marble能从文本生成3D世界。而Moonlake认为,世界状态不能被压缩为像素集合。以保龄球瓶为例,其同时是空间中的纹理物体、具备质量惯性的刚体、可被撞倒的目标、计分符号实体及撞击声源。球击中瓶子的瞬间,需同步更新变换矩阵、解析碰撞冲量、递增比分、触发音频及推进重置计时器——任何模态的延迟都会导致世界不连贯。

基于此,团队提出世界模型需编码五大维度:几何(变换、拓扑、空间关系)、物理(质量、力、碰撞约束)、可供性(可行动作及执行主体)、符号逻辑(规则、分数、状态机)及感知映射(视觉投影与空间音频)。这一框架更接近传统游戏引擎的实际功能,而非单纯追求视觉真实。

实际测试显示,Reverie可快速生成游戏原型,但精细化打磨仍需人工介入。Fast Company记者在体验中,首次尝试制作3D地牢探险游戏失败,仅生成布满胶囊形角色的单房间场景;改做2D冰淇淋堆叠游戏时,初版虽在15分钟内完成核心玩法,但存在物理效果缺陷——冰淇淋无法正确堆叠,厨师角色显示为白色粗糙图形。经过数小时反复调整需求,最终版本虽实现计分与结束画面,但消耗了月度1500信用点中的950点(按40美元月费计算约25美元)。

Moonlake的长期目标超越工具开发。团队强调,用户每次纠正物理行为、补充游戏规则或调整因果关系,都在为多模态模型提供训练数据。Fan-Yun Sun对比现有数据采集方式指出:激光扫描房间获取的是静态数据,视频分析缺乏人类语境,单一游戏数据(如《堡垒之夜》录像)难以泛化至真实世界。而用户交互天然包含意图与反馈,属于因果数据。若用户基数形成规模,数据量将呈指数级增长,推动模型能力持续提升。目前,团队已收到制造业企业的咨询,探索将技术应用于机器人训练、自动驾驶及人因分析领域。不过,其beta版每日仅开放100个测试名额,距离构建数据飞轮仍有较大差距。

iPhone网速测试新功能上线:原生工具支持5G与WiFi测速更便捷
2026年2月26日消息,近日苹果官方旗下的Apple支持应用迎来了版本更新(v5.12),正式上线网速测试功能,支持5G蜂窝网络与WiFi双环境测速,为用户提供精准的实时速率反馈。该功能面向升级iOS 1…

2026-02-26

荣耀Magic V6实测:轻薄机身下游戏性能表现究竟如何?
实测在10分钟的短时间测试中,荣耀Magic V6外屏提供了59.5帧的平均帧率,稳帧指数1;在更考验手机调校的1%Low帧中提供了31.1帧的表现;卡顿方面表现也不错,仅有每10分钟3次的卡顿,已经可以比…

2026-02-26

华为设备快充优选!6款22.5W SCP协议充电宝深度解析与选购指南
结合上述筛选标准,本次共梳理6款适配华为全系的22.5W华为SCP协议充电宝,各产品在容量、接口、设计上各有差异化表现,以下从核心优势、协议支持、容量/接口、安全配置、适配场景五大维度,对每款产品进行详细解…

2026-02-26

2026年微信小程序去水印实测!这3款免费无套路工具让视频素材保存更轻松
复制目标视频分享链接(2026年平台优化后一键复制超方便); 微信搜「无损去水印精灵」,链接自动粘贴; 点「一键解析」→ 保存到相册,搞定!全能首选:无损去水印精灵(全平台、无损、隐私); 实况/稳定…

2026-02-26

国泰中证机器人ETF(159551)微涨0.07%,规模份额双降,重仓股曝光
2月25日,国泰中证机器人ETF(159551)收盘涨0.07%,成交额2062.26万元。 机器人ETF国泰(159551)成立于2023年11月8日,基金全称为国泰中证机器人交易型开放式指数证券投资基金…

2026-02-26