数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

通义千问团队发布Qwen-AgentWorld:原生语言世界模型开启智能体交互新篇章

2026-06-24来源:快讯编辑:瑞雪

阿里通义千问团队近日宣布推出全球首个原生语言世界模型Qwen-AgentWorld,该模型通过模拟七大领域的智能体交互环境,在复杂任务处理能力上实现突破性进展。基于超过一千万条真实交互轨迹数据,模型采用CPT→SFT→RL三阶段训练架构,在全新发布的AgentWorldBench评测基准中超越GPT-5.4、Claude Opus 4.8等国际顶尖模型,成为智能体训练领域的重要里程碑。

该模型突破性地将环境建模融入训练全流程,形成原生世界建模范式。在CPT阶段通过交互轨迹学习环境知识,引入信息论损失掩码技术精准识别关键对话轮次;SFT阶段创新性地激活思维链推理模式进行状态预测;RL阶段则采用混合奖励信号优化输出质量。这种训练架构使模型在Web、OS、Android等GUI领域实现纯文本建模替代视觉渲染,通过可渲染代码直接呈现环境观测数据。

评测数据显示,3970亿参数版本的Qwen-AgentWorld在七大领域综合得分58.71,较GPT-5.4高出0.46分,尤其在Terminal和SWE领域展现显著优势。350亿参数版本通过三阶段训练实现8.66分的性能跃升,成功超越Claude Sonnet 4.6等同等规模模型。所有测试样本均配备真实环境执行的ground-truth数据,确保评测结果的可靠性。

研究团队提出两种互补的世界建模应用模式:作为解耦环境模拟器时,可为强化学习提供可控的虚拟训练场,其塑造智能体行为的能力远超真实环境训练;作为统一基础模型时,预热训练后的模型可直接迁移至多轮任务场景,无需额外微调即可保持优异性能。目前模型架构与评测基准已在Hugging Face和ModelScope平台开源,为全球研究者提供完整的技术框架与评估工具。

HHKB Studio键盘新宠:全新灰色键帽套装登场,适配多配色方案
IT之家 6 月 24 日消息,HHKB Studio 是 Happy Hacking Keyboard 在 2023 年推出的一款多功能一体式输入设备,结合了紧凑配列键盘、指点杆鼠标套件、手势触控输入面板,…

2026-06-24

隐私保护新趋势:三星引领防窥技术,小米荣耀加速研发测试跟进
PChome 6月24日消息,随着三星Galaxy S26 Ultra将防窥隐私显示功能推向市场,这一基于专属屏幕硬件实现的隐私保护技术正成为智能手机行业的新竞争点。目前已确认小米与荣耀均在推进防窥显示功能的…

2026-06-24

毕业季新选择:三星Galaxy Z Flip7 伴你开启多元精彩生活
一款实用性强、功能全面的手机,能够轻松兼顾出行娱乐、日常学习等多种需求,为新阶段的生活提供便捷助力。三星Galaxy Z Flip7手机精准承接了新阶段用户的多样化使用需求,以全面均衡的实用性能,为每一位奔赴…

2026-06-24

亚马逊云科技储瑞松:模型能力与工程体系共促Agentic AI爆发拐点到来
这背后,是模型能力的不断提升和Agentic工程体系的日益成熟,两者形成了一个相互促进的飞轮。储瑞松表示,Agentic工程体系是把模型能力转化为可以稳定交付业务结果的智能体的体系化的工程能力。 最后,储瑞…

2026-06-24

三星Galaxy Watch Ultra2智能手表示意图流出 方圆形表壳设计得以延续
IT之家 6 月 23 日消息,消息源 @GalaxyTechie 今天(6 月 23 日)在 X平台发布推文,分享了一组系统界面示意图片,展示了三星 Galaxy Watch Ultra2 智能手表设计。…

2026-06-24

传音Tecno发布Camon Slim新机:超薄机身配大电池,独特灯效背板成亮点
IT之家 6 月 23 日消息,传音旗下手机品牌 Tecno 日前在全球市场发布入门级新机 Camon Slim。 据IT之家了解,CamonSlim 在纤薄机身内塞入了一块 5600mAh 电池,并支持 …

2026-06-24