数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

Allen人工智能研究所推出MolmoWeb:开源视觉网络智能体新选择

2026-04-03来源:快讯编辑:瑞雪

人工智能领域迎来重要进展——Allen人工智能研究所(Ai2)正式推出开源视觉网络智能体MolmoWeb。作为Molmo 2模型家族的新成员,该系统以独特的技术路径和开源特性引发关注,其40亿参数与80亿参数两个版本均支持本地部署,为研究人员提供了轻量化的研究工具。

与传统依赖专有模型蒸馏训练的网络智能体不同,MolmoWeb采用创新的数据构建方式。研发团队通过可访问性树技术生成合成轨迹数据,结合3万个人类任务轨迹组成的训练集,其中包含1100多个网站的近60万个子任务。这种混合训练策略使模型既能理解网页结构,又能模拟人类操作逻辑。训练数据还包含220万组问答对,通过让模型回答关于400个网站截图的问题,强化其信息检索能力。

在功能实现层面,该系统具备完整的浏览器操作能力。通过分析网页截图预测行动步骤,可完成导航跳转、表单填写、商品搜索等复杂任务。其操作方式与人类用户高度相似,通过模拟点击、文本输入和页面滚动等交互行为推进任务流程。这种设计使其能够适应不同网站的结构变化,无需针对特定平台进行定制开发。

基准测试数据显示,MolmoWeb在浏览器操作任务中表现优异。其性能超越OpenAI旧版GPT-4o模型,在开放权重模型领域更是一骑绝尘,40亿与80亿参数版本均领先于Fara-7B和GLM-4.1V-9B等同类产品。不过研究人员坦言,当前专有模型在综合性能上仍保持优势,但MolmoWeb的开源特性为学术界提供了重要的研究基线。

该项目团队强调,开源生态的完整性比单一模型性能更重要。此次发布不仅包含模型权重和训练代码(即将上线),还同步开放了评估工具和人类演示数据集。其中人类任务轨迹数据集的规模创下公开数据集新纪录,为后续研究提供了丰富的训练素材。这种全链条开源策略旨在破解当前网络智能体研究中的可复现性难题,推动技术透明化发展。

目前,MolmoWeb已通过Hugging Face和GitHub平台向全球研究者开放下载。其轻量化设计使个人开发者也能在消费级硬件上运行模型,这为中小研究团队参与网络智能体开发提供了可能。随着训练数据的持续扩充和社区贡献的加入,这个开源系统有望催生更多创新应用。

谷歌9月起推行新规:Wear OS手表应用须支持64位,开发者需及时适配
谷歌表示,从今年 9 月开始,所有包含原生代码的 Wear OS 新应用和应用更新在发布到 Play 商店时,必须同时提供 32 位和 64位版本。 不过谷歌官方表示,32 位应用的支持政策暂时不会调整,…

2026-04-03

荣耀MagicBook Pro 14规格揭晓:超轻薄机身配长续航高性能处理器
IT之家 4 月 2 日消息,荣耀官方今天在微博发文,公布 MagicBook Pro 14 笔记本的部分规格。据介绍,这款笔记本搭载第三代英特尔酷睿 Ultra X9 处理器、3.1K 超清荣耀护眼屏,号…

2026-04-03

小米17系列:精准定位技术创新 性价比与体验双优成旗舰新典范
从处理器到屏幕,从电池到影像系统,小米17系列都展现了其在技术领域的深厚积累。用户们纷纷表示,小米17系列不仅性能强劲、设计创新,而且性价比极高,是值得购买的旗舰机。 小米17系列的成功,不仅为小米在高端市场…

2026-04-03

iPhone 17 Pro Max:科技美学与性能巅峰之作,开启未来新体验
如果你正寻觅一款能满足你对未来手机所有想象的设备,那么iPhone 17 ProMax绝对是不二之选,它定会让你收获超乎预期的满意。如果你渴望拥有一款能够引领未来科技潮流的手机,那么iPhone 17 Pr…

2026-04-03

库克回顾苹果50年:iPhone发布成高光,展望未来再启新程
当时,苹果内部每天都在使用智能手机,但体验十分糟糕,而 iPhone带来的触控交互彻底改变了这一点。这个月我们一直在庆祝这一里程碑,我也一直在回想史蒂夫曾说过的一些话。在过去 50 年里,这一理念吸引了最聪…

2026-04-03