数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

阿里云峰会重磅发布Qwen3.7-Max,国产大模型性能跃升开启智能体新纪元

2026-05-20来源:互联网编辑:瑞雪

在2026阿里云峰会上,阿里巴巴正式推出新一代千问旗舰大模型Qwen3.7-Max,引发行业高度关注。这款模型在第三方机构Arena全球大模型盲测中表现卓越,不仅超越Kimi-K2.6、DeepSeek-v4-pro等国产模型,更与GPT、Claude、Gemini等国际顶尖模型比肩,稳居国产模型榜首位置。

Qwen3.7-Max的突破性进展体现在多个维度。在编程能力方面,该模型在SWE-Pro、SWE-Multilingual等权威测评中取得领先成绩,Terminal Bench 2.0-Terminus得分达69.7,超越DeepSeek-v4-pro-Max、Claude-Opus4.6等模型。其编程能力覆盖从前端原型开发到复杂多文件工程的全流程,在SWE-bench系列测评和SciCode编程测评中较前代模型实现显著提升,展现出资深工程师级的代码编写与自我纠错能力。

通用智能体性能同样表现亮眼。在MCP-Atlas、MCP-Mark等现实能力测试中,Qwen3.7-Max超越GLM5.1、Kimi-K2.6等模型,创下国产新高。该模型在Kernel Bench L3测试中展现出强大的GPU内核优化能力,在GPQA Diamond、HLE等推理核心测评中均超越Claude-Opus4.6及所有国产模型。多语言能力方面,其在指令遵循IFBench评测中取得79.1分突破性成绩,在WMT24++、MAXIFE等翻译评测中保持领先优势。

最引人注目的是Qwen3.7-Max在长程复杂任务中的自主迭代能力。在平头哥真武M890芯片这一全新硬件平台上,该模型通过持续35小时的自主编程,完成1158次工具调用和432次内核评估,最终实现推理内核10倍加速。测试轨迹显示,模型在运行超30小时后仍能发现优化点,甚至主动发起架构重设计,这种长周期自主迭代能力为AI模型进化开辟了新路径。

在企业级应用场景中,Qwen3.7-Max通过MCP集成和多智能体协作,在SpreadSheetBench-v1办公自动化基准测试中斩获87分。以往需要专业团队耗时1-2周的复杂项目,现在由该模型驱动的智能体可在数小时内完成端到端交付。这种效率提升得益于其跨框架泛化能力,能在Claude Code、OpenClaw、Qwen Code等多种智能体框架下稳定运行。

阿里云同步宣布技术体系全面升级,推出"芯-云-模型-推理"一体化解决方案。Qwen3.7-Max模型API即将登陆阿里云百炼平台,同时将推出具备多模态推理和视觉理解能力的Qwen3.7-Plus等版本,构建覆盖编程智能体与视觉智能体的全能基座,为Agentic时代提供核心技术支持。

家庭光伏储能选型指南:5大核心问题解析,助你精准决策不踩坑
若参数选择不当,可能导致储能系统无法存下足够的多余光伏电力,或在频繁充放电下快速衰减,增加后期更换成本,影响整体投资收益。作为在太阳能与储能领域深耕的技术实践者,保定正联光电科技有限公司的经验表明,一份清晰…

2026-05-20

恒星力量北京开工全球首条钙钛矿太空光伏中试线 计划年内发射电池样品验证
数字新能源DataBM.com获悉,5月16日,恒星力量(北京)科技有限公司在北京未来科学城能源谷开工建设全球首条钙钛矿太空光伏中试线。 公开资料显示,恒星力量(北京)科技有限公司于2025年12月在北京市…

2026-05-20

苹果iPhone 18 Pro系列保护壳提前现身:相机模组或升级,设计兼容性生变
据消息人士 Majin 在 X 平台晒出的图片,iPhone 18 Pro系列的整体设计语言将延续前代,但相机模组尺寸有望进一步扩大,导致新机保护壳无法兼容 iPhone 17 Pro 系列。相机模组的尺寸…

2026-05-20

Google I O 2026全解析:AI模型升级,智能体革新,Gemini生态全面爆发
当然了,对于 AI 模型而言,「有轻量级的 Flash 就必然有专业级的 Pro」——在活动上 Google 也预告 Gemini 3.5Pro 将在下个月登场,但并未公布其他信息。 还记得我们开头是说过…

2026-05-20

谷歌三星联合发布两款智能眼镜:Gemini AI助力,语音导航实时翻译成亮点
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌携手三星公司,展示了由 Gentle Monster 与Warby Parker 共同参与设计的 2 款智能眼镜。 该眼镜…

2026-05-20

百度2026年首季财报:AI新业务占比过半,智能云与自动驾驶双轮驱动增长
2026年第一季度,百度集团-SW(09888)发布了令人瞩目的财报,显示公司实现总收入321亿元人民币,其中核心AI新业务收入占比首次突破50%,这一数据标志着百度在转型过程中取得了重要里程碑,进一步巩固了…

2026-05-20

vivo S60系列新机官宣定档5月29日!影像续航双升级,亮点抢先看
vivo新机开始预热,定档在5月29日发布,机型自然是vivoS60系列,倾向于中高端机市场,同样以影像为主,而且实况照片进一步提升,比如原生实况、4K Live直出、星光 Live等。 vivo S60…

2026-05-20

vivo S60系列官宣5月29日发布!“星星海”设计+7200mAh电池,亮点抢先看
今日,vivo 官方正式官宣vivo S60 系列,将于5月29日19:30召开新品发布会,继续由演员田曦薇代言。外观方面,本次官宣海报和之前曝光的路透图吻合,vivo S60系列采用的是横向大矩阵造型,官…

2026-05-20

vivo S60系列新机首发来袭!田曦薇代言,独特配色与多项黑科技5月29日见
IT之家 5 月 19 日消息,同样是在今天,vivo S60 系列新机首发亮相,并官宣将在 5 月 29 日 19:30发布。据介绍,vivo S60 系列依旧由田曦薇代言。新机将主打「星星海」配色,整个…

2026-05-20