数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

国产模型新突破!阿里Qwen3.7-Max发布,35小时全自主完成复杂优化任务

2026-05-21来源:快讯编辑:瑞雪

阿里巴巴在最新举办的阿里云峰会上,重磅推出全新千问旗舰模型Qwen3.7-Max,标志着国产大模型研发进入新阶段。该模型在第三方权威评测机构Arena发布的全球大模型盲测总榜中表现亮眼,不仅超越Kimi-K2.6、DeepSeek-v4-pro等国内主流模型,更与GPT、Claude、Gemini等国际顶尖模型形成有力竞争,稳居国产模型榜首。

作为千问系列近三个月内的第三次重大升级,Qwen3.7-Max的迭代速度显著加快。从3.5版本到3.6版本再到当前版本,阿里云通过持续优化算法架构与训练策略,使模型在智能体(Agent)场景下的综合能力实现质的飞跃。该模型专门针对复杂任务处理需求进行设计,在编程、通用智能体、逻辑推理等核心领域展现出突破性进展。

在编程能力测试中,Qwen3.7-Max在SWE-Pro、SWE-Multilingual等国际权威编程智能体评测中均取得领先成绩。特别是在Terminal Bench 2.0-Terminus基准测试中,该模型以69.7分的成绩超越DeepSeek-v4-pro-Max和Claude-Opus4.6等模型。测试数据显示,其代码生成准确率较前代提升23%,多语言编程支持范围扩展至15种主流编程语言。

通用智能体能力方面,该模型在MCP-Atlas现实场景模拟测试中取得92.3分的优异成绩,较GLM5.1提升11个百分点。在Skillbench多任务处理评测中,其任务完成率达到88.7%,创下国产模型新纪录。这些突破得益于模型对复杂指令的理解能力显著增强,能够更精准地分解任务步骤并执行跨领域操作。

逻辑推理能力测试结果同样引人注目。在GPQA Diamond、HLE等国际推理基准测试中,Qwen3.7-Max以绝对优势超越Claude-Opus4.6及所有参与评测的国产模型。特别是在HMMT 2026 Feb数学推理专项测试中,其解题正确率达到76.4%,较前代提升19个百分点,展现出强大的抽象思维能力。

通用能力评估显示,该模型在指令遵循IFBench评测中取得79.1分的历史新高,多语言处理能力在WMT24++、MAXIFE等国际评测中持续领跑。值得关注的是,在完全陌生的硬件优化任务中,Qwen3.7-Max展现出惊人的自主学习能力。面对从未接触过的平头哥真武M890芯片,模型在35小时内独立完成432次内核评估和1158次工具调用,最终实现推理内核10倍性能提升,且全程无需任何硬件文档支持。

任务轨迹分析显示,模型在运行超过30小时后仍能持续发现优化空间,甚至主动发起架构重设计。这种突破性表现源于其内置的动态优化机制,能够根据实时反馈自动调整策略。在Agent框架兼容性测试中,该模型在Claude Code、OpenClaw等主流框架下均保持稳定输出,跨平台适应能力得到充分验证。

办公自动化场景测试中,通过MCP集成与多智能体协作,Qwen3.7-Max在SpreadSheetBench-v1基准测试中取得87分的顶尖成绩。其文档处理准确率达到94.6%,表格数据解析速度较传统方法提升5倍。阿里云透露,Qwen3.7-Max API即将在百炼平台上线,后续还将推出覆盖视觉智能体等场景的Qwen3.7-Plus版本,持续拓展模型应用边界。

OPPO Reno16系列5月25日发布!实况照片+潮玩自拍屏,亮点抢先看
从官方预热来看,这次的主打卖点依旧是实况照片,同时还有一款名为“潮玩自拍屏”的配件发布,追星和喜欢自拍的小伙伴有福了。 在按键方面,OPPO Reno16系列标配旗舰同款的实体快捷键,该按键和系统内置的AI一…

2026-05-21

三星Galaxy S27系列将添新成员,S27 Pro 6.47英寸屏或携多项升级登场
同时,相关爆料显示,这款新增的Pro机型将是高端定位,与 S27 Ultra 共享部分技术基础,不过不支持 S Pen 手写笔。结合以上信息来看,下一代三星Galaxy S27 系列中隐私屏幕功能似乎还会…

2026-05-21

西圣、华为、倍思充电宝大比拼!充电效率、容量、控温谁更胜一筹?
今天,就在我测评的众多充电宝中把西圣、华为、倍思这三款充电宝拿出来进行对比,分别从品牌、容量与兼容性、充电速度、便携与安全四大维度真实对比,帮大家一步选对、不踩雷!完整充满2次后,在进行第3次充电时,手机电…

2026-05-21

2026智能家居怎么选?安徽洲润、华为、小米,口碑佳作助你畅享智能生活
生态链丰富:小米拥有庞大的智能家居生态链,用户可以根据自己的需求选择不同品牌的智能设备,实现设备之间的互联互通。 设备选择:在选择小米智能家居设备时,建议优先选择小米官方推出的产品,以确保设备之间的兼容性和…

2026-05-21

北通鲲鹏40御铠白深度评测:300元内AI智控手柄,软硬兼优的沉浸体验之选
用户反馈普遍提到这款手柄做工扎实,长时间握持不易疲劳,这为后续的深度游戏体验打下了良好的硬件基础。它不仅搭载了双限位阻尼可调TMR摇杆、光轴按键3.0、双切震动扳机等旗舰级硬件配置,更通过北通智控软件和AI语…

2026-05-21