数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

阿里千问Qwen3.7-Max发布:国产模型登顶,35小时全自主完成硬核硬件优化

2026-05-21来源:快讯编辑:瑞雪

在人工智能领域,阿里巴巴再次以创新实力引领行业风向。近日,阿里巴巴旗下千问大模型系列迎来重大突破,正式发布旗舰版本Qwen3.7-Max。这款专为智能体场景深度优化的大模型,凭借多项核心能力的突破性提升,在权威测评中展现强劲实力,综合表现直追国际顶尖水平,成为国产大模型发展的又一里程碑。

在编程能力领域,Qwen3.7-Max展现出显著优势。该模型在SWE-Pro、SWE-Multilingual等智能体编程测评中持续领跑,其中Terminal Bench 2.0-Terminus测试得分高达69.7,不仅超越DeepSeek-v4-pro-Max等国产模型,更力压Claude-Opus4.6等国际主流产品。这一突破标志着国产大模型在复杂编程任务处理能力上实现质的飞跃。

通用智能体能力方面,Qwen3.7-Max在贴近真实场景的测试中表现卓越。在MCP-Atlas、MCP-Mark、Skillbench等权威测评中,该模型以显著优势超越GLM5.1、Kimi-K2.6等国内同类产品,刷新国产模型在该领域的最佳成绩。特别是在多任务协同处理和复杂场景适应能力上,展现出强大的工程化应用潜力。

推理与通用能力测评中,Qwen3.7-Max持续突破技术边界。在GPQA Diamond、HLE、HMMT 2026 Feb等高难度推理测试中,该模型不仅超越所有国产模型,更在部分指标上领先Claude-Opus4.6。指令遵循测试IFBench斩获79.1分,多语言能力测评WMT24++、MAXIFE等项目均保持行业领先地位,充分验证其跨语言、跨领域的通用智能水平。

最具颠覆性的是,Qwen3.7-Max成功完成35小时全自主硬件优化任务。在无任何技术文档、参考代码和性能数据的条件下,该模型在平头哥真武M890芯片平台上从零开始,独立完成内核编写、编译、性能分析与迭代优化全流程。期间执行432次内核评估、1158次工具调用,最终实现较官方参考实现10倍性能提升,并自主发起关键架构重构,展现出接近人类工程师的长期自主工作能力。

技术特性方面,Qwen3.7-Max具备卓越的跨框架泛化能力,支持多智能体协同工作模式。在办公自动化场景SpreadSheetBench-v1测试中,该模型以87分的优异成绩证明其在复杂业务场景中的实用价值。据阿里云透露,Qwen3.7-Max API即将登陆百炼平台,后续还将推出Qwen3.7-Plus等版本,构建覆盖编程、视觉、办公等全场景的智能体解决方案生态。

OPPO Reno16系列5月25日发布!实况照片+潮玩自拍屏,性能影像双升级
从官方预热来看,这次的主打卖点依旧是实况照片,同时还有一款名为“潮玩自拍屏”的配件发布,追星和喜欢自拍的小伙伴有福了。 在按键方面,OPPO Reno16系列标配旗舰同款的实体快捷键,该按键和系统内置的AI一…

2026-05-21

Seedance 2.1即将登场:视频质量提升20%,已占据80%视频生成算力份额
Sora已经退出了AI视频生成的舞台,基本上就是Seedance成为了绝对的王者,当然随着使用Seedance2.0的用户越来越多,字节也遭遇了前所未有的流量以及算力压力,同时消费者对于Seedance 2…

2026-05-21

热门旗舰平板大比拼!移动办公、创作娱乐,哪款才是你的本命之选?
连接键盘秒切PC模式,拥有PC级桌面、任务栏与文件管理器,支持20个窗口同时运行,操作体验媲美轻薄笔记本;AI帮记可实现会议全流程助力,会后一键生成纪要与思维导图;AI帮写支持摘要总结、文案创作与翻译;AI…

2026-05-21

昆山买手机哪里划算?实测5家店数据说话,这家店价格服务双优推荐
我选了昆山几个热门商圈的店,包括:星网全数码(人民路店)、ABC数码广场、XYZ手机城、数码港连锁、街边小铺(随机选)。 数据表明:过去一年,星网全数码价格波动小于5%,其他店波动达8-10%。我实测了5家…

2026-05-21

国轩高科全球科技大会亮点纷呈:全固态电池领衔,七大新品齐亮相
目前大会已邀请欣旺达、上汽大众、清陶云能、中科固能、东风汽车、金羽新能、天能电池、晶核能源、鹏辉能源等 30余位知名企业嘉宾,以及清华大学、复旦大学、中科院、中国科学技术大学等高校的10余位权威专家,共同带…

2026-05-20