数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

阿里发布Qwen3-Max-Thinking:性能比肩国际顶尖,推理能力创新高

2026-01-27来源:天脉网编辑:瑞雪

阿里近日正式推出其最新一代千问旗舰推理模型——Qwen3-Max-Thinking,该模型在多项权威评测中创下全球新纪录,性能比肩国际顶尖的GPT-5.2和Gemini 3 Pro,成为国内AI大模型领域的新标杆。

作为阿里目前规模最大、能力最强的推理模型,Qwen3-Max-Thinking的总参数量超过万亿级别,预训练数据量高达36T Tokens。通过大规模扩展总参数、强化学习以及推理计算,新模型在科学知识、数学推理、代码编程等关键性能基准测试中刷新了全球纪录,展现了强大的技术实力。

在推理能力提升方面,Qwen3-Max-Thinking引入了一种创新的测试时扩展(Test-time Scaling)机制。这一机制通过提炼此前推理的“经验”,并进行多轮自我迭代,在相同上下文中实现更高效的推理计算,从而获得更智能的结果。相比业界普遍采用的冗余推理方式,该机制显著提升了推理效率和性能。例如,在“人类最后的测试”(HLE)中,Qwen3-Max-Thinking以58.3分的成绩超越了GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,成为当前所有模型中的最高分。

针对即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。通过基于规则奖励与模型奖励的联合强化学习训练,模型能够更智能地结合工具进行思考。这种自适应的工具调用能力已在QwenChat上实现,用户可以体验到模型自主选用搜索、个性化记忆和代码解释器等核心Agent工具功能,获得更专业、更贴合需求的回答,同时模型幻觉问题也显著减少,为解决复杂任务奠定了基础。

目前,开发者可以在QwenChat上免费体验Qwen3-Max-Thinking模型,企业用户则可通过阿里云百炼获取新模型的API服务。普通用户也可以通过千问的PC端和网页端试用该模型。据悉,千问App即将接入这一新模型,届时所有用户均可免费体验这款国内最强的AI大模型。

先导智能2025年业绩飙升:净利润预增超4倍,新能源龙头再启新程
2025 年全球动力电池市场持续回暖,储能领域需求强劲增长,行业整体需求持续复苏,公司在新能源智能装备领域的龙头地位进一步巩固。 业绩的强劲爆发,推动公司一度重返千亿市值,2025年年内股价涨幅超150%。…

2026-01-27

W3周手机销量榜:苹果前三占尽风头,华为Mate 80领跑国产,多款机型各显神通
排名六至三十位的机型依次为:OPPO A5x、vivo S50、OPPO Reno15、vivo Y50、vivo Y500、华为nova15、荣耀500、REDMI 15R、OPPO A6、荣耀畅玩60…

2026-01-27

2026游戏手机怎么选?这三款性能续航双在线,实测不踩坑!
不过相比荣耀WIN系列,K90在游戏专项优化上有所欠缺:UFS 4.0闪存和LPDDR5X标准版内存的组合,在大型游戏加载速度上比荣耀WIN的“至尊版三件套”慢17%,散热系统也仅采用传统VC均热板,长时间…

2026-01-27

商业航天蓬勃发展 太空光伏“放量降本”开启产业新篇章
多家企业已布局相关技术与业务,东方日升具备P型超薄HJT产品批量交付能力,累计出货数万片;钧达股份与拥有中科院技术背景的尚翼光电战略合作,深耕钙钛矿航天应用;迈为股份、捷佳伟创分别推出钙钛矿相关叠层电池整线…

2026-01-26

光伏板块强势崛起 商业航天持续走热 近4000股上涨市场情绪升温
以天合光能分布式市场指导价为例,该报价本月已经调价三次,中版型和大板型组件价格区间已经达到0.88-0.92+元/W,距离重回“1元时代”仅一步之遥,在行业向好的催化剂下,光伏板块也是在近期迎来爆发。 东吴证…

2026-01-26