数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

阿里开源千问Qwen3.5-Plus:小参数量大性能,推理效率与视觉能力双飞跃

2026-02-16来源:快讯编辑:瑞雪

阿里巴巴在人工智能领域再掀波澜,正式开源全新一代大模型千问Qwen3.5-Plus。这款模型凭借3970亿总参数、仅170亿激活参数的极致设计,实现了以小博大的技术突破,性能全面超越万亿参数的Qwen3-Max基座模型,在推理效率、部署成本等关键指标上达到行业领先水平。其API定价每百万Token仅0.8元,仅为国际竞品Gemini 3 Pro的1/18,标志着中国开源大模型在商业化应用层面迈出关键一步。

技术架构层面,千问3.5突破传统Transformer框架,创新性融合线性注意力机制与稀疏混合专家(MoE)模型架构。研发团队自主研发的门控技术曾斩获2025 NeurIPS全球AI顶会最佳论文,该技术通过动态参数激活策略,使模型在保持3970亿总参数规模的同时,实际计算量仅相当于170亿参数模型。这种设计使显存占用降低60%,在32K标准上下文场景中推理吞吐量提升8.6倍,256K超长上下文场景下更可达到19倍性能跃升,为实时交互类应用开辟新可能。

作为全球首个原生多模态开源大模型,千问3.5在视觉能力维度实现质的飞跃。在多模态推理(MathVison)、视频理解(MLVU)等20余项权威评测中均登顶榜首,尤其擅长处理复杂空间推理任务。其支持长达2小时视频的直接输入分析,配合图搜与代码生成能力,可将手绘界面草图自动转换为可执行前端代码,甚至通过单张截图定位并修复UI问题。在学科解题评测中,该模型以87.8分超越GPT-5.2,在博士级难题GPQA测评中取得88.4分,刷新行业纪录。

训练效率的突破得益于阿里云AI基础设施的全面升级。研发团队通过混合数据训练吞吐量优化技术,使文本、图像、视频等多模态数据的训练效率与纯文本模型持平,配合FP8/FP32混合精度策略,在数十万亿token训练过程中减少50%激活内存占用,同时提升10%训练速度。这种技术组合显著降低了多模态大模型的训练门槛,为中小研发团队提供可复制的技术路径。

在应用落地层面,千问3.5展现出强大的场景适应能力。其Agent框架支持手机与电脑端跨应用操作,可自主完成数据整理、流程自动化等复杂任务。春节期间,基于该模型开发的AI购物Agent在6天内处理1.2亿笔订单,验证了大规模真实场景商业化能力。目前,千问APP与PC端已完成模型接入,开发者可通过魔搭社区、HuggingFace平台获取模型资源,或通过阿里云百炼直接调用API服务。

作为全球下载量突破10亿次的开源项目,千问系列已衍生出超20万个定制模型,形成覆盖全尺寸、全模态的完整生态。最新发布的3.5版本支持201种语言,词表规模扩展至25万,小语种编码效率提升最高达60%。据透露,性能更强的Qwen3.5-Max旗舰模型将于近期开源,不同尺寸的垂直领域模型也在持续开发中,持续巩固其全球第一开源大模型的领先地位。

iPhone 18 Pro系列重磅来袭!五大升级亮点抢先揭秘
在即将到来的9月发布会上,苹果预计将只推出iPhone 18 Pro系列以及备受期待的首款大折叠屏iPhone Fold。 去年的iPhone17系列刚刚普及了苹果自研的N1芯片,而今年的iPhone 18…

2026-02-16

SaaS未死新篇启:智能体AI赋能,传统软件向行动系统华丽转身
在最近的财报和公司指导下,这种论调获得了关注,促使投资者修正了对大型SaaS提供商的增长预期。 在新兴的智能体经济中,将发生变化的是价值创造和交付的方式。67.5%的软件公司已经实施了智能体AI解决方案,这些…

2026-02-16

iPhone 18 Pro系列将至:小号灵动岛搭配2nm芯片,屏占比与性能双突破
与此同时,前置摄像头、点阵投影器以及红外镜头则继续保留在屏幕中央位置。 这种精密的布局调整,意味着iPhone 18 Pro和iPhone 18Pro Max将拥有苹果历史上最小的屏幕开孔,视觉重心更加集中…

2026-02-16

北大团队突破非易失性存储技术 研制纳米栅铁电晶体管构建自主知识产权体系
月 16 日消息,据北京大学官方账号昨日分享,该校在非易失性存储器领域取得突破性进展,电子学院邱晨光-彭练矛团队首次提出“纳米栅超低功耗铁电晶体管”,真正实现了超低功耗下的数据高效存储,相关成果日前发表于《科…

2026-02-16