数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

华为云Tokens服务接入384超节点,全栈创新引领AI算力新飞跃

2025-08-28来源:ITBEAR编辑:瑞雪

在第四届828 B2B企业节盛大启幕之际,华为云传来了一则振奋人心的消息:其Tokens服务已成功接入CloudMatrix384超节点,标志着华为云在AI算力领域迈出了重要一步。

借助xDeepServe架构的创新突破,华为云的单芯片性能实现了飞跃,达到了2400TPS的超高吞吐量和50ms的超低时延,这一表现远远超越了当前业界的平均水平。这一技术革新,无疑为AI应用的高效运行提供了强有力的支持。

近年来,中国AI算力需求呈现出爆炸式增长。据统计,从2024年初到今年6月底,中国日均Token消耗量从1000亿激增到30万亿,短短一年半时间增长了300余倍。这一数据不仅反映了我国人工智能应用规模的迅速扩张,也对算力基础设施提出了前所未有的挑战。

面对这一挑战,华为云于今年3月正式推出了基于MaaS的Tokens服务。该服务不仅提供了在线版、进线版、离线版及尊享版等多种规格,以满足不同应用和场景的性能需求,还通过灵活的计费方式,为用户带来了更为便捷、低成本的算力解决方案。

此次Tokens服务接入CloudMatrix384超节点,更是将性能推向了新的高度。借助384原生的xDeepServe框架,吞吐量从年初的1920TPS跃升至2400TPS,TPOT也降低至50ms。这一提升,无疑为AI工具的高效运行提供了更为坚实的算力保障。

华为云的这一成就,并非单点突破,而是从硬件到软件、从算子到存储、从推理框架到超节点的全方位创新。CloudMatrix384超节点以其全新的计算架构,突破了性能瓶颈,构筑了强大的算力基础。同时,CANN昇腾硬件使能、EMS弹性内存存储以及xDeepServe分布式推理框架等技术的协同作用,共同推动了算力的极致释放。

作为CloudMatrix384超节点的原生服务,xDeepServe采用了Transformerless的极致分离架构,将MoE大模型拆分为可独立伸缩的微模块,实现了高效的算力分配和利用。通过这一架构,CloudMatrix384上的大模型被拆解成“积木”,并分配到不同的NPU上同步处理任务,从而构建了一条超高吞吐的LLM服务平台,即Tokens的“超高速流水线”。

CANN作为硬件加速计算的中间层,包含了多个算子库和高性能通信库等组件,为AI模型的高效运行提供了有力支撑。其中,专为超节点上的大语言模型(LLM)服务打造的高性能通信库XCCL,充分发挥了CloudMatrix384扩展后的UB互联架构的潜力,为Transformerless的全面分离奠定了坚实的硬件基础。

而FlowServe作为被重构的“去中心”式分布式引擎,则将CloudMatrix384切割成完全自治的DP小组,每个小组都具备Tokenizer、执行器、RTC缓存与网络栈等完整功能,实现了千卡并发也不拥堵的高效运行。

目前,华为云MaaS服务已广泛支持DeepSeek、Kimi、Qwen等主流大模型及versatile、Dify等主流Agent平台。通过大量的模型性能优化和效果调优,华为云实现了“源于开源,高于开源”的目标,让更多大模型能够在昇腾云上实现更快更好的运行。

以文生图大模型为例,在轻微损失画质的前提下,通过Int8量化、旋转位置编码融合算子等方式,华为云MaaS平台实现了出图速度的两倍提升,最大尺寸支持达到2K×2K。而在文生视频大模型上,通过量化提速和通算并行等方式,视频生成速度大幅提升,相较于友商实现了3.5倍的性能提升。

在应用层面,华为云已与超过100家合作伙伴携手深入行业场景,共同推出了丰富的Agent解决方案。这些方案在调研分析、内容创作、智慧办公、智能运维等领域发挥了重要作用,帮助企业更便捷地拥抱AI创新,加速智能化转型。

例如,基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能够智能交互并处理任务,显著提升服务效率与客户满意度。而北京方寸无忧科技开发的无忧智慧公文解决方案,则通过智能化手段提升了公文处理效能,推动了政企办公的智能化转型。

苹果联名iPhone Pocket:争议中售罄,高价能否续写品牌忠诚传奇?
苹果与日本时尚品牌三宅一生日前联名推出的iPhone Pocket(iPhone 口袋)11月14日正式开售,1299元至1899元的定价引发全网热议,成为科技圈与时尚圈跨界合作的又一争议焦点。尽管争议不断,…

2025-11-14

联想明年再发力!moto razr折叠机与Y700平板将携骁龙8系新平台登场
【CNMO科技消息】11月14日,有数码博主爆料称,联想明年将继续迭代拯救者Y700平板和moto razr系列折叠手机。这两款产品将搭载第五代骁龙8至尊版和第五代骁龙8移动平台,其中,Y700平板屏幕比例为…

2025-11-14

联发科天玑8系芯片屠榜安卓次旗舰性能榜 性能能效双优成市场新宠
以榜单第一的真我Neo7 SE为例,通过与MTK联发科技的深度联合调校,该机在同价位段中展现出极为出色的游戏性能,搭配真我GT性能引擎,通过芯片级调校,实现了持久稳定的高帧率表现,同时能耗最高可降低7%,帧…

2025-11-14

高通跃龙IQ-X系列工业级PC处理器发布,为工业自动化注入AI新动力
高通跃龙 IQ-X 系列为工业自动化提供了 AI 基础设施,能够实现 AI模型移植,以及面向预测性维护、状态监测和缺陷检测等关键用例的应用开发。 该平台支持Qt、CODESYS等工业软件工具,通过高通AI软…

2025-11-14

OPPO Reno15 Pro 11月17日登场:天玑8450+2亿主摄,屏幕续航全面升级
最新泄露的信息显示,这款新机将在屏幕、影像和续航等多个维度带来显著升级。 爆料数据显示,OPPO Reno15 Pro将搭载一块6.78英寸1.5K分辨率直屏,采用全球最窄的1.15mm四等边设计,配合金属中…

2025-11-13

荣耀500系列全渠道预约开启 2亿像素主摄+8000mAh大电池成亮点
影像方面,荣耀500系列可能全系标配2亿像素主摄,采用1/1.4英寸大底传感器,并引入雅顾影像调校技术。其中,Pro版或加入潜望式长焦镜头,支持高倍率光学变焦。 续航方面,荣耀500系列预计内置一块高达800…

2025-11-13

京东11.11手机销售成绩亮眼 鸿蒙以旧换新新品AI手机全线飘红
11月11日24点,京东11.11迎来圆满收官。超级供应链上的京东11.11,为消费者带来了“又好又便宜”的商品和服务,手机产品销量增长显著。数据显示,10月9日20点至11月11日24点,成交额破亿的手机单…

2025-11-12

OPPO Reno 15系列11月17日发布,首发“出圈实况拼图”功能,开启影像创作新体验
【CNMO科技消息】11月12日,OPPO首席产品官刘作虎发文称,实况照片是这个时代移动影像最动人的发明之一,并宣布OPPO Reno15系列将首发“出圈实况拼图”功能。 据CNMO了解,OPPO Reno…

2025-11-12

荣耀GT2系列来袭:9000mAh大电池搭配骁龙强芯,性能续航双升级
【CNMO科技消息】11月12日,有数码博主爆料称,荣耀新款性能机GT2将搭载9000mAh超大电池和骁龙8至尊版移动平台。作为参考,现款荣耀GT Pro首批搭载了高通骁龙8至尊领先版移动平台,配合LPDD…

2025-11-12

2025年Q3中国平板市场双高峰助力增长 苹果线上销量份额居首
11月10号消息,根据洛图科技发布的《中国智能平板零售市场月度追踪》报告数据显示,2025年第三季度,中国消费级智能平板(平板电脑)市场的全渠道销量为796万台,同比增长11.6%。暑期消费旺季与开学季形成了…

2025-11-12