数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

华为云Tokens服务接入384超节点,突破AI算力增长瓶颈

2025-08-29来源:ITBEAR编辑:瑞雪

在第四届828 B2B企业节盛大开幕的当天下午,华为云传来了一则令人瞩目的消息:其Tokens服务已成功全面融入CloudMatrix384超节点,这一融合标志着华为云在AI算力领域的又一次重大突破。

得益于xDeepServe架构的创新应用,华为云Tokens服务的性能得到了显著提升。具体而言,该服务在单芯片上实现了2400TPS的吞吐量,同时保持了50ms的TPOT(Token处理时延),这一成绩无疑为AI算力的应用树立了新的标杆。

近年来,中国AI算力需求呈现出爆炸式增长。数据显示,从2024年初至2025年6月底,中国的日均Token消耗量从1000亿激增到30万亿,短短一年半时间内增长了300多倍。这一趋势对算力基础设施提出了前所未有的挑战。为了满足这一需求,华为云在2025年3月推出了基于MaaS(模型即服务)的Tokens服务,提供了多种规格以满足不同应用场景的需求。

此次Tokens服务与CloudMatrix384超节点的结合,更是将这一服务的性能推向了新的高度。依托超节点的xDeepServe框架,Tokens服务的吞吐量从年初的1920TPS跃升至2400TPS。这一提升的背后,是华为云对于大算力构建全栈创新的深刻理解,包括硬件、软件、算子、存储、推理框架及超节点等各个环节的协同优化。

xDeepServe架构作为CloudMatrix384超节点的原生服务,其创新之处在于采用了Transformerless极致分离架构。这一架构将MoE大模型拆解为Attention、FFN、Expert三个可独立伸缩的微模块,并通过微秒级XCCL通信库与FlowServe自研推理引擎进行高效整合。经过这样的优化,单卡的吞吐量从非超节点的600tokens/s大幅提升至2400tokens/s。

华为云还透露了xDeepServe架构的未来发展计划。目前,该架构已经实现了MA分离,未来还将进一步将Attention、MoE、Decode改造为数据流,并扩展至多台超节点,以实现推理吞吐的线性提升。

在应用层面,华为云Tokens服务已经支持了包括DeepSeek、Kimi、Qwen等在内的主流大模型,以及versatile、Dify等主流Agent平台。同时,华为云还与超过100家合作伙伴携手,在多个领域开发AI Agent,如调研分析、内容创作、智慧办公、智能运维等。这些应用不仅提升了服务效率与客户满意度,还推动了政企办公的智能化转型。

例如,基于MaaS平台的今日人才数智员工解决方案,通过集成自然语言处理、机器学习等技术,为企业提供了智能化的人才管理服务。而北京方寸无忧科技开发的无忧智慧公文解决方案,则利用AI技术实现了公文的自动化处理,大大提高了办公效率。

SK海力士新DDR5芯片“X021”亮相:或适配Intel未来处理器,原生频率达7200MT/s
快科技10月22日消息,SK海力士的全新DDR5内存芯片近日在网络上出现,据称代号为“X021”,并带有新的零件编码“AKBD”。 根据unikoshardware的说法,芯片上的“X021”标记表明它是第二…

2025-10-22

魔方网表,以技术为本,坚定的长期主义者
全球数字化的汹涌浪潮推着各行各业不断向前,商业世界正在以前所未有的速度与频率经历巨变。对此,企业如何快速有效地在日益复杂的市场环境下,抓住自身的发展机遇,是各行各业的急需解答的难题,而数字化转型又成为其中的必修之课。然而,对很多企业来说,快速变化的业

2025-10-22

售价13000元!三星Galaxy XR头显发布 直面苹果Vision Pro高端之争
【CNMO科技消息】10月21日,三星正式发布了其首款混合现实头戴设备——GalaxyXR,官方售价定为1799.99美元(约合人民币13000元),直接瞄准了苹果Vision Pro的高端市场。借助头显的…

2025-10-22

性能与美学的双重盛宴:iQOO 15的自我修养与突破
前面我们详细聊过,它把一块自研电竞芯片Q3塞进机身,像给手机装上一块真正的“独显”,再辅以双轴马达、对称大师双扬和一位随时陪练的AI军师——这一次,性能旗舰的终点不再是冷冰冰的跑分,而是指尖、耳朵,甚至心脏都…

2025-10-21

国家广电总局首颁“便捷看电视”认证,认准标志选电视享便捷观影体验
IT之家 10 月 20日消息,国家广播电视总局今日宣布,国家广播电视总局广播电视规划院为首款符合认证标准的智能电视机颁发“便捷看电视”认证证书。这款率先通过认证的产品由康佳研发打造,即将正式上市销售。 作…

2025-10-21

2025上半年全球智能眼镜出货增64.2%,2029年或破4000万台中国增速居首
【环球网科技综合报道】10月21日消息,市场研究机构(IDC)发布报告显示,2025上半年,全球智能眼镜(AI眼镜)市场出货量达406.5万台,同比增长64.2%。 IDC预计,到2029年全球智能眼镜市场出…

2025-10-21

牌面拉满!比亚迪成为多国元首的选择
近年来,我国新能源汽车产业在科技创新驱动下实现跨越式发展,比亚迪作为行业领军企业,技术领先全球瞩目,凭借过硬的技术实力与产品品质,赢得多国元首青睐,成为“中国制造”向“中国智造”转型升级的典型代表,更成为传递中国科技实力的“移动新名片”与“无声外交官

2025-10-21

IDC报告:百度智能云智算服务市场份额第一,GenAI IaaS增速最快
10月21日,国际权威咨询机构IDC发布了《中国智算专业服务市场(2025上半年)跟踪》报告。其中,在智算解决方案实施服务市场中,百度智能云以19.9%的份额位居第一;在GenAI IaaS领域,百度智能云实现近5倍增长,增速位居市场首位。随着大模型及AI应用的爆发,云计算正在以C

2025-10-21

抖音电商持续治理虚假宣传保健功效,清退违规达人4.3万名,违规商家793家
10月20日,抖音电商安全与信任中心发布治理虚假宣传保健功效的进展,公告称多平台反复出现以“健康焦虑”为卖点的功效虚假宣传现象,已成为食品行业的顽疾。据了解,部分不良商家、达人将普通食品包装为“保健品”或“特医食品”,甚至将保健食品夸大为具有医疗功效,损

2025-10-21