国产算力再攀高峰：深圳团队助力万亿级MoE大模型全参数训练稳落地-产业资讯-数据世界

深圳河套学院AI训练平台项目团队近日联合哈尔滨工业大学（深圳）、深圳市大数据研究院、华为GTS等机构，在国产算力大模型训练领域取得重大突破。基于昇腾910C国产算力集群，团队成功完成DeepSeek-V4-Pro全参数后训练工程实践，标志着国产AI基础设施从推理部署向超大模型全参数训练迈出关键一步。

作为拥有1.6万亿参数的MoE（混合专家）开源旗舰模型，DeepSeek-V4-Pro采用CSA+HCA混合稀疏注意力、mHC连接等创新机制，对训练框架提出极高要求。项目团队仅用一个月时间，便在千卡级昇腾910C集群上实现该模型全参数续训练与SFT（监督微调）稳定运行，累计完成超1500步训练，MFU（模型算力利用率）最终稳定在34.9%，单步训练时间控制在27秒。

技术层面实现三大核心突破：其一，构建覆盖权重、梯度、激活、优化器状态的分布式承载方案，实现数据并行、张量并行、流水并行与专家并行的协同工作；其二，优化MoE路由与稀疏注意力算子，通过专家负载均衡机制缓解通信拥堵与负载失衡问题；其三，建立全指标可视化长稳监控体系，确保多日连续训练中未出现Loss失控或NaN值异常。

在能力验证环节，团队设计专项实验增强模型数学建模能力。通过搭建SFT建模数据生产工作流，产出3000条高质量数学建模任务样本，覆盖4类目标任务与3种问题形态。训练结果显示，模型LM Loss收敛至0.2056，MTP 1 Loss收敛至0.2538，梯度曲线保持平稳。Benchmark评测表明，ORGeval WL等四项核心指标全面提升，复杂推理与建模能力显著增强。

该成果具备可复现、可工程化交付的万亿级MoE模型国产算力稳定训练能力。项目已完成工业级自动化运筹建模场景的闭环验证，证明国产算力可在短周期、低成本条件下完成行业大模型专项增强训练。此次突破不仅验证了国产硬件生态的成熟度，更为垂直领域大模型开发提供了全新解决方案。

苹果WWDC 2026：Siri“脱胎换骨”，Apple Intelligence深度集成开启AI新篇

然而苹果想做的是反过来，让AI适应用户已有的使用习惯，让它自然地出现在你本来就会用的App里。在一个AI可以生成以假乱真照片的时代，苹果选择给每张AI编辑的照片打上标记，让用户和平台可以识别哪些图片是原始…

2026-06-09

闪迪蓄势待发：新款4TB和8TB SDUC存储卡即将登场现有读卡器不兼容

据报道，SD 协会（IT之家注：SD Association）在展会现场的一张海报上宣布，闪迪即将推出新款 4TB/8TB 版 SD 卡和MicroSD 卡。但根据现场情报，这种情况将在后续改善，目前已…

2026-06-09

iOS 27重磅来袭：补齐中国大陆节假日闹钟短板，调休日闹钟不再“失声”

快科技6月9日消息，今日，苹果正式发布iOS 27全新操作系统，带来多项AI新功能和性能优化。 WWDC 26结束后，苹果也火速推送了iOS27首个开发者测试版，拥有开发者资格的用户已经可以下载尝鲜。从…

2026-06-09

厦门6月24日将公开拍卖6幅地块涵盖岛内外最高起拍楼面价达48000元/平

2026-06-09

芯碁微装董事会审议通过H股全球发售议案拟赴港交所上市再进一步

2026-06-09

小米MiMo与TileRT联手：8卡GPU实现万亿模型每秒千token输出
2026-06-09