数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

DeepSeek开源周新突破:双向管道并行与专家负载均衡技术亮相

2025-02-27来源:ITBEAR编辑:瑞雪

近日,DeepSeek“开源周”活动如火如荼地进行到了第四天,一项旨在优化并行策略的新项目正式对外公布。该项目聚焦于提升模型训练和推理过程中的计算与通信协同效率,力求为人工智能领域带来更为出色的性能表现。

此次开源的核心内容涵盖了三大亮点:

首先,DualPipe双向管道并行算法脱颖而出。该算法专为V3/R1训练设计,通过实现计算与通信阶段的高效重叠,显著减少了流水线中的空闲时间,即所谓的“流水线气泡”。这一创新策略极大地提高了训练资源的利用率,使得训练过程更加高效。

其次,专家并行负载均衡器(EPLB)的推出,为专家并行架构中的负载均衡问题提供了有效解决方案。在专家并行架构中,不同的专家模块被分配到不同的GPU上运行。然而,由于任务需求的变化,各专家模块的工作负载也会相应调整。为了保持GPU间的负载均衡,EPLB采用了冗余专家策略,通过复制高负载的专家模块,并利用启发式方法将其合理分配到不同的GPU上。为了减少节点间的通信开销,EPLB还尝试将同一组的专家模块尽可能部署在同一节点上。这一策略的具体实现细节已在`eplb.py`文件中开源,开发者可借此工具计算出平衡的专家复制与放置方案。尽管专家负载的预测方法未在此次开源范围内,但开发者仍可采用移动平均法等常见手段进行估算。

最后,项目团队还公开了V3/R1计算-通信重叠分析的相关数据。这些数据详细展示了计算与通信重叠策略的实现细节及其优化效果,为研究社区提供了深入了解和改进相关技术的宝贵资料。

关于DualPipe算法,它首次亮相于深度搜索-V3技术报告中。该算法的核心思想在于,通过双向流水线机制实现正向与反向计算阶段的完全重叠,从而大幅提升整体效率。而专家并行负载均衡器(EPLB)则不仅解决了专家并行架构中的负载均衡难题,还通过优化专家模块的部署策略,进一步降低了节点间的通信成本。

此次开源活动,项目团队旨在向社区提供更多实用的技术参考,推动人工智能领域相关技术的进一步发展。这些开源内容和数据的发布,无疑将为研究者和开发者提供更为丰富的资源和灵感,助力他们在人工智能的道路上不断前行。

Steam Frame登场 Valve停产Index VR头显 开启VR新征程
用户可通过无线适配器,将 PC 或 Steam Machine 上的平面屏(flatscreen)及 VR 游戏串流至 SteamFrame;与此同时,Steam Frame 本身也是一款独立设备,搭载高通…

2025-11-14

四名MIT辍学00后,两年打造AI编程神器,估值冲300亿成资本新宠
两年前,在完成种子轮融资后,创始人曾写了这样的期待—— Cursor的诞生,推动了「氛围编程」(vibe coding)在全球兴起。 他还在创纪录的时间内,完成了一份手写编程测试,给早期Facebook投资…

2025-11-14

疑似小米新款大尺寸横向阔折叠手机曝光 参数配置或迎重大升级
据CNMO了解,此前,有数码博主爆料称,小米新款大折叠手机正在测试2亿像素主摄,或采用1/1.4英寸大底高像素方案,可能支持35mm、50mm裁切光变。目前小米大折叠产品线型号为"MIX Fold",而新款…

2025-11-14

苹果屏下摄像头技术稳步推进,2027年iPhone或迎屏幕视觉体验新飞跃
苹果屏下摄像头技术的研发正按计划推进,预计将于2027年投入使用。此前有报道称,苹果将在 iPhone 18 Pro 机型上首次推出屏下面容ID 技术,而该技术预计将于一年后正式应用。 目前,苹果前置摄像头…

2025-11-13

华为专利收入45亿!超27亿设备获5G授权,以厚道之姿推动全球科技生态发展
华为作为中国科技企业的领头羊,凭借高研发投入,其技术积累和专利创新在国内遥遥领先,在国际上也名列前茅,苹果、三星等国际知名企业都需要向华为缴纳专利费。 2024年华为研发投入1800亿,占全年营收的20%以上…

2025-11-13

大疆新品亮点频现:Avata 360无人机配旋转云台,Osmo Action 6相机可变光圈
在镜头和视频规格方面,Action 6 将配备全新的 F2.0-F4.0 可变光圈镜头,等效焦距为 16mm;支持录制带有 HDR 和ProRes 编码的 8K / 30fps 视频,还支持 5.3K /…

2025-11-13

vivo双11新机Y500 Pro来袭,2亿像素+7000mAh大电池,1799元起售
为了双11准备新手机是这几年手机行业中的惯例,这段时间手机厂商们发布的新机数量远超平时,而今年双11期间最忙碌的手机厂商是vivo,一般来说准备一款新机是常态,准备两款新机算是比较激进的,准备三款新机的就很稀…

2025-11-12

“AI才女”罗福莉官宣加入小米,携手团队共筑AGI美好未来
罗福莉的职业生涯始于阿里巴巴达摩院,主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作。 此外,罗福莉在朋友圈提到的“XiaomiMiMo”是小米公司于2025年4月开源的首个推理大模型…

2025-11-12

苹果关闭iOS 26.0.1验证通道,已升级至26.1系统的用户无法官方降级
IT之家 11 月 11 日消息,苹果现已关闭 iOS / iPadOS 26.0.1 系统的验证通道,意味着已经升级到 iOS /iPadOS 26.1 系统的 iPhone / iPad 用户将无法再通…

2025-11-12

特斯拉得州超级工厂将扩建,Optimus人形机器人量产目标剑指年产能千万台
据IT之家了解,目前特斯拉已在位于北加州弗里蒙特(Fremont)的工厂内设立试点生产线,组装部分 Optimus 样机;但公司计划将Optimus 项目的绝大部分产能布局在得州超级工厂。 据透露,弗里蒙…

2025-11-11