数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

DeepSeek融资后首推开源新成果!DSpark框架让模型生成速度飙升60%-85%

2026-06-29来源:快讯编辑:瑞雪

在人工智能领域持续创新的浪潮中,DeepSeek再次引发关注。近日,该团队宣布开源一套提升现有模型运行效率的工程方案,推出DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark两款模型,同时开源推测解码框架DSpark及训练框架DeepSpec,为行业带来新的技术突破。

此次开源的核心在于推测解码技术的创新应用。DSpark框架通过将草稿生成与模型校验解耦,实现了大语言模型推理速度的提升。与传统方法不同,DSpark采用半自回归架构,结合并行主干网络与轻量串行模块,在保持生成质量的同时,有效缓解了末尾内容通过率衰减问题。该框架还引入置信度调度校验机制,根据预估前缀通过概率动态调整校验长度,显著提升了有效通过序列长度。

技术文档显示,DSpark在DeepSeek-V4线上服务系统的部署中展现出显著优势。在保持整体吞吐不变的前提下,单用户生成速度提升60%-85%,且在严格交互时延约束下避免了吞吐率大幅下降。这种性能提升得益于其独特的架构设计:并行生成模块负责快速产出候选序列,串行校验模块则对高置信度部分进行精准验证,两者协同工作优化了算力分配。

配套开源的DeepSpec工具链为开发者提供了完整解决方案。这个全栈代码库包含数据准备、模型训练、评估脚本等模块,支持MIT许可协议。其工作流程涵盖从提示下载、目标答案生成到模型训练评估的全过程,目前支持DSpark、DFlash和Eagle3三种草稿模型算法。特别值得注意的是,DeepSpec允许开发者基于Qwen3、Gemma等现有模型训练自定义草稿模型,降低了技术落地门槛。

行业分析指出,此次开源标志着大模型竞争进入新阶段。当模型训练技术逐渐趋同,推理效率成为新的竞争焦点。DeepSeek通过工程化创新,在保持模型性能的同时实现算力优化,这种技术路径选择反映出其对产业需求的深刻理解。特别是在高并发服务场景中,DSpark框架展现出的吞吐率稳定性,为商业化应用提供了重要技术支撑。

技术社区对这次开源反应积极。开发者认为,DSpark框架的模块化设计和DeepSpec工具链的完整性,使得技术复用变得简单高效。特别是置信度调度机制的引入,为解决并行生成中的算力浪费问题提供了新思路。有专家指出,这种将学术创新与工程实践紧密结合的做法,有助于推动推测解码技术的快速普及。

古尔曼爆料:苹果Mac Studio更新计划曝光,今年将推M5 Ultra芯片版
IT之家 6 月 28 日消息,彭博社马克 · 古尔曼(Mark Gurman)今日爆料称,在苹果的产品规划中,目前有两项有关 MacStudio 的更新计划: 一款预计于今年发布,搭载 M5 Ultra…

2026-06-29

2026年6月购机指南:荣耀600系列凭长续航强影像,成中端旗舰新宠
综合来看,2026年6月的手机市场百花齐放,但荣耀600系列凭借8600mAh超大电池、0.98mm极窄四等边以及5000万长焦(3.5倍光变,120倍数字变焦, OIS)等硬核配置,成功树立了中端旗舰新…

2026-06-28

IDC预测:苹果iPhone 18 Pro及Pro Max或涨价200美元,成本压力成主因
月 27 日消息,市场调查机构 IDC 昨日(6 月 26 日)预测,苹果 iPhone 18 Pro、iPhone 18 Pro Max两款机型的价格将上涨 200 美元(IT之家注:现汇率约合 1362…

2026-06-28

2026年6月拍照手机怎么选?高颜值+强影像,这几款手机女生闭眼入!
2026年6月高颜值拍照手机推荐,荣耀600系列凭借2亿大底主摄、5000万长焦(3.5倍光变, 120倍数字变焦, OIS)以及CIPA6.0级光学防抖,在影像防抖与画质上优势显著,前置4K Live直出…

2026-06-28