国产开源大模型领域迎来重要突破——DeepSeek V4正式发布预览版本并全面开源,其Pro与Flash双版本模型同步上线API服务。这款基于华为昇腾国产算力架构开发的模型,在性能表现与成本控制上均展现出强劲竞争力,标志着国产大模型在推理环节实现关键技术自主化。
技术参数方面,DeepSeek V4 Pro版本以1.6T参数量、49B激活参数和33T预训练数据构建起强大基座,上下文窗口长度突破性达到1M级别。其轻量化版本Flash则采用284B参数架构,在保持13B激活参数和32T预训练数据的同时,实现了同等规模的上下文处理能力。这种双轨设计分别对应网页端/App的"专家模式"与"快速模式",满足不同场景需求。
性能测试数据显示,该模型在多维度评估中表现亮眼:Agentic Coding测评中,Pro版本交付质量已接近Opus 4.6非思考模式水平,在开源模型中位居榜首;世界知识测试仅以微弱差距落后于闭源模型Gemini-Pro-3.1;推理性能更是在已公开评测的开源模型中独占鳌头。这些数据印证了官方宣称的"性能比肩顶级闭源模型"并非虚言。
价格体系成为另一大亮点。当前API服务定价显示,Pro版本每百万token输入(缓存未命中)12元、输出24元,Flash版本则低至输入1元、输出2元。尽管受高端算力限制,Pro版本初期服务吞吐量有限,但官方透露随着下半年昇腾950超节点批量上市,成本有望进一步下探。这种定价策略不仅在行业内形成显著优势,更得益于完全脱离CUDA生态的国产化适配,为后续价格调整预留充足空间。
值得关注的是,此次发布标志着国产顶级开源大模型在关键技术领域实现重要突破。通过完全基于华为昇腾架构的开发路径,DeepSeek V4成功摆脱对英伟达GPU的依赖,在推理环节构建起自主可控的技术体系。这种技术路线选择不仅降低了硬件成本,更为国产大模型生态的可持续发展提供了新范式。