数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

DeepSeek-V4预览版上线开源:百万字上下文,Pro与Flash双版本齐发

2026-04-24来源:互联网编辑:瑞雪

DeepSeek 正式发布全新系列模型 DeepSeek-V4 的预览版本,并同步开源,为人工智能领域带来新的突破。该模型具备百万字超长上下文处理能力,在 Agent 能力、世界知识储备以及推理性能方面均达到国内开源领域的领先水平。

DeepSeek-V4 系列模型分为两个版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。官方介绍,DeepSeek-V4 开创了一种全新的注意力机制,通过在 token 维度进行压缩,并结合 DSA 稀疏注意力技术,实现了全球领先的长上下文处理能力,同时大幅降低了对计算资源和显存的需求。从即日起,100 万上下文将成为 DeepSeek 所有官方服务的标准配置。

在 API 服务方面,DeepSeek 已同步完成更新。用户只需将 model_name 修改为 deepseek-v4-pro 或 deepseek-v4-flash,即可调用相应版本的模型服务。

DeepSeek-V4-Pro 在 Agent 能力上表现尤为突出。在 Agentic Coding 评测中,该模型已达到当前开源模型的最佳水平,并在其他 Agent 相关评测中同样取得优异成绩。目前,DeepSeek-V4-Pro 已成为公司内部员工使用的 Agentic Coding 模型。据评测反馈,其使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但与 Opus 4.6 思考模式仍存在一定差距。

在世界知识测评中,DeepSeek-V4-Pro 的表现同样亮眼,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。而在数学、STEM 以及竞赛型代码的测评中,该模型更是超越了所有已公开评测的开源模型,成绩可与世界顶级闭源模型媲美。

相比之下,DeepSeek-V4-Flash 在世界知识储备方面略逊于 Pro 版本,但其推理能力与之接近。由于模型参数和激活量较小,V4-Flash 能够提供更快捷、经济的 API 服务,满足对成本和效率有较高要求的用户需求。

在 Agent 测评中,DeepSeek-V4-Flash 在简单任务上的表现与 Pro 版本不相上下,但在处理高难度任务时仍存在一定差距。这一特点使得 V4-Flash 更适合对计算资源有限制或对任务复杂度要求不高的场景。

100千瓦静音发电车同城租赁:满足临时用电需求,灵活补充电力供应
针对特定功率等级和区域的设备租用服务,如“广州市番禺区南村镇100千瓦同城发电机租借”以及“静音发电车出租”,涉及多个技术与管理层面的考量。这与直接购买设备形成了对比:租赁转移了设备折旧、大型维修与闲置库存的…

2026-04-24

中科意象余山:探索脑机交互新路径 推动技术走向标准化微创化
余山认为,当前脑机接口的主流设计体系存在局限性,直接解码大脑“执行层”信号,决定了现有产品难以真正流畅、自然地响应人的意图。 他说,自己团队正探索一条全新路径:从更高层级的大脑“意图层”入手,结合AI与具身…

2026-04-24

Perplexity CEO:AI赋能下iPhone“数字护照”地位将更稳固
他强调,苹果Silicon芯片是苹果“被低估的资产”,随着 AI 工作负载逐渐向设备本地迁移,这一硬件优势将愈发凸显。“如果智能体循环开始本地运行,就不再需要集中在服务器上,”Srinivas解释道,这些工作…

2026-04-24

苹果首款折叠iPhone Ultra机模亮相:尺寸配置细节全解析
IT之家 4 月 23 日消息,消息源 @VadimYuryev 昨日(4 月 22 日)在 X平台发布推文,分享了一组机模照片,展示了苹果首款折叠手机(上市后预估叫 iPhone Ultra)。 IT之家…

2026-04-24