数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

DeepSeek新动向:MODEL1代码现身,新架构或整合前沿成果2月将至?

2026-01-21来源:快讯编辑:瑞雪

近日,AI领域传来新动态,有消息称DeepSeek计划在今年2月中旬农历新年期间发布新一代旗舰AI模型——DeepSeek V4,这一模型预计将展现出更为强大的代码编写能力,引发行业广泛关注。

在1月20日,恰逢DeepSeek - R1发布一周年之际,开发者群体有了新发现。他们在GitHub上注意到,DeepSeek更新了一系列FlashMLA代码,在横跨114个文件中,有28处都出现了未知的“MODEL1”大模型标识符。这个标识符与已知的现有模型“V32”(即DeepSeek - V3.2)在代码中并列或区别提及,这引起了开发者们的浓厚兴趣。

通过对代码上下文的深入分析,开发者们推测“MODEL1”很可能代表着一种与现有架构截然不同的新模型。进一步的研究表明,“MODEL1”与“V32”在关键技术层面存在明显差异。具体体现在键值(KV)缓存的布局方式、稀疏性处理手段以及对FP8数据格式的解码支持等方面。这些技术差异暗示着新架构或许在内存优化和计算效率方面进行了专门的优化设计。

值得一提的是,此前DeepSeek研究团队已陆续发布了两篇技术论文。其中一篇介绍了名为“优化残差连接(mHC)”的新型训练方法,另一篇则阐述了一种受生物学启发的“AI记忆模块(Engram)”。这两项研究成果的公布,不禁让外界猜测,DeepSeek正在开发的新模型很可能会整合这些最新的技术成果,为AI领域带来新的突破。

王腾新公司12天获数千万融资 智元入局小米系缺席 睡眠赛道能否再创辉煌?
月 20 日消息,王腾今天自己发微博确认了个大消息,他的新公司今日宜休,成立刚满 12 天就搞定了数千万种子轮融资。 这事儿也在评论区引发了不少讨论,有人猜测是不是和他去年因违规被小米辞退的过往有关,担心双方…

2026-01-21