数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

DeepSeek携手北大发布新论文,“条件记忆”亮相并开源记忆模块Engram

2026-01-14来源:快讯编辑:瑞雪

在大型语言模型领域,一项创新研究引发了广泛关注。北京大学与DeepSeek团队携手合作,共同完成了一项具有突破性的研究,其成果以论文形式呈现。论文题为《基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度》(Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models),并于近日对外发布。

该研究的核心亮点在于提出了“条件记忆”(conditional memory)这一全新概念。与传统大型语言模型架构不同,研究团队引入了可扩展的查找记忆结构。这一创新设计在保持模型参数和算力不变的情况下,为模型性能带来了显著提升。具体而言,模型在知识调用、推理、代码编写以及数学运算等多项任务中的表现均得到了大幅优化。

值得一提的是,DeepSeek创始人梁文锋也出现在了论文的合著作者名单之中,这无疑为这项研究增添了更多关注度。与此同时,DeepSeek团队还同步开源了与该研究相关的记忆模块Engram,为行业内其他研究人员提供了进一步探索和应用的宝贵资源。

谷歌加速供应链多元化布局 今年将在越南开启Pixel高端手机研发制造
据IT之家了解,新产品导入是电子设备企业推出新品过程中最关键的环节,涵盖生产流程的研发、验证与优化。尽管谷歌与苹果多年来一直致力于供应链多元化,但此前二者的智能手机新产品导入工作均在中国完成。 两位知情人…

2026-01-14

徐州市沛县胡寨服务区:光储充一体站投运 开启绿色出行新体验
近日,一座集光伏发电、储能调峰、智能快充于一体的智慧综合能源示范站在徐州市沛县胡寨服务区正式建成投运,标志着徐州市普通国省道公路服务区在向“绿色、智慧、低碳”现代化服务驿站转型的道路上迈出了坚实一步。 为彻底…

2026-01-14

真我Neo8定档1月22日 165Hz三星屏+骁龙8 Gen5+潜望长焦来袭
此前真我Neo8预热将于本月发布,但并未公布发布会日期,今日正式定档~ 官方预热真我Neo8将于1月22日19点发布,主打「165Hz性能觉醒,狠超上限」,采用的是一块165Hz三星苍穹屏,配备超声波3D屏下…

2026-01-14

泡泡玛特否认研发手机计划,2025年业绩飙升且关注增长健康度
1月13日,针对“泡泡玛特将推出‘潮玩手机’”的市场消息,记者向泡泡玛特相关人士求证,对方称:“公司没有研发手机的计划,近期会和知名手机品牌推出IP联名合作。” 摩根士丹利报告指出,泡泡玛特正在从过去两年的…

2026-01-14

苹果收购后首推大动作:Pixelmator Pro登陆iPad,1月28日正式上线
图像编辑工具 Pixelmator Pro 首次登陆 iPad,带来专为触屏操作优化的全新工作空间,支持 Apple Pencil全部功能,支持在 iPad 与 Mac 之间切换工作,并保留了 Mac …

2026-01-14

移远通信CES 2026亮相RG660Qx系列5G-A模组,为下一代5G应用提供强劲支撑
IT之家 1 月 13 日消息,移远通信 (Quectel) 在本月初的 CES 2026 上推出了符合 3GPP R18 标准的RG660Qx 系列 5G-Advanced 模组,其中 RG660QA 基…

2026-01-14

iOS 26.3测试版代码现端倪 苹果推进RCS消息端到端加密支持有望落地
据IT之家了解,按照全球移动通信系统协会(GSMA)标准的要求,这项设置可能用于向用户显示消息的加密状态。 最新 iOS 26.3 测试版中出现的运营商配置文件相关代码,或许是苹果在为未来的功能支持铺路,但…

2026-01-14