数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

17岁高三生领衔Kimi团队创新,重构AI大模型核心架构获马斯克点赞

2026-03-23来源:天脉网编辑:瑞雪

中国人工智能领域迎来一项突破性进展——月之暗面(Moonshot AI)团队提出的"注意力残差"(Attention Residuals)架构引发全球关注。这项发表于开源平台的研究重构了Transformer模型的信息流动机制,通过引入动态注意力机制替代传统残差连接,使480亿参数模型训练效率提升1.25倍。特斯拉创始人埃隆·马斯克在社交平台转发表彰,称其为"令人印象深刻的创新"。

研究核心在于突破十年未变的模型架构范式。传统残差连接采用固定权重叠加各层输出,而新提出的AttnRes组件通过softmax注意力机制,使神经网络能够根据输入内容动态检索历史层信息。这种"深度维度自注意力"设计,实现了从线性累加到非线性聚合的范式转变。实验数据显示,在Kimi Linear架构中,该组件使模型在保持精度的同时显著降低计算成本。

论文作者团队呈现年轻化特征,三位主要贡献者中包括年仅17岁的高三学生陈广宇。这位来自深圳国际学校的少年,拥有美国计算机奥林匹克竞赛铂金组参赛经历,曾在Kimi内部黑客马拉松夺冠。尽管尚未完成高中学业,他已作为机器学习研究员参与开源大模型核心研发,与团队共同完成这项被业界视为"下一代模型关键模块"的研究。

陈广宇的学术轨迹颇具传奇色彩:入选罗德信托未来领袖计划、在美国Tilde Research实验室开展AI研究、以第一作者身份主导顶级AI企业核心架构论文。面对外界关注,他特别强调研究成果属于整个团队:"前三位作者贡献同等重要,Kimi每位成员都参与了关键环节。"这种超越年龄的学术视野,与其在竞技编程领域积累的算法优化经验形成有趣呼应。

月之暗面作为2023年成立的AI新锐,由清华系创业者杨植麟领衔,其开发的Kimi大模型多次在国际评测中比肩GPT-4等头部产品。此次架构创新不仅验证了中国团队在基础模型领域的研发实力,更通过开源方式推动全球技术进步。研究论文已完整公开在GitHub平台,为开发者提供可复现的技术方案。

古尔曼爆料:新款入门iPad芯片升级A18,或4至5月发布支持AI功能
IT之家 3 月 22 日消息,本月早些时候,在苹果为期一周的新品发布活动中,不少人都期待除了 iPad Air、MacBook Neo以及其他新款 MacBook 之外,苹果还能更新旗下最平价的 iPad…

2026-03-23

OPPO Find N6全球开售获热捧,多国大使点赞,首销创折叠屏新纪录
IT之家 3 月 22 日消息,3 月 20 日,OPPO Find N6正式开启全球同步发售,上市初期便收获全球市场积极反馈。月 21 日,来自秘鲁、拉脱维亚、津巴布韦、萨摩亚、尼泊尔等国的驻华大使、参赞一…

2026-03-22

马斯克豪掷200亿建“Terafab”芯片厂,垂直整合模式能否改写行业格局?
英伟达 CEO 黄仁勋 2025 年 11 月在台积电的一次活动上,被问及马斯克自建芯片工厂的计划时表示先进芯片制造极其困难,不只是建厂房那么简单,台积电做了一辈子的工程、科学和“手艺”,要匹配这种能力“几…

2026-03-22

2026年预算2000多换手机别发愁!这4款高性价比机型闭眼入不踩雷
预算有限选红米K90,续航、性能、指纹都给力,性价比之王; 游戏党选iQOO Z11 Turbo,高刷屏+电竞芯片,玩起来就是爽;户外/重度用户选荣耀WIN RT,10000mAh电池+散热风扇,用起来…

2026-03-22