数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

Kimi重塑大模型残差连接结构,训练效率提升1.25倍获马斯克点赞

2026-03-17来源:天脉网编辑:瑞雪

在人工智能领域,一项突破性研究引发了广泛关注。月之暗面Kimi团队近日宣布,对大模型核心架构中的残差连接模块进行了创新性重构。这项历经十年未有实质性突破的技术,通过引入动态注意力机制,使模型各层能够根据任务需求自主选择信息融合方式,打破了传统统一求和的固定模式。

研究团队由杨植麟、吴育昕、周昕宇等学者组成,他们通过重构信息传递路径,使模型在训练过程中能够动态调整各层间的信息流强度。实验数据显示,在480亿参数规模的模型训练中,该技术使计算效率提升25%,同时保持了模型性能的稳定性。这种创新设计不仅优化了资源利用率,更为超大规模模型训练提供了新的技术路径。

这项成果在学术圈引发连锁反应。特斯拉创始人埃隆·马斯克在社交平台转发研究论文时特别指出:"这种架构创新展现了深度学习领域令人兴奋的进展。"行业分析师认为,该研究通过重新定义信息融合机制,为解决大模型训练中的梯度消失问题提供了新思路,可能推动自然语言处理技术进入新的发展阶段。

技术报告显示,新架构在保持原有模型精度的前提下,将训练迭代次数减少了20%。研究团队透露,这项突破源于对生物神经网络信息处理方式的模拟研究,通过引入类似突触可塑性的动态调节机制,使人工神经网络获得更强的自适应能力。目前相关代码已开源,全球开发者均可基于该架构进行二次开发。

京东启动超大规模数据采集行动 助力具身智能产业突破数据瓶颈
当前,具身智能行业虽在机器人运动控制“小脑”能力上不断进步,但决策核心“大脑”——具身大模型却因真实场景数据不足,导致技术落地产业困难重重。在此背景下,京东依托超级供应链核心优势,以及零售、物流、健康、工业…

2026-03-17

苹果iOS 27细节揭晓:适配折叠屏新界面,Siri升级健康服务添彩
据悉,苹果将在今年秋季带来折叠屏iPhone,iOS方面也会为这一产品带来适配升级。苹果的许多 iPhone 应用程序在显示屏左侧都会有侧边栏,苹果还为开发者提供了工具,以便他们能够轻松地将应用程序适配到这…

2026-03-17

智谱发布GLM-5-Turbo:深度优化“龙虾”场景 提升执行效率与稳定性
IT之家 3 月 16 日消息,智谱今天发布 GLM-5-Turbo,号称是首个针对OpenClaw“龙虾”场景深度优化的基础模型,从训练阶段就针对 OpenClaw 核心需求进行专门优化。 IT之家从智谱…

2026-03-17

蚂蚁灵波科技携手乐聚机器人,共探具身智能场景落地新路径
双方将充分发挥各自在具身智能大模型与机器人本体技术领域的优势,围绕工业、商业场景展开深度协同,形成“本体+数据+模型”协同创新示范,加速推动具身智能机器人迈向通用智能。 接下来,双方将依托蚂蚁灵波在具身大模型…

2026-03-17