数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

22岁天才破解Claude Mythos架构!开源新模型融合创新思路参数量减半性能持平

2026-04-20来源:快讯编辑:瑞雪

近日,AI领域掀起了一场不小的波澜:一位年仅22岁的创业者Kye Gomez,凭借公开论文和第一性原理,成功复现了Anthropic闭源已久的Claude Mythos核心架构,并将其开源项目OpenMythos公之于众。这一举动不仅让行业震惊,更引发了关于闭源实验室技术护城河是否依然存在的激烈讨论。

Kye Gomez,作为Swarms的创始人,此前还曾领导过Agora Labs,他的研究重点涵盖大规模多智能体系统、替代模型架构以及多模态模型。这位高中毕业后便投身创业的年轻人,在2021年至2024年间,同时担任了三家公司的联创或CEO,构建了一个以“APAC”为品牌的生态体系,业务范围横跨AI深科技、媒体、食品科技等多个领域。

此次,他通过OpenMythos项目,向世界展示了一个不依赖堆砌参数,而是通过“循环深度Transformer”(RDT)架构实现高效推理的模型。与传统大模型通过不断增加层数来提升性能不同,RDT架构采用同一套权重,在一次前向传播中循环运行最多16次,每循环一次,隐藏状态便更新一次,相当于模型“多想了一步”。这种设计不仅节省了显存,还降低了训练成本,为消费级硬件带来了福音。

OpenMythos的架构设计精妙,分为Prelude(序曲)、Recurrent Block(循环核心)和Coda(终章)三段。Prelude和Coda采用标准的Transformer层,而真正的计算核心则是中间的循环块。循环块中的更新规则结合了线性变换和Transformer计算,确保模型在循环过程中不会“跑偏”。项目还引入了多潜变量注意力机制,来自DeepSeek-V2,有效压缩了KV缓存,实现了显存的显著节省。

为了确保循环的稳定性,OpenMythos还设计了三个额外机制:LTI约束注入、自适应计算时间逐位置停机以及深度级LoRA适配器。这些机制共同作用,使得模型在循环过程中能够保持稳定,并允许每次迭代都有独立的行为调整能力。

实验数据表明,一个770M参数的循环模型,在同等训练数据下,能够达到1.3B标准Transformer的下游任务质量。这意味着,用一半的参数,就能完成同样的任务,参数效率直接翻倍。这一成果不仅挑战了传统的AI scaling法则,更预示着未来AI模型的发展方向可能将更加注重推理的深度和效率,而非单纯的参数数量。

Kye Gomez的这一壮举,不仅展示了年轻创业者的创新能力和技术实力,更对闭源实验室的技术优势构成了挑战。当一个人能够仅凭公开信息就重建出最核心的技术时,护城河便不再仅仅是架构本身。这一事件无疑将激励更多的研究者和开发者投身于AI领域的创新和探索中。

余承东坦言手机定价承压,新机或涨价,花粉换机时机要把握
这番话虽然直白,却道出了整个手机行业的真实困境,也让网友纷纷感叹:高端机看来真的要全面涨价了。华为虽然提示后期可能涨价,但也会在产品体验上持续升级,让用户觉得物有所值。对于准备换机的用户来说,近期或许是入手旗…

2026-04-20

华为Pura 90系列新机发布!标准版、Pro、Pro Max参数配置差异全解析
IT之家 4 月 20 日消息,在今天的华为 Pura 系列及全场景新品发布会上,Pura 90 系列正式发布。 型号Pura 90Pura90 ProPura 90 Pro Max外观颜色 超大底 2 …

2026-04-20

谷歌携手Marvell加速AI芯片研发 内存处理单元与新TPU或明年完成设计
月 20 日消息,据 The Information 援引两位知情人士消息报道,Alphabet 旗下谷歌正与 MarvellTechnology 洽谈合作,研发两款全新芯片,旨在更高效地运行人工智能模型。…

2026-04-20

华为Pura 90系列登场:直屏设计简约精致,影像芯片双突破4699元起售
同步亮相的Pura 90 Pro则采用后置三摄设计,主摄与ProMax规格一致,长焦部分调整为5000万像素超聚光微距长焦,同样配备第二代红枫原色摄像头,在超长焦和微距场景下提供画质支持。 在屏幕配置上,…

2026-04-20

谷歌推出A2UI 0.9标准:统一AI智能体UI设计,赋能生成式交互新体验
来源:环球网 【环球网科技综合报道】4月20日消息,据The Decoder报道,谷歌近日正式推出生成式UI设计标准A2UI 0.9,为AI智能体构建用户界面元素提供统一规范,支持从现有应用组件中调用资源,…

2026-04-20

22岁天才复现Claude Mythos架构并开源 融合创新思路引领AI新方向
更炸裂的是,他把这一项目——OpenMythos全开源了。OpenMythos在循环核心的每个FFN层,都替换成了MoE层,设计参考了DeepSeek-MoE: 现在的规则变了:未来最强的模型,不是参数最…

2026-04-20

华为Pura 90系列发布:Pro版麒麟9030S加持,标准版官网揭秘搭载麒麟9010S
IT之家 4 月 20 日消息,在今天的华为 Pura 系列及全场景新品发布会上,华为常务董事、产品投资评审委员会主任、终端 BG董事长余承东正式发布了 Pura 90 系列手机。 华为 Pura 90 P…

2026-04-20

华为Pura 90系列携XMAGE智拍登场,AI姿势推荐让摄影小白秒变高手
AI辅助构图可实时优化取景画面,自动调整比例与视野,帮助用户快速完成合理构图;假日心情色卡功能可根据场景需求,为照片添加对应氛围感。硬件配置方面,华为Pura 90系列搭载超大底2亿长焦、超高动态主摄及超…

2026-04-20

鸿蒙终端设备超5500万!鸿蒙6.1细节贴心,用过就知“回不去”
系统能感知你是左手拿手机还是右手拿,QQ音乐、小红书等常用App的核心按键,会自动向持握侧偏移。 Pura X Max首发的小艺伴随式AI,更是将“贴心”拉满,日常生活中,不管是阅读、待办还是出行场景,小艺伴…

2026-04-20