数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

蚂蚁技术研究院发布LLaDA2.0 扩散语言模型 参数达100B且开源共享

2025-12-12来源:快讯编辑:瑞雪

蚂蚁技术研究院近日正式发布全新离散扩散大语言模型系列——LLaDA2.0,同步公开的技术报告显示,该系列包含100B参数的"flash"版本与16B参数的"mini"版本,成为全球首个突破百亿参数的扩散语言模型。这一突破性成果标志着扩散模型在参数规模扩展领域取得重大进展,成功打破业界对扩散模型难以规模化应用的固有认知。

研发团队创新采用混合专家(MoE)架构,通过模块化设计实现模型性能与计算效率的平衡。在训练策略方面,提出的Warmup-Stable-Decay(WSD)持续预训练方法,使新模型能够直接继承现有自回归(AR)模型的知识体系,避免了传统从头训练带来的高昂成本。配合置信度感知并行训练(CAP)与扩散模型专用DPO技术,在保证生成质量的同时,将推理速度提升至AR模型的2.1倍。

多维度评估数据显示,LLaDA2.0在结构化生成任务中表现尤为突出。在代码生成、数学推理及智能体交互等场景下,其性能指标全面超越同级别AR模型,而在自然语言理解等基础能力方面则与开源AR模型持平。这种"专长强化+基础稳固"的特性,为特定领域的大模型应用开辟了新路径。

为推动技术生态发展,研究院已将16B与100B两个版本的模型权重及完整训练代码开源至Huggingface平台。开发者可通过公开资源复现训练过程,或基于现有模型进行二次开发。此次开源不仅降低了超大规模模型的技术门槛,更为学术界提供了研究扩散模型规模化应用的重要样本。

小米回应“不让卖小米”谣言:系恶意造谣 依法维权不应被污名化
小米方面强调,此前对相关账号发起的投诉,仅针对其长期存在的恶意模仿行为及捏造不实信息,特别是对小米公司及其高管名誉造成的侵害,并非限制“小米”二字在农产品等领域的正常使用。小米指出,该账号以“助农”为幌子,…

2025-12-12

华为登顶全球OWS榜首:开放式耳机市场高增长,新玩家仍有突围机会
快科技12月12日消息,Omdia2025年Q3个人智能音频设备数据显示,全球OWS(开放式耳机)本季度总出货量达1030万台,同比飙升69%。 其中华为以90万台的出货量、8%的市场份额登顶全球OWS厂商…

2025-12-12

苹果手机续航救星来啦!2026年十款适配充电宝实测大揭秘
在百元价位中追求高性价比充电宝,推荐西圣;是一款拥有顶级散热配置,NTC智能控温+MPC控温阵列,在充电时,可以及时散热,搭载了20W强劲的快充,支持PD3.0和QC3.0双向快充,是一款真正做到了安全、快…

2025-12-12