数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

腾讯推出业界最大规模MoE大语言模型Hunyuan-large:总参数389B领先行业

2024-11-05来源:ITBEAR编辑:瑞雪

腾讯近日揭晓了旗下全新的开源MoE大语言模型——Hunyuan-Large,该模型凭借业界领先的参数规模和卓越性能,一举成为行业焦点。

据悉,Hunyuan-large不仅在参数数量上达到了惊人的389B,同时其激活参数也高达52B,训练token数量更是攀升至7T。这一系列的数字背后,代表着该模型在处理长文本上下文时的强大能力,其最大上下文长度支持到256K,词表大小扩展至12.8w,为长文本任务的高效完成提供了坚实的技术支撑。

在技术创新层面,Hunyuan-large展现了其独特的魅力。通过巧妙地运用高质量的合成数据,该模型成功强化了训练过程,有效弥补了自然数据的不足之处。这一创新举措不仅提升了模型的训练效率,更进一步保证了其在处理复杂任务时的准确性和稳定性。

Hunyuan-large在多学科综合评测集上展现了卓越的性能。无论是在CMMLU、MMLU,还是在CEva1、MATH等评测集上,该模型均取得了令人瞩目的成绩。其在中英文自然语言处理、代码生成以及数学运算等九大能力维度上全面领先,甚至超越了Llama3.1和Mixtral等业内知名的一流开源模型。

为了进一步推动长文本处理技术的发展,腾讯还宣布将推出自研的长文评测集——“企鹅卷轴(PenguinScrolls)”。这一评测集的推出,旨在填补当前行业在真实长文评测方面的空白,为相关技术的研发和应用提供更为全面、客观的评估标准。

“企鹅卷轴”基于公开的金融、法律、学术论文等长文本构建而成,文本长度覆盖从1K到128K的广泛范围。这一设计使得该评测集能够全面覆盖深度阅读理解和长文推理等关键任务,为相关技术的深入研究和应用提供了宝贵的资源。

主流手机厂商暂无屏下摄像头手机量产计划,明年或难见新品推出
最近有传言称屏下摄像头技术取得了突破,并引起了行业巨头的关注,但博主@数码闲聊站确认Top5手机厂商目前没有量产这种前摄直板机的计划。博主认为这可能是因为现在消费者更喜欢屏幕打孔设计等其他创新设计。 尽管如此…

2024-11-05

任天堂预期调整:全年经营利润下滑,SWITCH销量或减少
任天堂第二季度净利润277.0亿日元,市场预估494亿日元;第二季度经营利润670.0亿日元,市场预估718.3亿日元;预计全年经营利润3,600.0亿日元,此前预计4,000.0亿日元;仍然预测全年净利润3…

2024-11-05

汽车零部件巨头博世德国大裁员,涉及7000岗位,未来何去何从?
根据最新报道,德国汽车零部件制造商博世公司计划裁员7000人,并调整其人力资源。该公司CEO Stefan Hartung表示,由于经济目标无法在2024年实现,公司可能会进一步进行人员调整。该公司设定了一…

2024-11-05

Meta前增强现实硬件高管跳槽OpenAI,领航机器人与消费硬件新征程
卡利诺夫斯基是一位硬件高管,她于 2022 年 3 月开始领导 Meta 的 AR 眼镜团队。 OpenAI最近还开始为一个机器人团队招聘研究工程师,该团队旨在帮助 OpenAI 的合作伙伴将其多模态 A…

2024-11-05

小米新品双头分线器开售:四合一设计,USB3.0高速传输仅需49元!
在办公室中使用它可以快速备份大量文件;在旅途中使用它可以为移动设备提供稳定的电源;而在家中使用它则可以方便地连接到家里的电视和其他外部设备。 总之,这款小米四合一双头分线器是一款功能强大、易于使用且价格合理的…

2024-11-05

铃木首款纯电SUV eVitara惊艳亮相,硬派动感设计抢先看!
2024-11-0501:42:20作者:姚立伟铃木今日发布首款电动汽车eVitara,该车定位于小型SUV,将在印度的铃木印度汽车公司生产,并于明年春季开始在欧洲、印度和日本销售。eVitara的车身长42…

2024-11-05