数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

2023-11-06来源:互联网编辑:芳华

11 月 6 日,李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型 Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。

零一万物此次开源的Yi系列模型包含34B和6B两个版本。据 Hugging Face英文开源社区平台和C-eval中文评测的最新榜单,Yi-34B 预训练模型取得了多项 SOTA 国际最佳性能指标认可,成为全球开源大模型“双料冠军”。

零一万物创始人及 CEO 李开复博士表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World's No.1’的初衷和决心。”

魔搭社区开源地址:

https://www.modelscope.cn/models/01ai/Yi-34B/summary

https://www.modelscope.cn/models/01ai/Yi-6B/summary

魔搭社区最佳实践:

https://mp.weixin.qq.com/s/hy-ovRIkXGfv39RiNEHddw

Yi-34B 登顶全球英文及中文权威榜单 No.1

在 Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72 分位列全球第一,碾压 LLaMA2-70B 和 Falcon-180B 等众多大尺寸模型。

page2image28079936

Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜,Yi-34B高居榜首(2023 年 11 月 5 日)

在 C-eval中文权威榜单排行榜上, Yi-34B超越了全球所有开源模型。对比GPT-4,在 CMMLU、E-eval、Gaokao 三个主要的中文指标上,Yi-34B 也具有绝对优势。

page3image28040304

C-eval 排行榜:公开访问的模型,Yi-34B 全球第一(2023 年 11 月 5 日)

在全球大模型各项评测中最关键的 MMLU(Massive Multitask Language Understanding 大规模多任务语言理解)、BBH 等反映模型综合能力的评测集上,Yi-34B 同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。

page4image27946576

各评测集得分:Yi 模型 v.s. 其他开源模型

和 LLaMA2 一样,Yi 系列模型在 GSM8k、MBPP 的数学和代码评测表现略逊 GPT 模型。未来,零一万物的系列开源计划中将推出代码能力和数学能力专项的继续训练模型。

全球最长200K 上下文窗口

Yi-34B模型将发布全球最长、可支持200K超上下文窗口(context window)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要。

受限于计算复杂度、数据完备度等问题,上下文窗口规模扩充从计算、内存和通信的角度存在各种挑战。为此,零一万物技术团队实施了一系列优化,包括计算通信重叠、序列并行、通信压缩等,实现了在大规模模型训练中近100倍的能力提升,也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。

AI Infra实测实现 40%训练成本下降

李开复曾经表示,“做过大模型 Infra 的人比做算法的人才更稀缺”。超强的 Infra 能力是大模型研发的核心护城河之一。

AI Infra(AI Infrastructure 人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施,包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等。

零一万物 Yi系列大模型基于阿里云平台打造,阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。零一万物的Infra 技术通过“高精度”系统、弹性训和接力训等全栈式解决方案,确保训练高效、安全地进行。

凭借强大的 AI Infra,Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达 50%。目前,零一万物 Infra 能力实现故障预测准确率超过 90%,故障提前发现率达到 99.9%,不需要人工参与的故障自愈率超95%。

零一万物组建了由前 Google 大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评价、可扩展的智能数据处理管线;还自研出一套“规模化训练实验平台”,用来指导模型的设计和优化。数据处理管线和加大规模预测的训练能力建设,把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。

李开复宣布,零一万物已启动下一个千亿参数模型的训练。

接下来,零一万物将基于 Yi系列大模型,打造更多To C超级应用。李开复强调,“AI 2.0 是有史以来最大的科技革命,它带来的改变世界的最大机会一定是平台和技术,正如 PC 时代的微软 Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是 ToC 应用。零一万物邀请开发者社群跟我们一起搭建 Yi 开源模型的应用生态系,协力打造 AI 2.0 时代的超级应用。”


百度发布多项AI重磅成果,李彦宏:内化AI能力让智能不再是成本而是生产力
“当AI能力被内化,成为一种原生的能力,智能就不再是成本,而是生产力。”11月13日举办的2025百度世界大会上,百度创始人李彦宏演讲时表示,更应关心如何让AI跟每一项任务有机结合,“让AI成为企业发展和个人成长的原生推动力。”作为最早进军AI赛道的科技公司,百度正

2025-11-13

昆仑芯未来五年“按年上新”,百度智能云宣布打造最硬AI云
11月13日,在百度世界2025大会上,百度智能云正式发布全新一代昆仑芯及基于昆仑芯的超节点产品天池,并公布未来五年按年推出新产品的规划。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,AI基础设施一定是长期投资,面向未来百度智能云将坚定长期布局,持续打造最

2025-11-13

双十一声学品类迎来“迷你风暴”,BOYAmini系列以技术革新领跑无线麦克风市场
随着“双十一”购物狂欢的开启,消费电子品类再度成为用户关注的焦点。在音频设备领域,轻量化、智能化与专业化的融合正成为新的趋势。据京东平台10月20日的“首小时战报”显示,BOYA品牌在数码影音娱乐类目中,专业音频解决方案厂商排名第一,搜索量与销售额双双跻身榜

2025-11-11

合合信息与上海交通大学开展课题合作研究,共探智能文档图像处理前沿技术
计算机视觉技术作为AI的“眼睛”,是当前人工智能领域的重要研究方向。近期,计算机视觉领域三大顶级学术会议之一的国际计算机视觉大会(ICCV 2025)顺利举行。会议期间,合合信息联合上海交通大学等机构主办了首届VQualA视觉质量评估研讨会,同时,为了推动建立智能文档

2025-11-07

伊利与京东启动“试销实验室” 打造新品孵化生态标杆
11月3日,伊利集团与京东联合举办战略合作发布会,正式启动“伊利x京东试销实验室”。此举标志着双方的合作由传统的渠道销售,全面迈向了基于用户洞察、共创产品、整合供应链的“价值共生”新阶段。现场直击:从“渠道铺货”到“用户造品”的战略升维依托京东新品创新中

2025-11-05

启信宝获得法博会“行业洞见奖”,相关服务即将登陆“深律通”
为构建多元联动、创新开放的法律服务体系,近日,以“以法律创新护航科技与产业创新”为主题的2025深圳法律服务博览会(下称“法博会”)顺利举办,吸引国内外权威机构和行业专家参与。合合信息旗下启信宝凭借其在法律科技领域的创新应用,于法律科技产品大赛中斩获“行业

2025-11-04

陈天桥在AIAS上提出:发现式AI而不是生成式AI是AGI的标准
10月27日、28日,AI驱动科学研讨会(Symposium for AI Accelerated Science,AIAS 2025)在美国旧金山举行。会议汇聚了近30位全球顶尖学者与产业领袖,与现场数百位学者、学生共同探讨AI如何驱动科学发现。会上,盛大集团、天桥脑科学研究院创始人陈天桥发表主题演讲,首

2025-11-03

从国家授时中心攻击事件,看数据中心安全的底层逻辑与实践路径
近期,国家安全教育日披露的美国国家安全局对我国国家授时中心的长期攻击案件,让关键信息基础设施的安全防护问题再次成为焦点。作为支撑金融交易毫秒级同步、电力调度精准控制、航空航天轨道计算的“时间中枢”,国家授时中心的安全直接关联国计民生运转,而此次攻击的

2025-10-30

Excel服务器2025实现了不用安装Excel也能实现Excel共享
想象一下这样的场景:企业信息化部门的王经理正在部署一套传统的Excel服务器,却被告知必须为每台电脑安装特定版本的Office软件;业务部门的小张发现,虽然名为“服务器”,但想要在手机上审批流程却无法实现;财务总监李总需要整合ERP和CRM系统的数据生成经营分析报告,

2025-10-28

全国盛会·智育未来——大沩赋能AI体育教育高质量发展
10月24日至26日,第86届中国教育装备展示会在青岛世界博览城成功举办。本届展会以“人工智能引领教育装备高质量发展”为主题,由中国教育装备行业协会主办,山东省教育厅和青岛市人民政府共同承办,集中展示了全国教育装备领域的最新技术成果与应用实践。浙江大沩携其智

2025-10-25