数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

革新大模型技术:Baichuan2-192K问鼎长文本评测榜首

2023-10-30来源:数据世界编辑:星辉

【数据世界】10月30日消息,百川智能今日宣布发布了全球最长上下文窗口的Baichuan2-192K大模型。这一模型的上下文窗口长度达到了192K,标志着在大模型领域的一项重要突破。

据数据世界了解,Baichuan2-192K具备处理约35万个汉字的能力,是目前同类大型模型Claude2(支持100K上下文窗口,实测约8万字)的4.4倍,以及GPT-4(支持32K上下文窗口,实测约2.5万字)的14倍。Baichuan2-192K不仅在上下文窗口长度上超越Claude2,还在长窗口文本生成质量、长上下文理解以及长文本问答、摘要等方面全面领先Claude2。

今年9月25日,百川智能已经开放Baichuan2的API接口,正式进军企业级市场,启动商业化进程。Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户,百川智能目前已经启动Baichuan2-192K的API内测,开放给法律、媒体、金融等行业的核心合作伙伴。

此次发布的Baichuan2-192K在10项中英文长文本问答、摘要的评测集中表现出色,取得了7项SOTA(State of the Art)成绩,明显超越其他长窗口模型。此外,Longeval的评测结果显示,Baichuan2-192K在窗口长度超过100K后依然能够保持强大的性能,而其他模型在窗口增长后效果明显下降。这一成就表明Baichuan2-192K在长窗口内容记忆和理解方面具备显著的优势。

百川智能采用了一系列创新的算法和工程优化方法,以实现窗口长度和模型性能之间的平衡。通过针对RoPE和ALiBi动态位置编码的外推方案,Baichuan2-192K提升了模型对长序列的依赖建模能力。此外,百川智能采用了自主开发的分布式训练框架,整合了市场上的优化技术,极大降低了长窗口训练和推理中的显存占用。

这一模型的发布不仅在大模型技术领域有重要意义,同时也为学术研究提供了新的探索路径。Baichuan2-192K已经开启内测,已经在法律、媒体等领域的真实场景中取得了成功的应用。

全面开放API后,Baichuan2-192K将更好地与垂直领域深度结合,为各行业用户提供更多帮助,从而降低成本、提高效率。这一模型能够一次性处理大量材料,对于长篇文档的信息提取、分析、长文档摘要、审核、编写等任务都有巨大的助力作用。

此外,更长的上下文窗口也为处理多模态输入和实现更好的迁移学习提供了技术支持,为行业在Agent、多模态应用等前沿领域的探索提供了坚实基础。

神龙拜耳柔性光伏支架:适应复杂地形,为光伏安装带来新选择
它采用柔性材料与特殊结构设计,能够跨越较大的距离,为光伏组件的安装提供支撑。这种支架系统主要特点是适应性强,可以在一些传统刚性支架难以应用的地形和场景中发挥优势。 在安装过程中,柔性支架系统往往展现出较高…

2025-12-18

荣耀WIN系列双旗舰12月26日登场!10000mAh电池+旗舰芯,性能续航双在线
亓言纪语:对于荣耀WIN系列,亓纪的想法是这样的:看到10000mAh电池的爆料后,亓纪多少有点懵逼的,因为没有想到荣耀在电池方面会如此激进。和其他厂商不同,首款搭载10000毫安时电池的不是荣耀中低端机型…

2025-12-18

荣耀WIN系列12月26日发布!双摄三摄双旗舰 性能续航双升级
快科技12月17日消息,今日,荣耀手机宣布,荣耀WIN系列发布会将于12月26日14:30举办,号称“超神性能双旗舰”。与此同时,荣耀还正式公布新机外观,系列包含两款机型,分别采用后置双摄与三摄方案。 ID…

2025-12-18

智测云联TOP级环境监测设备:以硬核实力护航光伏电站恶劣环境运行
在国内环境监测系统排名中,这款 TOP 级设备因 “超强耐用性”,成为沿海盐雾区、山地高湿区、荒漠高温区等恶劣环境光伏电站的首选 ——它由智测云联 (青岛) 智能科技有限公司研发生产。 其 “抗造” 能力源…

2025-12-18

百川光热助力!全球首个光解水制氢商业化项目在攀枝花竣工投运
近日,由太阳能光热联盟理事单位——内蒙古百川光热科技有限公司(简称:百川光热)提供了核心装备反射镜的全球首个光解水制氢商业化项目——四川省攀枝花市多面体钛酸锶聚光制(加)氢项目中试基地正式竣工投运,标志着我国…

2025-12-18