数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

合合信息IPO进行时:破解中文语料难题,加速大模型性能飞跃

2024-09-22来源:数据世界编辑:汪淼

近日,在2024年世界人工智能大会(WAIC)上,合合信息推出TextIn智能文档处理平台,这一创新举措不仅旨在解决当前大模型训练面临的数据局限与质量问题,特别是针对中文语料稀缺和复杂文档解析的难题,更为合合信息的IPO之路增添了浓墨重彩的一笔,为其在AI行业发展提供了强有力的“加速器”。

随着人工智能技术的飞速发展,大模型展现出前所未有的强大能力,其性能的提升离不开海量高质量数据的支持。然而,在中文领域,高质量数据资源的匮乏成为了制约大数据性能进一步提升的瓶颈。合合信息此次推出的Textin智能文档处理平台,针对这一痛点为行业带来了前所未有的解决方案,同时也为公司未来的IPO市场表现奠定了坚实的基础。

该平台集成了TextIn文档解析、TextIn Embedding(文本向量数据模型)以及OpenKIE三大核心工具,旨在从源头提升语料质量,加速大模型的训练与迭代。使用后的大模型具备了更快速、优秀的文档要素分析、表格内容识别能力。其中,TextIn文档解析引擎以其卓越的性能和广泛的适用性,在复杂文档解析方面展现出了强大实力,为大模型提供了更加纯净、结构化的训练数据。

除了文档解析,TextIn Embedding模型也是该平台的重要组成部分。该模型通过深入学习大量中文语料,能够迅速定位目标信息,提取有效文本特征,提高大模型在信息搜索和问答方面的质量、效率和准确性。相比其他开源模型,TextIn Embedding模型具有体积小、占用资源少、支持可变输出维度等优势,能够更好地适应不同场景的需求。

此外,OpenKIE信息抽取工具也为TextIn智能文档处理平台增色不少。该工具能够自动抽取文档中的关键信息,并直接应用于其他系统,极大地提高了工作效率。在大模型文档处理场景中,合合信息与百川智能等头部企业合作,共同破解了多文档元素识别、版面分析等难题,将百页文档的整体处理速率提升超过10倍。

合合信息智能创新事业部总经理唐琪表示,TextIn智能文档处理平台目前已覆盖金融、医学、财经、媒体等47个场景,共支持3200余类文档的处理。该平台已被多家头部大模型厂商纳入预训练流程,并积累了小批量开发者用户。。

未来,合合信息将继续深耕文档处理领域,为大模型的训练与应用提供更多优质“燃料”,推动人工智能技术的持续进步。同时,随着公司IPO进程的推进,合合信息将进一步加速其在AI领域的布局和发展,为社会创造更大的价值。

SK海力士新DDR5芯片“X021”亮相:或适配Intel未来处理器,原生频率达7200MT/s
快科技10月22日消息,SK海力士的全新DDR5内存芯片近日在网络上出现,据称代号为“X021”,并带有新的零件编码“AKBD”。 根据unikoshardware的说法,芯片上的“X021”标记表明它是第二…

2025-10-22

魔方网表,以技术为本,坚定的长期主义者
全球数字化的汹涌浪潮推着各行各业不断向前,商业世界正在以前所未有的速度与频率经历巨变。对此,企业如何快速有效地在日益复杂的市场环境下,抓住自身的发展机遇,是各行各业的急需解答的难题,而数字化转型又成为其中的必修之课。然而,对很多企业来说,快速变化的业

2025-10-22

售价13000元!三星Galaxy XR头显发布 直面苹果Vision Pro高端之争
【CNMO科技消息】10月21日,三星正式发布了其首款混合现实头戴设备——GalaxyXR,官方售价定为1799.99美元(约合人民币13000元),直接瞄准了苹果Vision Pro的高端市场。借助头显的…

2025-10-22

性能与美学的双重盛宴:iQOO 15的自我修养与突破
前面我们详细聊过,它把一块自研电竞芯片Q3塞进机身,像给手机装上一块真正的“独显”,再辅以双轴马达、对称大师双扬和一位随时陪练的AI军师——这一次,性能旗舰的终点不再是冷冰冰的跑分,而是指尖、耳朵,甚至心脏都…

2025-10-21

国家广电总局首颁“便捷看电视”认证,认准标志选电视享便捷观影体验
IT之家 10 月 20日消息,国家广播电视总局今日宣布,国家广播电视总局广播电视规划院为首款符合认证标准的智能电视机颁发“便捷看电视”认证证书。这款率先通过认证的产品由康佳研发打造,即将正式上市销售。 作…

2025-10-21

2025上半年全球智能眼镜出货增64.2%,2029年或破4000万台中国增速居首
【环球网科技综合报道】10月21日消息,市场研究机构(IDC)发布报告显示,2025上半年,全球智能眼镜(AI眼镜)市场出货量达406.5万台,同比增长64.2%。 IDC预计,到2029年全球智能眼镜市场出…

2025-10-21

牌面拉满!比亚迪成为多国元首的选择
近年来,我国新能源汽车产业在科技创新驱动下实现跨越式发展,比亚迪作为行业领军企业,技术领先全球瞩目,凭借过硬的技术实力与产品品质,赢得多国元首青睐,成为“中国制造”向“中国智造”转型升级的典型代表,更成为传递中国科技实力的“移动新名片”与“无声外交官

2025-10-21

IDC报告:百度智能云智算服务市场份额第一,GenAI IaaS增速最快
10月21日,国际权威咨询机构IDC发布了《中国智算专业服务市场(2025上半年)跟踪》报告。其中,在智算解决方案实施服务市场中,百度智能云以19.9%的份额位居第一;在GenAI IaaS领域,百度智能云实现近5倍增长,增速位居市场首位。随着大模型及AI应用的爆发,云计算正在以C

2025-10-21

抖音电商持续治理虚假宣传保健功效,清退违规达人4.3万名,违规商家793家
10月20日,抖音电商安全与信任中心发布治理虚假宣传保健功效的进展,公告称多平台反复出现以“健康焦虑”为卖点的功效虚假宣传现象,已成为食品行业的顽疾。据了解,部分不良商家、达人将普通食品包装为“保健品”或“特医食品”,甚至将保健食品夸大为具有医疗功效,损

2025-10-21