数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

天翼云数据库新突破!创新性Taste框架,研究界瞩目!

2024-10-16来源:ITBEAR编辑:瑞雪

近日,一篇题为《Taste: Towards Practical Deep Learning-based Approaches for Semantic Type Detection in the Cloud》的论文在国际知名数据库会议EDBT上获得长文收录,该论文由天翼云数据库团队、中国电信云计算研究院与深圳北理莫斯科大学联合完成。EDBT作为数据库领域的顶级学术会议,已连续举办27届,其近五年平均录取率仅为20.8%。此次收录标志着天翼云的科技创新实力再次获得业界与学术界的双重认可。

该论文聚焦于数据管理系统中的语义类型检测问题,并在此领域实现了检测性能和安全性方面的突破。语义类型,如人名、地址、身份证号等,对于人类理解数据和辅助数据管理系统提供关键服务具有重要作用。然而,现有技术每次检测均需扫描数据列内容,导致I/O和网络开销大、检测效率低,且可能对云用户业务产生不利影响。

针对这些不足,论文创新性地提出了两阶段语义类型检测框架(Taste)。该框架首先利用数据源的元数据进行初步快速的语义类型检测,减少对数据源的扫描;第二阶段则按需进行,结合列内容与元数据完成更精确的检测。这一创新不仅提升了检测效率,还增强了系统的鲁棒性,同时提供了更高的数据隐私保护。

论文还设计了一种新颖的非对称双塔检测模型(ADTD),通过多任务学习支持Taste的两阶段检测。该模型分为metadata塔和Content塔,前者编码元数据特征,后者结合元数据信息编码列内容特征。在训练过程中,两个阶段的输出结合进行多任务学习,使模型一次训练即可应用于两阶段推理。

实验表明,Taste框架在执行效率、准确性、降低数据列扫描侵入性等方面表现优异,并展现出云端大规模部署的潜力。目前,Taste框架已在天翼云数据管理服务(DMS)中落地,助力客户进行高效、灵活的语义类型检测,实现更加快捷且智能化的敏感数据识别,显著提升云端数据管理的安全性和稳定性。

天翼云作为云服务国家队,始终坚持核心技术自主攻关,以科技创新引领产业发展。未来,天翼云将继续推进数据库等云计算技术攻关,筑牢国云智算底座,为企业充分释放数据价值提供有力支撑。

《七龙珠》新作发售,IGN给7分,玩家却不买单?
该游戏在IGN的评分中获得了7分,其编辑在推特上表示“游戏的菜单节目非常漂亮”。 网友们开始拿《星鸣特攻》进行比较,“IGN给这游戏打了7分,而它甚至一周就被关闭了,简直是场灾难。”ZERO》虽然得到了IGN…

2024-10-16

微软CEO纳德拉:与联想携手,AI应用全面加速?
10月16日消息,联想集团举办年度创新大会Tech World,微软董事长兼CEO萨提亚·纳德拉表示,将联想的设备与服务同微软的全栈技术能力结合起来,帮助全球客户更好发展。微软与联想正在基于这些投入,全面加速…

2024-10-16

广汽埃安携手Momenta,共谋智能出行新篇章?
鞭牛士 10月16日消息,日前,,双方将致力于推动更高级别的智能驾驶方案的研发与量产落地,充分发挥广汽埃安的研发制造和产业优势,以及Momenta智驾大模型的技术潜力,加速智能驾驶技术在新能源汽车领域的广泛应…

2024-10-16

中国手游厂商9月全球吸金19.1亿美元,谁更赚钱?
鞭牛士 10月16日消息,Sensor Tower商店情报平台显示,2024年9月共35个中国厂商入围全球手游发行商收入榜TOP100,合计吸金19.1亿美元,占本期全球TOP100手游发行商收入36.0%。…

2024-10-16

英睿达出新招!零售端首推原厂内存条,速度达6400MT/s
昨日,美光旗下品牌英睿达推出了首批CUDIMM、CSODIMM内存条。首批推出的CUDIMM和CSODIMM内存基于16Gb DRAM颗粒,单条容量为16GB,传输速率为6400MT/s,符合JEDEC规范…

2024-10-16