【摘 要】
:
研究XML格式的重复数据元素的特点,提出对于特定应用领域,在具体的上下文环境中主动学习XML重复元素的识别规则。通过结构转换,将结构不尽相同的XML数据映射成结构一致的数据,并
【机 构】
:
南京邮电大学计算机学院,东南大学计算机科学与工程系
【基金项目】
:
江苏省“十五”高科技计划基金资助项目(BG2001013)
论文部分内容阅读
研究XML格式的重复数据元素的特点,提出对于特定应用领域,在具体的上下文环境中主动学习XML重复元素的识别规则。通过结构转换,将结构不尽相同的XML数据映射成结构一致的数据,并通过学习不同层次数据元素间的依赖关系权重来获得匹配规则。根据学习得到的转换和匹配规则,采用哈希过滤的方法来提高检测重复XML元素的效率。该方法能够有效地解决XML重复检测面临的结构多样性的问题,理论分析和实验表明,该方法有较高的精度和效率。
其他文献
文本阐释作为阐释学的研究核心,一直以来处于两难的境地,关于文本阐释的客观性和主观性之争伴随着阐释学的整个发展历程。一派学者坚持以"读者意图"为阐释标准,一派学者坚持
城镇化给非遗带来前所未有的冲击和挑战。当代绍兴水乡社戏在其发展过程中,同样面临着艰难的处境。如何将其更好地存续下去?可以从积极维系水乡的生态环境、适当修复水乡社戏
习近平总书记在"一带一路"国际合作高峰论坛曾强调"要坚持创新驱动发展,加强在数字经济前沿领域合作,推动大数据、云计算、智慧城市建设,连接成21世纪的数字丝绸之路"。新时
2003年9月22日,上海市徐汇区人民法院接到张业广老人的诉状。这位老人状告其就医的医院以及医疗器械厂商,要求得到医疗救助和近10万余元的赔偿。
磁悬浮列车的发展是人类交通方式的又一次新的突破与发展,结合高科技以及物理原理等多种元素,实现了列车的有效运行。我国的磁悬浮列车与发达国家相比起步较晚,但随着我国综
随着如今信息技术的高速发展,在教学领域当中也不断的在应用信息技术多媒体辅助教学,多媒体的运用给课 堂教学带来了很大的飞跃改变,丰富了课堂教学内容的信息量,同时也改善
现如今,我国经济建设发展迅速,建筑工程也在不断发展。当前阶段我国建筑工程管理内容繁多且管理机制混乱,尤其是在建筑工程的成本管理上存在诸多问题,对建筑工程的经济效益以
世界湾区形成、发展于全球尺度和本地尺度下的要素资源流动网络之中,流动性和世界湾区构成相互影响、相互依存的孪生关系。本文采用物资流动、人员流动、资金流动、信息流动
2000年元月9日,伴随着新千年的新气象,承河北省白沟镇人民政府协助,《小城镇建设》杂志社举办了第二期“小城镇,大战略”论坛。该期论坛主题为“中国加入WTO对小城镇建设的影