改进的XML智能数据清洗策略

来源 :计算机工程 | 被引量 : 0次 | 上传用户:sophieyeah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
摘要:针对XML数据的质量问题,以XML键为基础,借助多模板隐马尔可夫模型信息抽取策略与粒子群优化算法构建新的XML数据清洗方法。为了提高XML相似性数据并行检测效率,利用波函数对粒子群优化算法进行优化。仿真实验表明,与其他XML数据清洗算法相比,该方法的白适应学习能力强、人工参与程度低、计算量小,时间性能有94%左右的提升。
其他文献
本文在借鉴已有研究的基础上,提出了韩国中小企业对中国直接投资对策的构想并进行了相关分析。全文共分四个部分:第一章研究目的和研究方法;第二章主要介绍关于国际直接投资
针对报文解析过程中存在的数据存储无序、查询和调用不便等问题,提出应用XML数据字典进行数据存储的方案。根据给定的数据表,设计XML形式的数据字典。实现XML字典数据的解析,能
目前基于身份、门限代理签名和盲签名有机结合的研究不多,基于此,利用椭圆曲线上的双线性映射理论和秘密共享门限签名技术,提出一种基于身份的门限代理盲签名方案。该方案解
地震时,楼梯是重要的逃生通道,然而,汶川大地震震害表明,楼梯间的破坏相当严重。以板式楼梯为例,探讨了常用的板式楼梯设计方法问题,在震害分析研究的基础上,说明了楼梯应进
碳酸盐岩油藏多发育微裂缝、非均质性严重、天然能量低,弹性开采递减迅速的问题,常规调驱技术难以发挥有效作用。高压、大排量注入的氮气可以进入水无法进入的微裂缝,能够迅
以5个朝天椒品种为试验材料,研究不同移栽密度对朝天椒农艺性状及产量的影响。试验结果表明:株高、叶面积系数随着密度增加而增加,侧枝数随着密度增加而减少,产量在一定范围
以大型数据库应用为背景,基于多Agent技术,构建一个分布式数据库访问平台。研究分布式环境下的语义缓存技术,提出一种Agent平台下的智能预取算法,以及一种改进的黑板模型,用于实现
用五甲基环戊二烯三苄氧基钛与甲基铝氧烷催化体系合成出高分子量弹性聚丙烯(Fl-APP).用核磁共振碳谱、差示扫描量热法、动态力学分析等测试表明,该产物为高分子量无规聚丙烯
我院呼吸内科应用酚妥拉明、多巴胺静滴治疗肺心病顽固性心衰患者40例,效果良好,现报道如下。