基于概率模型和网络模式的多数据源冲突消解

来源 :第31届中国数据库学术会议 | 被引量 : 0次 | 上传用户:easyJMS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
冲突消解俨然成为数据集成中非常重要的过程,如何高效地从冲突描述中发现真值具有重要的研究意义.随着原始数据中混乱描述集的比例越来越大,现有的方法准确率也逐渐降低.针对这一问题,提出了一种基于信息熵的数据划分方法,将原始数据划分成常规数据集和混乱数据集.通过基于概率模型的方法对常规数据集进行消解,并且充分考虑数据源之间存在的依赖关系,消除数据拷贝所带来的影响.而针对混乱数据集,首次提出一种基于网络的消解方法,通过Google API获取相应文本信息,从中挖掘出属性间的模式,并通过最优模糊匹配提取出有效的信息来消除冲突.在真实数据集上的实验充分证明了算法的高效性.
其他文献
功耗攻击是密码芯片一种新的密钥破解方法,它对密码芯片的安全造成了较大威胁.对密码芯片运行时中间变量的功耗信息泄漏,从系统层次提出了五级功耗信息泄漏模型,在此基础上,
随着Android智能平台的普及,其安全问题尤其是应用安全日益受到人们关注.目前还没有能够在非root权限下对应用权限进行有效管理的方法.本文基于安全策略的思想,提出了一种And
  Recently,fingerprint recognition technique has been used to improve the security of online transaction by smart phone.The size of fingerprint is a key prope
会议
  The cryptographic algorithm MIBS was proposed in CANS 2009.It is a lightweight cryptographic algorithm which is currently suitable for the implementation su
在流式数据的实时处理中,计算资源有效利用以及计算性能是计算平台的重要评测指标.本文在一个以storm为基础的计算平台上,实现一套自定义的调度机制,针对不同的计算任务,分配
服务在移动环境下具有传统服务的一些特性如服务质量,但是相较传统互联网服务会拥有自身的一些特点.本文主要关注的内容是在移动环境下服务的可用性问题.由于移动环境下服务
随着Web技术的成熟和广泛应用,开放地理空间联盟(Open Geospatial Consortium)依据Web服务规范,构建并发布了很多Web服务,这些Web服务可组合为服务片段,以增值服务的方式实现
数据分析和处理是大规模分布式数据处理应用中的重要任务.由于简单易用和具有灵活性,MapReduce编程模型逐渐成为大规模分布式数据处理系统(如Hadoop系统)的核心模型.由于MapR
由于图数据之间关联错综复杂,图数据处理一般存在局部性较差的问题.因此,高效的处理大规模图数据一直是一个挑战.介绍能够高效处理10亿级别图数据的系统——以路径为中心的Tr
  A new disruption method using oscillating electric field has been developed in this study.In a low voltage oscillating electric field,Eschericia coli cells