P2P网络中不确定数据Top-k查询处理技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:dongjuanqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,针对集中式数据库中确定数据的Top-k查询研究已经取得了很多进展。但是,随着人们对客观世界认识的不断深入,不确定数据领域也受到了广泛重视。并且随着网络的发展,数据存放也越来越分布,导致分布式环境下不确定数据的Top-k查询成为了一个新的挑战。由于在很多真实世界的应用中数据内在的不确定性的出现,像传感器网络、P2P系统这样的分布式环境中,测量工具的精确度、测试环境和网络延迟都会导致信息的不确定和模糊。并且分布式的应用逐渐增多,采集的数据很大程度上是不确定的,而不确定数据与确定数据之间存在本质的区别。因此,研究如何有效地在分布式环境下检索全局的top-k不确定数据对象是很有必要的。基于以上目的,本文提出了一种新颖的方法,能够在大规模的P2P网络中对不确定数据进行Top-k查询处理,采用了超节点的网络拓扑结构,并假设数据集在节点上水平分布。在这个P2P网络中,首先使用网格索引为本地节点上不确定数据建立索引;然后所有超节点索引整个网络中不确定数据的一些摘要信息,叫做全局索引。基于这个全局索引,提出了一种有效的超节点的全局剪枝策略,能够减少大量的传输和计算代价;然后根据子节点上不确定数据的得分关系,介绍了一种局部剪枝方法,可以进一步减少计算代价;之后提出一种通过少量传输和计算代价确定结果的有效算法;最后,通过大量的模拟实验验证了提出的方法在数据的传输代价和响应时间方面的效率。
其他文献
随着Web技术及其应用的快速发展,XML作为Web上信息表示和数据交换的一种数据格式,在电子数据交换、科学数据表示、电子商务和搜索引擎等许多重要领域得到广泛的应用,Web上已经积
随着信息技术的不断发展和计算机不断普及,个人数据信息急剧膨胀,Web也日益成为一个巨大的信息共享平台,各种数据随之呈现出一些新的特性:一是增长的快速性;二是数据共享性;三是
不可能差分攻击是一种利用差分的性质,攻击分组加密算法的密码分析方法。作为差分攻击的一个重要变种,该方法以其简单的的攻击流程以及强大的攻击能力,引起了密码设计与分析
僵尸网络已经成为了互联网上最严重的威胁之一,检测和抵抗僵尸网络是现在的热点问题。目前僵尸网络的检测方法大部分是基于网络行为和特征,这种方法容易受到僵尸网络结构的影
随着网络技术和应用的飞速发展,互联网已经渗透到人们的工作、学习和生活等各个方面,人们对通信的需求也日益增长。在下一代互联网(Next Generation Internet, NGI)中,随时随
语义Web是下一代Web的发展方向,是当前互联网的延伸,其目标是使Web上的信息能够被机器理解,从而可以更加高效地检索信息。RDF(Resource Description Framework,资源描述框架)
身份认证技术是信息安全的一个重要机制,通信的双方只有在验证彼此身份之后才进行通信。然而传统的身份认证在对身份证明时不可避免的泄露身份相关的信息。为了满足现代通信
敦煌莫高窟作为我国唯一符合世界文化遗产全部六项评定标准的文化遗产,具有极高的历史文化价值和科学艺术价值。随着人们物质文化生活水平的提高,莫高窟景区的游客数量逐年递
随着互联网技术的高速发展,IPv6取代IPv4成为下一代互联网的主要协议,是网络发展的必然趋势。与此同时,计算机网络的相关技术也越来越引起人们的重视,网络行为分析就是在这种
本课题进行多角度人脸图像的性别分类和相应的特征选择研究。单一正面人脸图像的性别识别已经是一个得到较充分研究的问题,但是在实际环境下,由于人脸角度和朝向的多变性,使