对等网络中基于关键字的搜索

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:mynameisfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对等网络以其大规模,自组织,以及健壮性等优特近年来受到学术界越来越多的关注。自第一代对等网络系统Napster开始,文件共享一直是对等网络的一个非常重要的应用。由于对等网络的大规模的特点,文件共享系统可以充分利用各个加入该系统的用户的资源来提高服务的质量。然而这一特定也同时给对等网络文件共享系统带来了很大的挑战。其大规模分布式的特性使得在对等网络文件共享系统中的文件搜索变得非常困难,同时给网络也带来了非常大的负担。因此,如何在对等网络中实现高效的搜索是一个非常重要的研究课题。本论文将系统研究在两类流行的对等网络系统中——非结构化对等网络和结构化对等网络——如果实现高效的基于关键字的搜索。针对于对等网络大规模分布式的特点,我们着力于从提高搜索准确率和降低网络负担两方面来研究这一课题。以前提出的搜索机制往往要么搜索效果不佳、要么网络负担比较重,而很少能同时兼顾两方面。我们提出的搜索机制能很好的平衡两方面的因素,实现高效的对等网络搜索。在非结构化对等网络中,本文提出了一种基于学习的查询消息路由协议来实现高效的搜索。由于它利用了路由过程中查询及查询应答消息所携带的信息来构建和维护查询路由表,极大地减轻了查询对于网络所带来的不必要的负担。同时我们充分利用了在现实对等网络中所观察到的查询消息存在大量重复这一现象,利用加强学习的思想来达到优化查询路由决策的目标。这一机制相对于以前所提出的机制而言,同时获得了满意的搜索结果和极低的额外网络负担。在结构化对等网络中,文件按照其关键字在不同的节点上建立索引。对于多关键字的搜索就需要将不同关键字所对应的文件列表在节点间进行交换来实现来找到同时具有这些关键字的文件。由于单个关键字所对应的文件数量非常大,这一过程中网络负担也很严重。通过分析我们发现多个集合的交集的大小是由这几个集合的特性决定的。因此,找到一种合适的多集合求交的顺序策略,就能极大的降低这一过程中的网络负担。本文提出了一种高效的调度策略极大的降低了网络负担。
其他文献
学位
随着Internet的快速发展与日益普及,信息安全越来越受到人们的关注。虽然人们在主机上安装防火墙、入侵检测系统预防网络入侵,但入侵者仍可能通过非法手段盗取或篡改机密信息
随着Internet的不断发展和网络用户的大量增加,各种多媒体业务得到大量应用,而且越来越多的新兴业务如视频点播、电视电话会议、远程教学等不断涌现,导致传统的点对点单播通
移动Ad Hoc网络是一种新型的无线网络,正在得到越来越广泛的应用,成为移动通信技术发展的一个重要方向。Ad Hoc网络使用无线链路,具有安全性差、网络拓扑动态变化等特性。与
在我国,多数电视台从90年代后期开始使用商业性调查机构提供的收视率数据。收视率是衡量电视节目质量的重要指标,收视率统计数据已经成为电视台评价自己的节目,确定各频道和时段
关联规则可视化知识发现是一种利用可视化技术从数据中识别有效的、新颖的、潜在的、有用的、可理解的关系模式的非平凡过程。由于人类的大脑具有很强的模式识别能力,因此将
软件危机的出现使得人们开始寻找工程化的方法,因此出现了软件工程;同样,如何处理需求到设计的过渡和应对需求变化推动了软件体系结构的提出和发展。 但是基于需求驱动的软件
蛋白质远距同源检测是生物信息学中的一个重要问题。近年来,出现了很多新的同源检测方法,并取得了一定的成功。但是对于远距同源检测,这些方法的效率并不高。本文以此为出发
数据挖掘(Data Mining),指从大型数据库或数据仓库中提取隐含的、未知的、非平凡并有潜在应用价值的信息或模式的过程,它融合了统计学、数据库、人工智能、机器学习等多个领
地理信息系统(Geographical Information System,简称GIS)是20世纪60年代开始迅速发展起来的管理分析新技术,是计算机科学、地理学、测量学、地图学、管理学多种学科交叉的产