P2P网络中资源发现及性能优化的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:chunhuac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,对等网络(P2P网络)由于自身的自治性、扩展性、容错性等方面的优势,获得了快速发展。基于P2P网络的应用已远远超越简单的文件共享,在大规模互联网应用等方面显示出巨大的潜力。   P2P网络需要研究的问题包括体系结构、资源发现、数据管理、安全和信任等,资源发现是其中一个基本而且重要的方面。资源发现机制为P2P网络中节点提供了定位资源的能力。目前,无结构化P2P网络在Internet环境中获得了广泛应用,针对其中的资源发现方法,研究人员开展了许多研究工作,努力提高资源发现的性能,但是复杂的组织方法、过多的开销等因素影响它们实际的可用性,还有很多关键问题仍未很好地解决,需要进一步深入研究。   由于P2P网络的自组织特性,节点可以随时加入或离开网络而不受到任何约束,由此引起Churn现象,造成P2P网络结构不稳定,而且降低了资源的可用性,影响到P2P网络的性能。   本文对P2P网络资源发现的相关问题进行了深入研究,围绕节点兴趣特征,从多个方面探讨提高资源发现性能的方法,主要研究内容和贡献如下:   1.对无结构化P2P网络的资源搜索方法进行研究。在P2P网络中,节点表现出明显兴趣偏好,节点上的资源之间具有相关性,由此做出推断:如果一个节点拥有与用户所感兴趣资源相关的资源,则这个节点很可能拥有用户所感兴趣的资源。以此推断为基础,本文提出了基于贝叶斯网络的资源搜索算法(BNS算法)。根据语义关系,建立资源之间相关性以及相关程度的描述方法;采用贝叶斯网络建立相关度模型,根据相关资源的历史反馈信息,推断查询请求在邻居节点上成功发现的可能性;提出基于该模型的资源搜索算法。实验表明,这一方法不仅能够提高资源发现的性能,而且产生的消息量与随机游走方法产生的消息量相当,而且结构简单,不需要复杂的维护,具有良好的扩展能力。   2.研究预测用户兴趣集合的方法。在P2P网络中,用户的行为具有一定的规律性。如果能够准确描述用户的兴趣,预测用户未来的兴趣特征及其变化,将其应用于资源发现方法,能够为改善资源发现的性能提供帮助。本文针对用户的查询行为,采用聚类方法获得与其相关的主题;利用马尔可夫链为查询行为建立模型,描述用户查询相关主题的时序变化;应用极限概率,预测用户的兴趣集合。实验表明,在用户表现出明显的兴趣偏好时,采用这一模型预测用户未来的兴趣集合,具有较高的准确率。兴趣集合预测可以应用于多种资源搜索方法,有助于提高P2P网络资源发现的性能。   3.研究减轻Churn对P2P网络资源发现性能影响的方法。在P2P网络中,节点随意地加入或离开,节点之间关系不断变化,造成网络拓扑结构不稳定,使得网络中资源的可用性降低,对资源发现性能产生影响。本文依据网络中资源的可用性,提出减轻Churn对BNS搜索方法性能影响的策略。根据历史搜索的反馈结果,采用命中结果数的期望和方差对系统中资源的可用数量以及波动程度进行描述,反映在动态变化环境中资源的实际可用性;针对各种资源可用性的差异,分别采用不同的搜索策略和相关的算法。实验表明,这个方法使得BNS算法在Churn状态下的搜索性能得到改善,接近在静态条件下的搜索性能。   4.在P2P网络中,搜索可用性较低的资源需要付出很大的开销,在Churn环境中,这一问题更加严重。本文提出了基于预取缓存的方法,根据对节点兴趣的预测,推断节点兴趣相关资源在网络中的可用性;对与节点兴趣相关,并且可用度较低但波动度较高的资源,进行预取并缓存。实验表明,对于这类可用性较低的资源,这个方法能够减少对其搜索所付出的代价并且可以提高搜索性能。
其他文献
物联网下的数字化仓库通过给产品嵌入RFID电子标签,经RFID阅读器将标签内部的物品信息读取之后,由节点自带的无线收发单元通过无线自组织网络、计算机网络将物品信息自动录入企
近年来,计算机技术的不断发展和应用的广泛普及加快了人类社会信息化的进程。数据集成技术是解决甘前普遍存在的“信息孤岛”问题的重要方法。数据集成系统的优劣评判标准是
学位
遥感技术是一种能够对目标进行非接触测量,采集并且分析的一种新型探测技术。随着电子计算机和空间技术的发展,各种资源和环境卫星的发射和成功的运行,通过遥感卫星从太空的高度对地球全貌以及地表动态变化等各种资源信息的提取技术得到了快速的发展。因此,对获得的海量遥感图像进行识别处理,即通过提取图像信息的特征,并利用这些特征进行图像分类,进而达到图像识别一直是遥感技术所要解决的重要问题之一。神经网络因特有的自
随着现代控制技术和计算机技术的迅速发展,以单片机为核心的控制终端控制系统在工业自动控制工程领域中取得了很大的发展,尤其在地理环境恶劣,无人值守,作业点分散,频发小数
为了简化组网结构,提高组网可靠性,网络设备虚拟化技术应运而生。然而随着交换网络面临越来越高的要求,其可靠性、可用性、可管理性等多方面都面临越来越高的挑战,传统的虚拟
射频识别(RFID, Radio Frequency Identification),是一种实现非接触式信息识别和采集的技术。通过RFID系统中读写器设备读取电子标签中的信息,将信息交付给用户或者服务器做
粗糙集理论是一种有效的数据分析工具,它可以处理不确定、不精确、不完备、不一致的数据。然而,经典粗糙集理论是基于严格等价关系的,在处理实际应用中的数据时具有一定的局限性
随着现有的智能家电设备的功能性以及智能家居服务的广泛性的迅速发展,给人们带来的便利有目共睹,可是问题也是层出不穷。除了设备异构性导致的设备互操作困难,应用程序和设
当下医疗行业存在巨量的影像数据,它们对疾病诊断与疗效评价具有重要研究意义。本文将糖尿病患者的视网膜眼底图作为数据集,进行深度学习算法的应用研究。在算法上对于糖尿病
近些年来,由于计算机及信息技术的高速发展,人们获取数据的能力极大的提高,数据流作为一类重要的数据来源,越来越受到关注。数据流是连续的、快速变化的、有序的、海量的数据,不同