面向学术文献检索的P2P网络研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:shztky880
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Google Scholar为我们搜索各种来源的学术文献信息提供了一个简单易用的平台。它使用网络爬虫来把各种来源的文献信息集中存储到Google自己的数据库里,然后通过web向用户提供这些信息。从技术上来讲,Google Scholar是基于客户端/服务器端模型的,作为一个集中式的系统,有着它自身的缺陷。近年来,P2P(Peer-to-Peer,点对点)计算越来越盛行,它能够以分布,自治的方式来处理海量数据,其特征在搜索能力、可扩展性、高效率,以及对故障和动态环境的应变能力方面展现了巨大的潜力。 在本篇论文中,我们提出了一种面向学术文献检索的P2P网络研究--PPScholar,它建立在P2P网络和Dublin Core元数据标准的基础之上。我们的主要研究内容就是如何使各个学术文献信息源的数据库以P2P的方式合作,建立起一个适用于学术文献检索的基于元数据的P2P网络。在研究过程中,我们主要致力于两大问题:一是如何隐藏信息源的异构性;二是如何建立一个适合于本应用的P2P网络。在建立P2P网络的过程中,我们基于在Gnutella网络中发现的两种幂律分布,在Gnutella网络的基础之上,增加学习型节点来以多种方式改进我们的应用。 首先,我们根据在P2P网络中发现的节点连接数的幂率分布规律,将那些拥有连接数多,性能强大的节点选择为学习型节点,形成一种两层架构的P2P网络。这些学习型节点可以学习整个网络的知识,比如缓冲查询请求与结果等,从而使得查询请求能够在少数的学习型节点中就能得到结果。同时通过模拟实验,在将TTL(Time-to-Live)控制在可接受的前提下,尽量选择那些拥有连接数最多,性能最强大的节点作为学习型节点,从而尽可能减少学习型节点的数量。另外,我们还根据P2P网络中发现的搜索关键字的幂率分布规律,提出了新的缓冲算法--适应性最少频率使用算法(Adaptive Least Frequently Used),并根据此算法在学习型节点中建立缓冲区,作为学习型节点的学习能力之一。 通过实际模拟实验,我们验证了该算法相比其他的缓冲算法拥有更高的命中率。
其他文献
速度是计算机最基本的性能参数,致力于提高计算机性能的所有方法都是为了加快运算速度。多核系统为并行计算的研究及其实验提供了便利条件,已经成为系统架构设计中的主流。双核
随着数据库技术的广泛应用,数据管理的对象从非结构化数据向结构化数据延伸。依赖于图数据结构强大的表述能力,一些新兴数据库如XML文档数据库、社会关系网、化合物分子数据库
目前的数据库应用系统管理的数据大部分是与时间有关的,数据仓库就是一个很好的例子。通常把具有一种时间属性的数据称作是时态数据,时态数据的时间属性是指有效时间或事务时
在信息时代的今天,随着网络技术和多媒体技术的高速发展和广泛应用,越来越多的信息在网络上迅速方便地传输,但这同时也带来了信息安全隐患问题。因而,如何保护信息安全成为国
本文首先以QR二维条码为例,探讨了二维条码图像的定位与分割算法,利用Radon变换与Sobel边缘检测算法将条码图像从原始条码图像中有效地分割出来;然后分析了经过光学系统的条码图
集成了传感器、微机电系统和网络三大技术而形成的传感器网络是一种全新的信息获取和处理技术。随机分布的大量传感器节点,以无线自组织的方式构成网络,通过节点中内置的各种类
当前,大量的Web应用都采取了快速迭代的开发方式,产品需求时常发生改变,产品的前台界面和后台业务逻辑通常也会随之改变。因此,需要进行大量严格的回归测试,验证功能是否能完
由于采用了联合检测、智能天线等关键技术,TD-SCDMA 系统相对于WCDMA 和 CDMA2000 具有最好的频谱利用率,因此 TD-SCDMA 的相应关键技术是现在各个公司研究的重点。其中联合检
随着多媒体技术的快速发展,视频数据大量地增加,基于内容的视频检索的应用越来越广泛,而关键帧提取技术是视频分析和基于内容的视频检索的基础。一个镜头的关键帧就是反映该镜头
随着电子商务的发展,电子支付安全问题已成为人们日益关注的热点。常用的电子支付的协议有SSL协议和SET协议。基于SSL协议的电子支付系统成本低、应用简单透明、相对简单且快