基于对等网络的文档搜索技术

来源 :复旦大学 | 被引量 : 0次 | 上传用户:xiachl141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对等计算(P2PComputing)作为一种全新的分布式计算模式越来越多的受到学术界和工业界的共同关注。由于P2P系统具有良好的可扩展性、鲁棒性和信息可用性,因而被认为是未来Internet应用的前沿技术之一。同时,由于互联网的出现,人们迫切的需要从网上的海量数据中进行有效的文本检索。基于对等网络的文档检索系统由于其分布计算的性质和良好的扩张性,可以增强系统检索大规模文本的能力,特别适合互联网上不断增长的信息检索的需要。目前,学术界提出了一些在对等网络进行基于关键词查询的文本检索系统,但是这些系统存在着消耗带宽过多,查询执行时间较长,搜索准确率不高和查询负载不平衡等缺点。针对以上的问题,我们提出了一种新的在DHT网络中进行文档发布和检索的方法,对于网络中节点选择和负载平衡方法进行了研究,并开发了两个基于对等网络的信息检索系统。本文的主要贡献如下: ·提出了KEYNOTE,一种新的基于Chord网络的信息检索平台。KEYNOTE采用全新的term-node的信息发布方法,大大减少了带宽消耗和存储代价。模拟实验证明,KEYNOTE可以应用到Internet规模的信息检索,并且成功解决了对等网络中的文档全局排序的问题。 ·提出了两种简单但是非常有效的基于DHT网络的节点选择方法。实验证明,这两种节点选择的方法可以保证大多数和查询相关的文档可以通过访问网络中一小部分节点来获得。设计了一种基于Chord的负载平衡方法,这种方法能够保证在O(10gN)的路由跳转数内实现某个节点上面关于某个关键词的负载平衡。 ·开发了两个基于对等网络的信息检索系统,包括基于非结构化对等网络的信息检索系统BSearch和基于DHT对等网络的消息检索系统SIPPER。
其他文献
随着图书发行业务的垄断格局逐步被打破,市场激烈的竞争逼使图书发行集团选择技术含量更高的数据挖掘手段,提高企业的分析能力,提高企业的市场竞争力。 本文以某大型图书集团
随着计算机信息技术的发展,其对包括建筑业在内的各个行业的影响越来越大。将IT全面地应用于建设工程项目全过程,其结果将给建筑业带来革命性的工具和革命性的变化。 在本文
随着计算机网络技术的发展,信息安全问题日益突出,其核心技术基础之一的数字签名技术,被广泛地应用于军事、通信和电子商务等领域,它在身份认证、数据完整性和抗否认等方面具有其
Internet已被公认为是20世纪末人类科技史的里程碑,它促使人类社会步入了以网络为中心的信息时代。随着WEB信息量爆炸性增长,人们很难从大量的信息中迅速有效地提取出所需信
现如今,人们对手机的要求已经不仅仅局限于通话本身,而更关注于将越来越多的应用集成在一起。从通话、短消息到上网、收发E-mail,再到今天的照相、摄像,手机的功能已经越来越强大
本论文提出一种交互式古代壁画病害标识方法,在使用超像素和稀疏编码进行图像特殊区域快速识别的基础上,使用用户交互技术,提高壁画标识准确率。本论文提出的方法共分为以下
现代信息技术的迅速发展和广泛应用,使得信息化成为不可阻挡的发展趋势,从而导致企业信息化。企业信息化是为了提高企业整体经营水平而将信息技术与先进的管理思想和方法综合运
传统的视觉显著性检测方法通常能够模拟人的视觉处理系统对单一场景进行快速自动的分析,从而挖掘出图片中最为吸引人的区域。显著性检测结果一般被称作显著性图。协同显著性
随着以太网技术的迅速发展与工业控制系统“E网到底”的需要,将以太网应用于工业控制中已是一个必然的趋势。有鉴于此,我们参与了新一代工业现场数据通信技术的研究和国家标准
随着信息技术的飞速发展,各行各业无不受到信息化浪潮的冲击和影响。林业资源管理信息化建设虽然也有了长足的进步,但还存在着空间分析不足、缺乏统一的标准等问题,这些问题直接