基于对等网络的搜索引擎关键技术研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:brianwang1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络的高速发展,Web上的信息量越来越大,而且这些信息本身是高度分布式的。而传统的搜索引擎大都采用集中式的搜索机制,因此很难满足用户对于搜索效率和搜索结果的要求。与此同时,对等网络(Peer-to-Peer, P2P)由于其本身的分布式体系结构以及其对于网络中硬件资源的利用能力,为解决以上问题提供了一个新的研究方向——构建基于对等网络的搜索引擎。基于对等网络的搜索引擎的优势主要体现在以下几个方面:(1)网络中的信息本身就是高度分布式的,这与对等网络的体系结构相符合;(2)由于对等网络中的节点都能够向网络提供自己的资源,包括带宽、存储和计算能力等,因此对等网络能够利用到网络中更多的硬件资源。然而,基于对等网络的搜索引擎作为一种新兴的网络应用,还有很多问题有待解决,例如现有的搜索算法效率较低,难以支持复杂查询等等。本文在分析基于对等网络的搜索技术存在的问题基础上,提出了一种基于非结构化对等网络的信息检索路由算法——基于搜索历史的多关键字搜索(History-based Multi-keywords Search, HMS)算法。HMS算法只需要每个节点为各个邻居节点保存部分历史查询信息,当节点收到一个新的查询消息时,便根据对这些历史信息的分析自动发现有几个以及具体是哪几个邻居节点有可能回复当前的查询消息。在转发查询消息时,节点只把查询消息发给那些比较有可能回复该查询消息的邻居节点。最后,本文设计并实现了一个基于非结构化对等网络的信息检索仿真系统,并利用该系统对HMS算法的搜索效率作了验证。试验结果表明HMS算法能够有效地降低网络通信开销,同时还能够保证较高水平的查询结果。
其他文献
电子邮件技术已经成为一种快捷、经济的现代通信手段,几乎每个网络用户都有自己的邮件信箱。然而电子邮件也日益成为商业广告、病毒、木马等内容的重要载体,垃圾邮件的泛滥成
语义Web作为下一代万维网的发展方向,自提出以来就得到了人们的极大关注。它不是另外一个Web,而是现有Web的延伸,其中的信息被赋予了良定义的含义,从而使计算机可以更好的与
信件和包裹的自动处理及自动分拣是现代邮件分发系统中一个重要的任务。目前,因为信封图像和包裹图像的获取和储存比起十年前更容易、成本也更加低廉,所以邮政自动化已经融入
现代电信主干网络采用先进的SDH技术和标准化的主流产品,但是由于成本问题以及复杂程度,使得其在边缘接入网络的推广成为难题。传统PDH技术和产品仍然满足和适合端局接入网络
随着新技术的发展和新设备的应用,应急通信系统越来越复杂。监控系统作为应急通信系统的重要组成部分,被监控的设备也越来越多,节点处理的信息量也越来越大。移动代理技术能
射频识别(]RFID技术是一种利用电磁波进行信息自动识别的通信技术。RFID技术被广泛的应用于物流,零售,图书管理等领域,但是由于RFID技术采用无线传输,使得RFID系统容易受到恶
目前Web中存在大量可以访问的在线数据库,而且各数据库与用户特定查询的相关度不同,因此如何快速准确地选择出与用户查询密切相关的数据库变得越来越重要。在此,本文提出了一
随着互联网的普及、无线网络技术及信息传输技术的快速发展,无线信息网络进入了集视频、音频、文本、图像为一体的多媒体通信时代。伴随着网络信息多样性的发展,移动终端设备
随着互联网不断进步和发展,随着数字技术的巨大突破,每天都会有大量的图像信息资源充斥于互联网上。越来越丰富的图像资源让用户很难在浩瀚的图像数据中找出他们真正想要的图
车间调度问题是计算机集成制造系统工程中的一个重要组成部分,它对企业的生产和管理有着重要的影响。随着全球经济的发展,市场竞争越来越激烈,制造型企业必须根据市场的变化