基于网格的分布式信息检索技术研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:wilsonpfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的信息检索技术往往是集中式的,随着数据量的指数增长,这种集中式的数据存放对于数据库的更新维护带来很大的难度,同时检索查询操作也变得非常费时,这造成了整个系统性能的瓶颈。网格技术可以集中网络中闲置的计算资源和能力,提供巨大的计算能力和存储空间。本文将网格技术引入到信息检索中,与传统集中式信息检索相比,网格分布式信息检索将各种相关计算任务分配给网格上对应的计算节点,由于采用分布式的体系结构,可以提高速度,有效地提升了信息检索系统的整体性能。本文在深入分析了国内外研究的基础之上,吸取这些研究的经验教训,设计并初步实现了在网格环境下,可以根据用户提出的检索需求,快速、准确地找到所需的网格资源的分布式信息检索系统框架,并验证其可行性。文章在分析传统的集中式信息检索系统的诸多缺点的基础上,参考了国外网格信息检索小组提出的模型,引入用户兴趣模型和中文分词技术,使用基于NET的网格计算框架Alchemi设计了新的基于网格的分布式信息检索的模型,分析检索流程,并设计了系统安全访问控制模型。为了解决网格资源多样化的问题,引入元数据来统一繁杂的网格资源的表示方式,最后初步实现了其原型系统,通过实验证明了模型的可行性。论文的具体研究工作如下:参考现有的网格分布式信息检索的策略和方法,详细设计了基于网格的分布式信息检索的框架,并分析了具体的检索步骤,给出了基于用户模型和中文分词的检索策略,详细设计了系统的模块和各个模块的功能,给出两种系统访问模型。同时,鉴于网格资源的格式繁杂,引入元数据来统一网格资源的表示方式,给出了网格资源的元数据定义。最后,在Microsoft. Net平台下开发了网格分布式信息检索系统,考虑到系统实现的复杂性,本文详细介绍了系统的核心模块Alchemi任务分发和管理模块的实现过程,并用实例和统计数据证明了系统的可行性和有效性。
其他文献
随着油田的发展以及工业自动化水平的提高,利用现代计算机设备、通信网络技术对设备进行数据的远距离采集和监控的方式得到了广泛运用。在油田及其他工业领域经常通过有线的
近年来,因特网难以置信的飞速发展,使得web成为一个巨大、分布广泛、全球性的信息中心。在这个分布式信息空间中蕴涵着具有巨大潜在价值的知识,如何从海量信息中快速有效的获得
多秘密共享是密码学技术一个很重要的研究方向,它为重要信息的安全保存和合法利用提供了一种有效的途径,是信息安全方向的研究热点。利用它保管秘密,不但能防止权力过分集中
GML(Geography Markup Language)是一种用于描述现实世界中地理对象的标识语言。基于World Wide Web Consortium(W3C)提出的更宽泛的。Internet标准,GML以一种可以在互联网上
无线多媒体传感器网络(WMSNs)是在传统无线传感器网络(WSNs)的基础上发展起来的具有音频、视频、图像等多媒体信息感知功能的新型传感器网络。同只具有简单环境数据采集功能
随着数据仓库、决策支持等OLAP技术的广泛应用,数据库系统对执行引擎查询效率的要求越来越高,因此人们提出了一种的新的数据库系统设计理念,即以列为基本存储单位的列存储数
随着P2P网络技术的逐渐深入,P2P作为一种分布式网络技术在许多领域得以广泛的应用,尤其是针对资源共享。然而由于网络所存在的固有的安全性问题已成为制约P2P网络中资源共享
随着网络技术的不断发展,基于UDDI的传统的Web服务发现技术已越来越不能满足目前的需求。UDDI由于没有提供足够的语义信息,只能够进行基于关键字的服务查找,匹配精度不高。因
随着全球经济一体化,各个行业的竞争也越来越激烈。对于机械加工企业来说,如何提高生产率、产品质量和减少生产成本,成为企业关注的焦点话题,也成为企业生存的根本因素之一。
随着多媒体技术和网络的快速发展,图像信息资源大量增多,图像的有效管理和检索变得越来越重要。用户如何从海量图像数据库中快速而又淮确地检索出需要的图像,是目前研究的一