P2P环境下基于Ontology的搜索引擎

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:hahaohan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎是Internet迅猛发展的产物。它的出现使信息检索变得非常方便。但是,随着Internet以及随后出现的WWW技术的不断发展,导致网络所蕴涵的信息量急剧地膨胀。面对当前如此庞大的信息数据,目前普遍采用的是基于中心服务器的传统搜索引擎,所以在实际应用过程中很难准确、有效、快速地查找用户所需的信息。因此,搜索引擎技术急需进一步的发展和完善来适应新形势的变化。本文主要探讨了采用新的信息检索模型--P2P分布式检索模型,来增加搜索引擎系统的规模并改善了它的性能。论文首先分析了传统的搜索引擎的关键技术、发展趋势和面临的挑战,由此引出将先进的P2P理念与传统的搜索引擎技术相结合的新方法,顺应了搜索引擎技术趋向分布式、本地化方向发展的趋势。采用这种新的基于P2P分布式的搜索模型构建的搜索引擎系统,与现有的基于“网络蜘蛛”的搜索引擎相比较,在搜索到的信息的即时性、搜索到的内容的深度、搜索到的内容的范围广度以及搜索到的结果的精度和效率方面都有较大的改善空间。在提高查询准确率方面,利用目前发展较快的Ontology技术来改善。在传统的搜索引擎设计思想下吸收两者的优点,为提高搜索引擎的性能提出了一个可行的方案。在本论文的设计中,针对当前的各个P2P系统的不能相互兼容的问题,采用Sun公司的新一代通用P2P开发平台JXTA,并在此基础上构建了基本的P2P搜索网络,定义了位于搜索网络之上的基于JXTA的搜索引擎系统所需要的服务规范以及实现,构建了一种具有高度扩展性的本地化搜索引擎系统模型,同时也为有效的提高搜索引擎系统的规模和性能探讨了一条可行之道。P2P搜索引擎的研究在国内外尚处在理论探讨阶段,目前并没有较为成熟的商业应用。而Ontology技术也是下一代互联网—语义Web的主要技术,也正处于探索阶段。本文提出的基于JXTA的P2P分布式搜索模型,借助Ontology的语义表达优势构建搜索引擎系统的方法,为今后设计和开发具有较高实用价值的搜索引擎系统进行了实际意义上的探讨。
其他文献
软件行业的工业化趋势导致了软件构件的产生。能够像硬件系统那样,将部分软件组合起来构建软件系统,一直是软件行业多年来追求的目标。可以说,软件构件技术的出现是对传统软
张大千(款)《佛光普照》这件张大千《佛光普照》是某机构主办的宋元明清近代大家艺术研讨会专家所点评的精品之一(图1,纵130厘米,横59厘米)。对这件作品,研讨会的专家是这样
云计算由于其先进的理念、方便的使用方式,越来越受到各大厂商和用户的青睐。随着云计算的广泛使用,数据中心和集群的能耗问题越来越受到关注。服务器目前消耗的能源已经达到惊
软件复用作为解决软件危机的有效途径,越来越得到广泛的重视。随着面向对象技术和软件构件技术的应用,软件复用技术得到了迅猛的发展。基于构件的软件工程为应用软件的组织、
在即将过去的2006年里,北京动物园度过了百年华诞。北京动物园就像一位慈祥的母亲抚育着那些被她视若己出的珍禽异兽们,这其中不乏国宝级的大熊猫、世上稀有的白头叶猴等,但似乎唯有朱鹮最牵动她的心,而小朱鹮们的茁壮成长也让她感到欣慰和自豪。可又有多少人知道动物园母亲在朱鹮成长的历程中付出的艰辛呢?    发现最后7只朱鹮    朱鹮素有“东方宝石”之美誉,由于其形态和白鹭相似,因而又有朱鹭之称。在《走进
量子信息科学是物理科学与信息科学相互融合而产生的新兴交叉学科,它把量子力学的基本原理应用于计算、通信和密码学等领域,形成量子计算、量子通信和量子密码学三个分支。量
获取蛋白质的结构和功能是生物学研究的重要目的之一,但是使用X光晶体衍射和核磁共振技术等实验手段测定蛋白质的三维结构,以及使用生物化学方法研究蛋白质的功能时效率不高,
自从2008年8月25日改版中国蓝以来,浙江卫视遵循集团提出的“导向金不换,收视硬道理”的指导方针,提出“浙江卫视中国蓝”的全新口号,放眼全国收视市场,开创国内省级卫视新格
近年来,人们在皮影戏保护方面展开了很多的研究与探索。为了改变皮影戏传统文化的现状,我们在皮影戏的数字保护方面做了研究与探索。针对于目前的仿真形式缺少对皮影戏整体综合
工程图矢量化是将纸介质工程图纸扫描输入计算机后,对所得的扫描图像加以分析、识别,最终重建其中的目标对象的过程。本论文研究的测井解释成果图是进行油气勘探开发时使用的工