对等网环境下语义检索系统研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:A123456_gam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,P2P技术被广泛的用于网络节点之间的文件共享与搜索。采用P2P的搜索技术可以有效的跟踪数据的更新速度、提高访问的有效性以及检索的效率,同时有效地提高了共享资源的深度和广度。但现有的对等网络文件共享系统往往存在仅支持弱语义(甚至缺乏语义)的共享的局限性,不能有效地满足用户的需求。在研究和分析当前主流信息检索算法的基础上,重点研究基于查询条件概率的统计语言模型,并引入机器翻译领域中的统计翻译模型,改进统计语言模型的经典算法——一元语言模型,提出基于概率翻译方法的一元语言模型检索技术。从而改善一元语言模型认为词汇间没有任何联系的假设前提,将词汇间的同义词因素以概率翻译的方式考虑进来,将经典语言模型方法中的查询条件的生成过程看作是由文档中出现的词汇通过翻译模型向查询条件中相关词汇的一个映射过程,一定程度上改善了一元语言模型文档词汇间无相关性的先天不足,从而获得较好的语义检索性能。在此基础上,将改进的语义信息检索算法引入基于super-peer的P2P信息共享模型,建立支持语义的P2P信息共享模型,利用super-peer进行节点管理、信息转发和语义信息查询,既充分发掘P2P技术的潜在优势,消除传统集中式文件共享系统存在的资源发现效率和可扩展性等方面的局限性,又有效地支持了基于语义的检索技术。最后,将设计的对等网语义检索模型应用于系统中,开发出原型系统,并解决系统实现中涉及的若干问题,并对实验结果和实际运行结果进行了分析,进一步以实验验证了利用此模型来实现P2P网络语义文档共享的有效性。
其他文献
最优化(Optimization)是运筹学的一个重要的分支,它研究决策问题的最佳选择之特性,构造寻求最佳解的计算方法,研究这些计算方法的理论性质及实际计算表现。最优化问题可以简单的
随着互联网的广泛应用,人们对互联网的要求越来越高。传统的网络分布模型已经不能满足网络用户日益提高的需求,因此,Web Services(Web服务)应运而生。Web Services与传统的网络
分形图像压缩编码是一种具有高压缩比的新型图像压缩编码方法。这种方法利用了图像的自相似性对图像进行压缩。分形图像压缩编码的数学基础是迭代函数系统(IFS)、拼贴定理,其
随着对垃圾邮件过滤的各种技术和算法的不断发展,大部分基于机器学习的文本分类算法在实际使用中取得了较好的效果,但由于采用了文本分类中的一些算法,大部分算法都要求在应用前
目前,对于Internet上零散分布的海量学科资源,缺乏一种方法对它们进行有效的聚合。搜索引擎在底层使用爬虫技术发现了大量的Web资源,但是无法揭示出资源之间的联系并对资源的
随着市场需求以及用户对系统性能要求的不断提升,传统单核模式的嵌入式系统性能已经接近瓶颈,无法满足不断增长的性能要求,为此研究人员将目光投向多核架构。理论上,基于多核
ASP(Application Service Provider)技术是随着互联网发展把人类社会从工业经济时代推向电子商务时代的产物,是信息技术与制造业生产组织方式相结合的一种崭新的产品及服务模
随着世界各国海洋开发和海洋军事领域的飞速发展,水下传感器网络成为一个新的研究热点,它主要应用于对水下传感器网络所覆盖的区域进行中长期的水下预警、目标检测、海洋水文
随着Internet技术的普及和应用,办公自动化系统作为Intranet的重要应用必须能够与Internet相连接,包括电子邮件、Web发布等,这不仅沟通了机关内外的信息、对外宣传了机关单位,而
在嵌入式系统应用领域,将嵌入式系统连接到Internet,实现嵌入式系统与Internet之间的资源共享、信息通信和状态控制等功能,这种嵌入式系统与Internet之间的连接与应用就称为