一种基于查询扩展的搜索引擎的设计及研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:qiaobianhongyaogqw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文在总结传统搜索引擎的基础上,提出了一种新的搜索引擎模型,并对其涉及的关键技术进行了深入研究,主要包括以下工作:   (1)在一个基于全文检索的搜索引擎系统的实现中需要解决两种与词汇相关的问题,即“忠实表达”和“表达差异”问题,这两类问题的实质就是词的不匹配问题。本文构建了一个利用动态知识库实现查询扩展的搜索引擎系统,其关键在于根据检索结果动态地构建知识库。主要思路利用特征词关系对来构建知识库。这样系统经过多次使用后,就可积累一定数量的人的知识经验,逐步建立起一个符合人的认识规律的知识库,而且知识库的内容可以在系统的使用过程中不断得到更新与补充。每当用户检索时系统就从动态知识库中提取相关概念以扩展查询。   (2)本文结合向量空间模型文档表示方法,针对Web页面的特殊性,对特征项权重的计算方法进行了改进,提出了一种基于HTML文档的向量空间模型。
其他文献
问答系统是信息检索的一个新的发展方向,是解决互联网上信息不断丰富与人们从互联网上获取自己需要的信息越来越难的矛盾的有效方法.数据源是问答系统的知识库,它是问答系统
该文在分析了多种传统的持久化机制的基础上,深入研究了sun公司指定的JDO规范,结合软件模式设计、框架设计等技术,对JDO持久化中间件框架设计进行了研究,并提出了一套能够指
目标识别与跟踪是计算机视觉、图像处理与模式识别领域中非常活跃的课题。当前对运动目标检测与跟踪的研究已取得了一定的成绩,但由于运动目标经常处于室外多样的自然环境中,因
计算机用户界面是指计算机与其使用者之间的对话接口,是计算机系统的重要组成部分,它直接关系到整个计算机系统的可用性和使用效率。目前开发用户界面的工作量及难度十分可观,非
随着Internet技术的发展带来了电子商务的快速发展.那么如何在交易的过程中保证敏感数据的保密性、完整性、不可否认性,以及如何确认对方的真实身份就非常重要.公钥基础设施P
本文主要研究了如下几个方面的内容:(1)介绍了将混沌、分形的研究思想、方法和成果制作成CAI教学与试验软件的设计与实现方法.(2)设计了一种新的混沌扩频码序列中间段多比特
相干体技术是近年来地震勘探在资料解释方面的重要突破,与原来揭示地下异常体的方法相比,相干体可以更清楚地识别断层.该方法是一种自动和半自动的解释技术,它利用三维地震数
随着数字信息技术的飞速发展,由传统的模拟电视到数字电视的数字化革命已成为必然.数字电视将带给我们全新的视觉冲击和前所未有的大容量信息资源.中国目前也正在经历着电视
随着Internet规模的爆炸性增长以及新的应用需求、传输速度要求,Internet遇到了许多在设计初期所没有预料到的困难.为此我们提出了一种新的Internet体系结构:层次式交换网络(
随着计算机系统应用到航天、军事、工业等高可靠性领域,人们对计算机的系统在软件和硬件方面的可靠性要求也大大提高.故障注入作为一种加速系统失效的手段,能够测试并评估容