民航主题搜索引擎的索引技术研究

来源 :中国民用航空学院 中国民航大学 | 被引量 : 0次 | 上传用户:fairylky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎是传统的信息检索(InformationRetrival)技术与Web结合的产物,是一个集多种技术于一体的综合性系统。倒排索引是其中的一项重要技术,本文正是围绕倒排索引的核心技术展开,改进了若干索引的关键技术,其目的是提高搜索引擎的性能和检索结果的主题相关度。 中文全文索引技术中索引词选择直接影响检索系统性能,本文针对系统特点提出一种基于主题词表的混合索引技术。在索引创建过程中,对网页正文进行两次分词。通过在实际系统的应用实践,表明该技术能有效提高短语检索效率。倒排文件创建过程的开销是影响检索系统性能的重要因素,本文针对倒排索引的效率问题,提出了一种改进的分组索引算法。为了提高索引效率,我们设计了三级索引结构。这一方法为解决高效创建索引问题提供了一条有效的途径。 搜索引擎的系统结构是系统能否有效工作的基础。经过小组成员的实践,设计并实现一个搜索引擎检索实验系统。本文介绍了主题搜索引擎原型系统,并比较了主题和通用搜索引擎,其结果对于进行有效的检索评估实验有指导意义。
其他文献
随着信息化时代的不断发展,异构模式间的语义映射成为了人们关注的焦点问题。目前,模式间语义映射的两大关键组成部分多作为两个独立的单元分别进行研究,然而,随着SemanticWeb概
随着网络与数字产品的快速发展,版权意识与版权保护越来越被人们所关注。数字水印技术作为数字产品身份认证和版权保护的重要方法,也因此受到越来越多的重视与研究。大多数数
随着移动通信的发展,移动通信网络即将从2G(第二代移动通信网)升级到3G(第三代移动通信网)网络。3G网络最显著的特征是在R5(Release 5)中引入了IMS(IP Multimedia Subsystem),
本文将专家系统的技术应用于科技项目评估领域,开辟了评估专家系统的新应用领域。其目的是将已有的评估方法与专家系统结合,开发出科技项目评估专家系统,达到评估过程的科学
人群在现实生活中随处可见。在虚拟环境中,真实的人群运动会使整个环境显得逼真、生动。随着计算机视觉与计算机图形学技术的飞速发展,人群运动仿真技术受到了越来越多学者的
进入二十一世纪以来,移动终端作为一个新兴设备发展非常迅速,尤其是智能终端的问世,极大的方便了人们的日常生活,3G与4G网络的逐渐普及,网络带宽的增加,以iPhone的发布开始,A
本文介绍了一个通用的、可扩展的医学影像处理算法开发平台,该平台不但提供了灵活的算法开发接口,友好的影像操作界面,也为计算机辅助检测/诊断(CAD)系统高效、快速地开发提供了
近几年,以彩铃(Coloring Ring Back Tone,CRBT)为代表的电信增值业务发展迅速。中国移动在2003年成功推出彩铃业务,迅速得到用户的喜爱和使用,随后各大运营商纷纷跟进,使得彩铃在
本文研究分析了交叉认证技术中的信任模型、路径构造与路径验证,提出了一种针对域内为层次结构、域间为网状结构的混合模型下的交叉认证设计,它通过出示默认证书链,并使用加权信
在过去的二十年,神经网络理论研究取得了很大的进展,在各领域的应用也取得了丰硕的成果。作为神经网络的经典模型,BP网络也得到了快速的发展,同时,也存在着收敛速度缓慢、难