基于Web中文检索系统SEARCH2000的设计与实现

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:allen3lin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文详细介绍Search2000中文检索系统的设计思想及实现方法。与传统的全文检索系统相比,基于WEB的信息检索系统,具有许多全新的特征。页面为半结构化文档、页面通过超链接相互关联、页面的内容覆盖不同应用领域并且拥有大量专有名词和缩略词汇,这些特性成为影响查询精度的主要因素。针对Web的上述特性设计的Search2000全文检索系统,使用智能化的页面相关分析、评分技术,以及高效数据存取、压缩算法和知识库的支持,使其具有使用方便、查询时间短、查询精度高等特点。
其他文献
7月,盛夏的炎热挡不住昆明秀吧里热情洋溢的气氛,沸腾的人群不时为精彩的表演发出阵阵激动的喊叫,在这里来自英国的吉它大师,迈克·杰森正在演奏着
<正>~~
红外焦平面列阵(IRFPA)是新发展起来的一种红外探测技术。本文对IRFPA的技术、在世界各国的发展现状以及其面临的困难作了个概略性的介绍。
<正>~~
简谱现在广泛应用在我国的专业音乐工作与群众音乐中,因其简易,所以广泛流传。歌曲、民乐独奏或合奏曲、戏曲唱段及其伴奏与中小学部分音乐教材都用的是简谱,它是音乐工作中
本文介绍了一个实际应用中的中文商务名片识别系统,分析了系统的结构。该系统首先结合实际中的一些具体问题对名片图象进行预处理,然后在传统版面分析技术的基础上针对名片版面
改革开放以来,在利用外资和国外先进技术上,海洋石油企业取得了成功的经验,它的以吸收外资、引进国外先进技术和管理经验,开拓国际市场为核心内容的管理模式具有以下五个特征
<正>~~
期刊
石油成人继续教育是对石油企业在职专业技术人员和领导及管理人员的知识、技能进行补充、更新、拓宽和提高的一种追加教育,其目的是为了不断提高这些人员的业务素质,以保证生
本文提出了一种通用的并行算法模型。这种模型可以适用于许多多数据块处理系统。该算法可以成倍提高系统的处理速度。算法的核心采用了伪MMX技术,对机器硬件没有特殊要求,保证了程