信息检索的索引和检索技术的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liongliong526
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今社会里,信息的爆炸式增长已经成为人们必须面对的问题。借助计算机在海量信息中找到人们所需的有用信息的研究越来越受到人们的关注。本文回顾了信息检索技术的发展历程,并且由此引出信息检索的定义以及当前信息检索系统存在的一些问题。文章重点对中文信息检索系统的相关技术进行了研究;阐述了信息检索系统的组成以及各组成部分在整个系统中所起的作用;介绍了信息检索的索引分类、索引项的组织;提出了基于Cover级别的中文信息检索技术。文章在分析了众多信息检索系统的检索特点后,论述了基于Cover级别的中文信息检索技术的相似度计算方法以及信息检索的评价方法。同时,分析了基于Cover级别的信息检索技术中存在的不足。
其他文献
神经网络的输出对参数扰动的敏感性是神经网络设计和实现中的一个重要问题。参数的扰动对网络的输出会有怎样的影响?如何度量神经网络对参数扰动的敏感程度?本文着重计算和分
本课题针对我国海运行业业务面广,业务流程变化快,数据量大,业务系统开发工作量大、周期长以及业务数据的共享、抽取、分析,完整性、安全性的保持及高效的事务处理等问题提出
本文对网络测量、网络带宽测量的历史进行了回顾。按照测量方法的组成部分对带宽测量方法进行分类,突出了测量方法的特点,指出了各种测量方法的适用条件、技术原理和局
全球信息化快速推动了中国软件产业的不断发展,极大地促进了软件测试业的进步,但在软件测试的认识、软件测试技术、软件测试商业化等方面,目前中国的软件测试业与欧美还存在很大
本文主要研究滑动窗口连续查询的处理问题。滑动窗口查询是数据流中一类重要的查询类型。根据执行方式的不同,滑动窗口查询可以分为元组驱动滑动窗口连续查询和时间片
本文针对现在的异常检测系统由于计算机软硬件的原因,而无法很好的处理大流量的环境中的海量数据的问题,提出了一种基于数据流的在线保存数据概要信息的方法,实现了一个
本文研究了数据挖掘中频繁模式,聚类,分类算法,并提出了能够适应生物信息学数据和大数据量的频繁模式,聚类,分类挖掘算法。同时,提出了一种保存挖掘结果的缓存机制,提高了挖掘系
传统的分布计算与分布式数据库的研究是基于有线网络和固定主机的,这些都采用了一些默认的隐合假设,例如固定网络连接、对等通讯代价、主机节点固定不变等。计算技术和无线通讯
本文从探讨企业应用程序框架出发,对企业应用程序框架的概念的组成进行研究.对基于J2EE平台技术的CERP的企业应用程序框架进行了深入分析.总结了CERP应用程序框架的构成要素,
本文实现了基于虹膜的计算机自动诊断系统中的虹膜定位、虹膜图谱覆盖、分区技术和根据病理柔性分区关键技术.首先,本文提出了一种针对东方人种虹膜的虹膜定位算法.该算法利