文本检索综述

来源 :数字图书馆论坛 | 被引量 : 0次 | 上传用户:Wang_Sheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本检索是最早也是最重要的信息检索形式。本文从基于文字、基于结构、基于用户信息几个方面总结了信息检索中相关度计算的方法。对基于文字的信息检索,本文分别介绍了传统的布尔模型、向量空间模型、概率模型和近年以来兴起的统计语言IR模型。文本检索和其他学科逐渐融合构成当今文本检索的发展趋势,本文主要介绍自然语言处理、数据挖掘技术和文本检索的融合,并介绍了数字图书馆中的一些新的文本检索应用。
其他文献
<正> 居住小区的供暖锅炉房,大多数建在小区之内,有的距住宅楼仅10米,锅炉一投入运行,噪声问题便立即暴露出来,既影响居民的生活,也干扰正常的供暖秩序。几年来,我厂为解决锅
中共中央政治局常委、国务院副总理李岚清在国务院办公厅召开的全国城镇职工基本医疗保险制度和医药卫生体制改革工作会议上强调,要充分认识建立城镇职工基本医疗保险制度和
四字格结构是一种特有的语言现象,其结构对仗工整,平仄相间,凝练深刻,极具表现力。四字格作为一种重要的修辞手法,在中国的文学作品中广为出现,但是在英语中却没有类似的表达
日本高技术的应用越来越广,正从其他行业向住宅领域渗透,许多研究团体和组织,正在大力加快这方面的工作,市场上已出现“高技术住宅”类材料、部件和设备。作者对此作了几个方
2011年1月18日,商务印书馆举行"2011中青年语言学者沙龙",议题为虚拟语言生活。来自教育部语信司、中国社科院语言所、中国社科院民族所、教育部语用所、北京大学、清华大学、北京师范大学、中国人民大学、北京语言大学、北京外国语大学、中央民族大学、中国传媒大学、首都师范大学、北京邮电大学、天津市语委、南开大学、武汉大学、渤海大学
【正】 1月13日至15日,全国劳动和社会保障工作会议在北京召开。会议的主要任务是,深入学习贯彻中央经济工作会议和国务院国有企业下岗职工基本生活保障和再就业工作会议精神
2018年的"雷声”尚未消散,2019年的“雷声”竟又响起。从康美药业、东阿阿胶、承兴国际控股再到近期的精功集团,大批企业被爆出财务造假、业绩亏损、债务违约等问题,可谓是振
本文通过对长沙市家政服务业的现状分析,着重阐明了家政服务业的发展趋势。
目的探讨人源性乳酸杆菌的生物学特征,并对分离的人源性乳酸杆菌进行优选。方法对43株产过氧化氢(H2O2)乳酸杆菌利用CH-50L细菌鉴定系统进行鉴定,测定其培养液的pH与H2O2浓度