基于叙词表词间关系的领域信息检索

被引量 : 0次 | 上传用户:ddd12322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
叙词表是由从自然语言中优选出来的语义相关、族性相关的科学术语所组成的一种规范化词典。它是文献标引与情报检索过程中,用以将文献中及标引、检索人员所用的自然语言转换为统一的系统语言的一种术语控制工具,曾在传统信息检索中取得了巨大成功。20世纪90年代以后,随着互联网技术的迅速发展和普及,信息环境发生了根本性转变。传统叙词表的编制方式、表现形式及使用模式都不再适用于网络化的信息环境,也无法满足用户新的信息需求。但在以搜索引擎为代表的网络信息检索系统逐渐暴露出缺点和不足的情况下,传统叙词表的网络化转变及其在网络信息检索中的应用研究开始成为信息检索领域的研究热点。本文在对网络信息检索系统现状和叙词表进行深入理论研究和调查分析的基础上,设计了一种基于叙词表词间关系的领域信息检索方法体系,以探索将叙词表词间关系引入网络信息检索中的有效方法。该方法结合了受控语言——叙词法与自然语言——关键词法,借鉴查询扩展和加权检索的思想,基于叙词表词间关系,设计了一个网络信息扩展检索和结果相关性排序方法体系,希望为用户提供更准确的检索结果。与普通的网络信息检索系统相比,基于叙词表词间关系的信息检索方法更注重如何利用叙词表这一语义逻辑体系提高检索结果的准确性和相关性。为了验证该方法体系的可行性与有效性,本文在方法体系及各具体功能模块详细设计的基础上,利用C#和SQL Server实现了一个原型系统。然后选择《农业科学叙词表》中两个词量适中的类目范畴作为叙词表实验数据,分别以百度搜索引擎、万方数据的检索结果作为网页、文献的实验材料进行实验。实验具体分为两个阶段,首先是对扩展检索词的最优权值进行测定,然后是对相关性排序效果进行评价。实验结果表明,在叙词表的各种词间关系中,等同词和下位词能在一定程度上提高信息检索的准确率,而上位词和相关词几乎不能对准确率产生积极影响,应谨慎选用。此外,在具体的实验过程中也发现叙词表在真实信息检索系统中的应用还存在很多问题,需要不断对其进行改进和革新,使其更适应网络信息环境。
其他文献
渴望教育、追求知识是广大农民自发的心态,但它在与家庭经济状况、巨额教育投资、微小收益回报等经济因素相联系,在与教育动机、内容、体制等现实教育状况相联系,在与农村政
<正>先天性胆道闭锁是发生在新生儿的、由胆道闭锁引起的疾病,主要临床表现为梗阻性黄疸,其结果为胆汁性肝硬化,临床治疗首选于出生后6~8周内通过手术重建胆汁入肠的通道,如
本文的研究结果表明在岸市场依然具有人民币汇率定价中心的性质,主要体现在在岸即期和远期汇率都会对离岸远期汇率的变动有显著的均值溢出效应。而离岸即期市场对在岸即期市
在过去25年上市的药物中,直接或者间接地来自天然产物的药物约占40%,这表明天然产物(植物,动物,以及微生物等生物体内的次生代谢产物)在现代药物研究中具有重要意义。作为天
正确分离行、场同步脉冲信号和消隐脉冲信号是视频图像得以正确显示的关键。目前分离标准复合电视信号多是用硬件电路实现,如专用电子集成芯片LM1881等,而对于非标准的电视图
<正>近年来,剖腹产率呈逐年增长趋势,瘢痕妊娠患者也明显增多[1]。瘢痕妊娠是很危险的异位妊娠类型,是孕卵在子宫手术后切口瘢痕上着床、发育,浸润破坏子宫纤维疤痕组织,因纤
以垂直升降电梯式立体车库为主要研究对象,通过研究立体车库垂直提升和旋转定位并行工作的控制方式,进行了升降机构控制系统的设计研究。介绍了垂直升降式立体车库的总体结构
产品拆卸是再制造工程中重要的环节,拆卸的好坏直接影响产品再制造性。通过研究Pro/Toolkit二次开发的方法,得到拆卸仿真系统开发的流程:建立产品拆卸模型,提取模型拆卸信息,
现代化系统的结构日趋复杂,功能日臻完善,达到高可靠性的难度也大大增加了。对产品的可靠性分析、设计,评估都是不容忽视的重要问题。如何提高电子设备的可靠性越来越引起了
随着对外汉语与华文教材研究的深入,插图已不再是教材中可有可无的点缀,而是辅助学生学习,构成教材内容的重要组成部分。我们认为有必要对具有代表性的华文教材中的插图进行