非相关文献知识发现系统研究与实现

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:suzuzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技的发展和通讯技术的应用使得信息呈指数增长,信息激增和知识分裂使得人们获取知识变得困难,而获取隐藏于文献中的表面上没有关联的知识则更加困难。至上世纪中叶,情报工作者已经开始对知识分裂进行研究,直到1986年美国芝加哥大学的Don R.Swanson教授经过一系列研究提出了基于非相关文献的知识发现研究方法,为挖这种掘隐藏于文献中的知识提供了一盏明灯。非相关文献知识发现系统的开发,人们将繁琐冗杂的文献处理交给计算机,计算机将处理结果返回,提供最有可能的提示,节省了人们大量的时间和精力,推动了非相关文献知识研究方法的应用。首先,本文系统的归纳了现有的中英文非相关文献知识发现软件,通过对比分析,总结其中的有待改进之处。然后,本文以一套全新的思路为指导,对非相关文献知识发现继续研究。针对现有的非相关文献知识发现系统多以单种语言、医学文献为数据集,缺乏成熟的公开使用的系统,本文提出研究并设计一套适用于中英文文献、无学科限制、普遍适用的非相关文献知识发现系统。中文分词问题是中文信息处理的一个热点;文献中存在大量的无实际意义或与研究无关的词;自然语言广泛应用,使用自由、灵活给信息处理带来了困难,存在表示意义宽泛、模糊,可代替性的词语;非相关文献知识发现的目标是发现能揭示主题关联的中间词和目标词,而通过计算得出较多的中间词和目标词。因此在系统研究过程中,着重讨论了中文分词解决方案、词汇过滤、同义词控制和中间词与目标词的选择。接着,设计并实现非相关文献知识发现系统,设计系统的总体模块结构,并逐模块分解,给出各模块的功能说明,接着实现系统并简要的介绍系统。最后,测评系统的非相关文献知识发现效果。为了保证测试的有效性,测试结果必须是真实可信的、具有说服力。本文复现Swanson(?)口识发现,通过与Swanson(?)口识发现结果对比说明系统非相关文献知识发现效果。中文测评数据来自于中国期刊网1979年至2006年全文数据库生物医药卫生领域的文献,英文测评数据来自PubMed数据库1960年至1980年的医学文献。通过应用本系统,无论中文医学数据集还是英文数据集在开放式过程和闭合式过程都发现几乎全部镁和偏头痛的中间词,发现了鱼油和雷诺氏病的全部中间词。在为发现的中间词中,还有些是数据集中根本不存在中间词和开始词或目标词共现的文献。因此,通过测评结果证明了系统有较好的非相关文献知识发现能力。
其他文献
翁方纲是我国清代著名的经学家、金石学家、诗人、学者,也是四库馆臣之一,他的《四库全书总目提要稿》是研究《四库全书》以及《四库全书总目提要》的重要参考文献。目前,学
近年来,全球经济一直复苏乏力,主要经济体需求萎缩,宏观经济下行压力加大,大宗商品价格深度下跌,国内钢铁、煤炭等产能过剩问题显现,企业效益大幅下滑,甚至亏损严重,企业流动
鸭坦布苏病毒病也称为“鸭黄病毒病”,2010年春季开始在我国主要蛋鸭养殖区传播,是一种新的禽传染病。该病临床表现为蛋鸭采食量减少,卵泡变形、变性,卵泡膜出血、充血。产蛋鸭发
目的:探讨中西医结合治疗慢性咳嗽的临床效果。方法:以本社区门诊2016年6月-2017年6月接诊的80例慢性咳嗽患者作为观察研究对象,随机分为西医治疗的对照组(n=40),以及中西医
随着网络和计算机技术的发展,流媒体自1994年出现在互联网后便引起了学者和广大用户的关注。高新技术不断地运用于社会各领域,作为文献信息资源与服务中心的传统型图书馆也正
随着单片微机在各个领域中的应用越来越广泛,对其可靠性要求也越来越高。单片机系统的可靠性由多种因素决定,其中系统抗干扰性能是可靠性的重要指标。本文介绍了硬件及软件单
目的探讨大蒜素对大鼠局灶性脑缺血后热休克蛋白的影响.方法用线拴法建立大鼠大脑中动脉栓塞(MCAO)模型.50只大鼠随机分为5组,每组10只:假手术组、缺血组、大蒜素小剂量组、
目的:探讨隔药灸脐联合络活喜治疗高血压肝阳上亢证的效果。方法:本次研究选择100例患有高血压肝阳上亢证的患者当做研究对象,按入院顺序分为甲组和乙组。所有患者均通过络活
随着市场经济的发展,食用菌产业已逐步成为一个出口创汇、繁荣城乡经济和农村脱贫致富的重要行业.但在大面积袋栽食用菌过程中,菌棒杂菌污染一直严重威胁食用菌产业的发展.为