基于文献相似度的系统评价引文筛选系统的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hao8035
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统评价是循证医学非常重要的证据基础,它对于临床治疗、诊断测试和风险分析等都具有重要的参考价值。筛选参考文献是系统评价一个的步骤,通常需要至少两名专家进行人工审阅。由于医学文献数量的快速增长和医学数据库搜索引擎的特异度较差等问题,使得筛选参考文献成为了一个耗时耗力的过程。许多研究表明使用自动文本分类技术可以极大减少专家人工审阅文献的工作量。本文提出了一种基于文献相似度的系统评价引文筛选算法。该算法针对现阶段基于机器学习的自动文本分类算法存在的数据集不均衡和结合主动学习的机器学习分类算法训练初期数据不足等问题,通过使用文献的标题、摘要和出版类型等信息来计算文献之间的相似度,根据专家的文献筛选情况和文献之间相似度对文献进行优先级的排序以达到加速引文筛选过程的目的。本文使用LDA(Latent Dirichlet allocation)主题模型分别构建了标题和摘要的特征向量,使用词袋模型构建出版类型的特征向量,通过计算特征向量之间的余弦值来衡量文献之间的相似度。为了验证本文算法的有效性,本文基于Cochrane图书馆(Cochrane Library)提供的数据构建了十个主题的系统评价引文集作为测试数据,对比了系统评价引文筛选领域的另外两个经典算法结合主动学习的支持向量机分类算法和结合主动学习的朴素贝叶斯分类算法,结果表明在使用标题和摘要分别作为输入时,本文算法的WSS95分数比其他算法都要高出20.09%以上,而在使用出版类型作为输入时,本文算法的WSS95分数仅比其他算法低1.93%,证明了本文提出的算法可以有效减少专家进行系统评价引文筛选的工作量。本文设计并实现了一个系统评价引文筛选系统。该系统的主要功能是协助用户进行系统评价引文筛选,并给出了文献的优先级分数,作为用户停止文献筛选的一个参考值。为了方便用户查找文献,系统实现了文献检索功能,可以使用文献的不同元素信息进行相似主题文献的查找。系统还对用户的文献进行了同一的存储管理,方便用户使用该系统保存和管理文献。
其他文献
近些年来,慕课发展潮涌全球。随着慕课在我国的几何式增长,我国参与慕课学习的人数已经跃居全球第二位。与发达国家相比,我国慕课发展在数量上虽不逊色,但慕课中国化的发展进
目标管理是现代科室管理必然的发展方向,为探索以目标管理为基础,加强优质高效的护理管理,以提高医院护理工作效率,文章以目标管理的实质、实施的必要性为出发点,简要探讨了
采用中医辩证分型治疗隐匿性隐炎(包括无症状性血尿及无症状性蛋白尿)31例,结果显效11例占35.5%,有效16例占51.6%,无效4例占12.9%,总有效率87.1%,疗效较为满意。
目的:探讨P F N A治疗在老年股骨粗隆间骨折患者中的应用效果。方法:筛选我院在2017年5月至2020年3月收入的老年股骨粗隆间骨折患者进行研究,总例数为40,将其按照入院先后的
Sirtuins是酵母Sir2蛋白在哺乳动物中的同源蛋白家族,是一类进化高度保守的NAD+依赖的去乙酰化酶。因最初发现Sir2具有延长酿酒酵母寿命的作用,因此Sirtuins又被称为长寿蛋白
先兆流产与习惯性流产,在妇产科临床上发生比例逐年增大.作者宗"塞流、澄源、复旧"之法,按中医妇科学"胎漏"、"滑胎"病,以胶艾汤为主方,"固冲任,调气血,保胎元"治疗,每每奏效
目的:探讨新的教学查房模式,提高护理临床教学查房的质量。方法:将60名本科护生按实习时间分为对照组(30人)和实验组(30人),对照组采用传统教学查房方法,实验组采用护生主查式教学
笔者用大黄五倍子膏外敷治疗带状疱疹42例,治愈率100%.显示本疗法疗效可靠,且使用方便,疗程短,费用低,值得临床推广.
中华人民共和国是世界上第三大食品出口国,也是构建国际食品安全法制度的焦点。本文的研究目的是证明其有义务提供健康和安全的食品。对中国而言,这一义务既来自于国际人权法,又来自于世界贸易组织制度。本文认为,要实现总体食品安全这一目标必须实现法律规制与国际标准的统一。本文的研究将结合欧盟的食品安全体系,以中国食品安全法律体系的历史为例进行分析。尽管随着改革和现代化的加速,中国在过去几年中进行了法律改革和社