一种基于启发式搜索的论文元数据提取算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:xiaozhao550
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大量的科研论文以电子文档的形式出现,为了高效地检索这些科研文献资料,从中精确地抽取这些论文头部的元数据信息显得十分有必要。在条件随机场模型的基础上,提出了一种启发式搜索算法来对论文头部的元数据信息进行提取。该算法首先利用文本分块技术和特征提取规则来对文本进行预处理,然后结合条件随机场概率模型利用启发式搜索来进行元数据的提取。实验结果表明,在相同概率模型的基础上,该算法有着较好的性能,在精确度和召回率方面都有了明显的提高。
其他文献
社会主义法治理念是社会主义制度下的法治理念,以公平正义为价值追求,以监督制约为内在机制。对于检察机关来说,要保障在全社会实现公平和正义,就必须强化法律监督职能。社会主义
本文探讨规模化种植的优化规划搭配方案 ,它是农业规模化种植获取高产、高效的重要因素之一 ,是农业现代管理方法研究的一方面。本文所用的动态规划模型 ,可对所有可能的方案
目的探讨卒中后抑郁患者的中医护理方法。方法将60例首次发生卒中及确定有抑郁障碍的患者随机分为对照组和观察组各30例,两组患者均常规进行神经内科药物治疗。对照组予常规护
准确把握中国高技术产业集聚的时空格局演变特征及趋势是科学制定区域战略性产业发展政策的重要前提。本文基于中国高技术产业1995—2016年间的数据,运用产业集聚指数(EG)、
羊食道口线虫病是由毛圆科食道属的几种线虫寄生在羊的大肠所引起的。食道口线虫的幼虫可导致寄生部位肠壁形成结节,严重影响羊群的健康发育。本文主要介绍了羊食道口线虫病
随着排球运动的发展,对扣球技术的要求越来越高,娴熟、快速、高超的扣球技巧,不仅是突破拦网,同时也是夺回发球权、反击得分的重要环节.因此,进行扣球技术的基本功训练,已受
成都地名文化资源丰富,大致可以分为政治文化类地名、经济文化类地名、社会文化类地名。目前,成都地名保护存在地名文化遗产保护制度缺失、地名文化遗产保护意识淡薄、“地名
在充分分析我国目前煤矿安全现状的基础上,提出了煤矿安全科技的发展方向,并指出了重点地研究领域和研究课题。
本文首先闸述了复合加工技术的含义,提出了广义复合加工技术的观点。特别是精密复合加工技术的慨念。然后论述了精密复合加工技术在数控机床发展中的作用和创新意义,认为它是解
高校教育需要培养的高素养的人才,要促进学生的全面发展,必须要重视体育教育.当前高校体育教学高校体育课程教学内容具有明显的片面性,内容较为陈旧,教学缺乏系统性和连续性,