面向科技文献自动摘要的科研事件抽取研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:chunling329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技文献一直是情报学领域研究的重要对象之一。科技文献是包含有专业语义信息的非结构化文本,如果能将其结构化或者部分实现语义表示,有助于提高用户对科技文献的阅读与理解效率。  本文的核心目标是利用事件抽取技术对科技文献实现结构化自动摘要。本文首先提出了“科研事件”这一概念。与传统中句子级元事件抽取不同,科研事件将“事件”这一对象的范围从句子扩大到篇章,即不再将单个的句子看作一个事件,而是将一篇科技文献抽象看作一个为事件。科研事件假设科技文献文本中的句子都有一个事件要素角色类别属性,例如一个句子可能主要描述方法内容,也可能是描述文献背景内容等。科研事件抽取的目标就是识别文献中各个句子所属的事件要素类别。对科技文献文本中的各个句子进行事件要素类别识别的基础上,利用自动摘要相关技术得到每个句子在文本中的重要程度,最后选取各个事件要素类别下重要程度最高的句子组成最终的结构化自动摘要。  本文主要内容分为三部分,第一部阐述了科研事件抽取相关内容,包括科研事件定义与框架设计、科研事件要素触发词库自动构建、以及基于触发词的科研事件要素识别。第二部分为自动摘要技术相关内容,阐述了基于科技文献特征线索词与TEXTRANK的自动摘要方法,最后结合科研事件抽取结果得到最终结构化自动摘并给出了详细的实验步骤与测评结果。
其他文献
学位
知识是促进社会生产力发展和经济增长的驱动力。伴随着知识经济的迅速发展,知识资本作为创新主体间相互竞争的一个强大武器,给企业带来了巨大的经济效益。知识创新和技术革新是
本文阐述了科技查新工作中查新人员和客户之间的工作关系 ;继而指出了客户在查新工作中的义务和作用 ;最后 ,就搞好查新工作提高查新质量问题提出了几点建议。 In this pape
学位
课外阅读是小学语文教学中一个非常重要的组成部分,它既是与语文教学知识的有机融合,又提供了很好的发散思维的空间,更对培养学生的语文功底有积极作用.本文围绕小学语文教学
现阶段,人们越来越重视孩子精神方面的发展,其中书法已经成为人们喜欢的艺术形式.我国在小学阶段开设了书法课程,书法教师不仅仅需要注重书法技巧的传授,还需要在教学过程中
随着第三次产业革命的兴起,科技创新的理念和实践在不断进步,世界主要国家为形成新的经济增长点、发展新兴产业,均大力实施了不同程度的科技计划管理体制改革。欧美等发达国家和
如何在海量科技文献环境下提供有效的知识服务,已经受到了国内外学者与企业界的高度关注与重视。为此,作为持有海量文献资源的数字图书馆,正在逐步发展为一个全球化的知识引擎,以
知识是推动经济社会进步的关键动力,高校是新知识的重要来源。知识流动体现了知识的价值,高校知识流动能力在一定程度上代表了高校的科研水平。专利知识作为高校科研产出的重要
虽然小学阶段的英语学习内容比较浅显,都是一些基础部分,但是对于小学生而言,英语是一门基础性的实用科目.掌握英语技能,对于小学生未来的发展而言具有十分积极的作用,尤其是