基于句法分析的文献核心知识抽取方法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:ALIMHL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术文献中蕴含了大量具有学术价值的核心知识点,对学术文献中的核心知识的抽取有利于学术知识的利用。本文针对学术文献的结构和语言使用的特征,提出了一套基于句法分析的文献核心知识抽取方法,可以有效地对学术文献正文内的核心知识块进行抽取。本文提出了一种基于句法分析的文献知识关联度算法,将句子中的实义词集分成核心词集与其他词集来表示文献的知识,通过计算句子间不同类型词集出现的词耦合对数计算句子之间的关联度,以此构建文本网络。提出了基于章节的权重算法,以章为单位利用各章之间的词耦合计算各章的权重,加权计算句子的点度中心度,抽取文章的关键句子。以关键句子为中心,提出了一套知识块识别方法,分别从语言相关性和知识相关性向上文和下文进行扩展,抽取出文章的核心知识块。本文以10篇学术文献为样本进行实验,并对实验结果进行了讨论分析,抽取出的核心知识块准确率为87%,知识块识别效率为68%,人工评价得分为65%,达到初步预期效果,基本可以完成研究任务。
其他文献
文本是存储和交换信息的最自然的方式。相关研究表明,现实中80%的信息包含在文本文档中。随着计算机技术的不断进步,数字化文本数据不断增长。如何对海量的数字文本资源进行有效
科技的快速发展推动社会进入信息爆炸和快速消费时代,人们迫切希望从海量信息中获取感兴趣的内容。对科研人员来说,快速定位相关文献和科研信息尤为重要。文本相似度是解决该问
在互联网大数据时代,信息以前所未有的速度剧增,给情报人员带来了前所未有的挑战,促使情报分析和处理对象日益向着精细化方向发展。实体是细粒度的知识单元,是情报处理的基本单元
农村社区图书馆(室)是整个图书馆体系中重要的一环,也是农村文化建设中不可缺少的一部分。云南地处边疆,集边境、民族、山区、贫困于一体。最近几年,随着全省经济的快速增长,社会
期刊
采用神经电生理学与运动心理学相结合的方法,记录安静状态、运动表象、过度换气诱发试验和恢复期的脑电信号,对我国14名健将级优秀女子射箭选手的赛前脑电地形图指标进行了分
新年伊始,本刊的改版“产品”——《图书情报工作》(文中简称《工作》)2009年第1期(半月刊)已呈现在大家面前。“产品”质量究竟是优还是劣,是好还是坏,任有读者来检验。我们
以上海城市中心图书馆为主要案例,分析城市总分馆及一卡通服务发展中面临的采访编目标准化,物流配送社会化,网络服务规范化,通借通还一体化,人力资源专业化,组织文化行业化,
结合厦门市图书馆总分馆建设实践,介绍直管型、托管型、联办型和加盟型等4种分馆建设模式及其优劣,并对总分馆建设实践进行思考,提出推进公共图书馆网络建设要发挥政府的主导
以东莞构建城市图书馆服务体系的实施战略、实施过程和实施效果为例,探讨图书馆集群化管理的理论与总分馆制的实现方法,以期为正在发展的城市图书馆服务体系建设提供参考.