基于词汇功能的学术文献引文推荐研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:chunyu1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着学术文献数量的飞速增长,科研工作者进行文献调研、确定相关研究成果变得越来越困难。引文推荐能够针对某一具体的研究主题和学术文献,自动地为其推荐合适的相关成果和引文,借助于引文推荐,用户可以在一定程度上提高撰写学术文献的效率,降低对重要相关文献的遗漏。相比于传统只考虑文本相似度、引文计量指标、引文网络等有限因素的文献推荐,引文推荐充分利用文献内容和引文内容信息,能够提供质量更高更加多样化的推荐结果。引文推荐是一个较新的研究方向,但近年来受到学者的关注也取得了一些研究成果。本文首先对国内外引文推荐相关研究进行了全面梳理,从引文推荐的动机、分类、方法、评价、引文推荐系统、引文推荐研究热点和难点等方面对引文推荐问题进行了介绍。本文旨在从词汇功能语义角度对引文推荐问题进行探索。具体的,本文首先基于已有成果对词汇功能进行界定,将科研文献中的词汇功能区分为研究问题、研究方法、研究问题+研究方法、研究方法+研究问题、数据集、评测、工具、应用和主题不相关等九个方面,然后对信息抽取、情感分析、推荐系统三个领域共531篇学术文献相关研究段落进行了词汇功能标注,对标注结果的统计分析发现:研究问题、研究方法、研究问题+研究方法、研究方法+研究问题四种相关研究组织模式占比接近90%,故最终将段落词汇功能区分为这四类。并基于此提出本文的推荐框架,并在ACLAnthology部分数据集上开展了引文推荐实验。由于段落层面的引文推荐还未有研究涉及,故本文选择引文推荐最常用的方法之一 BM25模型作为Baseline实验。同时,本文首次提出用词汇功能语义特征对推荐结果进行加权,在BM25模型的基础上进行了两组对照实验。实验结果显示,当推荐列表设为10时,考虑时序因素的BM25F1值为18.5%;考虑时序因素的词汇功能加权BM25F1值为24.5%,推荐效果提升了近6%,在召回率上最高达到了 74.5%,说明词汇功能对引文推荐有比较显著的增强效果。本文的实验证明了词汇功能对于引文推荐的有效性,为引文推荐效率的提升提供了新的思路,本文在段落层面进行引文推荐还有助于文献综述的自动生成。
其他文献
圆碟形水下滑翔机是一款具有新概念外形设计形式的水下滑翔机,采用了绕中心轴全对称的机身结构,这种设计带来的变化是在于转向能力的提升,不再需要滑翔机作长距离的回转运动,
基因定点编辑技术为植物功能基因研究和作物遗传育种提供了重要的技术支撑。CRISPR/Cas9基因编辑系统作为当前最热门的基因编辑技术,其作用原理主要由sgRNA靶向目的DNA序列并
近年来,随着云计算、社交网络服务、流媒体等新兴应用和服务的发展,给互联网流量带来了极大的增长,数据中心正面临着巨大的变革。当前数据中心网络(DCN)通常部署的是基于商用电交换机来构建的多层胖树(FatTree)拓扑架构。由于受到半导体电路集成度的限制,DCN中使用的电交换机面临着带宽瓶颈;同时,由于多层电交换网络以及大量光-电-光(O/E/O)转换的使用,引入了很高的能耗和很大的延迟。这些限制因素
在石油化工、机械人控制、液体输送、恒温锅炉和污水回收等工业过程中,控制目标如液位、流量、温度、压强等受操作装置、外界环境变化以及人为操作控制等因素的干扰,主要影响为时滞环节导致的被控对象不同步反应,对响应时间,响应峰值甚至系统稳定性带来干扰,导致整个系统无法快速稳定甚至发散。自抗扰控制器(ADRC)通过扩展状态观测器(ESO)观测设定值和实际值之间的差异来实现对干扰的估计,并且实现自动补偿的效果。
研究目的:本文通过观察长期补充氢气对大强度运动大鼠运动能力、氧化损伤、抗氧化、肠屏障等指标的影响,明确其改善作用及最佳补充剂量;再进一步从Keap1/Nrf2/ARE信号通路和
移动数据的爆炸式增长,正给传统的蜂窝通信网带来前所未有的压力和挑战。为了缓解通信链路的流量拥挤状况,边缘缓存技术已得到业内的重点关注。边缘缓存就是搭建具有大容量存
目前L-CNG加气站已进入快速发展阶段,因天然气属于易燃易爆物质,且具有低温特性,使得加气站各工况操作过程趋于高强度化和专业化,一旦操作失误,后果严重。这也导致高校学生失
目的:了解心房颤动患者血清ROCK1的表达水平;探讨心房颤动患者术前血清ROCK1表达水平在预测射频消融术后的晚期复发中的价值。方法:选取2018年03月至2019年04月入住皖南医学
目前我国的人口红利已经收效甚微,推动技术创新是迫在眉睫的事情,我国政府深刻意识到了技术创新的重要性,提出了技术创新是国家发展战略的核心,而中国技术创新的大小是取决于
当前我国企业的研发投入强度较弱,不同所有制类型的企业在研发行为上存在明显的差异,国有企业与非国有企业在为研发活动提供外部资金支持的金融市场上也具有截然不同的融资地