基于引文上下文分析的文献检索技术研究

被引量 : 22次 | 上传用户:huangcheng118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,科学文献越来越多的以电子化文档的形式存在于网络中,这不仅能够促进文献的传播与推广,更能促进科学研究水平的发展,使研究者达到“站在巨人的肩膀上”的目的。然而,大量电子化学术文献的产生,不仅存在良莠不齐的问题,同时为文献管理提出了新的挑战,如何对文献进行有效的表示、筛选、应用,已经成为当今知识管理领域研究的热点问题之一。因此,本文将文本挖掘、信息检索等相关方法应用于文献检索技术的研究中,以引文分析方法为基础,利用引文上下文的相关语义信息,融合主题模型、排序算法、语言模型、网络图等理论,实现文献知识域可视化表示、文献排序算法的研究、文献检索模型的构建等,并选取相关学术论文数据对各个知识点进行实验验证。本文的主要研究内容可以包括:1.基于引文分析法提出一种引文概率分布距离的计算方法,并将其应用于文献知识域可视化的研究中。2.抽取引文上下文的文本信息,利用Labeled-LDA主题模型获得有向、加权引文网络中顶点权值与边权重两个先验概率,改进传统PageRank算法,实现基于引文上下文的文献排序方法(Context-Based Ranking Algorithm, CBRA)研究。3.将基于引文上下文的排序方法应用于作者权威度的分析实验中,针对每个主题建立相对应的作者权威度排名,并利用作者权威度信息改进文献排序结果,这样,文献排序不仅基于网络链接,同时考虑了作者权威度的影响因素。4.利用基于引文上下文的排序方法改进传统的基于语言建模的信息检索模型,利用系统开发的思想构建与主题相关的文献检索系统。5.将基于引文上下文的排序方法应用于段落检索研究中,构建基于主题的段落检索模型,从而提高传统文献检索的准确率以及有效性。
其他文献
<正> 在科学研究中,方法论问题是最根本的问题。任何一次科学的发现或创新,实质上都是研究方法上的变革。语言科学的发展同样依赖于研究方法的更新或变革。西方语言研究的历
利用大连地区雨量和气温资料,通过多年平均降水量等值线图法、代表站数理统计法,从大连地区降水量地区分布规律及规律性改变分析入手,论述"雨岛效应"产生成因及地区形成机制
目的:通过针刀治疗颈椎病前后热成像图谱的研究,为针刀治疗颈椎病疗效评价提供有效的影像学方法,验证针刀疗效。材料与方法:将120例符合纳入标准的颈椎病患者随机分成2组,第1组(60)
网络技术的广泛应用使得网络教学作为一种新兴的教学模式迅速发展起来。它解决了传统教育在时间和空间上的一些困难,提供了更便捷的学习方式、多样的学习环境和丰富的学习资
国际货运代理是服务性行业中的一种类型,国际物流服务中不可缺少的元素,在国际贸易运输发展过程中起着非常重要的作用。国际贸易的蓬勃发展,给全球国际货运代理行业带来种种机会
文艺复兴是西欧中世纪历史上的重要思想运动 ,在西欧社会经济和政治发生重大转变和飞跃的时期 ,都会伴随出现复兴古典文化为特点的思想文化运动。然而 ,由于社会历史发展阶段
电视环境处于家庭环境和社会环境的交叉点,经常容易受到人们的忽视。笔者从积极作用和消极作用两方面系统地分析了电视环境对儿童发展的影响。通过长期调研反映出中国儿童电
行政伦理责任在政府的政治责任、法律责任和行政责任中居于核心地位,是现代责任政府建立的根本要求。笔者论述了行政伦理责任在公共行政中的重要地位,并对行政伦理行为选择的
SERVQUAL在期望测量中预期"标的"模糊,期望测量没有完整反映期望的概念,差距计算无意义,模型结构不合适;针对这些问题,提出SERVQUAL的改进测量模型M-SERVQUAL.该模型应用修正
高丽人迁入东北主要在蒙古汗国时期。元朝对于迁到辽阳行省腹地的高丽人,采取聚族而居单独建置的方式进行统辖,先后设置高丽军民万户府(后改称安抚高丽军民总管府)、高丽军民