基于引文网络图模型的论文推荐系统研究与应用

来源 :云南师范大学 | 被引量 : 2次 | 上传用户:zkc19890314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于当前科研的不断发展,大量论文的出现使得科研工作者在进行论文研读时会产生一定的困扰,论文推荐系统可以很好的解决此类问题。因此本文提出了基于三层引文网络的图模型以及相应推荐算法。在三层引文网络图模型中结合了论文内容特征信息、论文引用关系、作者的合著关系以及论文的研究领域信息多种论文特征。本文主要研究工作如下:(1)对论文推荐系统以及相应算法进行一定的研究,了解相关领域的研究现状并进行综述。总结论文推荐系统以及引文网络中的理论信息,为后续的模型构建、算法应用以及推荐系统的实现做好理论基础。(2)构建了三层引文网络图模型。目前,大多数引文网络模型仅采用单一特征模型且未涉及到论文的研究领域信息。因此,本文将论文引用关系、论文内容特征信息、作者合著关系以及论文研究领域信息融入到该模型中。利用AMiner上的DBLP-Citation-network数据集,首先提取数据集中论文、作者以及研究领域信息;其次根据论文之间的引用关系建立论文引用网络,根据作者之间的合著关系建立作者合著网络;最终根据三者的关联关系建立三层引文网络图模型。生成的三层引文网络图模型将作为后续算法和推荐系统原型实现的数据模型基础。(3)提出了基于三层引文网络模型的论文推荐算法。将上述提出的三层引文网络图模型与重启随机游走算法相融合,形成本文的论文推荐算法(PAFRWR)。本文通过recall@N与NDCG@N的值作为评价指标值,首先对比不同重启概率下的评价指标值,确定了PAFRWR的重启概率参数=0.3。再通过对不同搜索向量的实验对比,确定当搜索向量包含论文、作者和研究领域三重信息时,评价指标更高。最后,将PAFRWR算法与PageRank、LDA和Link-PLSA-LDA进行对比实验,实验结果表明,PAFRWR算法的评价指标值优于其他三种方法。(4)设计并实现了基于三层引文网络模型的论文推荐原型系统。结合本文提出的模型和算法,介绍系统整体框架以及主要模块设计,本系统采用Python语言进行系统开发,借助XmlRPC模型,将推荐模型转化为RPC服务,最终通过以上技术实现该系统。
其他文献
<正>青花瓷器是中国陶瓷史上的一枝奇葩,长期享誉世界。许多青花瓷既是日常生活用具,又是精美的艺术品,给人以美的享受。由于青花瓷独具特色的优点,一经问世,就受到了人们的
共轭亚油酸(CLAs)是一类具有生理活性的多不饱和脂肪酸,是亚油酸衍生的共轭双烯酸的多种位置和几何异构体的总称。CLAs的9c,11t,9t,11t-和10t,12c-CLA三种异构体被证实能促进
长沙市试行"两考合一"考试政策多年,地理学科与语文、数学、外语学科一样被列入"两考合一"科目,走在全国课改前列。2017年长沙市中考地理试题特点可以概括为"一个亮点""两个
伴随着信息技术的飞速发展,企业数字化转型已成为提高服务型企业竞争力的重要途径。服务型企业能否顺利实现数字化转型,会受到企业外部和内部诸多因素影响。目前,对数字化的
目的本研究旨在通过分析广东省糖尿病的流行现状、危险因素及危险因素的影响因素,明确广东省糖尿病危险因素干预的优先问题和重点人群。同时建立该人群的糖尿病风险预测模型,
长久以来,我国对数字化教学资源建设的研究以政策剖析和理论建构为主,而对于真正要使用资源的一线教师的需求研究较少,进入教育信息化2.0阶段,资源的用户体验俨然已经成为教
本文从调研反馈材料入手,具体分析了河北省行政审批制度改革存在的三方面问题及出现这些问题的主客观原因,并在结合河北省省情和借鉴省外经验的基础上,提出了六条具体建议.
结构优化是用系统的、目标定向的过程与方法代替传统设计,在满足某种或某些约束的情况下获得造价更低、性能更佳的结构。随着结构优化理论的不断丰富,结构优化进一步发展为:
马克思主义理论的核心为马克思主义德育思想指明了基本方向和路线,马克思主义吸收了德国古典哲学、古典政治经济学和欧洲空想社会主义理论等的精髓,将唯物主义和辩证法有机结
聚酰亚胺具有优异的耐高温性能,但其熔融、加工性能较差,限制了其广泛应用。通过在聚酰亚胺分子结构中引入柔性基团、设计分子结构的异构化等方法,可制备热塑性聚酰亚胺,使得