基于分布式图模型的学术论文推荐算法研究

来源 :延边大学 | 被引量 : 0次 | 上传用户:yang2shuo7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据处理方案已经出现在各行各业当中,对数据有效地处理和存储是大数据时代的基本要求。推荐系统就是大数据时代衍生出来的一项重要技术。学术论文是科学研究者交流学术思想和科研成果的主要工具,是一种重要的研究资源。在学术论文推荐领域,推荐系统通过对用户的历史记录、行为反馈等信息进行分析,挖掘出用户潜在的需求,并向用户推荐需求领域内相关的内容,帮助研究人员在数千万的文献中找出可能需要的论文,使用户查找论文的过程变得简洁和方便。图模型是对现实数据以“图”结构的方式进行的抽象表达,而图算法是驱动在这种结构上的计算模式。对于存在较强依赖关系的论文数据,图模型是直观地体现它们之间关系的有效方式。本学位论文采用图模型结构表示方法,提出了一种基于分布式图模型的学术论文推荐算法。首先,针对论文数据良好的结构类型信息,分别进行题目、摘要、引用关系特征的提取,针对每一特征构建论文关系图模型。该模型能够合理地表达不同结构类型之间的关联性。然后将用户操作信息引入该模型,构建用户-论文两层图模型。其次,提出一种论文质量评价方法,该方法是对PageRank算法的一种改进,通过用户-论文两层图中顶点的关联程度,计算每篇论文的重要程度,并将该算法与SVD++算法进行融合,形成一种基于层次馄合的图推荐算法PRSVD++。该算法能有效地解决推荐精度低下的问题。最后,以Spark分布式计算平台为实验环境,利用GraphX图计算框架实现上述算法,在4个节点的分布式环境下的运行时间比单机下运行时间节省了28.1%。利用该环境基于内存计算的特点,有效地解决了针对大规模数据算法的可扩展性问题。实验结果表明,本文提出的基于分布式图模型的学术论文推荐算法的召回率、F值和覆盖率高于常用的推荐算法,验证了层次混合图推荐算法的合理性和有效性。
其他文献
为探索领悟社会支持对大学生学业成就的影响机制,采用应对效能问卷、领悟社会支持问卷、学业成就问卷调查了957名大学生(平均年龄为20.10岁,SD=1.67)。结果表明:应对效能存在显
<正>我们前面谈到,初期佛教的时代大体为公元前531年至公元前380年,约150年左右。在这150年中,前45年是释迦牟尼创立宗教并亲自领导教团的时期。其后约40余年,是释迦牟尼的两
<正> 今年5月28日至31日在上海举行了“发展中国经济伦理”国际研讨会。这是首次在中国内地举行的经济伦理国际研讨会,主办者为上海社会科学院经济伦理研究中心,得到上海市委
本文以泉州医学高等专科学校《儿童护理》课程为例,从教学目的设计、教学内容安排、组织形式的创新等方面出发,对比传统教学与慕课教学,探讨了建构主义学习理论在慕课教学中
对比道德国情大调查2007年、2013年和2017年的数据,可以发现,近十年来中国社会道德状况的整体面貌获得了相对改善,但与此同时当前中国道德的精神素质又呈现出复杂情形,新问题
<正> 印度部派佛教的分立过程,属于印度佛教研究中争论较大的领域。由于北传与南传的史料有异,也就有不同的读解与结论。它牵涉到佛入灭年代究竟是何时,也关系到结集的内容,
【目的】针对当前联盟数据在进行知识发现过程中存在的问题,设计联盟数据可视分析系统模型,实现对历史信息的采集、挖掘和可视化分析。【方法】构建联盟数据可视分析系统模型
由古至今延续了126代的日本天皇史中,有一个女天皇代出的特殊时期。就其原因,日本学者普遍认为与皇位的交替有关。即是为了避免大规模流血冲突,保证皇位的和平交接。可为什么当时只
<正> 环形激光,由于它对于诸如旋转、气体或液体定向流动、轴向塞曼效应等一系列非互逆效应极为敏感,从而有希望成为角速度、角度、流量、磁场强度等相应物理量的精密测试新