论文影响力的预测方法研究

来源 :内蒙古大学 | 被引量 : 2次 | 上传用户:HGameG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
被引量是衡量一篇论文影响力的一个最直观的指标,高度被引用的论文表明它具有较高的学术影响力。为了紧跟科研的潮流,科研工作者不仅需要不断地阅读当前有影响力的论文,而且还需阅读那些在未来会有影响力的论文。预先识别有潜力的论文有助于研究人员选择合适的参考文献和研究领域,也可以为论文检索和推荐系统提供参考依据。因此如何从庞大的论文库中找出具有潜在有影响力的论文是目前研究的一个热点。目前已有的研究主要是在提取与论文、作者和出版地有关的特征后预测论文的影响力。但是当前的研究还存在很多的不足:(1)与学术网络相关的特征现在还没有得到充分地考虑;(2)在众多的特征中,并不是每种特征同等地影响论文的影响力,哪类特征能够显著地影响论文的影响力也没有得到详细的研究;(3)没有考虑进行特征选择,也没有验证特征选择是否可以提高预测效率。本文在已有研究的基础上,针对以上存在的不足,提出了一个新的论文影响力预测模型。该模型主要包括以下几个方面:(1)提取学术网络相关的特征,包括与作者、论文、出版地、论文引文有向网络、作者合著无向网络和出版地引用有向网络相关的特征;(2)使用神经网络模型分析每个特征的重要性并通过基于相关性的特征选择方法和基于特征分析结果的人工选择方法选出几组较优的特征方案组;(3)通过不同的预测方法(多层感知机、高斯过程回归、多元线性回归和支持向量机)预测不同时间段(3年后和5年后)论文的被引量,确定出较优的一个预测方法。本文使用ArnetMiner上的数据集进行了多组对比实验。实验结果表明支持向量机最适合用于预测论文的被引量。与已有的方法相比,本文中所使用的模型提高了预测准确率。
其他文献
随着市场经济的发展和农村产业结构的调整,户均0.1hm2桑园的传统植桑养蚕模式已制约着当前桑蚕生产的进一步发展.桑桑套作和大棚养蚕是适合当前规模经营的一种新型生产模式,
<正> 一、广食性蚕品种的育成家蚕人工饲料育研究的最初目的是探明蚕的营养需求,自从1960年日本蚕丝试验场进行全龄人工饲料育,并成功地使其产卵以来,许多研究人员进行了饲料
幼儿舞蹈的创编教学难度很大,需要学生具有一定舞蹈功底、教师具有相关理论实践,同时还需激发学生的创编兴趣。因此教师在进行幼儿舞创编教学的过程中需要以观察生活,捕捉幼
<正> 近年来胆甾醇升高是成年人一大病患,所以必须控制胆甾醇的摄取量。血液中胆甾醇慢性升高是动脉硬化主要原因,并由此而多发冠心病和脑血栓等病症。而除胆甾醇以外其他食
患者女性.66岁。因上腹部疼痛伴发现腹块一年入院.检查:一般情况差.慢性消瘦病容,巩膜无黄染。心尖搏动在右第五肋间隙.心率每分钟80次.未闻及明显杂音。上腹部稍隆起.似及3cm&#215;2
体育教育是小学生终身体育意识、习惯行为养成最重要的萌芽阶段。因此体育教师应通过科学合理的知识素养让学生从认知到感知,再通过实际操作,不断丰富体育活动的经验,学会体
麦克斯韦分布率是热平衡状态下的速度分布函数,本文从速度空间及概率的角度给出一种较为简明的数学推导.从原点引出矢量OP=v,v的三个分量为(vx,vy,vz),其可看作P点的坐标,以此