论文部分内容阅读
科技期刊评价的主要目的是促进科技期刊健康发展,影响因子是评价科技期刊的重要工具,期刊影响因子的高低直接影响学者的投稿和图书馆期刊的选购。目前,某些期刊通过操纵非正常引用,而达到提高影响因子的目的,这种行为带来的严重后果是影响科技期刊评价的公正性和客观性。如何应对期刊操纵这一不良行为并消除其不良影响,是本文要解决的问题。为此,本文从以下两个方面对其进行研究:首先,本文研究了采用可靠性影响因子是否能抵消操纵行为的问题。依据Kuo & Rupe 2007年提出的可靠性影响因子的概念和累积引文分布模型,建立了影响因子和可靠影响因子的数学表达式,仿真分析了影响因子操纵过程中影响因子和可靠性影响因子的变化过程,发现可靠性影响因子可以部分抵消人为操纵行为的影响,理论上验证了可靠性影响因子对原有影响因子有一定修正作用。在此基础上,从期刊引证报告(JCR)数据库中,收集了4种正常期刊和4种异常期刊2000-2007年的影响因子和被引半衰期,计算了每个期刊的可靠性影响因子和近两年自引率,分析了操纵行为对影响因子和近两年自引率的变化特征,分析了可靠性影响因子作为期刊评价指标的优点。但是,实证分析不能得到可靠性影响因子的抵消行为很好的验证,必须寻找操纵行为的识别方法。其次,影响因子操纵行为的模式识别方法研究。收集了1998—2007年的10种正常期刊和8种异常期刊影响因子、被引总数、近两年的自引量等数据,对能描述期刊自引操纵行为的特征值进行提取和预处理,同时,为了扩容数据样本,对数据做一下重采样。然后,借助MATLAB工具,运用k-近邻分类器对数据进行训练、测试,根据得到的模式识别结果分析这种方法的准确性。在发现识别结果达到了理想效果后——分类器的识别结果在99%以上,可以看出,模式识别方法可以很好的识别期刊操纵行为。最后,利用该方法,从JCR中随机收集若干种期刊进行操纵行为的实证研究,观察和分析识别结果,从而检测模式识别方法在实际应用中的有效性和准确性。