论文部分内容阅读
〔摘 要〕[目的/意义]论文发表时间和所属学科的不同会对论文在后续的引文产生稀释效应的影响,发生在不同时间的引文也代表了不同的学术价值。从时序动态的视角设计一种学术影响力的评价指标,消除稀释效应的影响并能够体现不同时期的引文价值。[方法/过程]引入参考文献集合的篇均被引次数作为论文集合的基准值,消除由于发表时间和所属学科不同造成的稀释效应,进而再对不同统计时间点的被引次数赋予不同的权重,用以表征发生在不同时期的引文的不同价值。[结果/结论]以四川大学为例,选取ESI学科和研究人员作为评价对象进行实证研究,结果表明这一指标可以对学术影响力发展趋势不同的研究实体进行有效的区分。
〔关键词〕时序动态;学术影响力;评价方法;实证研究
DOI:10.3969/j.issn.1008-0821.2017.11.012
〔中图分类号〕G304 〔文献标识码〕A 〔文章编号〕1008-0821(2017)11-0074-07
An Empirical Study on the Evaluation of Academic Influence from the Perspective of Time Series
Shu Yu Zhang Lili
(Library,Sichuan University,Chengdu 610065,China)
〔Abstract〕[Purpose/Significance]The difference between the time of publication and the discipline of the study will cause an effect on the dilution of the citations in the following citations.This paper designed an evaluation index of academic influence from the perspective of temporal dynamics,which could eliminate the influence of dilution effect and can reflect the value of citation in different periods.[Method/Process]The Average number of citations per paper of the reference set was choosen as a benchmark to eliminate the dilution effect caused by the publication time and different discipline,furthermore,different weights were given to the citations that happen on different statistical time points,which could be used to characterize the different values of citations in different periods.[Result/Conclusion]Taking Sichuan University as an example,this paper selected the ESI discipline and the scientific research personnel as the evaluation object to carry on the empirical research,the results showed that this index could effectively distinguish the different research entities with different academic development trends.
〔Key words〕time series dynamics;academic influence;evaluation method;empirical study
學术影响力的评价则是科研绩效评价中的一个主要组成部分,在学科、高校乃至国家层面的科研评价体系中发挥了极其重要的作用[1-2]。文献计量分析为学术影响力的测度提供了相应的定量指标,是对同行评议等定性评价方式的重要补充[3-4]。基于文献计量分析方法设计的定量评价指标可以分为综合性指标和单一指标两种方式[5]。综合性指标包括h指数、g指数、p指数等,而单一指标主要从论文的产出、质量、利用率等各个方面进行单一维度的评价[6-7]。综合性指标和单一指标在科研绩效评价中都得到的广泛的应用,但是往往忽略了对文献老化过程中引文变化规律的描述,由于论文的施引文献发生的年度代表了在不同时期被利用的情况,自然也就具有不同的价值,例如一位科研人员的论文引用文献逐年上升,而另一位科研人员的论文引用文献却逐年下降,显然这两位科研人员学术影响力的发展态势是不一样的,因此需要从时序动态的视角设计学术影响力的评价指标,使之能够真实的反映出文献在不同时期的引用文献的价值。学术影响力的动态评价指标多集中在综合性指标的改造上,Sidiropoulos A以与论文发表年度的时长呈反比的系数为权重,降低早期发表的论文的引文数量,再以修正后的引文数量定义了一种当代的h指数[10],韩毅针对时间因素的稀释效应和凝聚效应,在P指数的计算框架下构建了Pt1和Pt2指数,分别用以评价不同发表时间和不同老化速度的文献价值[5],此外高志等对各种学术影响力的动态评价方法也做了深入的对比与分析[11],并针对科学家个人学术影响力随时间变化的计算方法进行了研究[12]。 综合性指标的优点在于可以用一个指标将研究实体在不同角度的科研绩效综合起来表征,在一定程度上体现了研究实体的整体面貌,但是在某些时候,我们又希望学术影响力的评价指标能够从某一个独立的角度展现研究实体的科研绩效,这样更有利于我们对研究实体在某一个具体的方面存在的问题进行分析,而综合性指标显然无法达到这一目的。以h指数为例,h指数是论文产出和学术质量的综合表征,但是却无法告知我们研究实体在学术质量这一单一维度上的表现,Van Raan便指出不应该用“一个音符”对研究人员或者研究团队的学术表现进行阐述[8],Glnzel也指出设计多个评价指标可以从不同的角度更加充分地反映学术的实际绩效[9]。事实上,学术影响力的内涵是多样的,不仅意味着学术的传播面和活跃度,也是学术质量的一种表征,同时还体现了学术成果的重要性,例如论文数量、论文总被引次数可以描述研究实体学术的传播度、辐射面,论文的篇均被引次数可以描述研究实体学术的质量,论文的被引率可以描述研究实体学术上的转化率、利用率,高被引论文、热点论文等又可以描述研究实体在前沿研究上的学术影响力。基于这种考虑,本文从篇均被引次数这一单一的维度出发,引入时间因素,设计一种时序动态视角下的学术影响力评价指标,以期将研究实体学术质量的发展趋势有效地描述出来。
1 时序动态视角下学术影响力评价指标的设计
研究实体(如科研人员、研究团队,机构、机构的某一学科或者机构下属的二级单位等)的学术成果通常可以用其发表的论文集合体现,现假设某一研究实体的论文集合中文献数量为N,截至到统计时间点(比如进行被引次数统计的当天)时,被引用的总次数为C次,那么该研究实体的学术影响力可以用论文集合的篇均被引次数Cpp=CN表征。显然C是由发生在不同时间节点的引文数量C1,C2,…,组成的,即C=∑iCi ,例如一篇当前被引用总次数为10的论文,其被引总次数可能是由来自2015年的2次被引和2016年的8次被引组成的。由于不同时期的引文数量所代表的价值是不一样的,例如两篇被引次数相同的论文,一篇引文量逐年上升,另一篇引文量逐年下降,其表征的学术价值显然是不同的。因此为了区分其价值的差异,我们希望能够为不同时间节点上的引文数量赋予不同的权重系数λ1,λ2…,λi,…,最终该研究实体的总被引次数可以表示为各时期引文数量的线性加权,即=∑iλiCi,进而将研究实体学术影响力表征为
但是注意到,论文集合在某一个时间点的引文数量Ci往往又是由不同时期发表的论文在该时间点的被引次数组成的,即Ci=∑jCji ,不同发表时间j的论文在时间点i上的被引次数Cji是不具可比性的,例如一篇2010年发表并在2015年被引用15次的论文与另一篇2012年发表并在2015年被引用12次的论文,其学术影响力是无法比较的,韩毅称这种导致不可比性的影响因素为稀释效应,并根据发文时间对Cji进行简单平均作为修正稀释效应的加权[6]。如果把这种稀释效应推广至更一般的情况,即这些论文还来自不同学科,于是Ci可进一步地描述为Ci=∑i∑kCj,ki ,其中Cj,ki表示第j年发表的来自学科k的论文在第i年的引文数量,显然论文发表时间和论文所属学科的不同都會对引文数量产生影响,因此Cj,ki之间是有明显差异的,彼此之间同样是不具可比性的,这样由Cj,ki累加得到的各时间点上的被引次数Ci是非标准非规范的,在此基础上对Ci赋予权值也就缺乏合理性,并且严格来说直接把不同的Cj,ki相加也是没有任何意义的,例如一位科研人员在2010年发表了一篇计算机方向的论文,在2015年被引用10次,在2012年发表了一篇数学方向的论文,在2015年被引用6次,那么这两篇论文在2015年的被引用总次数C2015不能简单的看作是C2015=10 6,因为2015年的被引次数来自发表于不同的时期且属于不同的学科的两篇论文,其被引次数10次与6次是在不同的尺度下测度得到的,直接取和10 6是没有任何实际意义的。对于这种情况我们考虑引入学科的篇均被引次数对Cj,ki进行修正,消除不同发文时间和不同学科对引文带来的差异性,这样既保证了对各时期的被引次数Ci进行赋值的合理性,还能使得这样设计的评价指标可以消除学科之间的引用差异,实现对不同学科的学术影响力的横向比较。基于上述考虑,我们设计的时序动态学术影响力评价指标分为以下两步完成:
Step 1.对于发表于不同年代、属于不同学科的文献在同一个统计时间点上的引文标准化处理。
假设论文集合中属于学科k发表于第j年的所有论文在第i年的被引总次数为Cj,ki。其中,k=1,2,…,K,表示待评价论文集合共涉及K个学科;j=1,2,…,J,表示将该论文集合中最早发表的论文时间作为统计时间节点的第1年,最晚发表的论文时间作为第J年;i=1,2,…,I,表示将该论文集合中最早发表的论文时间作为统计被引次数的时间节点的第1年,将统计被引次数的时间节点的最后一年记为第I年。
我们首先按照发表时间和所属学科将论文集合中的论文划分到不同的组,每一组的论文均发表于相同年份、属于相同学科,然后对每个组的论文引入一个对应的参考文献集合,例如,可以选择为第j年发表的属于学科k的全球论文,显然同一组的论文在后续时间段被他人引用应当具有相同的共性,因此用该参考文献集合的论文篇均被引次数作为基准值可以修正由于论文之间发表年份不同、所属学科不同带来的稀释效应的影响。设第j年发表的属于学科k的论文的篇均被引次数为ej,ki,于是第j年发表的属于学科k的论文在任意一个统计时间点i的被引次数j,ki可以修正为:
需要说明的是,由于通常选择的学科划分是ESI学科,按照论文与ESI学科的对应规则,一篇论文只对应一个ESI学科,但是如果学科选取的Web of Science的学科划分方法,则会出现一篇论文对应多个学科的情况,为此我们是这样考虑的:将修正论文被引次数的基准值ej,k取作论文对应的相应学科的论文篇均被引次数的平均值。例如,一篇2012年的论文在2015年的被引次数为15次,这篇论文对应Mathematics、Mathemitics,Applied和Mathemitics,Interdisciplinary Application 3个学科,而这3个学科2012年的论文篇均被引次数分别为3.46、4.89和6.81,那么则将3个学科2012年的论文篇均被引次数的平均值作为修正这篇论文被引次数的基准值,即e=((3.46 4.89 6.81))/3=5.05,这篇论文在2015年修正后的被引次数则为15/5.05=2.97,这样把论文集合中2012年的每篇论文在2015年修正后的被引次数加起来,则为论文集合中2012年的论文在2015年的修正后的被引次数。不失一般性,如果论文集合中的每篇论文均对应一个学科,那么这样的处理方法则与上述Step1的方法是一致的。
〔关键词〕时序动态;学术影响力;评价方法;实证研究
DOI:10.3969/j.issn.1008-0821.2017.11.012
〔中图分类号〕G304 〔文献标识码〕A 〔文章编号〕1008-0821(2017)11-0074-07
An Empirical Study on the Evaluation of Academic Influence from the Perspective of Time Series
Shu Yu Zhang Lili
(Library,Sichuan University,Chengdu 610065,China)
〔Abstract〕[Purpose/Significance]The difference between the time of publication and the discipline of the study will cause an effect on the dilution of the citations in the following citations.This paper designed an evaluation index of academic influence from the perspective of temporal dynamics,which could eliminate the influence of dilution effect and can reflect the value of citation in different periods.[Method/Process]The Average number of citations per paper of the reference set was choosen as a benchmark to eliminate the dilution effect caused by the publication time and different discipline,furthermore,different weights were given to the citations that happen on different statistical time points,which could be used to characterize the different values of citations in different periods.[Result/Conclusion]Taking Sichuan University as an example,this paper selected the ESI discipline and the scientific research personnel as the evaluation object to carry on the empirical research,the results showed that this index could effectively distinguish the different research entities with different academic development trends.
〔Key words〕time series dynamics;academic influence;evaluation method;empirical study
學术影响力的评价则是科研绩效评价中的一个主要组成部分,在学科、高校乃至国家层面的科研评价体系中发挥了极其重要的作用[1-2]。文献计量分析为学术影响力的测度提供了相应的定量指标,是对同行评议等定性评价方式的重要补充[3-4]。基于文献计量分析方法设计的定量评价指标可以分为综合性指标和单一指标两种方式[5]。综合性指标包括h指数、g指数、p指数等,而单一指标主要从论文的产出、质量、利用率等各个方面进行单一维度的评价[6-7]。综合性指标和单一指标在科研绩效评价中都得到的广泛的应用,但是往往忽略了对文献老化过程中引文变化规律的描述,由于论文的施引文献发生的年度代表了在不同时期被利用的情况,自然也就具有不同的价值,例如一位科研人员的论文引用文献逐年上升,而另一位科研人员的论文引用文献却逐年下降,显然这两位科研人员学术影响力的发展态势是不一样的,因此需要从时序动态的视角设计学术影响力的评价指标,使之能够真实的反映出文献在不同时期的引用文献的价值。学术影响力的动态评价指标多集中在综合性指标的改造上,Sidiropoulos A以与论文发表年度的时长呈反比的系数为权重,降低早期发表的论文的引文数量,再以修正后的引文数量定义了一种当代的h指数[10],韩毅针对时间因素的稀释效应和凝聚效应,在P指数的计算框架下构建了Pt1和Pt2指数,分别用以评价不同发表时间和不同老化速度的文献价值[5],此外高志等对各种学术影响力的动态评价方法也做了深入的对比与分析[11],并针对科学家个人学术影响力随时间变化的计算方法进行了研究[12]。 综合性指标的优点在于可以用一个指标将研究实体在不同角度的科研绩效综合起来表征,在一定程度上体现了研究实体的整体面貌,但是在某些时候,我们又希望学术影响力的评价指标能够从某一个独立的角度展现研究实体的科研绩效,这样更有利于我们对研究实体在某一个具体的方面存在的问题进行分析,而综合性指标显然无法达到这一目的。以h指数为例,h指数是论文产出和学术质量的综合表征,但是却无法告知我们研究实体在学术质量这一单一维度上的表现,Van Raan便指出不应该用“一个音符”对研究人员或者研究团队的学术表现进行阐述[8],Glnzel也指出设计多个评价指标可以从不同的角度更加充分地反映学术的实际绩效[9]。事实上,学术影响力的内涵是多样的,不仅意味着学术的传播面和活跃度,也是学术质量的一种表征,同时还体现了学术成果的重要性,例如论文数量、论文总被引次数可以描述研究实体学术的传播度、辐射面,论文的篇均被引次数可以描述研究实体学术的质量,论文的被引率可以描述研究实体学术上的转化率、利用率,高被引论文、热点论文等又可以描述研究实体在前沿研究上的学术影响力。基于这种考虑,本文从篇均被引次数这一单一的维度出发,引入时间因素,设计一种时序动态视角下的学术影响力评价指标,以期将研究实体学术质量的发展趋势有效地描述出来。
1 时序动态视角下学术影响力评价指标的设计
研究实体(如科研人员、研究团队,机构、机构的某一学科或者机构下属的二级单位等)的学术成果通常可以用其发表的论文集合体现,现假设某一研究实体的论文集合中文献数量为N,截至到统计时间点(比如进行被引次数统计的当天)时,被引用的总次数为C次,那么该研究实体的学术影响力可以用论文集合的篇均被引次数Cpp=CN表征。显然C是由发生在不同时间节点的引文数量C1,C2,…,组成的,即C=∑iCi ,例如一篇当前被引用总次数为10的论文,其被引总次数可能是由来自2015年的2次被引和2016年的8次被引组成的。由于不同时期的引文数量所代表的价值是不一样的,例如两篇被引次数相同的论文,一篇引文量逐年上升,另一篇引文量逐年下降,其表征的学术价值显然是不同的。因此为了区分其价值的差异,我们希望能够为不同时间节点上的引文数量赋予不同的权重系数λ1,λ2…,λi,…,最终该研究实体的总被引次数可以表示为各时期引文数量的线性加权,即=∑iλiCi,进而将研究实体学术影响力表征为
但是注意到,论文集合在某一个时间点的引文数量Ci往往又是由不同时期发表的论文在该时间点的被引次数组成的,即Ci=∑jCji ,不同发表时间j的论文在时间点i上的被引次数Cji是不具可比性的,例如一篇2010年发表并在2015年被引用15次的论文与另一篇2012年发表并在2015年被引用12次的论文,其学术影响力是无法比较的,韩毅称这种导致不可比性的影响因素为稀释效应,并根据发文时间对Cji进行简单平均作为修正稀释效应的加权[6]。如果把这种稀释效应推广至更一般的情况,即这些论文还来自不同学科,于是Ci可进一步地描述为Ci=∑i∑kCj,ki ,其中Cj,ki表示第j年发表的来自学科k的论文在第i年的引文数量,显然论文发表时间和论文所属学科的不同都會对引文数量产生影响,因此Cj,ki之间是有明显差异的,彼此之间同样是不具可比性的,这样由Cj,ki累加得到的各时间点上的被引次数Ci是非标准非规范的,在此基础上对Ci赋予权值也就缺乏合理性,并且严格来说直接把不同的Cj,ki相加也是没有任何意义的,例如一位科研人员在2010年发表了一篇计算机方向的论文,在2015年被引用10次,在2012年发表了一篇数学方向的论文,在2015年被引用6次,那么这两篇论文在2015年的被引用总次数C2015不能简单的看作是C2015=10 6,因为2015年的被引次数来自发表于不同的时期且属于不同的学科的两篇论文,其被引次数10次与6次是在不同的尺度下测度得到的,直接取和10 6是没有任何实际意义的。对于这种情况我们考虑引入学科的篇均被引次数对Cj,ki进行修正,消除不同发文时间和不同学科对引文带来的差异性,这样既保证了对各时期的被引次数Ci进行赋值的合理性,还能使得这样设计的评价指标可以消除学科之间的引用差异,实现对不同学科的学术影响力的横向比较。基于上述考虑,我们设计的时序动态学术影响力评价指标分为以下两步完成:
Step 1.对于发表于不同年代、属于不同学科的文献在同一个统计时间点上的引文标准化处理。
假设论文集合中属于学科k发表于第j年的所有论文在第i年的被引总次数为Cj,ki。其中,k=1,2,…,K,表示待评价论文集合共涉及K个学科;j=1,2,…,J,表示将该论文集合中最早发表的论文时间作为统计时间节点的第1年,最晚发表的论文时间作为第J年;i=1,2,…,I,表示将该论文集合中最早发表的论文时间作为统计被引次数的时间节点的第1年,将统计被引次数的时间节点的最后一年记为第I年。
我们首先按照发表时间和所属学科将论文集合中的论文划分到不同的组,每一组的论文均发表于相同年份、属于相同学科,然后对每个组的论文引入一个对应的参考文献集合,例如,可以选择为第j年发表的属于学科k的全球论文,显然同一组的论文在后续时间段被他人引用应当具有相同的共性,因此用该参考文献集合的论文篇均被引次数作为基准值可以修正由于论文之间发表年份不同、所属学科不同带来的稀释效应的影响。设第j年发表的属于学科k的论文的篇均被引次数为ej,ki,于是第j年发表的属于学科k的论文在任意一个统计时间点i的被引次数j,ki可以修正为:
需要说明的是,由于通常选择的学科划分是ESI学科,按照论文与ESI学科的对应规则,一篇论文只对应一个ESI学科,但是如果学科选取的Web of Science的学科划分方法,则会出现一篇论文对应多个学科的情况,为此我们是这样考虑的:将修正论文被引次数的基准值ej,k取作论文对应的相应学科的论文篇均被引次数的平均值。例如,一篇2012年的论文在2015年的被引次数为15次,这篇论文对应Mathematics、Mathemitics,Applied和Mathemitics,Interdisciplinary Application 3个学科,而这3个学科2012年的论文篇均被引次数分别为3.46、4.89和6.81,那么则将3个学科2012年的论文篇均被引次数的平均值作为修正这篇论文被引次数的基准值,即e=((3.46 4.89 6.81))/3=5.05,这篇论文在2015年修正后的被引次数则为15/5.05=2.97,这样把论文集合中2012年的每篇论文在2015年修正后的被引次数加起来,则为论文集合中2012年的论文在2015年的修正后的被引次数。不失一般性,如果论文集合中的每篇论文均对应一个学科,那么这样的处理方法则与上述Step1的方法是一致的。