论文部分内容阅读
摘 要 论文以国内图情档领域五所著名院校的198名教师为研究对象,从数量和质量两方面选择计量指标,采用描述统计和信息计量中的引文分析方法,从性别角度对高校教师的科研生产率进行实证研究。结果表明,在中青年群体中,高校女性教师在人数和科研成果数量方面已经超过或正在赶超男性,正在迈向科研质量方面的超越,但女性杰出人才群体的形成还需更多努力。最后,分析了该现象的存在原因。
关键词 科研生产率 性别差异 引文数量 论文数量 高校教师
分类号 G250
Abstract From the quantity and the quality perspective, an empirical study of research productivity of the faculty is completed by this paper, based on 198 teachers in five popular domestic universities of the library and information science. It shows that there are more female people among the young and middle-aged faculty, and they published more journal articles. However they still need to improve the quality of publication according to the citation count analysis. There are still more outstanding male researchers. Lastly, this paper states possible explanation of such phenomenon.
Keywords Research productivity. Gender differences. Citation counts. Publication counts. Faculty.
0 引言
学术评价是信息计量学和科学计量学研究的热点之一,通常从数量和质量两个角度进行评价。教师科研水平的高低与学科发展和人才培养密切相关。在高等教育机构的评价研究中,教师的科研数量和质量被赋予很高的权重,比如在USNEWS和QS中,学术能力占40%,引文指标占20%;在THE中,教学和科研占30%,引文指标占32%;在邱均平的大学评价中,科学研究占到45%;在武书连的排行榜中,教师学术水平和学术引用也占有相当比例。
从性别角度,高校教师由男性和女性两大群体构成。这两个群体之间的科研能力、科研成果是相同的,还是有差异的。Peas和Willett选择图书情报领域国际排名前列的5所高校,其中英国3所(拉夫堡大学、谢菲尔德大学和英国皇家图书情报学院),美国2所(伊利诺伊大学香槟分校和印第安纳大学),对图书情报系的教师科研成果进行计量分析。研究发现男性教师在科研成果数量方面明显高于女性教师;而引文数量表明,在科研质量方面,女性与男性无显著差异[1]。
本文选取国内图情档领域知名高校进行研究,采用定量方法从数量和质量角度对本领域高校教师的科研产出进行分析,对于我国教师不同性别群体的科研生产力进行研究,并得到一些有意义的结论。
1 研究对象与计量指标
1.1 研究对象
选取国内5所图情档领域知名高校中的信息管理学院(系)教师为研究对象,分别为武汉大学信息管理学院、南京大学信息管理学院、中山大学资讯管理学院、中国人民大学信息资源管理学院和北京大学信息管理系。除中大外,其余4家高校都具有“图书馆、情报与档案管理”一级学科博士学位授予权,武大、南大、北大具有该一级学科博士后流动站。
根据学校网站上提供的师资队伍信息,并结合实际调查咨询和主要研究领域,将所有教师进行分类,分为图书馆学、信息管理(情报)、档案与电子政务和出版发行,共4类。极个别教师在CNKI和万方数据中无记录,予以删除,最终选择的有效研究对象有198名教师。
1.2 计量指标
(1)数量型指标
选择发文量、年均发文量作为数量型指标。以第一篇论文年份与最后一篇论文年份之间的间隔为分母计算年均发文量。发文量是研究对象累积科研成果量,随着从业年限而增长;而年均发文量体现了该对象持续的发文能力。
(2)质量型指标
在信息计量和科学评价领域,学术论文的被引数量通常作为评价论文质量高低的有效指标。一篇具有高被引数的论文往往是一篇学术影响力广、质量高的论文。这里选择总被引次数和篇均被引次数作为质量型计量指标。总被引次数随着时间增长;而篇均被引受到总引文次数和总论文量的影响,随着时间有可能增长或下降,能体现研究对象发表论文的平均质量。
(3)H型指标
2 数据获取和预处理
2.1 获取原始数据
图情档在学科上隶属于管理学,教师的科研成果大多以期刊论文形式出现。因此,所有实证研究数据来自2012年11—12月的CNKI数据库和万方数据库。主要通过CNKI数据库提供的著者检索功能,并结合作者单位进行检索。由于CNKI对于《情报学报》刊物的收录时间截止2002年底,而该刊物在图书、情报领域是重要期刊,因此通过万方数据库对该刊2003年及以后发文情况进行统计。在实际检索中,由于数据库更新问题,某教师的发文数量和引文数量可能出现12月底检索的数据较11月初检索的数据略偏高。在实际数据收集工作完成后,我们对数据进行了抽样重复检索,检索时间不同带来的差异非常小。完成检索的顺序依次为武大,南大,北大,人大和中大。通过检索可以直接获得发文量、发文年份、每篇论文的引文数量。 2.2 数据预处理及说明
部分教师的研究领域跨度较大,比如工程领域、声学领域。本文考虑的是高校教师科研生产率,所以没有剔除。但是,对于非学术性论文予以剔除,对于教学型论文未做剔除。
部分教师英文论文较多,而中文论文相对较少,本文选择的数据来源局限于中文期刊,因此存在极少部分优秀教师在本文中的指标值偏低的情况。
合著者问题,没有考虑合著的分配问题,对于多名著者的同一篇论文,每位作者分别计算一次。显然,合著多的教师,指标偏高。从生产率角度,合著有利于科研产出;从社会网络分析角度,合作越多的人越容易成为核心节点。
在检索中,对同名者的处理主要依据教师履历介绍。对于同一单位,名字相同者,通过论文内容予以区分。对于曾就职多个机构的教师,论文成果予以累计。
在获取检索结果基础上,分别计算年均发文量、篇均被引量、H指数、G指数和R指数。
3 数据分析
3.1 对数据分层
按照研究对象的内部属性——年龄,予以分组。按照出生日期分为5组,分别对应60岁以上、50岁至60岁,40岁至50岁,30岁至40岁以及30岁以下,如第一组是1951年及以前出生,以此类推。女性人数分布为4、8、34、29、5,合计80人;男性人数分布为6、23、55、30、2,合计118人。
按照学术年龄分组(即第一篇论文至最近一篇论文之间的间隔):第一组(30年及以上),第二组(29-25),第三组(24-20),第四组(19-15),第五组(14-10),第六组(9-5),第七组(1-4)。女性人数分布为1、9、10、19、16、19、6;男性人数分布为8、17、17、26、34、13、3。在实际分析时,由于人数太少,第一组和第七组予以剔除,即剔除掉学术年龄小于5年的和大于30年的研究对象。
按照职称分组:第一组(教授),第二组(副教授),第三组(讲师)。女性人数分布为25、45、10;男性人数分布为63、40、15。
从教师数量角度,40到50岁之间、学术年龄在10到19年教师最多,是教师队伍的主体;40岁以下、学术年龄10年以下的年轻教师中,女性已经或正在超过男性数量。从职称看,教授组,男性是女性组的2.5倍,而副教授组和讲师组男女差异不大;女性组的职称分布呈正态,副教授是主体;而男性组教授数量超过副教授和讲师数量之和,呈偏态分布。
3.2 描述统计分析
3.2.1 按照年龄分组的数据分析结果
(1)数量型指标的对比
本文针对不同性别群体进行比较研究,不关注个体的情况,因此以组内成员的平均值作为该组的值。整体上,不同性别组的数量差距在缩小。发文量和年均发文量在第一组中表现出的差异最大,男性到140为止,女性接近100,随着年龄递减,男女发文量也呈递减。至第五组女性的数量型指标超越男性组,但都低于20。
(2)质量型指标的对比
整体上,不同性别组的质量型指标差距在缩小。总引用数之间的差异由第一组的766逐渐变小至第五组的-2。即最年长的一组研究对象,男性较女性的总被引次数平均多766次;最年轻的一组研究对象,女性组的总被引次数比男性平均多2次。篇均被引数男性组整体高于女性组,两者最接近的是第三组。
(3)H型指数对比
H指数、G指数和R指数,第一组差距最大,然后逐渐减少;第五组,女性组反超男性组;其他3组数据的变化趋势类似。总体上,随着年龄递减,此指数也呈递减趋势。
3.2.2 按照学术年龄分组的数据分析结果
按照学术年龄分组后,由于样本量小,将第一组和第七组剔除。我们分析了第二到第六组的数据,共180人。发文量、年均发文量和总被引数量均是第二组和第三组差异较大,男性大于女性;而第四组和第五组女性组接近或超越男性;第六组数据男性超过女性。篇均被引数女性组在两次反超后,第六组数据又明显低于男性组,论文数量和总被引数之间的微小反向差异被放大。
H指数和G指数、R指数,从第四组反超后,第五、第六组值比较接近。总体上,男女的H指数值呈递减趋势。
3.2.3 按照职称分组的数据分析结果
按照职称分为3组,对每组计算其均值。两个数量型指标,均表现出男女差异变小,讲师组女性反超男性的趋势。年发文量第三组女性明显高于男性。
总引用次数,男女差异在第二组开始变得不明显,男性保持微弱优势。由于数量上的反向差异,导致男性第三组在篇均被引方面显著高于女性组。
H指数、G指数和R指数,第一组差距最大,然后逐渐减少,副教授组男女最接近,讲师组女性略低。
3.2.4 不同指标间关系的分析
(1)数据的变异性分析
变异系数是衡量资料中各观测值变异程度的一个统计量。如果平均数不同,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较,即变异系数。
比较每组数据的变异系数,观察组内值的均匀分布情况。这里以年龄分组的第一组和第三组数据为例,如表1所示。其中第一组男性8人,女性4人,均为教授。第一组数据显示,男性组中强者更强。第三组数据显示,女性组中强者更强。考虑到第一组数据中,男性指标明显高于女性指标,而第三组数据中,女性与男性指标很近似。在某种程度上,某性别群体的崛起必然有少数强大的个体出现。
而整体上,组内差异大,明显符合洛特卡规律及二八定律,即生产率高的个体占总体的少数。男性组,共118人,其中发文最多的26人所共完成总论文数量的80%,图像为正偏态分布,平均数48,中数33,见图1。女性组,共80人,其中发文最多的17人贡献了所有论文数量的80%,图像呈正偏态分布,平均数31,中数24,见图2。 (2)数量指标与质量指标的相关性分析
通过相关性分析,判断发文数量和引用质量是否存在相关性。利用SPSS进行因子分析并得到各因素之间的相关性。
由主成分分析可知,论文总数和年均发文这两个数量型指标之间属于极强相关,总被引数与论文总数极强相关,与年均发文强相关;3个H型指数之间属于极强相关,尤其是G指数和R指数,相关性为0.999;H型指数与论文总数、年均发文和总被引之间属于强或极强相关;而质量型指标之一的篇均被引,与论文总数和年均发文弱相关或极弱相关,与其他四个指标中等程度相关,与R相关性最明显。在本文选择的计量指标中,除了篇均被引,其余6项指标之间显著相关;而篇均被引与H型指标中等程度相关。
表2是男性组数据的分析结果。女性组数据的分析结果类似。
3.2.5 杰出人才在不同性别组的分布
按照卢梭定律,用总人数的平方根简单估算优秀者人数。表3是男女按照年龄分组后(此处剔除了第五组),进入优秀者行列的临界H值和G值。比如,对于40岁到50岁之间的本领域高校女教师,成为女性群体中的优秀者的必要条件可能是H值达到或超过11,即至少有11篇论文(每篇至少被引用11次);如果不考虑性别,要想成为本年龄群体的优秀者,必要的条件可能是H值达到或者高于14,即至少有14篇论文(每篇至少被引用14次)。
不分性别,按照年龄分组。在第一组中,优秀者是武汉大学马费成、邱均平和胡昌平,均为男性;第二组的优秀者也没有女性;第三组9名优秀者中,R指数确定的女性为武大黄如花和司莉、人大周晓英,以G指数确定的为黄如花和南大陈雅;第四组7名优秀者,H指数确定的女性为武大宋恩梅、北大的张久珍、人大刘越南,G指数确定的女性为张久珍和刘越南;第五组学术年龄较小,没有做分析。优秀者隶属的机构,第一组均出自武大,后面逐渐分散。
g-h学术差和g/h学术势是叶鹰在2007年提出这两个指标[8],从这两个指标分析,要想成为优秀者,具备高被引论文,即影响力大的学术论文是必要条件。显然,男性组的杰出者表现出更高的学术差,在男性组的杰出者与组内其他人相比,高被引,或者说高影响力论文非常重要。
4 结论
通过对研究对象的定量分析,我们得到以下结论。
第一,在实际统计中,发现部分教师,尤其是中年及以上教师,发文初期的连续性不好,第一篇论文和第二篇论文距离较远,影响年平均发文率。这与上世纪八九十年代的高校科研投入低,科研工作受重视程度不高有关。
第二,年轻教师普遍起点高,论文数量和质量整体水平好。从获得的学者基本信息发现,80后年轻教师群体普遍学历高(博士比例几乎百分之百,海外留学经历的比例高),经过连续的科研能力培养。而基于科研论文成果的定量研究也表明这一群体普遍学术素质高、科研能力强。
第三,高校教师女性比例变大,高校40岁以下教师中,女性人数等于或大于男性,女性科研生产率接近或略高于男性。通过访谈,大致原因包括以下几点:主观上,女性认为高校工作环境好、工作比较轻松,能较好地平衡家庭和事业;而男性认为高校收入不高,陈规陋习多,体制僵化,吸引力弱;客观上,接受高层次教育的女性人数增加,女博士(或更高)受过严谨的科研学术训练,但大多没有实际工作经验,进公司就业存在劣势。总体上与社会分工、经济发展都有着密切的关系。
第四,由因子分析结果分析,篇均被引指标是一个比较独立的指标;其他6个指标之间两两相关性均在0.67以上。我们对198名研究对象进行篇均被引值排序,篇均被引大于12者有22位,最高达到49。22人中,教授14人,副教授6人,讲师2人。篇均被引指标能凸显科研论文数量少而影响广泛的作者,这一指标与目前人才评价体系中要求提供代表性论文的要求相吻合,正如有学者呼吁“学术评价:超越量化模式”[11]。但从学科评价和学校排名角度,篇均被引是否还有更深刻的含义和价值,需要进一步的研究。
第五,实证研究表明,女性教师在科研数量上的赶超幅度大于质量上的赶超,因此造成篇均被引指标反而差距变大。在完成数量赶超后,女性教师需要关注论文质量的提高,关注科研成果的质量和学术影响力。
通过对图情档领域的高校教师科研生产率的定量分析,我们认为随着时代的发展,女性教师已经成为高校重要的科研、教学力量。在某些专业领域,女性教师不仅在人数和科研成果数量上赶超男性,在科研成果质量上也在逐步缩小差距,甚至开始超越男性,但要想成为行业优秀人才,还需关注学术质量和影响力。
本文研究对象是图情档领域的高校教师群体,属于管理学科,性别分布与与理工科可能存在差异,因此这一结论能否适用其他学科,还需要更多的数据支持。
参考文献:
[ 1 ] Peas C S, Willett P. Brief communication:Genderdifferences in publication and citation counts in li-brarianship and information science research[J]. Journal of Information Science,2006,32(5):480-485.
[ 2 ] Hirsch J E. An index to quantify an individual’s scientific research output[C]. Proceedings of the National Academy of Sciences of the United States ofAmerica,2005,102(46):16569-16572.
[ 3 ] Braun T, Gianzel W, Schubert A. A Hirsch-type index for journal[J]. The Scientist,2005,19(22):8.
[ 4 ] 周英博,马景娣,叶鹰. 国际基础学科核心期刊h指数实证研究[J].大学图书馆学报,2009,27(2):66-70.
[ 5 ] 程丽,方志伟,韩松涛,等.国际大学h指数与综合指标排名的比较研究[J].大学图书馆学报,2009,27(2):71-75.
[ 6 ] 次仁拉珍,叶鹰.专利权人h指数研究[J].图书与情报,2009(6):67-69.
[ 7 ] Egghe L. Theory and practice of the g-index[J]. Scientometrics,2006,69(1):131-152.
[ 8 ] 叶鹰.h指数和类h指数的机理分析与实证研究导引[J].大学图书馆学报,2007,25(5):2-8.
[ 9 ] Burrell Q L. On the h-index, the size of the Hir-sch core and Jin’s A-index[J]. Journal of Informet-rics,2007,1(2):170-177.
[10] Jin B H, Liang L M, Rousseau R, et al. The R-and AR-indices: Complementing the h-index[J]. Chinese Science Bulletin,2007,52(6):855-863.
[11] 陈洪捷,沈文钦. 学术评价:超越量化模式[N]. 光明日报,2012-12-18(15).
刘 玮 西安电子科技大学经济管理学院副教授。陕西西安,710071。
李 玲 北京邮电大学图书馆馆员。北京,100876。
沈奎林 南京大学图书馆馆员。江苏南京,210093。
(收稿日期:2013-10-28 编校:刘 明)
关键词 科研生产率 性别差异 引文数量 论文数量 高校教师
分类号 G250
Abstract From the quantity and the quality perspective, an empirical study of research productivity of the faculty is completed by this paper, based on 198 teachers in five popular domestic universities of the library and information science. It shows that there are more female people among the young and middle-aged faculty, and they published more journal articles. However they still need to improve the quality of publication according to the citation count analysis. There are still more outstanding male researchers. Lastly, this paper states possible explanation of such phenomenon.
Keywords Research productivity. Gender differences. Citation counts. Publication counts. Faculty.
0 引言
学术评价是信息计量学和科学计量学研究的热点之一,通常从数量和质量两个角度进行评价。教师科研水平的高低与学科发展和人才培养密切相关。在高等教育机构的评价研究中,教师的科研数量和质量被赋予很高的权重,比如在USNEWS和QS中,学术能力占40%,引文指标占20%;在THE中,教学和科研占30%,引文指标占32%;在邱均平的大学评价中,科学研究占到45%;在武书连的排行榜中,教师学术水平和学术引用也占有相当比例。
从性别角度,高校教师由男性和女性两大群体构成。这两个群体之间的科研能力、科研成果是相同的,还是有差异的。Peas和Willett选择图书情报领域国际排名前列的5所高校,其中英国3所(拉夫堡大学、谢菲尔德大学和英国皇家图书情报学院),美国2所(伊利诺伊大学香槟分校和印第安纳大学),对图书情报系的教师科研成果进行计量分析。研究发现男性教师在科研成果数量方面明显高于女性教师;而引文数量表明,在科研质量方面,女性与男性无显著差异[1]。
本文选取国内图情档领域知名高校进行研究,采用定量方法从数量和质量角度对本领域高校教师的科研产出进行分析,对于我国教师不同性别群体的科研生产力进行研究,并得到一些有意义的结论。
1 研究对象与计量指标
1.1 研究对象
选取国内5所图情档领域知名高校中的信息管理学院(系)教师为研究对象,分别为武汉大学信息管理学院、南京大学信息管理学院、中山大学资讯管理学院、中国人民大学信息资源管理学院和北京大学信息管理系。除中大外,其余4家高校都具有“图书馆、情报与档案管理”一级学科博士学位授予权,武大、南大、北大具有该一级学科博士后流动站。
根据学校网站上提供的师资队伍信息,并结合实际调查咨询和主要研究领域,将所有教师进行分类,分为图书馆学、信息管理(情报)、档案与电子政务和出版发行,共4类。极个别教师在CNKI和万方数据中无记录,予以删除,最终选择的有效研究对象有198名教师。
1.2 计量指标
(1)数量型指标
选择发文量、年均发文量作为数量型指标。以第一篇论文年份与最后一篇论文年份之间的间隔为分母计算年均发文量。发文量是研究对象累积科研成果量,随着从业年限而增长;而年均发文量体现了该对象持续的发文能力。
(2)质量型指标
在信息计量和科学评价领域,学术论文的被引数量通常作为评价论文质量高低的有效指标。一篇具有高被引数的论文往往是一篇学术影响力广、质量高的论文。这里选择总被引次数和篇均被引次数作为质量型计量指标。总被引次数随着时间增长;而篇均被引受到总引文次数和总论文量的影响,随着时间有可能增长或下降,能体现研究对象发表论文的平均质量。
(3)H型指标
2 数据获取和预处理
2.1 获取原始数据
图情档在学科上隶属于管理学,教师的科研成果大多以期刊论文形式出现。因此,所有实证研究数据来自2012年11—12月的CNKI数据库和万方数据库。主要通过CNKI数据库提供的著者检索功能,并结合作者单位进行检索。由于CNKI对于《情报学报》刊物的收录时间截止2002年底,而该刊物在图书、情报领域是重要期刊,因此通过万方数据库对该刊2003年及以后发文情况进行统计。在实际检索中,由于数据库更新问题,某教师的发文数量和引文数量可能出现12月底检索的数据较11月初检索的数据略偏高。在实际数据收集工作完成后,我们对数据进行了抽样重复检索,检索时间不同带来的差异非常小。完成检索的顺序依次为武大,南大,北大,人大和中大。通过检索可以直接获得发文量、发文年份、每篇论文的引文数量。 2.2 数据预处理及说明
部分教师的研究领域跨度较大,比如工程领域、声学领域。本文考虑的是高校教师科研生产率,所以没有剔除。但是,对于非学术性论文予以剔除,对于教学型论文未做剔除。
部分教师英文论文较多,而中文论文相对较少,本文选择的数据来源局限于中文期刊,因此存在极少部分优秀教师在本文中的指标值偏低的情况。
合著者问题,没有考虑合著的分配问题,对于多名著者的同一篇论文,每位作者分别计算一次。显然,合著多的教师,指标偏高。从生产率角度,合著有利于科研产出;从社会网络分析角度,合作越多的人越容易成为核心节点。
在检索中,对同名者的处理主要依据教师履历介绍。对于同一单位,名字相同者,通过论文内容予以区分。对于曾就职多个机构的教师,论文成果予以累计。
在获取检索结果基础上,分别计算年均发文量、篇均被引量、H指数、G指数和R指数。
3 数据分析
3.1 对数据分层
按照研究对象的内部属性——年龄,予以分组。按照出生日期分为5组,分别对应60岁以上、50岁至60岁,40岁至50岁,30岁至40岁以及30岁以下,如第一组是1951年及以前出生,以此类推。女性人数分布为4、8、34、29、5,合计80人;男性人数分布为6、23、55、30、2,合计118人。
按照学术年龄分组(即第一篇论文至最近一篇论文之间的间隔):第一组(30年及以上),第二组(29-25),第三组(24-20),第四组(19-15),第五组(14-10),第六组(9-5),第七组(1-4)。女性人数分布为1、9、10、19、16、19、6;男性人数分布为8、17、17、26、34、13、3。在实际分析时,由于人数太少,第一组和第七组予以剔除,即剔除掉学术年龄小于5年的和大于30年的研究对象。
按照职称分组:第一组(教授),第二组(副教授),第三组(讲师)。女性人数分布为25、45、10;男性人数分布为63、40、15。
从教师数量角度,40到50岁之间、学术年龄在10到19年教师最多,是教师队伍的主体;40岁以下、学术年龄10年以下的年轻教师中,女性已经或正在超过男性数量。从职称看,教授组,男性是女性组的2.5倍,而副教授组和讲师组男女差异不大;女性组的职称分布呈正态,副教授是主体;而男性组教授数量超过副教授和讲师数量之和,呈偏态分布。
3.2 描述统计分析
3.2.1 按照年龄分组的数据分析结果
(1)数量型指标的对比
本文针对不同性别群体进行比较研究,不关注个体的情况,因此以组内成员的平均值作为该组的值。整体上,不同性别组的数量差距在缩小。发文量和年均发文量在第一组中表现出的差异最大,男性到140为止,女性接近100,随着年龄递减,男女发文量也呈递减。至第五组女性的数量型指标超越男性组,但都低于20。
(2)质量型指标的对比
整体上,不同性别组的质量型指标差距在缩小。总引用数之间的差异由第一组的766逐渐变小至第五组的-2。即最年长的一组研究对象,男性较女性的总被引次数平均多766次;最年轻的一组研究对象,女性组的总被引次数比男性平均多2次。篇均被引数男性组整体高于女性组,两者最接近的是第三组。
(3)H型指数对比
H指数、G指数和R指数,第一组差距最大,然后逐渐减少;第五组,女性组反超男性组;其他3组数据的变化趋势类似。总体上,随着年龄递减,此指数也呈递减趋势。
3.2.2 按照学术年龄分组的数据分析结果
按照学术年龄分组后,由于样本量小,将第一组和第七组剔除。我们分析了第二到第六组的数据,共180人。发文量、年均发文量和总被引数量均是第二组和第三组差异较大,男性大于女性;而第四组和第五组女性组接近或超越男性;第六组数据男性超过女性。篇均被引数女性组在两次反超后,第六组数据又明显低于男性组,论文数量和总被引数之间的微小反向差异被放大。
H指数和G指数、R指数,从第四组反超后,第五、第六组值比较接近。总体上,男女的H指数值呈递减趋势。
3.2.3 按照职称分组的数据分析结果
按照职称分为3组,对每组计算其均值。两个数量型指标,均表现出男女差异变小,讲师组女性反超男性的趋势。年发文量第三组女性明显高于男性。
总引用次数,男女差异在第二组开始变得不明显,男性保持微弱优势。由于数量上的反向差异,导致男性第三组在篇均被引方面显著高于女性组。
H指数、G指数和R指数,第一组差距最大,然后逐渐减少,副教授组男女最接近,讲师组女性略低。
3.2.4 不同指标间关系的分析
(1)数据的变异性分析
变异系数是衡量资料中各观测值变异程度的一个统计量。如果平均数不同,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较,即变异系数。
比较每组数据的变异系数,观察组内值的均匀分布情况。这里以年龄分组的第一组和第三组数据为例,如表1所示。其中第一组男性8人,女性4人,均为教授。第一组数据显示,男性组中强者更强。第三组数据显示,女性组中强者更强。考虑到第一组数据中,男性指标明显高于女性指标,而第三组数据中,女性与男性指标很近似。在某种程度上,某性别群体的崛起必然有少数强大的个体出现。
而整体上,组内差异大,明显符合洛特卡规律及二八定律,即生产率高的个体占总体的少数。男性组,共118人,其中发文最多的26人所共完成总论文数量的80%,图像为正偏态分布,平均数48,中数33,见图1。女性组,共80人,其中发文最多的17人贡献了所有论文数量的80%,图像呈正偏态分布,平均数31,中数24,见图2。 (2)数量指标与质量指标的相关性分析
通过相关性分析,判断发文数量和引用质量是否存在相关性。利用SPSS进行因子分析并得到各因素之间的相关性。
由主成分分析可知,论文总数和年均发文这两个数量型指标之间属于极强相关,总被引数与论文总数极强相关,与年均发文强相关;3个H型指数之间属于极强相关,尤其是G指数和R指数,相关性为0.999;H型指数与论文总数、年均发文和总被引之间属于强或极强相关;而质量型指标之一的篇均被引,与论文总数和年均发文弱相关或极弱相关,与其他四个指标中等程度相关,与R相关性最明显。在本文选择的计量指标中,除了篇均被引,其余6项指标之间显著相关;而篇均被引与H型指标中等程度相关。
表2是男性组数据的分析结果。女性组数据的分析结果类似。
3.2.5 杰出人才在不同性别组的分布
按照卢梭定律,用总人数的平方根简单估算优秀者人数。表3是男女按照年龄分组后(此处剔除了第五组),进入优秀者行列的临界H值和G值。比如,对于40岁到50岁之间的本领域高校女教师,成为女性群体中的优秀者的必要条件可能是H值达到或超过11,即至少有11篇论文(每篇至少被引用11次);如果不考虑性别,要想成为本年龄群体的优秀者,必要的条件可能是H值达到或者高于14,即至少有14篇论文(每篇至少被引用14次)。
不分性别,按照年龄分组。在第一组中,优秀者是武汉大学马费成、邱均平和胡昌平,均为男性;第二组的优秀者也没有女性;第三组9名优秀者中,R指数确定的女性为武大黄如花和司莉、人大周晓英,以G指数确定的为黄如花和南大陈雅;第四组7名优秀者,H指数确定的女性为武大宋恩梅、北大的张久珍、人大刘越南,G指数确定的女性为张久珍和刘越南;第五组学术年龄较小,没有做分析。优秀者隶属的机构,第一组均出自武大,后面逐渐分散。
g-h学术差和g/h学术势是叶鹰在2007年提出这两个指标[8],从这两个指标分析,要想成为优秀者,具备高被引论文,即影响力大的学术论文是必要条件。显然,男性组的杰出者表现出更高的学术差,在男性组的杰出者与组内其他人相比,高被引,或者说高影响力论文非常重要。
4 结论
通过对研究对象的定量分析,我们得到以下结论。
第一,在实际统计中,发现部分教师,尤其是中年及以上教师,发文初期的连续性不好,第一篇论文和第二篇论文距离较远,影响年平均发文率。这与上世纪八九十年代的高校科研投入低,科研工作受重视程度不高有关。
第二,年轻教师普遍起点高,论文数量和质量整体水平好。从获得的学者基本信息发现,80后年轻教师群体普遍学历高(博士比例几乎百分之百,海外留学经历的比例高),经过连续的科研能力培养。而基于科研论文成果的定量研究也表明这一群体普遍学术素质高、科研能力强。
第三,高校教师女性比例变大,高校40岁以下教师中,女性人数等于或大于男性,女性科研生产率接近或略高于男性。通过访谈,大致原因包括以下几点:主观上,女性认为高校工作环境好、工作比较轻松,能较好地平衡家庭和事业;而男性认为高校收入不高,陈规陋习多,体制僵化,吸引力弱;客观上,接受高层次教育的女性人数增加,女博士(或更高)受过严谨的科研学术训练,但大多没有实际工作经验,进公司就业存在劣势。总体上与社会分工、经济发展都有着密切的关系。
第四,由因子分析结果分析,篇均被引指标是一个比较独立的指标;其他6个指标之间两两相关性均在0.67以上。我们对198名研究对象进行篇均被引值排序,篇均被引大于12者有22位,最高达到49。22人中,教授14人,副教授6人,讲师2人。篇均被引指标能凸显科研论文数量少而影响广泛的作者,这一指标与目前人才评价体系中要求提供代表性论文的要求相吻合,正如有学者呼吁“学术评价:超越量化模式”[11]。但从学科评价和学校排名角度,篇均被引是否还有更深刻的含义和价值,需要进一步的研究。
第五,实证研究表明,女性教师在科研数量上的赶超幅度大于质量上的赶超,因此造成篇均被引指标反而差距变大。在完成数量赶超后,女性教师需要关注论文质量的提高,关注科研成果的质量和学术影响力。
通过对图情档领域的高校教师科研生产率的定量分析,我们认为随着时代的发展,女性教师已经成为高校重要的科研、教学力量。在某些专业领域,女性教师不仅在人数和科研成果数量上赶超男性,在科研成果质量上也在逐步缩小差距,甚至开始超越男性,但要想成为行业优秀人才,还需关注学术质量和影响力。
本文研究对象是图情档领域的高校教师群体,属于管理学科,性别分布与与理工科可能存在差异,因此这一结论能否适用其他学科,还需要更多的数据支持。
参考文献:
[ 1 ] Peas C S, Willett P. Brief communication:Genderdifferences in publication and citation counts in li-brarianship and information science research[J]. Journal of Information Science,2006,32(5):480-485.
[ 2 ] Hirsch J E. An index to quantify an individual’s scientific research output[C]. Proceedings of the National Academy of Sciences of the United States ofAmerica,2005,102(46):16569-16572.
[ 3 ] Braun T, Gianzel W, Schubert A. A Hirsch-type index for journal[J]. The Scientist,2005,19(22):8.
[ 4 ] 周英博,马景娣,叶鹰. 国际基础学科核心期刊h指数实证研究[J].大学图书馆学报,2009,27(2):66-70.
[ 5 ] 程丽,方志伟,韩松涛,等.国际大学h指数与综合指标排名的比较研究[J].大学图书馆学报,2009,27(2):71-75.
[ 6 ] 次仁拉珍,叶鹰.专利权人h指数研究[J].图书与情报,2009(6):67-69.
[ 7 ] Egghe L. Theory and practice of the g-index[J]. Scientometrics,2006,69(1):131-152.
[ 8 ] 叶鹰.h指数和类h指数的机理分析与实证研究导引[J].大学图书馆学报,2007,25(5):2-8.
[ 9 ] Burrell Q L. On the h-index, the size of the Hir-sch core and Jin’s A-index[J]. Journal of Informet-rics,2007,1(2):170-177.
[10] Jin B H, Liang L M, Rousseau R, et al. The R-and AR-indices: Complementing the h-index[J]. Chinese Science Bulletin,2007,52(6):855-863.
[11] 陈洪捷,沈文钦. 学术评价:超越量化模式[N]. 光明日报,2012-12-18(15).
刘 玮 西安电子科技大学经济管理学院副教授。陕西西安,710071。
李 玲 北京邮电大学图书馆馆员。北京,100876。
沈奎林 南京大学图书馆馆员。江苏南京,210093。
(收稿日期:2013-10-28 编校:刘 明)