论文部分内容阅读
本文由ProjectSyndicate和人文科学研究院授权《南风窗》独家刊发中文版。作者是美国印第安纳大学布卢明顿分校信息科学荣誉教授、伦敦城市大学荣誉教授。
“要引用数据来源。”这一戒条回响在每一个马虎的本科生和想走捷径的博士后同学耳边。但有时候,我们要想想是否过于强调引用数据了?
从小我们就被教导要感谢用思想和洞见影响我们思维的人。在我们的学术生涯中,我们学习为我们使用的词汇、数据或图像提供正确的属性。而“感谢应该感谢的人”则是整个学术发表体系所围绕的核心原则。
在学术界,引用他人工作并不仅仅是出于礼貌,而是一种规范要求。事实上,几乎无法想象某本著名杂志会发表不列明参考文献的文章。剽窃是极少数可以让辉煌的学术生涯戛然而止的行为之一。
引用穿插在研究之中,有助于引导读者。读者通常对某篇文章所选取的参考文献的质量有自己的判断,从而以此为基础评估文章作者工作的价值。引用也让读者能够追溯先前不了解但可能非常有用的研究工作。
尤金·加菲尔德(Eugene Garfield)明白这一点。1955年,加菲尔德创建了科学文献索引(Science Citation Index,SCI),该数据库包括了名望最高的科学期刊中的所有被引用文献,构成了一张连接文献的庞大网络。正如他所言,“通过在编辑文献索引过程中使用作者参考文献,我们开始真正利用索引器的威力,作者每列举一条参考文献,事实上都是在为自己的观点编辑索引”,SCI将让研究者能够沿着科学文献中的引用链接来追溯知识链条。
SCI从未失去在科学界的潜力,学者们很快就接受了它—但原因并非人们所预想的。丰富的前人分析主题、关联和相同引用文献的结论显然都是吸引力的一部分。但是,更有吸引力的是有可能以此追踪自己或他人在长期和多领域的学术影响力,并找到被引用最多的科学家、论文、期刊和机构。
几乎在一夜之间,谦逊的目录式参考文献获得了象征意义,科学也有了记分牌。但科学真的需要记分牌吗?
SCI催生了众多基于引用的指标,其中有两个特别值得注意。第一个也源于加菲尔德的构思,名为影响因子(IF),该指标以所刊文章在前两年中平均被引用的次数为基础推定学术期刊的质量。高影响因子可以立竿见影地提高期刊的地位。
另一个值得关注的指标是H指数。该指标由物理学家乔治·赫西(Jorge Hirsch)提出,旨在衡量学者的生产率和影响。H指数的计量方法非常直观:某研究者发表了20篇文章,每篇文章至少被引用了20次,则他的H指数就是20。如果他发表了34篇文章,每篇文章被引用至少34次,则它的H指数就是34。
尽管这些指标有着广为诟病的局限性,但凭借着简明性——更不用说科学进步固有的竞争了——它们仍具有相当广泛的吸引力。因此,它们被应该是更明白的人认为很有意义。事实上,引用数据已成为学术界的重要统计数字,研究者通常会在简历中写上他的IF数据和H指数——以及来自汤森路透的科学网(Web of Science)、艾斯维尔的斯高帕斯(Scopus)和谷歌学术(Google Scholar)等来源的原始引用分数。
类似地,一些年度大学排名——包括CWTS莱顿排名、上海交通大学世界大学学术排名、QS世界大学排名等——的算法都基于发表和引用数据。大学校长必须致力于增加本校的引用记录,尽管他们知道这些数据的准确性和有效性以及它们所衍生的排名大有可疑。
问题不仅在于学术界。管理人员用这些指标评估他们聘用和给予资金支持的人的生产率,追踪他们所承担的研发项目的下游影响,而丝毫不关注这些指标的局限性。在英国、澳大利亚、德国和意大利等国家,研究评估工作正在无情地创造一种资格文化和问责文化,引用数据的重要性日益增加。
越多这些“客观”指标被用于研究评估和人事评估,就有越多科学家感到必须参与这个引用游戏。逐渐地,这意味着与制度周旋,专注于能带来短期效益的工作,追求“热点”研究主题,将更多的时间用于钻营(社交媒体的兴盛起到了推波助澜的效果),将工作切割包装以最大程度地吸引关注。最近出现的所谓“替代指标”(如下载、推荐、Facebook“喜欢”和Tweet等)更是加剧了研究者收集影响力证据的压力。
平心而论,将社会分析用于研究和学术界,可以带来重要洞见,让我们更容易评估学者“真正”的贡献。挑战在于,如何才能不因为透明化而导致平庸。据说爱因斯坦曾说,“可数的未必重要,重要的未必可数”。