论文部分内容阅读
随着近年来电子存储技术的不断进步与发展,以及科学界的学术数据的指数增长,人们得以在更高规模的数据集上对科学事业进行更深层次的探索。随着存储技术的发展和计算能力的提升,这些数据的可获取性和可分析性得到极大增强,同时也催生了一门新兴的交叉学科:科学学(Science of Science)。科学学旨在通过网络科学、数据科学和人工智能的理论基础与技术手段,对这些由学术大数据构成的复杂系统进行挖掘与分析,使人们能够从数据的角度理解科学内部的构成和演化规律。19世纪的法国科学家巴斯德曾说过:“科学不分国界,因为知识属于人类,是照亮世界的火炬。”随着国际学术合作的加强和“开放科学”运动的展开,科学将会变得更加地无国界化。虽然科学并不具有国家属性,但作为科学影响力的表征,论文及其引文索引却是有“国籍”的。现有研究已经充分表明,一篇论文往往更倾向于引用来自本国的论文,并且论文受本国读者阅读的程度也显著高于该国论文发表量的国际占比。然而,尚不清楚的是,各国对其他国家的引用是否具有偏好,人们对科学工作的认可和赞赏是否已经构成了不同的社团结构,即属于同一社团的国家和地区之间的引用强度较高,而属于不同社团的国家和地区之间的引用强度较低。本文旨在通过对Web of Science收录的1970年至2016年的文献数据进行分析来探究这一问题。由于不同的国家和地区每年发表的论文数量不同,导致可引用的论文的曝光率不同,因此直接量化两个国家之间的引用强度是存在量级偏差的。本文针对论文产量排全球前20的国家/地区,从引用强度的度量、国际引文网络的社区发现、中国论文的迅速增长对学术社团的影响等方面进行了研究和分析:首先,本文提出基于标准分数Z-score(zero-mean normalization)构建的随机引用零模型,即各个国家收到的期望引用数量正比于其论文发表量的国际份额。另外,由于标准分数Z-score的数值不受原始变量单位的影响,因此本文将其用于度量各国的实际被引用量与期望值之间的相对标准距离,使各国之间的引用强度具备可比性。在得到各国之间的引用强度矩阵之后,考虑到该矩阵的维度和规模,本文采用适用于低维、较小规模网络的层次聚类算法对该矩阵进行层次划分。结合由层次聚类算法得到的树状图和引用强度的热力图发现:科学界存在明显的两个学术社团,即属于同一社团的国家/地区互相引用的程度更深,而属于不同社团的国家/地区互相引用的程度更浅。继而,本文针对中国的学术发展情况提出6种假设,并通过对中国的论文进行随机删减使其达到国际平均发展水平,从而讨论中国在各学科领域的快速发展对该学术社团划分的结构性影响。研究发现:(1)国际科学界中出现的“东方”和“西方”学术社团,基本上遵循人们对东西方世界的直观认知。以东方国家/地区为首的“东方阵营”包括中国、韩国、印度、土耳其、伊朗和中国台湾。西方国家为主的“西方阵营”包括美国、加拿大、英国、荷兰、澳大利亚、瑞士、德国、法国、意大利、西班牙和日本。唯一例外的是日本,它在地理上是一个东方国家,但在科学上与西方接触更为密切。该“东西方二分”的出现始于2004年左右,并且稳定出现超过十年。在此之前,国际科学界像一个洋葱状的结构,西方国家构成了引文网络的核心,且彼此之间的引用强度十分紧密。位于外层的国家/地区虽然远离核心层,但彼此之间的引用强度不足以形成一个新的核心。当只关注在单一国家署名的论文及其引用关系时,这种“东西方二分”的社团划分保持不变。(2)基于引用强度的热力图表明,“东方阵营”与“西方阵营”之间存在引用强度的非平衡关系:“西方阵营”受到“东方阵营”无偏的引用强度,而“东方阵营”受到“西方阵营”远低于期望的引用强度。由于引用行为是对学术成果的认可度的反映,“东方阵营”受到“西方阵营”的有偏引用也体现于国际主流科学奖项的颁布情况,例如诺贝尔奖(Nobel Prize)、菲尔兹奖(Fields Medal)和图灵奖(Turing Award)很少授予来自东方的学术成果,而“西方阵营”在其中占据主导地位。此外,本文以美国和中国为例,发现该有偏引用会对“东方阵营”成员的国际被引用率产生显著的抑制作用,而对“西方阵营”成员的国际被引用率产生显著的增益效果。(3)东方科学研究的快速发展和西方的相对衰落可能导致了该东西方社团划分的出现。在过去二十年来,大多数东方国家,如中国、印度和韩国,都经历了科学成果的稳定和高水平增长时期。其中中国的增长水平之高尤其显著,因此本文通过控制变量,对中国的论文进行随机删减使其达到国际平均发展水平。并由此发现中国在特定研究领域的快速发展,很大程度上影响了“东西方学术阵营”划分的出现。综上所述,本文基于Z-score构建的引用强度零模型,度量了各国之间的引用偏好,并通过层次聚类算法对各国的引文模式下的社团结构进行划分,发现了国际科学界中潜在的“东西方学术阵营”。继而讨论该社团结构给国际学界带来的实际影响,最后通过控制变量法,发现中国在各学科的快速发展对“东西方学术阵营”的形成具有结构性影响,对我国在各学科领域的学术发展工作具有参考意义。