论文部分内容阅读
科学数据引用是数据密集型科学研究范式中科研工作者普遍的信息行为,规范引用科学数据近年来受到了学术界和国家政策管理部门的持续关注,2018年国务院发布《科学数据管理方法》和国家标准《信息技术科学数据引用》(GB/T 35294-2017),为我国科学数据的引用实践与管理工作提出新的要求。作为重要的科学数据用户,科研工作者需要在学术成果表达中规范呈现、引用科学数据,以提高科学数据可见性、促进科学数据共享,从而有效发挥科学数据的科研价值并推动科学研究的发展。基于此,本研究从科研工作者的科学数据引用行为结果出发,聚焦探究期刊论文中的科学数据引用行为,旨在描述不同学科领域对科学数据的引用现状,揭示科学数据引用行为模式特征与关联性,挖掘不同学科领域的科学数据引用行为模式差异。本研究结合《信息技术科学数据引用》(GB/T 35294-2017)从18个维度构建科学数据引用行为内容分析类目系统,并以此编制科学数据引用行为模式的研究变量集;以中国知网(CNKI)期刊全文数据库为数据来源抽取不同学科领域12种学术期刊的2017~2019年每年第一期论文,经调研771篇样本论文,通过人工编码方法从中识别4992条明确的科学数据引用并根据内容分析类目系统对引用片段进行多维度编码。针对编码数据,首先通过不同维度的类别数据频数统计分布揭示期刊论文中科研工作者的科学数据引用行为模式特征,主要从引用标注方式、引用呈现形式、引用位置、引用标记标注位置、引用来源信息标注位置、数据来源标题、唯一标识符和解析地址八个方面反映科学数据引用行为特征,从创建时间、创建者、传播者、来源国家、形式和内容类型六个方面反映被引用科学数据的特征;随后通过卡方检验、对数线性模型、对应分析方法分析引用行为模式特征变量间的关联关系与影响效应,并揭示不同学科领域科研工作者的科学数据引用行为模式差异。研究发现:总体上,科研工作者在期刊论文中的科学数据引用行为较为普遍,科学数据引用数量逐年提高,但不规范引用行为普遍存在;科研工作者对科学数据不同引用元素的标注程度存在差异,其中关于科学数据唯一标识符和解析地址的不规范引用尤为突出,主要与引用标注方式和科学数据的传播者类型相关;科研工作者的引用标注方式、引用标记标注位置与引用来源信息标注位置共同反映了有连带性的科学数据引用标注行为系列,目前呈现两种较为普遍的引用标注行为系列表现,分别为“引用之处使用标记&参考文献注明来源”和“无标记&引用之处直接说明来源”,两种表现模式中具体的引用标记位置和来源信息标注位置形成了较为固定的搭配,同时,科学数据的创建者和传播者类型对科研工作者的引用标注行为系列表现具有显著影响作用。不同学科领域科研工作者的科学数据引用行为模式具有差异:其一,科学数据引用程度存在差异,自然科学与工程技术领域对科学数据的引用量日益增加且高于总体平均水平,而社会科学和人文学科领域的科学数据引用数量较为稳定且低于平均水平;其二,科学数据类型的引用倾向存在差异,主要表现在科学数据的创建时间、创建者和内容类型三个方面,自然科学与工程科技领域引用的科学数据时间跨度较长、类型丰富,较倾向引用个人或团队研究者形成的科学研究数据,社会科学领域引用的科学数据及时性较强,倾向引用组织机构创建的调查统计类科学数据,而人文学科领域较倾向引用形成时间久远的事实描述类科学数据;其三,科学数据引用来源信息的位置存在明显差异,自然科学与工程科技领域的科研工作者基本在论文的文后参考文献列表中标注,社会科学领域中较多在论文正文内直接描述说明,人文学科领域中较多通过注释标注在页脚中,该差异主要受学科科研范式和固有引用标注习惯的影响;其四,科学数据的引用位置倾向具有较大差异,科学数据在不同学科科研活动中的引用功能存在一定差异。