论文部分内容阅读
摘 要:本文运用情报学中计量学的研究方法,使用文献题录信息统计分析工具(Statistical Analysis Toolkit for Informetrics, SATI)最新4.0網络版,对《中国档案》近20年刊载文献进行可视化分析,以期探讨我国档案管理行政部门工作人员的研究热点和方向,为今后其进一步研究提供参考和借鉴。
关键词:档案;行政管理部门;可视化;SATI
档案是“真金白银”, 档案事业是关乎千秋的伟业。档案行政管理部门是具有政府行政管理职能的档案事业管理机构,主管全国及各级行政区域内的档案事业,并对本行政区域内机关、团体、企业事业单位和其他组织的档案工作实行监督和指导。其工作人员主要从事机关档案的管理工作,加之其日积月累的实践,会形成一批专业知识精通、实践经验丰富的研究学者,本文通过文献计量学的方法,探讨其研究热点和主要学者所作的贡献,为档案行政管理部门研究学者的进一步研究提供参考。
一、数据选取与研究方法
1.数据来源
《中国档案》自1951年创刊,前身为《材料工作通讯》,到上世纪80年代,随着我国档案学研究的全面繁荣,档案期刊在这一时期也如雨后春笋般集中涌现。《中国档案》杂志(月刊)系国家档案局主办的业务指导类期刊,是档案界创刊最早的刊物,其发文作者主要来自档案行政管理部门研究学者,研究的内容主要与行政管理部门档案工作密切相关,因此以《中国档案》刊载文献作为数据基础,对于我国档案行政管理部门档案研究现状进行分析,具有可行性和可操作性。
本文以《中国档案》近20年刊载文献为研究对象,通过中国知网(CNKI)选取数据源,时间设定为“2000年1月1日至2020年1月1日”,文献来源设定为《中国档案》精确匹配,检索去重后共5589篇,选择EndNote格式,导出题录信息。
2.分析工具
本文采用文献题录信息统计分析工具(Statistical Analysis Toolkit for Informetrics, SATI),结合文献计量学、科学计量学等方法,来处理分析所搜集到的数据。SATI作者刘启元,最初设计并发表于2012年,旨在通过对期刊全文数据库题录信息的处理,利用一般计量分析、共现分析、聚类分析、多维尺度分析、社会网络分析等数据分析方法,挖掘和呈现出美妙的可视化数据结果。如今一个新的Web版SATI 4.0被作者设计开发,放于网络共研究学者免费使用,它不仅保有旧版SATI的全部功能,还将跨平台使用,支持几乎所有操作系统和浏览器;异步处理数据,让服务器资源分配得到优化,可处理极大数据量,软件界面清晰,操作简单,利用云服务无需安装任何编程方面的专业工具就可以轻松使用。
二、关键词分析
关键词是反映论文主题概念的词或词组,由论文作者根据论文研究主题以及运用的核心方法自行标引。如果在多篇文章当中,同一关键词出现多次,在一定程度上说明此主题是本学科领域的研究热点。关键词共现分析指的是,两个或者多个关键词,同时在一篇文章中出现,出现的频率越高,说明两个关键词之间的联系越密切,主题概念之间的关联性越高。
表1为《中国档案》近20年刊载文献统计出现频次超过100以上的关键词,共计29个。由表1可以看出,排除出现频次最高的档案一词,排名前三位的关键词为“档案局”“国家档案局”“档案馆”,说明来自《中国档案》的作者主要研究对象以档案行政管理部门为主,因此以《中国档案》期刊刊载文献为研究对象,对档案行政管理部门研究学者的档案研究工作开展研究是十分有针对性的。值得注意的是排在第3位的“国家档案局”一词,其发文作者基本都来自国家档案局,作为国家档案局主办的刊物,其研究学者在研究发文上十分积极且具有一定的优势和权威。
由表1可以看出档案行政管理部门研究学者关注重点为档案局(馆)、档案工作、档案管理等主题,主要涉及机构自身建设和与其主营业务范围有关的主题为对象,侧重于实践性研究。还可以看出近年来,对于各级档案局(馆)建立综合档案馆、数字档案馆,如何实现纸质档案的数字化、档案信息化建设等也是研究的热点之一。同时结合图1,关键词共现网络图谱可以看出,高频关键词节点相互之间紧密的连接在一起,两两之间都有线连接,说明这些高频关键词两两都曾出现过且频率相当,没有形成明显的不同聚类,说明档案行政管理部门研究学者研究热点集中,研究方向较为一致。
三、高产作者及其合作网络分析
对检索到的5589篇文献进行统计,作者总数6723位,独立作者数3655位,平均每篇文章1.2位作者,表2列出发文量前10位高产作者及其发文量。来自中国档案杂志社刘守华发文超过100篇,占比超过总量的1%。其研究方向主要为中国近现代史、考古和人物传记。
利用SATI4.0网络版,运行得到作者合作网,除去噪点(独立作者)后,得到如图4所示高频作者合作图谱,图中用不同颜色区分了作者间的合作关系,聚合形成了7类,如表3。可以看出每一类别都只有2~3名作者,且产生合作关系的作者只占作者总数的0.25%。结合表2发现,前10位的高产作者中有6位属于高频合作作者,占比60%。
综上所述,高产作者即为高频合作作者,也说明高产作者在学术研究、学术交流上拥有较大权威、掌握更多学术资源,对档案的发展有一定的推动作用,形成了作者核心区。但从整体上看作者间合作网,合作作者占总体人数小,网络密度低,说明作者之间的交流合作较少,独立发文为主要形式,这样既不利于知识的传播,也不利于档案工作的发展与创新。
四、高产机构及其共现分析
对于发表于《中国档案》的相关研究机构的分布情况进行统计,其中发文量前20名的高产研究机构及其发文量和占比如表4所示。其中,发文在50篇以上的前8个高产机构,均集中在北京和上海,形成了研究机构核心区,也体现了我国档案机关管理部门档案研究能力从中央到地方,从经济相对发达地区向相对落后地区层级递减趋势。 利用SATI4.0网络版,导入检索出的题录信息,生成作者机构合作網络,如图5。从作者机构合作网络图谱中显示,有合作关系的机构聚合为三类,通过文献分析,汇总各省档案局(馆)的资讯等信息类文章不算做作者间合作关系,从而修正合作作者机构图,国家档案局则占据了核心,其作为高频合作机构,其中国家档案局技术部主任、评议委员会副主任委员黄丽华与浙江省档案局、中国人民大学信息资源管理学院、国家博物馆等机构作者均有合作。但从整个合作作者机构图谱和高频合作机构合作列表,表5中反映,作者跨机构、跨区域合作相对较少,信息沟通、知识交流及合作研究欠缺, 合作主要集中于单位内部,再大一点的涉及到省内部分档案管理机构,跨省合作则成为主要的壁垒。
五、结论
本文基于计量学方法,对《中国档案》发表于2000年至2020间的文献进行统计分析,使用SATI网络版处理数据,进行可视化分析,可以发现:
第一,通过高频关键词及共现分析,以“档案局(馆)”“档案事业”“档案工作”可知我国档案行政管理部门档案研究工作热点主要集中在档案管理部门自身发展建设上,近些年及今后研究热点还在于如何利用信息化手段,建立完善行政管理部门综合档案馆、数字档案馆等业务上。
第二,通过高产作者及其合作网络分析,可知高产作者大多来自中国档案杂志社和国家档案局,发文量大,对本领域发展贡献较大,形成了作者核心区,但从整体合作上看,作者之间的合作网络密度低,研究较为独立,相对于高校从事档案专业教学研究工作的学者,在学科交流和创新能力上还有欠缺,不利于档案行政管理部门档案研究工作的交流与发展。
第三,通过高产机构及其共现分析,可知我国档案行政管理部门已经形成核心研究机构,且研究能力从中央到地方逐级递减。跨机构、跨地区之间的交流合作较低,不利于档案工作的发展和创新。
最后,值得注意的是本文仅从关键词、作者和机构形成的网络进行可视化,而在计量学统计分析中,引文分析对研究重点和热点探讨也是十分重要的,因此,被引和共被引网络分析也是后续研究的主要内容。
参考文献:
[1]邓小军.大档案 大服务 大安全[J].中国档案,2011
[2]刘启元,叶 鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012
[3]杨来青.智慧档案馆是信息化发展的必然产物[J].中国档案,2014
[4]杨来青,李大鹏.智慧档案馆功能及体系结构[J].中国档案,2015
[5]杨来青.智慧档案馆建设关键技术研究与应用[J].中国档案,2016
[6]刘守华.用文化遗产锁住人类记忆[J].中国档案,2003
(作者单位:淄博市技师学院)
关键词:档案;行政管理部门;可视化;SATI
档案是“真金白银”, 档案事业是关乎千秋的伟业。档案行政管理部门是具有政府行政管理职能的档案事业管理机构,主管全国及各级行政区域内的档案事业,并对本行政区域内机关、团体、企业事业单位和其他组织的档案工作实行监督和指导。其工作人员主要从事机关档案的管理工作,加之其日积月累的实践,会形成一批专业知识精通、实践经验丰富的研究学者,本文通过文献计量学的方法,探讨其研究热点和主要学者所作的贡献,为档案行政管理部门研究学者的进一步研究提供参考。
一、数据选取与研究方法
1.数据来源
《中国档案》自1951年创刊,前身为《材料工作通讯》,到上世纪80年代,随着我国档案学研究的全面繁荣,档案期刊在这一时期也如雨后春笋般集中涌现。《中国档案》杂志(月刊)系国家档案局主办的业务指导类期刊,是档案界创刊最早的刊物,其发文作者主要来自档案行政管理部门研究学者,研究的内容主要与行政管理部门档案工作密切相关,因此以《中国档案》刊载文献作为数据基础,对于我国档案行政管理部门档案研究现状进行分析,具有可行性和可操作性。
本文以《中国档案》近20年刊载文献为研究对象,通过中国知网(CNKI)选取数据源,时间设定为“2000年1月1日至2020年1月1日”,文献来源设定为《中国档案》精确匹配,检索去重后共5589篇,选择EndNote格式,导出题录信息。
2.分析工具
本文采用文献题录信息统计分析工具(Statistical Analysis Toolkit for Informetrics, SATI),结合文献计量学、科学计量学等方法,来处理分析所搜集到的数据。SATI作者刘启元,最初设计并发表于2012年,旨在通过对期刊全文数据库题录信息的处理,利用一般计量分析、共现分析、聚类分析、多维尺度分析、社会网络分析等数据分析方法,挖掘和呈现出美妙的可视化数据结果。如今一个新的Web版SATI 4.0被作者设计开发,放于网络共研究学者免费使用,它不仅保有旧版SATI的全部功能,还将跨平台使用,支持几乎所有操作系统和浏览器;异步处理数据,让服务器资源分配得到优化,可处理极大数据量,软件界面清晰,操作简单,利用云服务无需安装任何编程方面的专业工具就可以轻松使用。
二、关键词分析
关键词是反映论文主题概念的词或词组,由论文作者根据论文研究主题以及运用的核心方法自行标引。如果在多篇文章当中,同一关键词出现多次,在一定程度上说明此主题是本学科领域的研究热点。关键词共现分析指的是,两个或者多个关键词,同时在一篇文章中出现,出现的频率越高,说明两个关键词之间的联系越密切,主题概念之间的关联性越高。
表1为《中国档案》近20年刊载文献统计出现频次超过100以上的关键词,共计29个。由表1可以看出,排除出现频次最高的档案一词,排名前三位的关键词为“档案局”“国家档案局”“档案馆”,说明来自《中国档案》的作者主要研究对象以档案行政管理部门为主,因此以《中国档案》期刊刊载文献为研究对象,对档案行政管理部门研究学者的档案研究工作开展研究是十分有针对性的。值得注意的是排在第3位的“国家档案局”一词,其发文作者基本都来自国家档案局,作为国家档案局主办的刊物,其研究学者在研究发文上十分积极且具有一定的优势和权威。
由表1可以看出档案行政管理部门研究学者关注重点为档案局(馆)、档案工作、档案管理等主题,主要涉及机构自身建设和与其主营业务范围有关的主题为对象,侧重于实践性研究。还可以看出近年来,对于各级档案局(馆)建立综合档案馆、数字档案馆,如何实现纸质档案的数字化、档案信息化建设等也是研究的热点之一。同时结合图1,关键词共现网络图谱可以看出,高频关键词节点相互之间紧密的连接在一起,两两之间都有线连接,说明这些高频关键词两两都曾出现过且频率相当,没有形成明显的不同聚类,说明档案行政管理部门研究学者研究热点集中,研究方向较为一致。
三、高产作者及其合作网络分析
对检索到的5589篇文献进行统计,作者总数6723位,独立作者数3655位,平均每篇文章1.2位作者,表2列出发文量前10位高产作者及其发文量。来自中国档案杂志社刘守华发文超过100篇,占比超过总量的1%。其研究方向主要为中国近现代史、考古和人物传记。
利用SATI4.0网络版,运行得到作者合作网,除去噪点(独立作者)后,得到如图4所示高频作者合作图谱,图中用不同颜色区分了作者间的合作关系,聚合形成了7类,如表3。可以看出每一类别都只有2~3名作者,且产生合作关系的作者只占作者总数的0.25%。结合表2发现,前10位的高产作者中有6位属于高频合作作者,占比60%。
综上所述,高产作者即为高频合作作者,也说明高产作者在学术研究、学术交流上拥有较大权威、掌握更多学术资源,对档案的发展有一定的推动作用,形成了作者核心区。但从整体上看作者间合作网,合作作者占总体人数小,网络密度低,说明作者之间的交流合作较少,独立发文为主要形式,这样既不利于知识的传播,也不利于档案工作的发展与创新。
四、高产机构及其共现分析
对于发表于《中国档案》的相关研究机构的分布情况进行统计,其中发文量前20名的高产研究机构及其发文量和占比如表4所示。其中,发文在50篇以上的前8个高产机构,均集中在北京和上海,形成了研究机构核心区,也体现了我国档案机关管理部门档案研究能力从中央到地方,从经济相对发达地区向相对落后地区层级递减趋势。 利用SATI4.0网络版,导入检索出的题录信息,生成作者机构合作網络,如图5。从作者机构合作网络图谱中显示,有合作关系的机构聚合为三类,通过文献分析,汇总各省档案局(馆)的资讯等信息类文章不算做作者间合作关系,从而修正合作作者机构图,国家档案局则占据了核心,其作为高频合作机构,其中国家档案局技术部主任、评议委员会副主任委员黄丽华与浙江省档案局、中国人民大学信息资源管理学院、国家博物馆等机构作者均有合作。但从整个合作作者机构图谱和高频合作机构合作列表,表5中反映,作者跨机构、跨区域合作相对较少,信息沟通、知识交流及合作研究欠缺, 合作主要集中于单位内部,再大一点的涉及到省内部分档案管理机构,跨省合作则成为主要的壁垒。
五、结论
本文基于计量学方法,对《中国档案》发表于2000年至2020间的文献进行统计分析,使用SATI网络版处理数据,进行可视化分析,可以发现:
第一,通过高频关键词及共现分析,以“档案局(馆)”“档案事业”“档案工作”可知我国档案行政管理部门档案研究工作热点主要集中在档案管理部门自身发展建设上,近些年及今后研究热点还在于如何利用信息化手段,建立完善行政管理部门综合档案馆、数字档案馆等业务上。
第二,通过高产作者及其合作网络分析,可知高产作者大多来自中国档案杂志社和国家档案局,发文量大,对本领域发展贡献较大,形成了作者核心区,但从整体合作上看,作者之间的合作网络密度低,研究较为独立,相对于高校从事档案专业教学研究工作的学者,在学科交流和创新能力上还有欠缺,不利于档案行政管理部门档案研究工作的交流与发展。
第三,通过高产机构及其共现分析,可知我国档案行政管理部门已经形成核心研究机构,且研究能力从中央到地方逐级递减。跨机构、跨地区之间的交流合作较低,不利于档案工作的发展和创新。
最后,值得注意的是本文仅从关键词、作者和机构形成的网络进行可视化,而在计量学统计分析中,引文分析对研究重点和热点探讨也是十分重要的,因此,被引和共被引网络分析也是后续研究的主要内容。
参考文献:
[1]邓小军.大档案 大服务 大安全[J].中国档案,2011
[2]刘启元,叶 鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012
[3]杨来青.智慧档案馆是信息化发展的必然产物[J].中国档案,2014
[4]杨来青,李大鹏.智慧档案馆功能及体系结构[J].中国档案,2015
[5]杨来青.智慧档案馆建设关键技术研究与应用[J].中国档案,2016
[6]刘守华.用文化遗产锁住人类记忆[J].中国档案,2003
(作者单位:淄博市技师学院)