论文部分内容阅读
通过分析共现现象可以从多个角度解释、挖掘隐含在论文中的各类信息,揭示论文与论文之间的内容关联和逻辑关联。但是,目前对共现现象的研究主要从两个不同或相同的特征项共现展开,本文致力于将三个或以上特征项共现的现象作为研究主体,在总结现有的共现研究方法、数据挖掘技术、可视化技术、知识发现方法的基础上,拓展共现现象的研究范围。本文界定了多重共现的概念,构建了一套多重共现的基础理论体系,研究了可用于多重共现的可视化方式,设计并开发了三重共现的可视化分析工具,并进一步构建起多重共现知识发现方法的分析体系,包括共现关联强度、被引关联强度、共现突发强度三个方面,最后通过实证研究验证了该套方法体系的分析效果及其可应用的研究范畴。通过该论文的研究发现,由于多重共现是专门针对三个或以上特征项共现的分析,因此,基于多重共现的可视化方式、分析工具还有知识发现方法无论从分析角度或者是分析深度上来说,可揭示出比一般的一重共现和二重共现分析结果更多的知识内容。
本文的主要研究内容包括:
(1)相关理论的研究:对共现相关领域的研究背景、国内外发展现状与趋势、相关研究的理论与实践等进行综述。
(2)多重共现的基础理论体系的构建:本文对Morris的共现研究理论进行改进,构建了一套独特的基础理论体系,具体包括多重共现的定义及研究范畴、用于多重共现的变量符号、多重共现的矩阵定义、多重共现的数据组织形式以及多重共现的延展系数计算公式与应用范畴。
(3)多重共现的可视化方法研究:对可视化概念进行了概述,并分析了目前在知识图谱领域应用的可视化分析方法与软件工具。同时,也研究了可应用于多重共现的可视化分析方式,包括社会网络可视化方式以及交叉图技术可视化方式,还对这两种可用于多重共现可视化的具体分析方法、显示方式进行了阐述和展示。通过对比这两种不同可视化方式的特点,发现采用交叉图技术作为多重共现的可视化方式效果较好。
(4)多重共现知识发现可视化分析工具的设计与开发:本文在多重共现交叉图可视化技术研究的基础上,自主设计和开发了多重共现知识发现可视化分析工具(MOVT),目前该工具可以通过导入论文集数据,自动生成三重共现的交叉图,并且该三重共现的交叉图技术能够同时把一重、二重、三重共现的信息同时展现出来,实现其它分析软件所不能展示的三重共现可视化效果。
(5)多重共现知识发现方法的理论研究:对知识发现的概念、模型及其一般过程进行了分析,并且在知识发现方法研究的基础上构建起一套多重共现的知识发现方法体系,包括共现关联强度的分析方法、被引关联强度的分析方法以及共现突发强度的分析方法。还依据各类分析方法的不同特点设计其数据模型、分析模型以及分析样例。
(6)三重共现知识发现方法的实证研究:通过选取实际的三重共现样例,分别对多重共现中的共现关联强度、被引关联强度以及共现突发强度的知识发现方法进行实证的研究。通过三重共现知识发现方法的实证分析发现该方法除了能够揭示出三重共现的知识内容外,还涵盖了一重、二重共现的知识内容揭示,从而能揭示出比一般共现更为深入和广泛的知识内容。