基于多重共现的知识发现方法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:wangyuantianjin99se
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析共现现象可以从多个角度解释、挖掘隐含在论文中的各类信息,揭示论文与论文之间的内容关联和逻辑关联。但是,目前对共现现象的研究主要从两个不同或相同的特征项共现展开,本文致力于将三个或以上特征项共现的现象作为研究主体,在总结现有的共现研究方法、数据挖掘技术、可视化技术、知识发现方法的基础上,拓展共现现象的研究范围。本文界定了多重共现的概念,构建了一套多重共现的基础理论体系,研究了可用于多重共现的可视化方式,设计并开发了三重共现的可视化分析工具,并进一步构建起多重共现知识发现方法的分析体系,包括共现关联强度、被引关联强度、共现突发强度三个方面,最后通过实证研究验证了该套方法体系的分析效果及其可应用的研究范畴。通过该论文的研究发现,由于多重共现是专门针对三个或以上特征项共现的分析,因此,基于多重共现的可视化方式、分析工具还有知识发现方法无论从分析角度或者是分析深度上来说,可揭示出比一般的一重共现和二重共现分析结果更多的知识内容。   本文的主要研究内容包括:   (1)相关理论的研究:对共现相关领域的研究背景、国内外发展现状与趋势、相关研究的理论与实践等进行综述。   (2)多重共现的基础理论体系的构建:本文对Morris的共现研究理论进行改进,构建了一套独特的基础理论体系,具体包括多重共现的定义及研究范畴、用于多重共现的变量符号、多重共现的矩阵定义、多重共现的数据组织形式以及多重共现的延展系数计算公式与应用范畴。   (3)多重共现的可视化方法研究:对可视化概念进行了概述,并分析了目前在知识图谱领域应用的可视化分析方法与软件工具。同时,也研究了可应用于多重共现的可视化分析方式,包括社会网络可视化方式以及交叉图技术可视化方式,还对这两种可用于多重共现可视化的具体分析方法、显示方式进行了阐述和展示。通过对比这两种不同可视化方式的特点,发现采用交叉图技术作为多重共现的可视化方式效果较好。   (4)多重共现知识发现可视化分析工具的设计与开发:本文在多重共现交叉图可视化技术研究的基础上,自主设计和开发了多重共现知识发现可视化分析工具(MOVT),目前该工具可以通过导入论文集数据,自动生成三重共现的交叉图,并且该三重共现的交叉图技术能够同时把一重、二重、三重共现的信息同时展现出来,实现其它分析软件所不能展示的三重共现可视化效果。   (5)多重共现知识发现方法的理论研究:对知识发现的概念、模型及其一般过程进行了分析,并且在知识发现方法研究的基础上构建起一套多重共现的知识发现方法体系,包括共现关联强度的分析方法、被引关联强度的分析方法以及共现突发强度的分析方法。还依据各类分析方法的不同特点设计其数据模型、分析模型以及分析样例。   (6)三重共现知识发现方法的实证研究:通过选取实际的三重共现样例,分别对多重共现中的共现关联强度、被引关联强度以及共现突发强度的知识发现方法进行实证的研究。通过三重共现知识发现方法的实证分析发现该方法除了能够揭示出三重共现的知识内容外,还涵盖了一重、二重共现的知识内容揭示,从而能揭示出比一般共现更为深入和广泛的知识内容。
其他文献
本文通过对荣华二采区10
随着互联网的发展和微博的日趋流行,新浪等中文微博网站已成为海量信息的发布平台,然而目前对中文微博的研究大多还是针对单一的用户关系分析,对微博本身内容的挖掘分析研究较少
未来技术分析在科技规划、科技管理与战略领域发挥了越来越重要的作用,对于情报研究而言,除了在拥有良好基础的动态监测和态势分析的基础上,还应在技术创新领域开展更多的面向未
近些年对信息行为的相关研究无论从深度上还是广度上都已经有所成就,借鉴心理学、社会学及人类学等相关学科的基础理论方法形成了很多理论体系,一部分是基于认知的信息行为研究
本研究以新生代农民工为研究对象,通过对昆明市新生代农民工的信息行为进行长期的实地调查、理论分析和实证研究,把握新生代农民工的信息行为特征、规律,对新生代农民工择业过程
当前,互联网已经从浏览时代、搜索时代发展到了推荐时代,个性化推荐系统是推荐时代的主要特征。个性化推荐系统有助于解决目前用户所面临的“信息超载”问题。在以信息服务为主
随着开源软件的成功,开源软件项目也逐渐引起研究者们的注意。然而关于开源项目的大多数研究都集中于社区用户的参与动机,项目成功因素分析,或者某种质量控制机制在开源项目中的
在科技规划、科技管理和科技战略领域,识别技术主题的未来发展态势,选择未来技术发展方向,并对发展方向中的核心技术主题的演化趋势和演化路径进行全面、深入的分析,从而识别该技
信息技术教学与信息技术教育手段的整合,实现现代多媒体技术的组合,达到直观、形象、生动、多角度、立体式地展示信息技术教学的内在规律,有机地与其他学科联系和交互影响。
随着网络通信技术和数字资源出版业的不断发展,图书馆的信息存储方式和使用方式逐渐网络化、数字化,读者对图书馆各种资源的需求以及利用方式不断更新;同时,数字资源种类和数量的