论文部分内容阅读
目的共词可视化可用于揭示学科领域的发展及演进趋势、研究课题的扩散与传播的关系。本文通过应用几种常用的可视化方法探索医学信息学学科结构的演变过程,比较几种方法的特点,并尝试将几种可视化方法结果整合。材料与方法从PubMed数据库下载1999-2003年及2004-2008年两个时间段医学信息学核心期刊上发表的文献,利用书目共现分析系统提取所有文献的主要主题词,并统计出词频。依据高频低频词界分公式,确定阈值选取高频词后,生成高频词主题词共词矩阵与词篇矩阵。根据上述矩阵,探索医学信息学学科结构的可视化表达:(1)以SPSS15为统计工具绘制聚类树图。(2)根据共词聚类分析结果和高频主题词的共现矩阵,绘制出战略坐标图。(3)利用UciNet绘制高频主题词共词矩阵的社会网络图谱。在比较各种方法表现程度的基础上,本文尝试了三种可视化方法的融合,将不同方法得到的结果在一个知识图谱中展现出来。实验结果聚类树图、战略坐标和社会网络图谱展现出医学信息学研究领域的主题结构的变化、主题演变过程及其主题内部关系的改变。在此基础上,本文得出这三种可视化方法的特点:(1)聚类分析描述该学科领域的当前研究热点,可提供主体结构,通过对两个时间段的分析展示了热点主题结构的变化;但无法得知类内外的关系及每个词之间直观的联系。(2)战略坐标在聚类分析和共词矩阵的基础上,将该领域的主题结构展示在坐标轴中,通过揭示该学科类内外的联系,判断热点主题的成熟度与核心度,结合两个时间段的分析可展示学科热点主题结构演变过程,但无法展现词间关系。(3)社会网络分析恰恰弥补了前两者的不足,可以从空间的角度描述个体之间的关系,充分展现高频主题词之间的连接关系,即根据节点大小、连线粗细反映出词团间的联系的强弱,词团间联系的强弱通过网络关系图一目了然;并且通过社会网络分析中的k核分析,能够快速定位核心词团与边缘词团。其不足之处在于:不能反映词团的成熟度,难以判定某研究领域的成长趋势。由于各种方法原理和特点不同,其表现程度也不同。本文提出了三种可视化方法的融合,将不同方法得到的结果在一个知识图谱中展现出来的方法所得到的结果比较直观更易读。结论在基于共词矩阵的学科结构分析中,三种可视化方法具有各自的特点:聚类树图展现出某学科领域的主题结构、战略坐标展现出各主题在整个学科结构上的重要性或特性、社会网络图谱展现出各主题内部关系。将三种可视化方法结合起来使用可以达到更好的效果。