GMAP共词分析法及其在古村落文献分析中的应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:madywu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
20世纪80年代,古村落开始受到人们的关注,但是直到20世纪90年代才受到重视,在这之前的文献都是考古方面。近些年来,随着国家对我国传统文化的保护意识的增强,古村落已经得到越来越多的学者关注,中国知网中有关古村落的文献数量也随着时间呈指数增长态势。因此,对古村落领域文献的探索具有重要的研究价值。共词分析方法是文献计量领域的经典分析方法,被广泛应用于领域的主题发现。现有的传统共词分析方法主要分为三个阶段:术语收集阶段、共现频率统计阶段以及聚类分析阶段,传统共词分析方法在以上三个阶段存在主观性过强、信息量不足,聚类不稳定、成员划分不合理、类团解释缺少语义分析等问题。因此,本文针对传统共词分析方法存在的缺陷提出了一种新的共词分析方法——GMAP共词分析方法。该方法首先使用g指数确定高频关键词的个数;其次,使用互信息概念对共现矩阵进行包容化处理;最后,使用AP算法进行聚类得出领域主题。为了动态追踪领域主题,本文提出了基于GMAP共词分析方法的主题演化框架,使用具有不对称性质的KL散度计算主题之间相似度,并利用ThemeRiver模型进行可视化,最终将主题演化结果直观地展示出来。本文首先通过文献调研研究出传统共词分析方法存在的缺陷,从每一个阶段着手进行改进,达到了自动化生成聚类中心以及合理对类团进行语义分析的目标,接着通过对古村落领域文献进行数值实验来验证本文提出的GMAP共词分析方法的有效性。另外,本文的主题演化框架是基于本文提出的GMAP共词分析方法,选择当前最优的可视化技术和与之匹配相似性度量方法,以达到追踪主题的变化的目标。为了验证本文提出的主题演化框架的实用性,本文将其应用到中国古村落领域文献的主题发现与追踪之中,并分别从宏观和微观层面对古村落领域的主题演化进行了深入分析。
其他文献
AAA是认证、授权、计费系统的简称,用来完成对用户身份合法性的鉴别、权限的分配、话单的采集、费用的结算等功能。其核心模块Radius服务器与网络接入服务器之间的通信协议采用RADIUS协议。通过对RADIUS协议层次结构、软件结构特点、工作原理及认证计费流程的详细分析,验证了AAA系统采用RADIUS协议的可行性。
充分发挥二、三级医疗机构退休医学专家技术专长,提升社区全科医生综合能力,助推社区卫生服务事业高质量发展,进行相关机制探索.
地面植被下层与次地表层的星载微波遥感要求低频波段(如P波段)的合成孔径雷达(SAR)探测,但低频P波段将受到电离层Faraday旋转(FR,Faraday rotation)效应的显著影响.文中分析FR后的P波
先简支后连续梁桥因其具有连续梁桥的受力特性和简支梁桥施工方便的特点而在公路工程中得到广泛应用。分析先简支后连续梁桥的构造特点和受力特点,并对其主要施工工序和质量控
研究一类具非线性扩散系数的脉冲时滞双曲型偏微分方程组,利用二阶脉冲时滞微分不等式,给出了该类方程组在Robin边值条件下所有有界解振动的充分性判据,所得结果充分反映了脉冲
思想政治工作是我党的传统优势和基本工作方法,在新形势下面对各种复杂的社会矛盾和社会思潮,只有继承思想政治工作优势、加大思想政治工作力度、创新思想政治工作方法,才能克服
目的:探讨舒普深治疗老年肺部感染的效果.方法:选择我院2016年1月-2018年10月收治的老年肺部感染患者100例.随机分为注射用头孢曲松钠组采取注射用头孢曲松钠治疗与舒普深治
功耗是导致片上多核处理器出现故障的重要诱因,也是片上多核处理器设计的重要制约因素.如何降低多核处理器的功耗并提高处理器能量效率,具有很大的研究意义与探索空间.文中主要从
对Excel数据处理进行了阐述,介绍了如何利用VBA编程实现Excel工作表中的数据检验和比较,并给出了相应的代码。
对2003年北极航次采集的样品进行颗粒生物硅(particulate biogenic silica,PBSi)浓度测定,依据光合浮游植物粒径大小,计算出两个粒级结构(0.8—20μm,〉20μm)的PBSi对水柱中生物硅现