论文部分内容阅读
研究前沿探测作为科学计量学的重要研究内容,对于学术领域有着重要意义。一个学科领域的研究前沿往往代表着领域内最核心的研究主题与发展趋势,对研究者科研选题及国家科技政策制定具有重要的参考价值。从研究前沿的概念提出至今,学者们提出了不同的研究前沿探测方法。主流方法有词频分析法、突显词检测方法、共词分析法和基于引文的方法等。关键词是研究前沿探测的重要载体之一,基于关键词的分析方法通常是将关键词词频作为研究前沿探测的原始数据,以词频的大小和词频变化的快慢为依据,通过分析研究主题的发展趋势和演化过程来探测学科领域的研究前沿。词频方法因数据处理简单、结果分析直观而被广泛使用。但现有的词频方法依旧存在可改进之处,现有方法为了反映词频在时间维度的变化过程,通常会将词频做时间切片处理,这一操作简化了数据计算,但忽略了时间窗口内的关键词时间分布特征,使得同一时间窗口内的关键词差异性消失,且词频变化在整个时间轴上的连续性也遭到破坏。本研究的目的正是为了克服上述缺陷,在较为全面保留关键词原始时间分布特征的基础上,能够更加精细化刻画关键词的演化过程。本研究以《中文核心期刊概览》的统计学、会计、电影电视艺术、测绘学、口腔科学、植物保护、安全科学7个学科所收录中文期刊2008-2018年所有论文高频关键词为研究对象,将所有高频关键词以时间为自变量拟合出关键词累积分布函数,并用词频累积速度和词频累积加速度表征领域关键词的热度和潜力。在此基础上综合热度和潜力两个维度探测研究前沿并分析动态演化。本研究的数据处理与分析主要集中在三个层次:关键词层次、学科领域层次、多学科层次。关键词层次上,高频关键词的动态演化过程可以转化为词频累积速度和词频累积加速度两个连续函数,关键词在每一个时刻上的发展现状与趋势都可通过热度和潜力指标进行表达;在学科领域层次上,高频关键词之间根据同一时刻上的热度-潜力值绘制出热度-潜力分布图,再依据关键词在分布图上的位置,将关键词分为重点前沿关键词、高潜力关键词、高热度关键词和一般性关键词;多学科层次上,本研究分别对7个学科领域内关键词多年份热度与潜力排名进行相关性分析,比较不同学科间相关性计算结果,结果表明7个学科整体都在发展,但不同学科的具体发展过程并不相同。此外,本研究还将热度-潜力指标下的探测结果与现有词频方法探测结果进行比较,比较结果可知:热度-潜力指标下的探测结果与现有词频方法探测结果存在差异,且这些差异在一定程度上体现了热度-潜力指标在时效性上的优势,保留关键词时间分布特征的探测方法是对具有时间累积性评价的有益探索。但本研究尚不完善,对关键词时间分布的拟合仍需要更多尝试以及进一步的研究。