论文部分内容阅读
信息资源数量和种类的急速增长,使得科研人员及情报分析人员在把握学科领域中的研究热点时面临着越来越多的挑战。如何快速主动地从海量信息资源中识别和判断研究热点已成为当前科学研究面临的一个重要问题。文章针对该问题,努力探索一种自动识别和判断学科领域最新研究趋势的有效途径,辅助科研人员和情报分析人员。
文中在分析国内外提出的多种学科热点判断的相关理论和方法基础上,重点研究了新兴研究趋势探测(Emergingtrenddetection,ETD)的理论方法和关键问题,总结其对学科热点判断的启示和当前在实践应用的技术方法上存在的问题。文中在对ETD理论研究的基础上,结合医学领域的资源特点,提出了医学领域新兴研究趋势(Emergingtrend,ET)的判断模型和相应的流程步骤。主要步骤包括医学主题词抽取、医学主题词筛选、主题词聚类形成主题领域、评价主题领域是否具有ET特征的指标定义、新兴研究趋势的综合判断等。在医学主题词抽取上,本文以从自由文本映射到医学专业主题词的工具-MMTx为基础,设计了医学主题词抽取方案。在医学主题词筛选中,本文借鉴了自然语言检索领域的加权词频公式-BM25F模型来衡量主题词对文献内容的贡献程度大小,挑选其中重要主题词集合。在主题词聚类形成主题领域中,本文采用k-means聚类方法来对筛选出的重要主题词集合进行划分,以紧密关联的一组主题词集合——主题领域来代表一个具体的研究趋势。同时,文中针对ET的各项特征来设定每个主题领域的评价指标,综合每个主题领域在各个评价指标上的表现情况,形成一个综合指数来将主题领域划分为新兴研究趋势、潜在的新兴研究趋势、分散的主题领域和不再流行的主题领域等四种类型。借助本文设计的判断模型和具体步骤,笔者选用骨关节炎为实验案例,对整个医学领域ET判断模型进行试验。针对试验结果,笔者阅读相关中文文献综述以及对相关领域专家进行了访谈,其结果验证了本文探索出的技术方法具有一定的可靠性。
通过上述的工作,本文设计和实现了医学领域ET判断的模型,探索出了一种判断医学领域研究热点行之有效的途径,能够对情报分析领域学科热点的识别和判断起到积极地辅助作用。