基于LDA模型的主题演化分析:以情报学文献为例

来源 :北京工业大学学报 | 被引量 : 0次 | 上传用户:baihuiguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了掌握科研动态和追踪研究热点,需要挖掘文献中的主题及其变化规律,因此,提出了一种基于隐性狄利克雷分布(latent Dirichlet allocation,LDA)的主题演化分析模型.首先,在整个文本集合上使用LDA模型识别主题及其关键词,并计算每个时间窗口中文档-主题概率分布;然后,对各个时间窗口下的文本集合分别使用LDA模型计算出主题-词汇概率分布,并计算不同时间窗口下不同主题的相似度,从而得出主题强度的演化趋势;最后,通过相似主题下的词汇的概率分布得到主题内容的变化.可观察到中文情报学领域,"语义分析"等主题的关注度具有持续上升的趋势.
其他文献
司各特以其整理苏格兰民歌遗产、巨大的小说创作业绩及其所深切表达的苏格兰认同,被苏格兰人尊为苏格兰民族英雄。然而,这样的伟大苏格兰文学家译介到了中国,却仅仅是英国通
男女平等的思想自新中国成立以来就已深深根植于人们的头脑当中,但如何真正做到男女平等却是时至今日仍一直在探讨的问题。近一段时日以来,人们一直在探讨争论的"妻子是否可
我国倡导"一带一路"的"五通发展"战略。在此大背景下,与其他国家和地区之间的商务沟通日益频繁,需要培养具有良好跨文化商务沟通能力的有用人才。这些能力涉及语言和非语言两
由于含汞废物排放量大,对环境毒副作用强,因此近两年对含汞废物治理和回收的研究逐渐深入。随着分子生物学的发展,国内外学者都把目光投向利用微生物对含汞废物进行治理方面,尤其
<正>幼儿园语言能力的培养是《幼儿园教育指导纲要(试行)》"语言"领域的重要的培养目标之一。如何培养幼儿的语言能力是每一位幼儿教育工作者应积极探究的课题。1重视语言环
会议
<正> 明代医家万全(字密斋),精于儿科及养生学,临证效捷,经验丰富,对小儿优生、优育亦颇重视.兹示《幼科发挥》育儿思想之鳞爪,以窥全貌。父母体健儿强胎弱百病由生万氏认为
分析了用氢化物发生-原子荧光光谱法测定纯镁中铅含量不确定度的主要来源。建立了数学模型,对测定过程中的测量重复性、标准曲线的变动性、标准溶液、试液体积、试样称量等引
本论文以商丘工学院"大学计算机基础"课程为例,突出了课程的特色。实现教学互动和课程教学资源共享的同时,也实现了学生的自主学习能力和教师的教学水平的提高,该精品课程网站
本文对我国和其他一些国家或地区慈善捐赠税收政策进行了比较分析,指出我国目前慈善捐赠的税收优惠政策与一些发达国家或地区相比并没有太大差距。在改善我国慈善捐赠现状的
期刊