基于LDA模型和话题过滤的研究主题演化分析

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:fogstorm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前科学技术文献数量激增、难以从总体上分析把握的现状,提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法.该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题.然后,通过话题过滤剔除意义有限的话题,并借助简单启发式规则选择种子话题.最后,再利用语义相关度将相邻时间片内内容相近的种子话题联系起来,以得到研究主题的演化趋势.实验结果表明,在不对话题生成进行人工干预的前提下,本文方法较真实地描述了研究主题强度和内容随时间的演化趋势,避免了无意义话题对研究主题演化的负面影响.
其他文献
本文以案例的形式,尝试从预设学习目标、设计评价内容、分析学后认知水平等方面构建基于SOLO分类理论的"区域认知"学习评价框架,并以此促进学生"区域认知"能力的提升和教师教
在超分子研究领域,主要研究方向之一是构筑结构稳定的超分子纳米结构,并通过各种手段赋予纳米结构以智能的响应特性,实现特殊功能。为了达到这样的目标,越来越多的响应刺激材料被
目的:探讨肺栓塞在心血管内科的发病情况及肺栓塞的诊断方法研究。方法:回顾性分析2012年01月~2013年12月期间入院科室为心血管内科并确诊为肺栓塞患者28例,其中男性17例,女性11
F过去对视觉媒体的检索 ,如图象和视频 ,进行了大量的研究 .但是我们注意到音频也是多媒体中的一种典型媒体 ,是信息的一种常用载体 .常规的处理是把数字音频当成非结构化流
文章综述了人类基因组计划研究和进展的情况
<正>在企业并购融资中,融资渠道和融资结构的设计是企业并购项目筹划的头等大事,是决定并购方案是否可行的首要因素。目前,国内资本市场融资渠道较窄且审办手续繁琐,
实践性社群(Communities of Practice,COP)已被发展为企业内以及企业间知识分享及创造的主要平台,其强调的是松散且非正式的社群架构,而当中的成员组成也是强调自愿加入,所以
先秦诸子,思想各异,但有一点却是一致的,他们都在不遗余力地向最高统治者献纳自己的治国为政之策。国以民为本,治国必先安民,所以他们的治国之策中着重强调的也是安民。而先
警察出庭作证是指,在法庭审判过程中,如果刑事案件被告人及其辩护人对侦查行为的合法性及通过侦查取得的证据的合法性有异议时,警察应该以控方证人的身份出庭作证,就对案件实
西方主流经济学一直把自由市场作为理论的重要起点之一,亦影响到我国经济改革的"私有化"和"市场化"走向。另一方面,却是国家在国企垄断和诸如楼市调控中显示出来的强势计划性