基于优化随机游走模型的文本热点主题探测研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:srsyzjks
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的/意义】结合随机游走算法Page Rank、词共现和多样性测度指标提出一种改进的热点主题探测方法C_BI-Page Rank,该方法有效提高了热点主题探测的效率和模型质量。【方法/过程】首先对Page Rank算法进行理论回顾,引入词共现和布里渊系数构建C_BI-Page Rank算法模型,然后采用4种不同因素组合的Page Rank算法对Web of Science系统2006-2016的应用心理学领域的期刊文献进行实证分析,最后基于波达计数的专家方法进行算法比较与评价,同时也探索其与词频统计之间的相关性问题。【结果/结论】实证表明C_BI-Page Rank不仅在运行效率上收敛快、运行时间少且质量评估优势明显。该方法引入不同文本主题因素,一定程度解决传统词频分析和机器学习的不足,为热点主题探测方法提供了新思路。
其他文献
澳大利亚西部伊尔岗克拉通卡尔古利地体是世界上太古宙与科马提岩有关的硫化物镍矿床最为集中的地区。该区科马提岩型硫化镍矿床主要有两大类型:①由高品位的块状、海面陨铁状
融资难一直是限制我国中小企业发展壮大的“瓶颈”,解决这一问题已迫在眉睫。本文通过对衍生金融工具的分析,从中得到对中小企业融资工具设计思路的有益启示,即充分利用未来
拓展训练是在世界范围内被广泛推广和采纳的一种学习和训练方法,也是近几年在我国比较流行的一种体育训练模式。它不仅有助于运动参与和身体参与的教学目标的实现,也充分蕴含
热轧机伸缩轴断裂是澳大利亚某钢铁厂经常遇到的问题 .机械故障分析的结果表明 ,故障产生的主要原因是伸缩轴扭矩超高 .而伸缩轴扭矩超高则由钢锭进入轧辊时的机械冲击引起 .
本文将克拉申的"词素习得顺序"理论,即在第一语言习得研究中的结论应用于二语习得研究中。通过研究在二语习得过程中的语法词素习得顺序,对目前英语教学中忽视的问题提出见解
2006年5月以来,中国股市和基金市场像巨大的磁场,吸引广大储户变成了新股民和新基民,"拿出储蓄、参与投资"成为股市流行语,在"牛市"财富效应的"感召"下,老百姓的投资理念发生
1研究背景据世界卫生组织定义,心血管疾病(Cardiovasculardiseases,CVDs)为一组心脏和血管疾病,是全球死因的首要原因。数据显示,2015年1770万人死于CVDs,主要是冠心病和脑卒
近些年来二维或三维微米/纳米纤维作为药物载体已获得广泛的关注和研究。在药物递送系统中,如何确保纤维的载药能力与药物稳定性,并最终满足期望的药物释放曲线是当今的研究
通过对模糊控制系统相平面响应轨迹特性的分析,提出了相平面响应轨迹实时特征向量和实时特征向量夹角的概念;在分析实时特征向量夹角特性的基础上,提出基于相平面响应轨迹特