LDA与BTM概率主题模型抽取科学主题效果比较研究

来源 :情报工程 | 被引量 : 0次 | 上传用户:fibiya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析文献主题是挖掘科学脉络的基础,目前存在多种提取文献主题的方法,被学者广泛使用的方法是使用概率主题模型抽取文献的主题。使用不同的算法和不同的语料提取出的主题结果也不同,本文通过计算查全率、查准率和定性分析方法分别比较利用了LDA抽取标题、LDA抽取摘要、BTM抽取标题、BTM抽取摘要的主题效果。本文以纳米材料领域数据为例进行分析,实验结果表明使用摘要做语料提取出的主题颗粒度较小且能够反应文献研究内容的细节,LDA算法在提取摘要主题方面优于BTM算法,BTM算法在提取标题主题方面优于LDA算法。
其他文献
中浓和高浓臭氧段是依据文献确定的。传质过程、臭氧消耗、选择性和化学需氧量携带的影响均作了研究。高浓度(HC)臭氧段试验,目的在于探索最佳工艺参数。所提供的数据包括:反应速度
目的观察血府逐瘀汤合五味消毒饮治疗糖尿病周围神经炎的临床疗效及其对神经传导速度的影响。方法将68例糖尿病周围神经炎患者随机分为2组。对照组36例给予盐酸丁咯地尔注射
目的:探讨慢性乙型肝炎(CHB)及HBV携带者自体外周血单核细胞采集的护理方法。方法:采用MCS+血细胞分离机对465例患者进行外周血单核细胞的采集,并在采集前、中、后给予观察及
<正>志菊:读了你的信,心中的酸甜苦辣全都涌上来。一片痴情,一片心。铁打的心也会被溶化。说实在的我也怕将来不能给你带来幸福的生活,而在去年给你写了那样的信。我是一个平
随着新课标的提出,许多学校为跟上时代步伐盲目改变教学方式.这种方式不仅不能让学生在学习过程中学会自主思考,深入探究,还会让他们陷入盲于提升成绩的恶性循环的学习中.尤
大数据时代业已到来,学界、业界乐此不疲的讨论大数据及其带来的革命性变化,使其变成了一个流行词汇。但是任何新技术的到来都会产生副作用。大数据在变革工作与思维的同时,
数字阅读已成为我们生活中不可或缺的一部分,但数字阅读满意度相关研究较少,满意度研究能促进数字阅读理论与实践的发展。基于DeLone&McLean信息系统成功模型和美国满意度指