抑制背景噪声的LDA子话题挖掘算法

来源 :华南理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:Susan616
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专题文章集合是一些拥有相似背景知识的文章集合.为了更好地从专题文章集合内部的复杂信息关联中高效挖掘子话题信息,文中提出了抑制背景噪声的线性判别分析(LDA)子话题挖掘算法BLDA,通过预先抽取专题文档集合的共同背景知识、在迭代过程中重设关键词的产生等方式提高子话题抽取的准确程度.在微信公众账号文章上的系列实验证明,BLDA算法针对有共同背景的专题文章集合的聚类结果显著优于传统的LDA算法,其中主题召回率提高了170%,Purity聚类指标提高了143%,NMI聚类指标提高了160%.
其他文献
通用技术与信息技术都属于"技术"课,而信息技术重在培养学生的信息素养,通用技术则重在培养学生的"技术"素养。将现代信息技术作为工具和手段渗透到通用技术教学中,实现通用技术
配子输卵管内移植(gamete intrafallopian transfer, GIFT).主要适用于非输卵管性不育症.由于GIFT技术,更接近于生理状态,临床妊娠率较高,近年来我们开展了经阴道配子输卵管