论文部分内容阅读
新闻话题及其它的演化研究可以帮助人们快速了解和获取新闻内容。本文提出了一种挖掘新闻话题随时间变化的方法,通过话题抽取、话题过滤和话题关联实现话题的演化。首先应用LDA对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;根据话题对文档的贡献度过滤话题:计算相邻时间段中任意两个话题的分布距离实现话题的关联。实验结果证明该方法不但可以描述同一个话题随时间的演化过程,还可以描述话题内容随时间的变化,反映了话题(或子话题)之间多对多的演化关系。