论文部分内容阅读
针对电子公告栏(BBs)内容演化过程中话题数量动态变化的特点,提出基于潜在狄利克雷分布的自适应在线话题演化模型。该模型以历史时间窗口中话题、词分布的后验线性加权调节当前时间窗口中话题、词分布的先验,给出在线新话题检测和消亡话题检测方法,自动适应数据流中的话题数量。实验结果表明,该模型能有效识别BBS内容演化过程中话题的产生与消亡,分析它们在时间和内容上的演化,及时发现热点事件。