基于VOLDA主题模型和ESG预测模型的话题热度预测研究

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:lwp2007sh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,web2.0社交媒体对人们的日常生活产生了巨大的影响,同时生成了海量的网络舆情文本。这些舆情文本如论坛帖子,实时反映当前网络舆情的热点话题,具有丰富的话题内容信息。因此,如何对舆情文本进行在线主题建模,实时挖掘出话题信息并进行话题热度计算与预测具有重要的研究意义。然而现有研究对话题的热度计算中忽略了舆情文本的主题组成情况并且现有的预测模型对话题热度的预测能力较差,因此本文提出了一种基于VOLDA主题模型和ESG预测模型的话题热度预测方法。本文首先研究了在线主题模型与时间序列预测方法的相关理论,将其作为本文的研究基础。其次在OLDA模型中引入主题相似度矩阵来去除非相关时间片主题影响,构建了可变在线LDA模型(Variable Online-LDA,简称VOLDA)。此外考虑到时间序列一般由多个时间序列模块组成,本文提出了ESG(EEMD-SVM-GMDH)预测模型用于时间序列分解预测。之后,本文设计了基于上述两个模型的话题热度预测方法,提出了结合主题模型和热度指标的话题热度计算方法,利用VOLDA模型自动获取话题及其热度时间序列,并利用ESG模型对其进行预测。最后,本文爬取天涯论坛帖子构建实验数据集进行实验,实验证明本文提出的模型与方法是有效且可靠的。具体的创新点有:(1)本文构建了VOLDA主题模型和ESG预测模型。VOLDA模型去除了主题内容演化矩阵中当前主题无关的时间片,从而避免了主题演化受无关主题的影响,提高主题跟踪能力;ESG预测模型将时间序列进行了分解,并将分量预测结果加权累加得到最终预测值,更加充分利用了原始时间序列信息,提升预测效果(2)提出了基于VOLDA和ESG的话题热度预测方法,结合主题信息和外部热度特征更加合理的定义了话题热度并在VOLDA主题建模过程中自动获取话题及其热度时间序列,最后采用ESG模型分解预测以取得较好的预测效果。
其他文献
2011年4月12日,三星B2B在北京中奥马哥孛罗大酒店,举办了主题为"智览科技尊享视界"的三星商用大屏幕显示器新品发布会,正式发布了第二代超视界无缝液晶视频墙UD55A,凭借再度创
随着人们生活水平的不断提高,对所在城市的环境质量也提出了更高的要求。因此,如何通过园林工程施工与绿化增加城市绿化面积,为人们提供一个良好的自然生活环境,同时净化和调
目前,我国工业锅炉已经形成了比较完备的体系,随着时代的发展,对工业锅炉产品提出了更高的要求。本文从燃烧技术、燃料替代、节能减排等方面对我国主流工业锅炉的发展趋势进
为贯彻落实《福建省人民政府关于加快发展智能制造九条措施》(闽政〔2015〕36号),日前,福建省经济和信息化委员会发布《关于开展2017年福建省智能制造试点示范企业推荐工作的通
受疫情影响大学生对于毕业就业普遍存在抑郁、依赖、逃避等心理,究其根源在于大学生对后疫情时代下就业形势变化认知不足,消极应对。疫情的影响是具有时效性的,自身的强大才
<正> 2003年11月中旬,由中央教育科学研究所与南京市教育局共同举办的“全国校长发展学校”在南京隆重开学,首届学员是来自全国各地的近100名中小学、职业学校校长和区县教育
针对矿山资源开采过程中产能不确定的分配问题,引入了模糊结构元素理论。将产能用结构元表示,并利用结构元加权序将模糊数比较转化为单调函数比较,将含有模糊变量的线性规划问题
采用等孔体积浸渍法经500℃焙烧得到了负载型光催化剂TiO2/Ce0.45Zr0.45Mn0.05La0.05OX,以气相苯模拟室内挥发性气体,在静态反应装置中考察该催化剂对气相苯的光催化降解性能
本文从罗兰·巴特的意指系统理论出发,对赛珍珠小说《大地》中的人物形象符号进行剖析,旨在挖掘人物符号背后隐含的文化内涵。本文先就王龙、阿兰、荷花三个主要人物进行分析
The integrity of the basal stem cell layer is critical for epithelial homoeostasis.In this paper,we review the expression of oral mucosal stem cell markers(OM-S