基于Web公共舆情自动分析及预警关键技术研究

来源 :北京邮电大学 | 被引量 : 9次 | 上传用户:a60414010299
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的普及和网民人数的增加,网络舆情已经成为了公共舆情的重要组成部分。同时,网络舆情和传统公共舆情相比,具有数据量大、突发性强、来源分散、影响范围大等特点。因此,网络舆情的监控引导十分重要,但是目前网络舆情的监控手段多数是采用人工监控方式。为了提高舆情监控效果,迫切的需要采用自动分析及预测手段及时地了解网络舆情的动态,掌握其发展趋势,以便于相关部门进行及时干预。本文首先研究了现有舆情分析预测技术和相关舆情分析系统,总结了目前舆情分析预测的一般模型,将舆情分析预测模型分为热点舆情发现模型和热点舆情预测模型两部分。经研究发现模型有以下不足之处:热点舆情发现模型中的文本特征表示阶段,存在着只处理报道内容的局限性;在舆情数据采集和处理方面,对多来源数据同等对待;其次,在热点舆情预测模型建立过程中,对训练数据的分类不够合理。针对以上几点,分别提出改进。首先,将Web意见挖掘应用在文本结构化阶段,利用SO-PMI和K-Means算法构建Web意见词典,量化评论意见,提出了评论内容向量和评论意见向量,完善了舆情文本表示和结构化;其次,提出了舆情来源分析模型补充舆情数据采集和处理的不足之处。·最后,利用C5.0决策树算法将训练数据按照热点舆情意见倾向的极性和强度分类,对各类舆情数据分别建立BP神经网络热点舆情预测模型,改善了模型的预测精度。实验分析表明,改进模型降低了热点舆情发现的错检率和漏检率,同时降低了热点舆情发展趋势预测的平均绝对百分比误差(MAPE)。
其他文献
在20世纪90年代脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)是一种新型神经网络的技术,研究具有一定的应用价值。本文研究了PCNN的原理模型,针对特定的研究对象,对传统
石斛属(Dendrobium)植物是兰科的附生植物,它是我国传统的名贵中药材,除了具有较高的药用价值外,它还具有较高的观赏价值。前人在形态、细胞学、分子、生理和药用等方面已经对石
草地生态系统是陆地生态系统的重要组成部分,其结构和功能的变化直接影响到陆地生态系统的物质循环和能量流动等生态过程。随着全球变化的日益加剧和草地生态学的不断发展,尤其
学位
无线通信产业的蓬勃发展,对系统的收发机提出了越来越高的要求,市场竞争越来越激烈,要求系统整体小型化,高可靠、低成本。滤波器和天线是射频收发系统两个重要的微波器件。天线为
淫羊藿属植物作为传统道地性药材使用已有2000多年的历史;同时,因其花色、叶色丰富多彩已成为新型观赏植物。淫羊藿植物药效成分主要由丰富的类黄酮类物质构成。为此,以往研究
半导体型单壁碳纳米管(SWNTS)是一种结构独特的直接带隙半导体纳米材料,具有很高的载流子迁移率、随直径可调的禁带宽度,以及能够对应从紫外到红外的宽谱光吸收的多子带的对
随着强流ERL的发展,国际上超导加速器开始向着更高的流强应用方面发展,超导高频腔的设计平均流强已经超过100mA,甚至已可达到安培量级。目前世界上的高平均流强多cell超导腔
当前,随着无线通信设备数量的增长,频谱资源需求越来越大;另一方面,可用于无线通信的频谱资源是有限的;这两方面的矛盾造成了频谱资源紧张问题变得越来越严重。认知无线电(Cogn
经济的快速发展加大了我国对于能源的需求,由于我国是一个多煤、少油、少气的国家,因此在我国的能源结构中煤炭占据了主要的地位.据统计现阶段我国每年开采并消耗的煤炭占据
已有大量研究表明,脂肪细胞凋亡对于脂肪组织的减少有重要贡献。在肥胖症全球流行的今天,研究脂肪细胞的凋亡有着重要的生物学意义。过氧化物酶体增殖激活受体(peroxisome prol