面向BBS的舆情分析系统的研究与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:qq237599512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息传播的重要新媒介网络的产生,BBS已经成为了传播最快的公共平台之一。在这个复杂的网络环境中,社会中各种现象、问题和观点交错其中,不但存在着正面的信息,也潜存着危险的信号。所以把握舆情,对舆情信息进行分析就是亟待解决的问题。但目前已有的系统大多是对新闻网页进行分析,针对BBS的舆情分析系统还有待开发。   本文针对上述的问题,汲取了已有技术的优势,同时结合BBS的特点,改进并设计了面向BBS的数据采集、主题分类和关键词提取等方法,同时构建并实现了一个面向BBS的舆情分析系统。本文围绕BBS的数据环境,以提高面向BBS的舆情分析效果为主要目标,主要研究了面向BBS的信息爬取、敏感话题监测和热点话题发现等模块的关键技术,主要的研究内容包括以下几个方面:   1.面向BBS的数据采集方法   研究并总结了BBS的数据特征,并结合特性改进舆情分析系统的数据采集和抽取方法。文本提出面向BBS的网络爬虫,根据其URL特征进行个性信息爬取;信息抽取时利用BBS数据的结构化特点,以基于模板的方法提取有效信息。   2.面向BBS的主题分类   文本充分利用BBS数据特征,改进了文本特征项抽取方法,提出了面向BBS的特征重调整方法;重点研究了向量空间模型并加以改进,提出基于VSM的BBS文本分类算法;利用改进的算法设计了面向BBS敏感话题监测机制。   3.基于词汇链方法的热点话题发现   本文研究了词汇链的构造与抽取方法并对其进行了改进,提出了面向BBS的相似度计算方法,并根据BBS的数据特征进行词汇链构造,设计出针对BBS数据的关键词抽取方法,同时构建出一种基于词汇链方法的热点话题发现机制。   4.面向BBS的舆情分析系统   本文设计并实现了面向BBS的舆情分析系统,完成了对BBS舆情的敏感话题监测、热点话题分析和舆情跟踪等功能,提高了BBS舆情分析结果的准确性和全面性。
其他文献
纵观计算机科学和技术发展的历史,可以发现计算模式已经经历了主机计算、桌面计算和普适计算三个时代。由于人类对生产效率、生活质量的不懈追求,人们开始希望能随时、随地、
信息技术的发展和普及,使越来越多的儿童有机会使用计算机,计算机的恰当使用能够指导和帮助儿童提高其认知及创造能力。编程过程可以有效地提高儿童的逻辑思维能力、想象力和
随着多核系统、集群、云计算等技术的发展,虚拟化技术在应用中体现出来的优势也日益显著,但同时虚拟化环境中的安全可信问题也面临着很大的挑战。   本文对虚拟化环境中的
随着集成电路制造工艺的不断发展,NAND Flash因其非易失性、低功耗、低成本、大容量等特点被广泛应用于各类嵌入式系统中,而设计一款通用、高效的NAND Flash控制器,开发相应的设
头发作为人体的重要特征,对于真实的表示三维虚拟人物起着不可或缺的作用。真实感的头发模拟是计算机图形学中的研究热点,并有着广泛的应用,例如:化妆造型、三维电影和虚拟游
在企业、政府中存在大量不同时期、由不同厂商、在不同平台上建设而成的系统,由于缺少统一规划和标准,彼此之间很难实现信息共享,形成了大量孤岛式的业务应用系统。因此,如何
随着高性能计算需求的不断增长,千万亿次的高性能计算机成为了当前高性能计算领域的研究热点。曙光6000高效能计算机系统是国家智能计算机研究开发中心正在研发的千万亿次超级
对等网络(Peer-to-Peer,简称P2P)技术发展迅速,在现代互联网和商业系统中得到了广泛应用,尤其在大规模的资源检索和内容分发系统中起到非常重要的作用。P2P网络的核心在于如何快
在现代印刷行业中,预涂感光版(Presensitized Plate,PS版)作为最主要的胶印印刷版正发挥着越来越重要的作用。其品质的优劣在很大程度上决定着印刷产品质量的好坏。而PS版面
基于图像的三维重建技术,即利用拍摄的多幅图像来重建物体或场景的三维模型,相比较利用激光扫描设备获取点云数据进行模型重建的方法,该方法对摄像机设备没有较高的要求,并且受环