高校BBS热点话题的挖掘与分析

来源 :安徽农业大学 | 被引量 : 0次 | 上传用户:ceolq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为传统的网络应用,BBS依旧是高校学生在网络中进行信息交流的重要平台之一。学生们可以在BBS上较为方便地表达诉求、展现自我、获取资源。学生群体是一个对社会热点事件反映活跃、交流积极的群体,而网络中的信息真伪难辨鱼龙混杂,学生群体在遇到一些事情时,如果没有得到学校足够的重视和及时的解决,比较容易引发学生群体的不满情绪。又由于网络信息传播的匿名性、传播便捷快速,容易出现网络突发事件,因此,高校BBS一直是学校比较重点观察的学生舆情场所。但是,由于各个高校对于网络的信息安全意识素养不一,管理能力参差不齐。特别是绝大部分的高校是以人工监控为主,对于信息的判断尺度不尽相同,容易出现对重要舆情信息的疏漏。同时,人工监控往往无法在话题的潜伏期和酝酿期发现重点的话题,缺少对于突发事件的预测能力,常常在话题的爆发期才能发现重点的话题。数据挖掘技术可以从大量的数据中筛选出我们需要的可信的、有用的信息,也可以通过已观测到的信息,对隐含的信息进行发现,甚至可以通过趋势判断对数据演化进行预测。现在,数据挖掘技术已经在网络的信息处理和网络行为学上有了大量的应用。我们可以通过数据挖掘技术,在对高校BBS信息的实时收集、处理和分析的基础上,对BBS中可能出现的热点话题和突发事件进行预测和观察。本文在数据挖掘的方法上,对BBS的信息进行分析,区分出我们所关心的热点话题和突发事件,作为网络舆情监控的有力参考。本文的主要研究内容如下:一、数据预处理:通过数据挖掘对信息进行分析,最基础的工作就是对BBS中的文本数据进行预处理,包括中文分词、文本特征提取及文本的聚类等工作。二、文本的热度算:作为热点话题判断的主要参数,需要通过文本的浏览密度和回复密度进行计算,对整个BBS及各个主题进行评分,判断BBS中是否出现了热点话题,进而判断具体哪些主题属于热点话题。三、文本的情感计算:在提取的情感词等基础上,对于BBS中出现的主题及回复进行情感值计算,判断出文本的情感强度和情感倾向,作为突发事件预警的评判参考。
其他文献
杂草是农作物的主要威胁,它导致作物的产量和品质下降,增加了农民的生产成本,所以针对田间杂草自动识别技术的研究是非常有必要的,田间植物与背景的分割是田间杂草自动识别技
中医认为舌是人体全身脏腑、器官的缩影之一,人体各组织器官的病变均可通过神经、血管和经络反映到舌的不同部位上来,因此中医舌诊对于辨证施治、身体健康具有重要作用。但是
实际工程问题的复杂性、约束性、非线性和建模困难等特点,对优化和计算技术提出了更高的要求,寻找新型的智能优化方法逐渐成为一个新的研究热点。群体智能,作为一种新兴的智
随着民航事业的快速发展,我国迫切的需要拥有自主知识产权的民航空管系统。一是为了不受他国的技术限制,使我国的民航事业可以长足的发展,二是可以节约相当多的资金。信息产业部
近年来,决策支持系统取得了长足的发展,应用到社会的各个领域。其中体育运动、训练、管理是一个很重要的应用领域。国内外关于这个方面也已有了不少的研究成果,但大多是集中
运动目标检测与跟踪是数字图像处理和模式识别以及计算机视觉领域研究的主要内容之一,逐渐成为人们研究的热点,在军事、民用等诸多领域有着广泛的应用。本文在充分研究视频目
随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品
在SOA领域中,QoS一直是备受关注的研究课题。目前,大多数研究人员使用服务信誉来判断一个服务的整体质量,而服务信誉则被定义为服务消费者对服务评价的均值。虽然很多学者在
图像分割是计算机视觉的一个重要研究课题,图像分割技术就是把图像分割成具有相同的强度、纹理、颜色、运动等子区域,由于图像中物体自身的复杂性以及所要识别多个不同目标的
随着互联网络的飞速发展,网络信息安全正日益得到人们的关注,入侵检测则成为安全专家积极研究的重要课题。入侵检测方法主要分为误用检测和异常检测两类,它们各有自己的优势,