舆情监控关键技术研究与系统实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:liongliong489
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展和网民数量的迅速增长,网站的功能也不断扩展,由此造成了人们参与网络活动的方式不断演化,即从简单的获取信息到直接参与网络内容的建设。网络逐渐成为了信息的集散地,进而发展成为民意的集散地。研究网络舆情监控相关技术对于维护国家的信息安全,保障社会的舆情稳定具有积极的重要意义。及时了解和掌握瞬息万变的网络热点话题并合理地引导网络舆论,就成为当前一个很重要的研究课题。 网络舆情监控系统是通过对互联网海量信息进行自动获取、自动分类、专题聚焦等,实现监控网络舆情的信息处理系统。用户可以通过网络舆情监控系统全面掌握当前网络舆情动态,为相关机构提供依据,以便做出正确的舆论引导,形成正确的决策。并且可以利用信息自动处理及时迅速的特点,结合人工监控体系形成快速的舆情预警响应处理机制。 本文研究了舆情监控技术的现状和不足,按照监控的需求,设计并实现了一个网络舆情监控系统IPFMS(Internet Public Feelings Monitoring System)。系统根据网络监控的特点,提出了两层监控处理方法:先根据用户设定的主题关键词用快速关键字匹配的方法过滤掉无关的主题内容,再对相关主题内容用较为复杂的文本分类方法进行处理。两层监控处理方法减轻了后续文本处理分析的强度,提高了系统的整体速度。对于IPFMS中的关键技术——文本分类处理技术,本文从特征提取角度出发,利用改进的DF (Document Frequency,文档频率) 方法,结合IG (Information Gain,信息增益) 方法进行复合特征提取,降低了特征维数。实验证明,在较少的特征维数上,分类效果有所提高。由于不同站点的不同用户群具有各自的内容风格,因此本文根据此类特征结合反馈训练的方法提出了为不同性质站点设置个性分类器的分类方式,以改进实际分类系统运行中的分类效果。 本文对实现IPFMS所需的关键技术进行的研究,并对系统进行了整体实现和效果测试,为网络舆情监控系统的进一步研究积累了经验。
其他文献
由于数据库中存在着大量数据,因此从数据库中发现有价值的信息显得十分重要。数据挖掘技术就是为解决这个问题而产生的。对数据挖掘技术的研究,国内外已经取得了许多令人瞩目的
本体在计算机应用如知识管理及语义网中正发挥着越来越重要的作用,而对领域本体的建立和维护成为制约这些应用发展的瓶颈。目前只有很少手工构建的本体如WordNet和CyC,但是一方
在传统的脊柱外科手术中,医生利用CT成像系统引导进行穿刺。首先,医生根据CT扫描图像找出病灶位置,确定手术工具作用路径,然后进行手工穿刺。但往往由于目测偏差、操作技术水平和
计算机图形学和虚拟现实技术在近些年来取得了巨大进步,这为我们开发驾驶模拟训练系统提供了强有力的工具。本文描述了名为“面向驾驶训练的汽车驾驶仿真模拟机”(简称TODS)的
随着时代的进步,远程教育已日益成为传统教育的重要补充和发展。在远程教育的实际教学中,许多学科的课程,特别是理工科课程,为了培养学生的实际动手能力和观察能力,往往需要
在信用卡欺诈监测、差异性营销、网络入侵检测和传感器网络等应用中,随着时间的更迭而生成一种新型的具有连续、有序、变化、快速到达、海量等特征的数据,即“数据流”,其数据量
本文基于固网短信系统项目的研究与实现,研究了固网短信技术的基本原理以及使用到的关键技术和协议,如CTI技术、FSK技术、DTMF技术、ADSI协议、SMTP协议等。分析和设计了系统的
本文首先对手写数字图像的图像灰度化、二值化、去噪、细化、归一化、特征提取等预处理过程进行分析;其次,利用动态模糊理论解决手写数字字符识别中的多维特征和动态模糊性问题
目前,传统的DVD碟片容量已无法满足观看高清晰视频节目(分辨率1920×1080)的要求。蓝光光盘价格居高不下,且转产成本高,而国内厂商也面临着DVD专利困扰,这些都表明了开发一种
知识表示一直是人工智能研究的重要课题,无论应用人工智能技术解决什么问题,首先遇到的就是所涉及的各类知识如何表示。在人工智能领域,对知识的表示有多种方法,但一般都受其