网络舆情话题识别与跟踪系统的研究与实现

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:lbxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学技术不断进步和发展的时代,越来越多的人通过网络发布和获取信息、参与讨论和发表自己的意见,于是网络舆情成为政府以及企业重要的信息来源和参考。网络舆情中的热点话题反映了舆论的风向,及时发现网络舆论危机,采取适当的措施控制和引导热点话题的发展,对于构建稳定和谐社会具有重要意义。但是由于网络庞大复杂,网民数量剧增和行为活跃带来的海量信息,加大了热点话题的发现的难度。话题识别和话题跟踪的研究因而受到越来越多的重视,文本学习是话题识别与跟踪技术的基础,人类的语言是复杂的逻辑性强的,文本转化成计算机能够处理的形式会丢失大量的信息,即使文本的最表面和简单的信息转化过后,却又带来新的高维和稀疏的难题,所以话题识别与跟踪的效果一直有个能力上限。文本预处理的质量、特征提取算法的选择、文本聚类和分类算法的选择和改进都会对话题识别与跟踪的结果产生重大影响。本文针对现在使用的话题识别与追踪技术各有所长,而各自适合于不同的环境的情况,综合考虑和选择多种不同算法的来比较话题识别与追踪的结果,选择最佳的算法,设计和实现了网络舆情话题识别与跟踪系统,提供给用户热点话题列表、话题列表中的话题的所有相关报道列表,用户可以选择的需要跟踪的热点话题的列表,用户可以搜索站内热点话题,直观地查看话题聚类分布、话题发展历史热度以及相关信息的可视化图示,此外用户还可以灵活配置和选择适合自身的最优算法或算法组合。本系统具有以下特性:(1)集成性。网络舆情话题识别和跟踪系统为用户提供了话题相关全方位的信息。在话题呈现方面,集成了话题和网页列表,话题类簇分布图,话题发展历史热度图,话题来源分布图,话题实体分布图等;在算法方面,集成了一个算法框架可供选择。(2)交互性。网络舆情话题识别和跟踪系统允许用户主动搜索热点话题;网络舆情话题识别和跟踪系统允许用户自由配置聚类分类策略算法或算法组合,以满足使用条件,达到话题识别和跟踪的最优化。
其他文献
来源于日本的"阿米巴"经营模式,其核心在于通过将企业划分为一个个"阿米巴"组织,让他们独立进行各项经营活动,从而实现企业灵活管理和长远发展的目的,因此阿米巴模式为国内的
运用文献资料法、实地考察法、逻辑分析法、对休闲健身和沂蒙老区的红色旅游进行研究,创造性地将红色文化中的思想道德教育与喜闻乐见的体育活动形式相融合。研究发现,体验经
本文对不合时宜的观念、做法、体制,对马克思主义错误的和教条式的理解,对主观主义和形而上学在当前的表现作了较全面的概括,有助于深入学习领会江泽民同志“三个解放出来”的论
目的:通过对功劳口疡清(Gong Lao Kou Yang Qing,简称GLKYQ)进行药效学实验及毒理学实验,观察检测其毒性反应及药效结果。方法:通过石炭酸复制大鼠实验性口腔溃疡模型,给予功劳
乡村振兴战略确立了农村农业优先发展的重要地位,为建设广东省珠海市“幸福村居”,实现共同富裕,应准确把握农村农业产业振兴的实现路径。本文运用文献分析法、实地考察法,从
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
移动电子商务是电子商务的延伸,它几乎完全继承了传统有线电子商务的所有业务,更进一步实现了企业信息化、信息网络化、网络大众化,它不仅是对有线电子商务模式的补充,更把电
扶贫龙头企业作为贫困地区带动农户增收致富和农业产业化经营的龙头,其发展具有较强的集聚力和带动力,是贫困地区和贫困农户实现小康和农村经济发展的重要载体,已成为解决新
随着我国社会经济结构进一步调整、发展方式进一步转变、区域融合进一步加快,市县域经济蓬勃发展,各地方商业银行、城市商业银行扩展势头迅猛,乡镇银行、农村银行、金融财务