网络舆情语义识别的技术分析及识别流程构建

来源 :吉林大学 | 被引量 : 0次 | 上传用户:fyq20061001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会网络化进程的加速,网络已经成为人们表达个人意见和观点的重要渠道。网络舆情信息成为舆情信息的一个关键部分。网络舆情和传统舆情相比,具有数据量大、突发性强、影响范围广等特点。在大数据环境背景下,网络舆情信息的挖掘较以往的传统媒体更加困难,并且更加难以规范。因此,如何利用语义识别技术,有效地从海量的舆情信息中挖掘出其中的关键因素并指导决策以及突发事件的处理就成为舆情研究的重要方向。本文通过分析研究网络舆情语义识别的各类技术,重新建立一套网络舆情语义识别的流程。该流程不仅包含网络舆情语义识别的技术细节,同时也建立起一套网络舆情突发事件的评判标准提供参考。本文所构建的网络舆情语义识别的流程包含网络舆情信息采集模块、网络舆情预处理模块、网络舆情话题识别模块以及网络舆情反馈模块等四组子模块,前三个模块的主要工作是对网络舆情进行识别分析,从浩如烟海的网络信息中将网络舆情信息加以提取,所以这三个子模块是舆情预警与疏导的基础;而网络舆情反馈模块则是基于上述三个子模块的识别结果对网络舆情态势进行系统的分析,并针对舆情突发事件的不同爆发状态提出相应的疏导策略。本文针对当前网络舆情爆发的主要阵地微博平台提出了实证研究,选取了当前的舆论热点话题进行语义识别分析,并预警突发事件,提出疏导建议。本文的创新点主要有:将网络舆情信息语义识别技术进行归类,比较分析各种语义识别技术找到其各方面的特征,比较分析的方面主要有:信息处理的精度比较、人工参与程度比较、特征库比较、多媒体信息的处理能力比较、深层次语义信息的挖掘比较、技术复杂程度比较以及通用性、适应性的比较。对网络舆情信息的语义识别技术进行研究,并根据网络舆情的特点,提出一个网络舆情语义识别的技术流程方案。整个流程分为信息采集、预处理、话题分析、舆情反馈等几个步骤。在网络舆情信息的采集过程中,本文采用通用网络爬虫技术对网络信息进行爬取;在获取了基础的数据集合之后,需要对信息集合进行预处理,将文本进行分析处理并去除文本中的停用词,对文本信息的特征进行抽取;随后,对舆情信息的文本集合进行聚类分析,使用文本向量模型对文本信息金星表示,采用K-means聚类算法对文本信息进行聚类,挖掘信息话题;对信息的情感倾向性进行分提取,对其情感倾向的强弱进行排序,得出舆情语义识别的结果。
其他文献
用义马煤和淮南煤进行了正交试验,初步研究了水、煤和水煤浆在磁化杯内进行磁化后的水煤浆性能变化情况。结果表明,通过磁化杯磁化可使水煤浆粘度降低,流动性变好。
据国外媒体报道,甲骨文4月20日宣布,该公司将以每股9.5美元的价格收购Sun。该交易价值约为74亿美元。这一消息颇令人感到意外。早些时候,IBM和Sun之间的收购谈判破裂。知情人士称
为预防由安全注意力衰减引起的虚假安全问题,构建员工安全注意力衰减模型。采用多主体建模法并基于Netlogo仿真平台,分析个体因素、管理因素和环境因素对员工安全注意力水平
2009年12月8日,RIM公司联席CEO与中国移动董事长王建宙一起宣布了双方新的战略合作:RIM将推出TD版黑莓手机,中国移动将把黑莓手机推广到个人用户手中。此次RIM与中国移动的合作
2017年1月18日,三江至柳州高速公路正式通车。该高速公路通车后,三江至柳州的车程由原来的3.5h缩短为不到2h。据悉,该高速公路主线全长168.73km,全线共137座桥梁,概算总投资124.72亿
目前高职院校大学生劳动素养缺失和劳动观念薄弱的现实非常严峻,严重违背了职业教育的人才培养的目标,这既与学校劳动教育的缺失有关,也和学生自身对劳动的认知有关。本文从
大气校正的目的是消除大气的影响,获取地物真实反射率。介绍了利用6S(SecondSimulationoftheSatelliteSignalintheSolarSpectrum)模型构建查找表对HJ-1/CCD遥感影像逐像元进行
贵州省2016年完成公路水路固定资产投资1500亿元,同比增长20%,约占全省投资的12%、全国交通投资的8%,投资总额位居全国第一。2016年,贵州省在下达1360亿元投资任务基础上,追加投资140
从电力产业链角度出发,界定46项可能对电力行业发展产生影响的能源技术。基于技术领域专家调查问卷,通过层次分析(AHP)法建立指标评价体系和确定权重,采用模糊综合评价法对20
针对阳泉二矿采用圆盘过滤机回收煤泥过程中产生的问题进行分析并提出解决问题的办法。