舆情监控系统中的数据倾向分析研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:jaslxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络大数据时代的兴起,许多带有观点色彩的舆论数据层出不穷,网络中的各色观点也带动着不同的舆论走势,所以舆情数据的倾向分析也越来越受到许多学者和政府部门的关注,舆情数据大多是评论性的文本内容,数据倾向就是文本内容的褒贬程度。本文对网络评论数据进行了倾向分析,引入了语言处理,主题提取,机器学习等相关知识,达到提高倾向分类精确度的目的。本文的研究工作如下:1.网络舆情倾向分析影响因素。本文对舆情分析的特征选择阶段和主题提取阶段进行了研究,找出了其对倾向分类结果的影响,并利用组合分类器模式作为主要倾向分类方法。着重分析了不同人群观点差异对倾向分类结果的影响,并结合现阶段的研究模式,对相关阶段的算法进行优化。2.主题提取模式研究。分析主题观点的形成过程,明确主题观点在整体倾向分析过程中的重要性,将观点的形成过程与LDA主题模型相结合,并验证了 LDA模型对最终倾向分类效果的影响。在倾向分析的过程中,对特征提取阶段的相关算法加入了词频影响因子进行优化,并对优化后的算法进行验证,找出了最为高效的特征项提取方式。3.舆情数据倾向分析方法研究。针对网络舆论数据的复杂性,为了快速得出倾向分析结果,引入了机器学习理念,依据组合分类原理,在分布式框架上搭建分类器,提高了数据倾向分析结果的速度和准确性。结果表明:主题提取模型对舆情观点的形成过程描述精确,在主题观点提取模型基础上对特征选择方法进行优化,并结合分类器进行验证,可看出优化后的特征选择方法对倾向分析结果有明显改善。最终结合分布式框架构建组合分类器,使得数据倾向分析的速度和准确率显著提高。
其他文献
针对北京西部清水河上游山区生产生活用水日趋紧张的问题,该文应用遥感与地理信息系统软件处理TM影像、土壤和质地图及数字高程模型等基础数据,结合soil conservation servic
<正>约翰·杜威(John Dewey,1859-1952)是美国著名的哲学家、教育家,他所处的时代正值美国由农业社会向工业社会的转型时期。杜威出生后不久,美国就爆发了南北战争,战后加快
为了去除生物油中的糠醛,该研究利用竹子为前躯体热解制得竹炭,选取糠醛为生物油模型化合物,在深入分析测试竹炭表面特性的基础上,研究竹炭对糠醛的静态吸附特性,并利用Langm
通过在硅烷改性聚醚密封胶中添加硅树脂微球,研究其对密封胶性能的影响。比较了不同硅树脂微球用量对密封胶密度、硫化速度、拉伸强度以及拉断伸长率等的影响。结果表明,当硅
<正>兔球虫病是对3月龄以内幼兔危害最大的疾病,常造成幼兔大批死亡,死亡率可高达80%~100%。该病虽年年防,但还是常发,尤其在夏、秋温暖多雨季节仔兔易发病。如何有效防治该病
背景:成人膝大骨节病(Kashin-Beck disease,KBD)混合畸形采用常规方法治疗很难奏效,常需关节置换手术治疗。应用后稳定型全膝关节置换术(total knee arthroplasty,TKA)治疗成
为了给寒区犊牛提供适宜的生存环境,该文设计并建造了一种温室型犊牛舍。以传统犊牛舍为对照,对其温热环境和空气质量进行了测定和评价。结果表明:在舍外平均气温为-17.3℃、
为探讨染色体异常克隆在嗜酸性粒细胞增多症诊断和鉴别诊断中的意义及克隆性嗜酸性粒细胞增多症涉及的染色体异常,收集了65例嗜酸性粒细胞增多患者的骨髓标本,培养24小时,采
农田控制排水(又称地下水位管理)是一种通过调控农田排水量以达到减少污染物输出并保证农业生产的环境友好型水管理措施。该措施的发展经历了不同的阶段,从最早的保墒增产到
企业文化的建设是企业发展的重中之重。在我国,很多企业都是中小型企业,这些企业每年都产生着巨大的经济效益,但关于企业文化的建设,很多中小型企业都缺乏建设意识或者建设工