面向网络舆情分析的文本倾向性分类技术的研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:koala_zz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网在全球范围内的飞速发展,网络逐渐发展成为反映社会舆情的主要载体。当前,对网络舆论的导向进行监测和预警已经显得愈发重要。文本倾向性分类是其中的研究热点之一。文本倾向性分类是指判断一篇文章对评价对象是否具有情感倾向以及所持有的情感倾向类别。文本倾向性分类在民意调查、舆情监控、市场分析、智能导购等方面均有应用价值。本文在研究现有各种主题分类所用技术的基础上,首先构造了中文文本倾向性分类用语义资源,并以此为基础设计实现了结合语义资源及其上下文的文本形式化方法,然后使用LIBSVM作为分类算法的实现构建了完整的文本倾向性分类器,最后通过实验验证以上成果对文本倾向性分类的改进效果,并将这些技术集成到系统平台。本文旨在通过以上研究提升舆情分析中文本的倾向性分类性能。本文主要研究内容包括如下四个方面:(1)对现有各种主题分类相关技术进行研究,分类列出了这些技术中对文本倾向性分类仍然适用的方式和方法,并总结了其中面临的主要技术瓶颈;通过列举文本倾向性分类处理对象的特点规律,总结了在构建倾向性分类器时需要着重考虑的问题和因素。(2)针对目前倾向性语义资源匮乏的现状,收集和整理了当前主要的基础语义资源,分析了在构建语义资源时需要考虑的因素,提出了用于倾向性分类的语义资源的构建方法并实际构建了一部领域极性词典。(3)完整构建了一个文本倾向性分类器,分类器包括了文本形式化表示和分类算法的实现两部分。为有效融入倾向性语义资源,对特征选择和特征项权重计算等文本形式化过程做了算法改进,并通过分类实验验证了分类性能的改善。(4)以框架和应用组件的形式将UIMA与文本倾向性分类器进行了整合,为后续舆情分析系统的开发作积累和准备。
其他文献
<正> 我国价格体系改革的任务主要分布在三个领域:一是工业品出厂价格,二是消费品的销售价格和公用事业收费等,三是农副产品收购价格。我认为,根据当前国民经济发展的状况和需要,我国改革价格体系的首要一步,应是工业品、主要是初级工业品价格的改革。从这方面入手改革价格体系,有利于整个经济体制改革的深入进行。一、改革初级产品价格是当前价格改革的首要一步。党的十一届三中全会以来,为配合经济体制改革的开展,我国价格体系和管理办法不断作了一些调整改革,如提高农副产品收购价格;扩大议购议销价格范围;放开部分日
美国退役军人教育资助制度是指美国联邦与州的立法、司法与行政机构,为帮助退役军人及其家属接受教育和培训而颁布的一系列法律法规的总和。该制度创始于1944年,是在传统安置
在语文学习中,阅读的过程是“吸收”的过程;写作的过程是“倾吐”的过程。阅读过程是学生理解感悟文章的过程;写作的过程是表达自己思想感情的过程,同时也是学生思维训练的过程。
国际组织是国际法主体的重要组成部分,在国际交往中的作用也越来越重要。国际组织活动渗透到国际交往的方方面面,成为国家间交往的重要途径。国际组织作为一个具有法律人格的
煤层气是煤炭伴生的洁净能源。勘探结果表明,中国拥有丰富的煤层气资源,但绝大部分储气煤层为低渗透煤层,煤层气开采量较小,无法形成大规模工业化开采。因此研究煤层气的解吸
目的:探讨对老年颅内动脉瘤破裂患者进行外科夹闭术治疗的临床效果。方法:将2014年1月至2018年12月期间临汾市人民医院收治的82例老年颅内动脉瘤破裂患者作为研究对象。按照
<正> “真理的界限”是马克思主义认识论中的一个重要的范畴。“真理的界限”是认识论中的一系列矛盾(主观与客观、一般与个别、理性与感性、概念中幻想的成分与实在的成分等)的集结点。它表明了马克思主义的真理观既是唯物的,又是辩证的。不掌握“真理的界限”这一范畴,就不能真正懂得马克思主义的真理论、认识论,就难以在实践中正确地运用;忽视和抹杀“真理的界限”是极“左”思潮的认识论根源之一。然而,在哲学工作中,人们却常常忽视“真理的界限”这一重要范畴。因此,阐明“真理的界限”在马克思主义认识论中的意义是很
目的:探讨对进行无痛分娩的产妇实施体位护理的效果。方法:选取2018年12月至2019年3月期间在贵州省骨科医院进行经阴道分娩的100例足月妊娠产妇作为研究对象。将这些产妇平均
社会在飞速发展,事物之间也逐步融合。时代发展到今天,学科之间早巳打破界限,相互融合渗透。以前我们总说“文史不分家”,现在看来,各基础学科之间也都是分不开的。如今,由于新课程
“以分数论英雄”的高校录取方式似乎天经地仪,如今国内有高校出现“高分退档”的现象,引来不少质疑之声。