论文部分内容阅读
随着网络时代的发展,网络信息爆炸性增长,相关机构是否能快速准确地判断网络信息的情感倾向性,是否能对网络舆情及时地采取应对措施,让网络能够朝着健康的方向发展。在军事领域舆情中网络信息的情感倾向性关系更为复杂,快速准确地判断情感倾向性尤为重要。通过分析军事领域的舆情倾向性的研究方法发现,目前常用的方法中,基于统计方法具有实现简单的优点但准确率较低,基于机器学习的方法具有知识获取客观、准确率较高的优点但依赖于庞大的训练集,基于情感相关性分析方法具有分析精准的优点但受限于抽取算法和语义关系。针对情感文本分类的准确率问题,本文研究军事领域的情感倾向性分析,主要研究TF-IDF技术获取军事领域的情感词,然后利用情感词结合常用的情感本体、HowNet、NTUSD词典,构建军事领域情感本体;研究了情感倾向度计算问题,将情感倾向度计算转换成情感词与基准词语义相似度的计算,并对情感词的语义相似度算法进行了改进,同时结合句法规则、程度副词以及否定词对情感倾向度的影响,采用情感相关性方法对文本进行分析;通过基于军事领域情感本体的方法与基于词典方法、基于极值表方法以及基于情感本体方法对改进的方法进行了对比实验,实验结果表明,本文采用的基于军事领域情感本体的方法能够提高情感文本分类结果的准确率。本文研究的主要工作如下:(1)构建军事领域情感词汇本体。利用TF-IDF技术统计军事领域特有高频词,提出正面、负面两类军事领域的情感词分类。然后利用可视化本体构建工具Protégé和OWL编码语言,构建军事领域本体。(2)提出了一种改进的情感词相似度算法。研究SIPO概念语义相似度算法,从语义重合度、语义距离、层次深度、节点密度4个维度综合考虑语义相似度计算,提出了一种改进的语义距离算法:ASIPO算法,设置一个新的影响因子用于计算上下位关系,通过对比实验,改进后的算法在文本分类准确率获得较好效果。(3)提出一种基于正面、负面基准词赋值的情感词汇相似度算法。对正面、负面的基准词进行赋值,应用改进的相似度算法对构建好的军事领域本体的词与基准词进行相似度计算,得到相应情感倾向度。(4)搭建一个军事领域情感倾向性分析平台。该平台实现了文本分词和预处理,并将文本划分为若干个情感单元,通过匹配规则与词语,同时考虑转折词、程度副词、否定词对情感倾向性词产生的影响,获得相应的规则公式与倾向值,计算文本的总体倾向度,判断文本的情感倾向性。