论文部分内容阅读
随着互联网的快速发展,人工智能逐渐获得了人们更广泛的关注,其研究也在人们的不断努力下得到突破,进入了新的发展阶段。在此背景下,与其息息相关的情感分析相关研究工作也纷纷展开。本文的核心是:①通过分析现有文本情感分析方法,对比多种传统机器学习模型的情感分类效果;②引入集成学习方法,提出“多特征多分类器的元集成情感分析模型(MFMB-ME,Multi-Features Multi-Base-Classifiers Meta Ensemble Learning Sentiment Analysis Model)”,通过选用不同特征集与基分类器组合进行集成学习模型训练,分析其情感分类效果,进行情感分析实验并得出结论:通过使用MFMB-ME相比基于单特征集的集成分类模型,分类正确率能获得明显提升;③结合文本情感分析和态势感知理论研究,总结出“文本情感分析的态势感知模型(SA-SA,Sentiment Analysis Based On Situational Awareness Model)”。本文首先介绍了人工智能的发展并引出文本情感分析的意义与价值,通过对国内外研究现状的分析了解当前文本情感分析的发展情况以及存在的问题。详细介绍了文本情感分析相关内容及其现存流行技术。结合态势感知方法论分析“文本情感分析的态势感知模型”。其次,采用三次实验分别对比了基于传统机器学习算法,单特征集成学习算法,“多特征集多基分类器的元学习集成学习”算法的文本情感分类效果。基于传统机器学习方法实验中,分别采用决策树,支持向量机,逻辑回归算法进行分类建模,对比分析不同模型的情感分类结果;基于单特征集成学习算法实验中,采用随机森林对词特征集进行模型训练,对比分析其与传统机器学习算法的分类效果差异;基于多特征集多分类器的元学习集成学习实验中,组合不同的文本特征集(包括词,词干,词性,语法,n-gram等)与不同的基分类器(包括逻辑回归,语言模型等),通过以随机森林为元学习器的集成学习方法,对比分析不同组合策略的分类效果。最后综合实验结果可分析:对于实验语料,与单特征集成学习分类模型和传统机器学习分类模型相比较,本文提出的FMB-ME模型对测试集的分类正确率更高,具有更优的分类效果,且分类性能提升较明显。