基于深度学习的短文本多分类情感分析

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:liongliong499
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,社交网络已经成为人们表达观点的重要平台。针对社交网络数据的文本情感分析已成为信息处理领域的研究热点,通过对文本进行情感分析,可以及时地捕获到用户的情感倾向,了解到用户的需求。传统的基于机器学习和情感词典相结合的情感分析方法需要对特征进行选择,而情感特征的选择往往较为主观,会导致分类模型易过拟合,泛化能力不足。深度学习通过有效地提取文本的情感特征,构建深度情感模型,使得基于正负面的文本情感分析准确率大幅度提升,但由于多类别情感语料的不足,使其不能准确地表达文本所蕴含的情感色彩。因此本研究以深度学习技术为基础,研究微博类短文本的多情感分类问题。论文主要工作包括:在多类别的情感语料获取方面,提出了一种基于情感种子词的语料迭代获取方法。该方法首先提取现有语料中的情感词集合,利用同义词词林对情感词集合进行扩充,然后计算各情感词的TF-IDF权值,选取权值较高的情感词构建情感种子词集合,最后采用多种子词搜索策略采集微博情感文本,并将其自动标记扩充到对应类别的微博语料中,通过多次迭代完成语料获取。实验发现,该方法可有效解决情感语料的样本不足和不平衡问题。在基于深度学习的情感分类模型构建方面,分析了现有CNN网络和LSTM网络在文本情感分析方面的弱点,提出了一种基于Attention机制的多分类情感分析模型。该模型运用Attention机制将CNN网络提取的局部特征和LSTM模型提取的语序特征相融合,并在分类层采用集成模型的思想,分别将CNN网络和LSTM网络提取的情感特征拼接,作为模型最终提取的情感特征。通过对比实验,发现该模型的准确率有了显著的提高。
其他文献
为了有效地研究水稻高产栽培技术,本文结合有效的工作实践,对其进行了深入探索,希望分析能够进一步提高水稻种植水平。
接触网是高速铁路上空架设的一条特殊形式的输电线路,其作用是为电气化列车提供电能,它的主要组成部分有:承力索、吊弦及接触线。吊弦起着保持接触线并将其连接到承力索的作用,它不仅要确保电流正常通过,而且还必须具有较强的耐疲劳性。当受电弓高速滑过接触线时,作用在吊弦上的循环应力可能会导致吊弦疲劳断裂,成为行车安全的一大隐患,因此,研究吊弦的应力特性意义重大。本文主要研究内容如下:一、利用截面法,从理论上推
强化人本管理提升发展层次——对农业银行济南市分行的调查及启示张王彦斌王延田社会发展理论认为:发展的第一层次是经济的发展;第二层次是政治、科学、教育、文化、道德的综
采用Zigbee技术实现智能家庭的无线传输。其无线收发模块射频芯片使用CC2420,并以单片机PIC18LF4620作为微控制器。该微控制器通过SPI总线和一些离散控制信号与RF收发器通信
<正>目的比较社区和住院病人用不同阴性症状量表测评后的成绩,为住院病人能否回归社区提供量表支持。方法2011年9月到2012年12月,选取163例诊断符合国际疾病分类手册第10版(I
会议
在国产SC-6气相色谱仪上使用FID和GDX-102填充柱,甲醇作内标,用峰高比测定酒精饮料中的乙醇含量。对无水乙醇、两种米酒、1种葡萄酒和1种啤酒分别进行了10次平等测定,其CV依次是0.0
为提高工程地质勘察水文地质的工作质量,文章从岩土工程的水文地质的条件和状况进行调查了解,从地下水对岩土的重要性进行分析,侧重地下水对岩土工程,水文地质内容,岩土性质
针对15数码问题,提出了一种基于改进A*算法的求解方法。依据问题特征,定义了估价函数f(n)中启发函数h(n)的一种计算方法,设计了高效的算法步骤和C语言程序实现。测试结果表明
本报讯 (驻浙江记者骆蔓)3月23日至24日,实施乡村振兴战略中浙江省非物质文化遗产保护工作现场推进会在浙江丽水市松阳县召开。会议以学习贯彻党的十九大关于实施乡村振兴战略重
报纸