基于深度学习的中文文本情感分析

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:Andy_nnu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet文本信息数据的爆炸式增长,带来了越来越多包含作者情感、观点以及看法的非结构化文本数据,如何能够从这些数据中提取出文本情感信息,将极大地影响网络舆情分析、社会舆论导向、商品辅助决策的发展。文本情感分类是指对某待分析文本中蕴含的情感极性做出不同标准的判别分类。传统方法多采用基于统计或规则的方法,随着数据量的增长,对于人力物力的需求越来越大,分类效果却越来越低,不能满足大数据时代的要求。情感分析中的重要环节之一就是中文文本情感分类,在21世纪爆炸信息产生的时代,引起多数研究者眼球的是对于海量数据的情感分类研究,而研究者的目标是要发现如何对文本语义进行深度的学习得到有用信息,表达带有准确特征信息的语义,提高分类中文文本情感极性的准确性。传统的基于机器学习方法,存在不能抽象得出文本语义信息的缺陷,本文在原有浅层机器学习特征的基础上提出了混合堆叠深度学习特征的模型研究文本情感分析,提高抽取出的特征对文本语义信息表达的准确完整性,增加模型对语义的深层理解和深度学习能力。本文的模型在以下方面做了改进:1)使用了新的激活函数,提高了模型的收敛速度和泛化能力,缓解了梯度消失问题;2)使用了新的优化函数,使得在训练过程的每一次偏置校正后,迭代学习率都有确定的范围;3)在模型中加入了Dropout层以及L2正则稀疏化的方法,提高模型的拟合能力,使模型更加精炼;4)在CNN提取局部特征最大值时使用Max Pooling技术;根据网络产品评论数据集以及IMDB英文公开影评数据集的结果表现论证了本文的改进的有效性。此外,本文对设计的模型对比应用了多组模型参数,研究了参数对于深度学习模型的影响。
其他文献
雷贝拉唑钠是一种新型的质子泵抑制剂(PPI),临床用于治疗胃酸过多导致的疾病,如胃及十二指肠溃疡,食道返流症等。雷贝拉唑钠作用于H+/K+-ATP酶的4个部位,由于结合靶点增多,故其作用快,能强烈抑制胃酸分泌,并使胃内pH产生较大且持久的升高。雷贝拉唑钠是最新的质子泵抑制剂,其解离常数较第一代PPI大,活化的pH范围明显增大,因此在壁细胞中可以更快地聚积,起效以及解除症状的速度均较第一代PPI快。
数学语言是极其丰富的,形式也是多种多样的.本文通过对近几年高考中常见的表格型数列问题的探究,给读者一些有益的启示.
本文运用面板数据DEA方法测算了1992~2005年间京津冀地区总的以及分产业的生产率,并检验了三个地区生产率的收敛性。分析表明,在1992-2005年,京津冀地区总的生产率存在很大的差异
目的:通过在GD-Ⅱ型推拿按摩教学考试系统上进行一指禅推法操作,初步测定一指禅推法的力学参数,探讨一指禅推法在不同操作者之间的手法差异。方法:随机选取在读针灸推拿学专
在传输带宽或存储受限时,视频压缩所带来的压缩噪声明显地影响了用户的主观体验。针对这种低质量的压缩视频,本文利用卷积神经网络,分别从空域,联合时空域提出解决方法。本文
涡轮作为燃气轮机三大部件之一,其性能的变化与燃气轮机整体的性能有紧密的联系。在涡轮级的流动中,叶顶间隙泄漏引起的一系列问题是包括燃气轮机和航空发动机等旋转机械在内的引起损失的重要来源之一。间隙泄漏问题得到越来越多的关注,其中燃气轮机中由叶顶间隙引起的流动损失占到三分之一以上。减小叶顶泄漏流动的一种方式是在叶顶加装封严结构,叶冠的封严结构因具有良好的气动性能以及结构特性广泛的应用在低压涡轮结构中。叶
用循环抗原,特异抗体,辅助诊断三种方法同时测定来院就诊的可疑囊虫病人386例,检出阳性病例160例,总阳性率为41.45%。朝鲜族的检出率明显高于汉族(P<0.01);31岁以上的年龄组显著高于30岁
读写任务是2007年广东高考英语改革出现的新题型,已历时五年。我们尝试通过这五年的高考试题,分析揭示它的考点所在。常考要点的经典模板将会是你高考备考的秘密武器,一定不