基于深度学习的文本情感分类研究

被引量 : 0次 | 上传用户:w313829237
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分类在情感分析研究中占有举足轻重的地位,在信息爆炸的21世纪,海量数据的情感分类研究吸引了很多的研究者,如何深入学习文本的语义信息,准确表达语义特征,提高情感分类的准确性是研究的目标。鉴于传统的机器学习方法无法学习文本语义信息的缺陷,本文在浅层学习特征的基础上提出了融合深度学习特征的方案研究文本情感分类问题,提高特征对文本语义信息的表达,增加模型对语义的学习和理解能力;研究中发现融合中采用的深层特征由于不是基于多隐层的深度学习方法抽取的,导致学习到的深层特征向量不能真正的理解文本中的具体语义,针对这些问题,文章引入了基于深度学习的半监督RAE方法研究文本的情感分类问题,RAE方法是多隐层的神经网络结构,可以逐层分析,优化每一层学习得到的特征向量表示,因此它抽取的文本特征向量可以更准确的表达语义信息,提高分类结果。本文首先采用传统的SVM方法进行情感分类问题的研究,实验中选择词、词性和词典的特征组合方式,得到最好的分类正确率结果是81.88%;融合深度学习特征的方案中首先通过实验得到最佳深度特征向量长度值为150,在此条件下得到的最优分类正确率是81.98%,比传统的SVM方法提高了0.1%;基于深度学习的半监督RAE方法中经过实验得到深度特征向量的最佳长度值是50,其结果得到了显著的提高,正确率为85.10%,比传统的SVM方法提高了3.2%,将样本容量增加到原来的2倍时,情感分类的正确率可提高2.5%,同时模型的学习时间增长到原来的3倍。
其他文献
本文先概括介绍了20世纪以来鲁迅作品在日本的传播,进而通过比较中日近代化的异同,并以研究鲁迅的竹内好和受鲁迅影响颇深的大江健三郎为例,简要分析了为什么中国作家中鲁迅
随着我国民航业的快速发展,通勤航空迎来前所未有的发展机遇,阿拉善盟通勤航空试点的建立更加说明在我国发展通勤航空是一种必然趋势。通勤航空起源于美国,发展速度极快,目前
<正>改革开放以来,我国现代制造业体系已经初步形成,逐渐成为国家经济发展的重要支撑。2011年,我国制造业产值首次超过美国,跃居世界第一,"MADE IN CHINA"产品遍布全球。为了
电影《孔子》基本符合历史剧创作的原则,孔子一生的重大事件及整个人物的悲剧命运符合文献记载,杀少正卯事件的缺位体现了《孔子》没有选择富有争议性的历史事件。但《孔子》
研究背景进入21世纪后,我国肺结核防治局面依然十分严峻。结核病疫情呈现感染率高、患病率高、发病率高、耐药率高、死亡率高,结核病控制进程慢等“五高一慢”的特点。结核病
一、目的:近年来,国内外大量研究文献都表明氧化应激是许多病理因素造成心血管损伤的共同机制,在许多心血管疾病的病理过程中都有过量氧自由基产生,同时抗氧自由基防御机制却
目的:比较超声和CT在小儿急慢性阑尾炎诊断中的应用价值。方法:回顾性分析我院经术后病理证实为阑尾炎的5~12岁小儿患者134例,与术前CT及超声结果进行对比,分别计算超声与CT
目前高校的安全教育和管理还存在着许多缺陷,尤其是师生安全意识和安全工作管理效率的不足给高校留下许多安全隐患。针对以上情况,本文提出加强全覆盖安全宣传教育以增强师生
<正>花生,"地上开花,地下结果"的特殊作物,播种与收获均不同于其他谷物。覆膜、播种、田间管理,收获时的起挖、去土、放铺、晾晒、捡拾、摘果和脱壳等多个生产环节,需要的人
美国高度依赖网络空间。为防止潜在对手对美国发起网络攻击,美国实施网络威慑战略。为实现此目标,美国高调宣布实施网络威慑战略,研发先进网络武器,以实现拒止威慑和惩罚威慑