基于深度学习的文本情感分类研究

被引量 : 5次 | 上传用户:am1047973925
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的加速进步与全面发展,各类网络社交媒体如雨后春笋般出现在人们的生活中,极大地丰富了人们交互信息的模式,人们可以在任何时间任何地点以不同的方式在网络上发表各自的看法和意见,这使得网络中的数据信息量日益庞大。由于这些信息在很多情况下都传达着人们对事物的情感态度和观点看法,为了能够从大量文本资源里筛选出可以运用于相关应用研究的有价值的情感信息,需要对文本进行一系列处理和分析,由此产生了文本情感分类这一研究热点,这对舆情监测、商品营销、金融分析等实际应用有着重要影响。目前,使用情感词典方法和机器学习方法是处理文本情感分类问题的主要途径,而深度学习作为一种新模式的机器学习算法在自然语言处理相关任务中也受到了大量国内外学者的关注。本文首先设计爬虫程序从豆瓣电影中采集影评文本,并由人工对影评情感进行类别标注,然后分别研究了词典法、朴素贝叶斯法和支持向量机法在文本情感分类任务中的运用,接着重点研究了卷积神经网络对文本情感分类的处理性能。在研究应用于文本情感分类的卷积神经网络过程中,构建了基于词汇特征的卷积神经网络模型,首先使用word2vec工具对文本进行向量化,然后结合特征提取方法和词汇向量维度大小探究了其对卷积神经网络模型分类性能的影响,得出了选择合适的文本特征提取方法和词汇向量维度大小能在一定程度上提升文本情感分类准确率的结论。考虑到基于词汇特征的卷积神经网络模型忽略了文本的词性特征及词性之间具有语义相关性这一特性,本文提出了融合词汇特征和词性特征的方法,并按照特征融合模式提出了两种WPCNN(Word and POS Convolutional Neural Network)模型结构:拼接卷积模式和独立卷积模式,在Tensorflow上构建了这两种结构的分类器模型。鉴于词性具有上下文相关性,同样使用word2vec工具训练词性向量模型对词性进行向量化。为验证提出的两种WPCNN模型的可行性和有效性,在豆瓣影评文本上就正负面情感分类问题进行相关研究,并与词典法、朴素贝叶斯法、支持向量机法,以及基于词汇特征的卷积神经网络模型进行对比实验,结果表明,融合词性特征的WPCNN模型可以更多地学习文本语义信息,对正面情感文本和负面情感文本的分类性能在多个评价指标上都有所提高。
其他文献
本论文采用氧-乙炔火焰喷焊和多弧离子镀(PVD)技术制备具有优良耐磨性能和耐腐蚀性能的CrN/Ni60(WC)复合涂层,这种CrN/Ni60(WC)复合涂层主要用于工况复杂严苛的球阀表面。实
纳米孪晶金属优异的综合力学性能源于其独特的塑性变形机制。大量实验测试、计算模拟和理论分析研究结果显示,位错-孪晶界的交互作用是决定纳米孪晶金属宏观力学性能的本征原
党的十九大提出“健全自治、法治、德治相结合的乡村治理体系”。浙江早在2013年就把“三治”作为坚持和发展“枫桥经验”的重要内容,今年又把“三治融合”作为总结提升推广新
报纸
为推动我市专职人民调解员队伍建设,规范专职人民调解员的聘任管理工作,根据《中华人民共和国人民调解法》和《广东省实施〈中华人民共和国人民调解法〉办法》,结合我市实际,制定
报纸
TC4钛合金表面微弧氧化制备得到的膜层因热应力在膜层表面有微裂纹存在,使得膜层与基体的结合强度差,耐磨损性能欠佳。其次微弧氧化是高电压、大电流的氧化过程,膜层中物相的
互联网的普及为电子商务的发展奠定了基础,信息时代下的企业间竞争日益激烈,昔日“以产品为中心”的思想逐渐转变为“以客户为中心”,用户在线评论成为买卖双方信息沟通的桥
随着现代科学技术的发展进步,金属材料在医学上的应用不容小觑。因镁合金具有良好的生物相容性、能有效的避免“应力遮挡效应”等诸多优势,使得镁合金在生物医用方面具有良好
铁基非晶及纳米晶合金在功能材料和结构工程领域具有广泛的应用前景,因其具有优异的软磁、力学性能及低廉的价格。然而,非晶形成能力较低,两次晶化温度区间过窄,这对制备非晶
<正> 一般资料:本组156例,其中男94侧,女62例,年龄均在一月至三岁之间。病程一天以内者96例二至,三天者42例,四至七天者16例,三周以上者2例。治疗方法:吴茱萸6克、苍术7克,白
目的:应用分子生物学的方法,在细胞水平观察促红细胞生成素(erythropoietin,EPO)对在血管紧张素Ⅱ(angiotensin Ⅱ, AngⅡ)诱导培养下的乳鼠心脏成纤维细胞(Cardiac Fibroblas