基于卷积神经网络的中文情感分析研究

来源 :长沙理工大学 | 被引量 : 3次 | 上传用户:jinr0op8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网相关技术的快速发展,在以微博、淘宝等为代表的新型自媒体上,用户自由地在网络平台上表述自己的观点。评论观点不仅是用户选购产品或讨论时事的参考依据,也是收集民意信息的重要途径。由此可见,挖掘海量评论文本的观点倾向,分析情感极性,能够促进各方面的需求,具有重要的研究价值。情感分析也成为自然语言处理领域的一个重要研究课题。传统情感分析方法主要采用人工标注,对文本进行简单情感分类,难以自动学习,提取更准确的特征。近年来,机器学习、深度学习相关技术为自然语言处理带来了新的机遇。词语作为最基本的研究单元,词向量训练的好坏对任务完成的准确率至关重要。针对传统的词向量只考虑了词语中的语义信息,且卷积神经网络并未考虑句子结构和句子重要性特点,本文围绕词向量的训练方法以及基于卷积神经网络的中文情感分析相关技术展开,重点研究了采用信息词向量在改进的新型卷积神经网络中的情感分析方法,取得了一定成果,总结如下:(1)考虑到word2vec方法从上下文学习的语义词向量不包含词语自身的情感信息,且传统的卷积神经网络模型没有考虑到句子的结构,提出了一种基于情感词向量的动态多池卷积神经网络(SDMCNN)模型。该模型将语义词向量结合情感信息共同训练情感词向量,以转折词来分段句子,卷积神经网络中的动态池化层提取句子结构的多个最大特征值。实验结果表明,SDMCNN模型在精确率、召回率和F1值等指标上优于机器学习方法和传统卷积神经网络模型,证明了模型在中文评论情感分析任务上的有效性。(2)通过将产品信息引入神经网络方法来处理词向量问题,同时根据句子在文档中具有不同的重要性,提出了一种结合产品特征的权重卷积神经网络(PWCNN)模型。模型首先基于向量的语义合成计算原理训练产品信息词向量,然后采用池化加权的卷积神经网络来实现有区别的特征提取,进而学习文档级评论的情感表示。为了防止过拟合且提高泛化能力,在输出层采用dropout策略。实验结果表明,PWCNN模型在多领域产品评论数据集上情感分类准确率明显提高且加快了模型训练速度。
其他文献
随着当今计算机技术的飞速发展,数据的爆炸性增长使得从中发现有价值的信息变得越来越困难,原本在低维数据集上能够取得良好聚类效果的方法,由于受到“维灾”影响,无法在高维
随着现代科学技术的发展,手机、数码相机、笔记本电脑等便携式电子设备在人们的日常生活中扮演着不可替代的角色,电子设备的运行离不开储能电池的支撑,锂离子电池具有高能量密度、工作范围宽、无记忆效应且无气体排放等优点,被广泛用作便携式电子设备的储能电池来提供能量,全球可充电锂电池的的市场总值高达100亿美元,并且呈逐年增长的趋势。然而,到目前为止,锂离子电池一直受限于资源短缺,生产成本高以及无法满足对容量
在重离子碰撞初期产生大量高能的部分子,之后这些部分子在穿越QGP介质的过程中由于与介质的相互作用,诱发辐射胶子造成能量损失,导致喷注的横动量展宽等现象,这个过程称为喷注淬火效应。喷注淬火效应可以作为探测QGP信号的一个强有力探针。此外,在碰撞实验中观察到了强磁场的产生,而且还发现QGP还具有化学势。因此,在磁场、化学势背景下QGP性质的研究具有较重要的意义,除了一些对理论上的发展,在QCD的动力学
随着我国筑坝技术的飞速发展,高坝大库数量急剧增多,高度越来越高,甚至超出现有设计规范,拱坝以其厚度薄、整体性好等特点备受青睐,特高拱坝的安全问题是当前坝工界关注的焦点;同时,施工期和蓄水初期又是大坝失事或事故出现的多发期,施工期结构工作性态直接影响运行期结构性态,最终影响工程结构的安全。因此,有效监控施工期特高拱坝的应力状态,保证特高拱坝安全施工意义重大。本文在国家自然基金“混凝土坝长期变形特性数
信息隐藏技术是信息安全领域中的一个热门研究方向,可广泛地用于机密信息的安全存储与传输、隐蔽通信、数字媒体的版权保护等。但信息隐藏技术也可能被恶意滥用,如秘密窃取机
场景分类一直是计算机视觉领域的一个难点,在数字图像管理、视频监控、遥感图像处理等领域有着诸多应用。随着社会成像探测技术的迅猛发展以及高速通信网络的构建,产生了海量
随着世界气候变化和经济的急速的发展,生态环境遭受到严重破坏,并在日常生活中的各种水问题已经变得越来越严重。为了进一步探讨水资源与环境的问题,为合理利用水资源提供理论依据,博斯腾湖流域的人们最终面临的是水,水和自然发展。在博斯腾湖整体的流域内正确使用的湖泊,河流和地下水,应用环境同位素技术,在对博斯腾湖流域的开都河、清水河、黄水沟及周边地下水采样进行氢氧稳定同位素测定的基础上,分析“三水”之间的供应
在中国经济高速发展和人民日益提高的物资生活水平下,人们消费水平的提高和对产品的高追求迫使企业不得不对产业进行升级,早期传统行业过多的投入和转型的困境使生产与当前的
目前我国正处于新常态下的“转型期”,各行业面临着新的机遇和挑战。私募证券基金,是我国资本市场上的一股新生力量。笔者在工作中发现,很多私募基金存在着战略管理问题,本文
在最近的近十年里,很多发展中国家致力于促进智能电网的建设与发展。应用智能电网相比传统电网,可以通过用户用电行为辨识算法来判断用户的用电模式并进行分类,对实现需求响应和电价制定具有重要意义。针对K均值算法中用电数据特征选取策略问题,本文提出了一种考虑特征间相关关系的迭代型特征优选策略。首先基于DBI指标对不同特征组合下的K均值聚类效果来作为特征选取的标准;然后,建立特征优选模型,通过实验将备选特征优