基于深度学习的中文短文本情感分析研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:QINSHAOKUN1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网上产生了大量的产品评论,这些产品评论中往往蕴涵着许多有价值的信息,通过分析在线产品评论的情感倾向可以为用户和商家的决策提供支持。目前,互联网文本评论的情感分析已经成为文本挖掘的热门领域,基于神经网络的情感分析方法虽然克服了机器学习方法存在的特征提取困难的问题,但是神经网络仍然存在无法感知不同单词的重要程度、无法学习句子的内部结构和无法利用单词的位置信息等问题。同时,产品评论为短文本,具有词汇少和噪声多的特点,使用词向量对其进行表示时存在特征稀疏的问题,导致短文本表示不足。针对上述问题,本文主要进行了如下研究:1.针对神经网络无法区分特征的重要程度和短文本表示不足的问题,提出了一种融合词性与注意力的MCNN-BLSTM情感分析模型。该模型首先将词向量和词性向量进行融合作为文本的特征表示,然后通过多通道的卷积神经网络提取文本不同粒度的局部特征,同时使用双向的长短期记忆网络提取文本的语义特征,将提取的特征进行融合作为文本的深层语义表达,最后通过注意力机制为融合的特征分配不同的权重,用来区分不同特征的重要程度。根据实验结果,该模型在htl-2000、htl-4000、htl-6000和htl-10000酒店评论数据集上分别达到了92.65%、93.03%、93.27%和93.77%的准确率。在htl-6000平衡数据集上,该模型与基于BGRU和自注意力机制的模型相比,准确率提高了3.09%;在htl-10000非平衡数据集上,该模型与基于字向量和词向量的CNN模型相比,准确率提高了2.07%。2.针对神经网络无法关注文本序列的局部关键特征和无法学习文本序列隐含特征信息的问题,提出了一种基于自注意力与胶囊网络的情感分析模型。该模型首先通过双向的长短期记忆网络来编码文本序列,学习文本序列之间的依赖关系,然后通过自注意力机制捕获句子的内部结构,关注文本序列的局部关键特征,最后通过胶囊网络挖掘文本序列中词语的位置信息和文本的句法结构等隐含特征信息。根据实验结果,该模型在Shop评论数据集上达到了94.27%的准确率。该模型与基于CNN-BGRU和注意力机制的模型相比,准确率提高了2.24%。
其他文献
纺织服装行业是社会发展的支柱产业。随着人们生活水平的提高,纺织行业的消费市场已经由排浪式消费阶段向个性化消费阶段转变,传统的手工生产已经不能够适应时代的需求,服装私人定制将会成为未来纺织服装行业的主要发展方向,而服装私人定制化的发展,离不开工业机器人技术的支撑。机器人末端执行器作为直接与物体接触的部件,是工业机器人在纺织行业应用的关键。因此,针对服装行业的机器人末端执行器的研究,对我国服装行业的发
近年来,神经网络已经广泛应用于图像处理,故障诊断,复杂系统控制等各个领域。众所周知,神经网络系统的许多应用很大程度上都依赖于其动力学行为,尤其对于平衡点的存在性和稳定性。而且,在实际的应用中由于放大器的转换速度和信息处理速度有限,导致时滞在神经网络系统中往往是难以避免的。时滞的存在,不仅会使系统的性能降低,而且会导致系统不稳定甚至紊乱。在许多实际问题中,还存在一种不同于传统时间延迟的典型时间延迟,
最近,耦合神经网络的同步等动力学行为受到了学界广泛关注。在研究耦合神经网络同步现象过程中系统解的收敛速度是一个重要但很难被准确估计的指标。因此,能够准确提供系统解收敛速度的衰减同步逐渐成为研究热点,同时,值得注意的是在现有的可以查到的相关文献中,耦合反应扩散神经网络的衰减同步还没有被考虑过。因此本文研究了多权重的状态耦合以及空间扩散耦合的反应扩散神经网络的衰减同步。接着,本文以现有的衰减同步和H∞
多层多道焊接方式常用于航空航天和船舶制造等工业领域里中厚板工件的焊接,是一种非常重要的连接工艺方法。而基于激光视觉传感器的机器人智能化焊缝跟踪方式以其价格低廉、抗干扰能力强和精度高等巨大优势成为应用最广的方法。然而,在进行实际焊缝跟踪时,利用视觉传感器获取的焊接图像不可避免地会受到强反射、飞溅和电弧噪声的污染导致无法保证焊接的稳定性和精确性。因此,对基于激光视觉的多层多道焊缝跟踪进行研究具有重要意
在科学研究和工程技术领域,优化问题无处不在,但这类问题往往带有复杂的约束条件使搜索过程复杂化,加大了解决问题的难度。在过去的几十年里,进化算法被广泛应用于求解优化问题。然而,单纯只用进化算法来解决约束优化问题是不准确的,因为它们不能直接减少约束问题的约束偏移。因此,对于约束优化问题,如何能够设计出有效处理约束且能找到最优解的算法即为本文的研究重点。本文主要从进化计算中约束处理技术的角度出发,结合有
近几十年来,多智能体系统的分布式协同控制引起了越来越多研究者的关注,其研究方向涉及传感器网络、编队控制、一致性问题、航天器姿态跟踪控制、分布式优化计算和控制工程等各个领域。一致性问题是多智能体分布式协同控制的基本问题,其目标是指一组智能体基于局部交互规则在一定的物理量上达成一致。在现有的研究基础上,本文研究了二阶多智能体系统的一致性问题,主要从以下两个方面展开研究:在实际的多智能体系统中,由于智能
随着科技的迅猛发展,许多工程应用都需要大量的决策变量来解决问题,这种大规模问题的优化将对现有的优化算法提出挑战。由于决策变量的数量较大,所以问题的搜索空间也是巨大的,甚至是无限的,这就使得问题难以入手求解。此外,在这巨大的探索空间中,必然存在着许多伪全局最优值,这些值将影响算法并使其陷入局部最优,从而失去了搜索全局最优的机会。针对大规模问题的优化,通常使用两种优化技术:一是基于分解技术的协同优化框
神经网络的发展和大型数据集的增多,以及计算机硬件运算能力的提升,使得基于深度学习的技术在单模态(图像、文字、语音)已经取得的巨大的发展和应用。但是,多模态理解和交互等人类高级认知和推理功能还是很弱。针对这个问题,本文研究多模态交互领域一个极其重要的研究课题——视觉问答(VAQ)。视觉问答涉及图像和文本两个模态的信息,由于卷积神经网络(CNN)和循环神经网络(RNN)分别在图像和文本上的突出表现,许
随着汽车自动避障技术和服务机器人的逐渐发展,路径规划已经成为了移动机器人技术领域的热点问题。作为人工智能领域的深度强化学习由于不需要人工标记和不需要依赖先验知识的优势,目前多个领域已经结合实际应用对其进行了研究开发,同样在机器人路径规划任务中也有该方向的研究。本文使用单目相机作为机器人的感知手段,研究基于深度强化学习的室内自主避障问题。首先,在编码器-解码器网络结构的基础上,采用监督训练的方式,提
随着机械制造技术的飞速发展,高速电主轴成为了当今数控机床的核心部件,对其性能的要求也越来越高。电主轴是否具有优良的动态特性成为了确保机床加工精度高低的必要条件。轴承受预紧力的作用影响其接触刚度,高速时转速的变化导致轴承摩擦热的产生影响了接触变形进一步影响接触刚度。轴承作为电主轴的支撑部件其刚度又决定着电主轴的动态特性。本文以赫兹接触理论、摩擦理论、传热学、转子动力学理论为基础,分析多工况条件下的电