融合用户和产品信息的文本情感分类研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wangpeng532
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档级别的情感分类是情感分析和观点挖掘的基础任务,它根据文本中单一的目标或产品来决定该文本的情感极性。传统的情感分类方法是手动地从文本中抽取、设计和选择一些高质量的特征,然后训练各种分类器,这种方法依赖于人工设计的特征选择方法,并且难以应用在海量数据集的场景中。近几年来,深度学习方法在自然语言处理领域取得了重大突破,越来越多的研究者关注如何利用深度学习技术提高情感分类的效果。但是,目前大部分工作只关注文本内容而忽视了用户和产品信息,提取的情感信息较为单一,并且对文本数据缺乏有效利用导致信息丢失,这些问题严重影响了情感分类任务的准确率。本文针对上述问题,主要工作如下:1.考虑到用户信息和产品信息对情感分类任务的影响,设计并实现了一种分层注意力和用户产品信息相结合的情感分类模型(Hierarchical Attention Network With User And Product Attention,HAN_UPA),分别在词语层和句子层考虑用户偏好和产品特征对情感评分的影响,并且优化了情感评分函数,通过计算词向量和平均句向量的语义相似度、句向量和平均文档向量的语义相似度来提高重要词语和重要句子的权重,进而提高情感分类的准确度。在三个英文数据集上的实验结果表明,考虑用户偏好和产品特征的情感分类模型与结合语义相似度的情感分类模型都提高了分类的准确率。2.针对提取情感信息单一的问题,设计并实现了融合用户信息和产品信息的分层多头注意力情感分类模型(Hierarchical User And Product Multi-Head Attention Model,HUPMA)。在词语层和句子层中分别用多头注意力提取出词语和句子的情感信息,形成指代信息更丰富的注意力权重分布;同时在每个注意力中融入用户信息和产品信息,在多个子空间上得到用户偏好和产品特点对情感评分的影响,挖掘出用户信息和产品信息在多个维度上的深层特征。实验结果表明,多头注意力的引入大大提高了情感分类效果,尤其是融合了用户信息和产品信息的分层多头注意力模型取得了非常好的效果。3.为了提高情感分类模型的局部特征提取能力,减少信息丢失,本文结合卷积神经网络(Convolutional Neural Network,CNN)和多头注意力机制,设计并实现了基于长短期记忆网络和卷积神经网络的多头注意力情感分类模型,采用了长短期记忆网络和卷积神经网络相结合的方式,不仅能够较好地处理文本的时序信息,同时也能够提取局部深层次语义信息。除此之外,本文将多头注意力思想与卷积网络的池化层相结合,用多头注意力的池化策略代替传统的最大池化策略或平均池化策略,更大程度上保留了对分类结果有重要影响的词语,减少了信息丢失。实验结果表明,基于LSTM和卷积神经网络的多头注意力情感分类模型比原来的模型在准确率上取得了进一步的提高。
其他文献
北京外国语大学文秋芳教授在《外语教学理论与实践》一刊中发表文章称,在国际人才竞争极其激烈的背景下,西方对思辨力的培养越来越重视,尤其是美国许多高校将思辨力培养列为高等教育的重要任务。但当前,中国缺少对学生辩证思维能力的培养。此外,北京外国语大学孙有中教授也在《中国外语》一刊上发文指出,中国的英语专业教学应当将思辨能力的培养作为重点。针对这种情况,外语教学研究出版社引进了《立场:辩证思维训练》系列书
人类最主要的信息获取方式就是通过视觉途径,尤其是在这个信息革命的时代,我们对于图像承载信息的方式有了更多的依赖。虽然集成电路的飞速发展极大地提升了图像处理的速率,
近些年,随着生活质量的提升,国人对口腔健康问题逐渐产生了更高层次的追求,即在无生理性病痛的基础上,追求牙齿外在的整齐洁白,以塑造良好的个人与社会形象。受此需求影响,正
在我国经济转型攻坚克难的关键时期,非金融企业部门对全社会杠杆率的突出影响,引发全社会各界的高度关注。现阶段,以国有企业为代表的众多企业杠杆率居高不下,债务规模与日扩大,财务负担不断加重。目前来看,从国际角度出发,经济环境受2008年以来次贷危机的持续影响,经济全球化程度也在不断加深;从国内角度出发,我国经济正处于“L”型走势谷底区,下行压力较大。部分企业经营能力不能跟上时代的步伐,无法满足需求,埋
高光谱图像(Hyperspectral Image,HSI)波段覆盖范围广,光谱分辨率高,蕴含了丰富且精细的空间和光谱信息,具有较强的对相似地物类别精确识别的能力。目前高光谱图像已经广泛应用于土地覆盖检测、资源管理和医疗诊断等领域。高光谱图像分类是高光谱图像处理中的重要环节,备受专家学者的关注。高光谱图像分类的实质是给每个像元分配一个类别标签,从而产生一张地物分布图,可以精准地反映真实的地物分布情
由图像来进行三维重建是计算机视觉中的重要研究目标之一。本文从两个方面研究了三维重建的方法:基于视差图的三维重建和基于特征点的三维重建。然后对其中的某些步骤进行了
伴随着计算机视觉技术的快速发展,人体动作识别技术已在该领域占据重要的位置。在安全防护、高级人机互动、视频搜索分析以及体育运动分析等方面具有重要的实用价值和研究价
影视记录,作为当前大众记录生活、记录文化的一种惯用手段,已经成为少数民族文化传承的新方式。近几年,随着社会对少数民族文化关注度的提升,少数民族文化相关的影像作品也层出不穷。通过梳理这些影像资料,为大众呈现出深埋在相关贵州少数民族女红文化影像作品中少数民族女性与女红文化之间的特殊关系,以影视人类学的角度解读相关贵州少数民族女红文化的影视作品,从形象构建、起源说、现象论、文化误读等方面对这一文化进行影
近年来,随着经济的快速发展,人民生活水平的提高,大众对健身养生的需求也不断增加,而科学的健身气功锻炼有益于身心健康,颇受人民大众的喜爱。健身气功管理中心通过大量调研
根据现行法律法规、司法解释的规定,建设工程施工合同无效但工程项目竣工验收合格时,承包人可参照合同行使折价补偿工程价款的请求权。那么如何认定无效建设工程施工合同(以下简称“无效施工合同”)的工程价款方能均衡各方利益,值得我们探讨。基于此背景本文采取案例分析法、文献研究法以及实证研究等研究方法对相关问题展开论述。本文在分析了无效施工合同认定情形的基础上探讨了无效施工合同的处理方法,阐述了无效施工合同因