基于深度学习的中文商品评论情感分析

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:heyifeizhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术的快速发展,网络购物已经逐渐成为了人们生活中不可或缺的一部分,国内网上购物平台的兴起也进一步导致中文商品评论文本数据的大量产生,这些评论文本数据中往往包含着大量的情感信息,因此如何分析应用这些信息无论对于企业、个人还是国家都有着重要的研究意义。本文在首先介绍了中文商品评论情感分析的研究背景和意义、国内外研究现状和相关的理论基础知识后,着重研究中文商品评论的情感分析。本文的主要研究工作包括如下:本文首先阐述了在以往的研究中,很多学者仅仅关注评论文本中词语与词语之间的上下文信息,而忽略对于有价值的中文商品评论文本句子与句子之间也存在的丰富的语义和上下文信息,因此本文提出了一种基于分层的双向长短时记忆神经网络(Hierarchical Bi-LSTM)和注意机制相结合的方法用于中文商品评论情感分析。其次本文基于Word2vec词嵌入技术无法解决词语的多义性等局限性的考虑,结合了目前流行的BERT预训练模型技术,提出了将BERT预训练模型用于中文文本的词向量表示,从而实现了在词向量技术上提升中文商品评论情感分析的性能。最后在本文的实验部分中,首先收集到用于实验的电商平台语料数据集作为本文的研究对象,经由预处理之后,使用BERT预训练语言模型处理评论文本获得词向量表示,然后应用Hierarchical Bi-LSTM模型分别从句子和单词中提取语义和上下文特征信息,再利用softmax获取到商品评论的三分类的情感分类结果。通过实验的结果表明,本文所提出的方法在中文商品评论的情感分析上,相比于传统的情感分析方法实现了更为理想的效果。
其他文献
车辆型号的识别在智能交通领域有着广泛的应用前景,其中识别任务主要使用监控系统的车辆图像。日间车辆图像的识别准确率较高,但是夜间车辆图像饱受弱曝光、大量噪声、多重光源等的干扰,这些干扰增加了车型识别任务的难度,因此针对夜间车辆的暗光增强研究在智慧城市中具有重大意义。在增强过程中,不同的增强方法会产生不同的噪声、欠曝光、过度曝光和模糊等现象。针对这些现象,本文基于卷积神经网络(convolutiona
学位
人体运动数据被广泛应用在影视制作、医疗康复、体育训练和虚拟现实等领域之中。为了满足用户在不同场景下的需求,出现了多种运动采集设备,形成了多种模态的人体运动数据,多模态人体运动数据的融合可以用于运动数据去噪和运动合成等研究。然而,现有的多模态人体运动同步数据集的数据量和动作种类有限,为支撑更具通用性的研究,设计并采集一套公开的多模态人体运动数据集是亟待解决的问题。因此,本文基于现有的运动采集设备设计
学位
2021年,元宇宙的概念火遍全球。虚拟化身是用户在数字化场景中使用的形象,是元宇宙与现实世界的接口。在元宇宙背景下,用户对在虚拟环境中构建自己第二分身——虚拟化身的需求将会增加,并且用户更倾向于自定义虚拟化身。自定义虚拟化身是指用户根据自身喜好在虚拟场景中设计并使用的形象,其特点是只有模型没有运动数据。所以在实时驱动这种自定义虚拟化身时一般是需要实时的运动重定向技术生成运动数据。然而,研究发现,一
学位
在当今学术合作中,人们对不同领域、不同学科的学术合作的兴趣与日俱增,但人们仍然对学术大数据中跨学科、跨领域的动态协同合作机制知之甚少。以往的研究要么主要集中在学术网络拓扑上,而忽略了学术网络中的属性,要么主要研究学术网络中节点的属性,而忽略了学术网络中拓扑关系。为了进一步理解学术大数据中的主题和结构变化模式进而探究其中的协同合作关系,我们首先总结归纳了动态学术社交网络关系的分析以及图可视化方法,然
学位
高光谱图像因其丰富的光谱信息而获得广泛的关注,但由于传感器硬件设备的局限性,使得高光谱图像的空间分辨率较低,这在很大程度上限制了高光谱图像的实际应用场景。为了解决这个问题,一种主流的做法是将低空间分辨率的高光谱图像与高空间分辨率的多光谱图像进行融合。高光谱图像作为一种典型的三维结构数据,具有光谱和空间两种重要属性,能否充分利用这些属性的特征成为融合算法非常关键的一步,为此,本文开展了如下工作:(1
学位
早期隔行(交错)视频通常包含复杂的交错横纹和各类压缩伪影,严重影响了主观视觉体验。尽管近年来针对早期视频的高清重建技术取得了很大进展,但有关视频去隔行研究依旧匮乏。随着人们对视频内容不断增加的多元化需求,早期经典视频的增强重建受到了越来越多的关注和应用。针对上述问题,本文提出了一种基于多帧的隔行视频联合增强模型,实现低质量隔行视频的交错去除,压缩伪影去除,超分辨率等增强任务,同时还将所提算法进行改
学位
随着整个社会进一步的网络化和数字化,越来越多的场合需要对人的真实身份进行有效认证。掌纹识别作为一种新兴的生物特征识别技术在过去二十年里受到了广泛的关注。感兴趣区域(Region of Interest,ROI)的准确提取是掌纹识别的关键步骤,直接影响后继的识别性能。然而,在已有的研究中,不同学者提取的ROI大小、位置、方向都不尽相同,为以后大规模应用带来潜在的隐患。深度学习在近年的计算机视觉任务中
学位
在数据大爆炸的时代,高维数据已广泛地存在于生产与科学研究领域。当前数据维度也变得越来越高,同时会带来研究上的困难,用传统的聚类方法对高维数据进行聚类将消耗非常大的计算量,这对有限的计算内存来说是一种很大的计算消耗和开销。如何有效地分析和管理这些数据信息变得非常重要,在复杂的该数据背景下聚类技术是对数据进行分类处理的重要手段。传统的聚类方法,如众所周知的模糊k均值算法,通常需要足够的数据才能找到一个
学位
考古遗存是古代先辈活动遗留下的客观实体和精神文明的物质载体,目前正面临着来自自然活动及人类活动的巨大挑战,数字化模型技术将为其延长生命并赋予新的活力。多视图三维重建方法具备相当便捷、高效和低成本的特点,是有力的数字化手段之一。作为历史遗存的物品纹理相似性很强,多视图重建流程中的特征提取准确性至关重要;另一方面,传统的多视图重建流程到点云或三角化网格即为完成,但历史遗存的展示性需求,希望数字模型拥有
学位
随着社交媒体和电子邮件的普遍使用,短文本在互联网上大量涌现。短文本分类任务在情感分析、垃圾邮件分类和新闻分类等领域中有广泛的应用。一方面,这些短文本数据长度限制和一词多义带来了数据稀疏性与歧义性问题。另一方面,实际应用中的短文本含有大量的无标记数据,而人工标注这些无标记数据耗时且繁琐,使得短文本分类任务面临着巨大挑战。为此,本文分别针对标记数据与无标记数据开展了监督和半监督的短文本分类方法研究,其
学位