基于注意力深度学习的商品评论情感分类研究

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:KAI12321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务快速普及,网络购物已成为人们消费的必经渠道。网络商品评论的情感极性是获取顾客对该种类商品反馈的最直接方式,商家可以通过分析评论洞察顾客体验,优化产品,调整销售计划。与机器学习、规则学习方法相比,深度学习无需人为构建和提取详尽的文本规则与语义特征,能自底向上地提炼文本特征,资源节约效应显著。在当前商品评论情感分类任务中,评论文本与情感词典的数量、质量一直是研究难点,现有算法也存在分类效果不佳、效率较低等问题。针对现有难点,本文主要研究内容如下:(1)使用爬虫技术从京东商城获取真实评论,并对评论进行处理以保证质量。现在广泛使用的语料集都存在文本缺损、商品类型参差不齐等各种不足,为保证使用语料集的准确性与全面性,本文使用爬虫技术从京东商城获取手机、电脑等电子产品评论作为数据集,以产品评论星级为准进行分类存储,便于后续使用。由于获取的产品评论数据可能存在重复评论、无效评论等情况,在规则去重与人工校核后,共获得两万余条有效语料,并设计出三种情感类型,分别为正面、中性和反面情感。(2)构建网络词词典与电子产品领域情感词典。因为网络评论文本规范性通常较弱,NLP常用分词工具jieba自带词典存在领域局限,无法将评论文本完美切分,需构建常用网络词词典,二者相结合使用才能正确切分文本,为词语文本的后续使用提供良好基础。评论文本中不同词语含有不同程度的情感倾向,为准确识别出评论整体的情感极性,需对词语赋予情感倾向性。目前,在情感分类领域汉字情感词典相对较少,所以选用主流的《知网》和台湾大学的情感词典为根基,将基于网络词词典所构建的网络词情感词典进行扩充,作为后续所用的电子产品领域情感词典。(3)改进卷积神经网络结构。对卷积层进行优化,使用数个尺寸卷积核来获取多维度语义特征。对池化层的池化操作进行改进,采用k-max池化以避免丢失大量有用特征。通过添加跳跃层引入原始语义特征,对卷积层提取特征起到信息补充作用。将改进后卷积神经网络作为XL-GSAt MSC算法的一部分,以充分学习商品评论里的隐性文本特征。(4)构建联合词向量并运用于XL-GSAt MSC算法。当前自然语言处理任务大都使用Word2Vec和Glove来预先训练词向量,由于Word2Vec无法根据同一词语不同意思生成词向量,本文选用Word2Vec与XLNet相结合的方式来生成词向量,保证词向量能更好体现文本语义在空间上的关系,并结合词语在情感词词典中的情感极性构建包含语义与情感的联合词向量。由于文本情感分类任务中,CNN易忽略文本上下文语义关系,RNN循环机制存在缺陷,本文构建一种名为XL-GSAt MSC的新型算法。循环神经网络无法处理长语句和并行运算,本文使用门控循环单元结合注意力机制提取长距离特征,提高运算效率。然后,基于门控循环单元所获特征开展MSCNN短距离特征抽取,充分学习商品评论里的隐性文本特征。商品评论情感分类结果可在用户推荐系统中使用,为商品寻找到潜在顾客。
其他文献
在现代战争中,随着作战服和防弹衣的性能提升,躯干和四肢受伤的概率有所减少,但肢体结合部位(腋窝、腹股沟、颈部)由于缺乏有效防护,受伤的概率则大大增加,这些部位分布着大动脉,伤及处往往会伴随着大动脉的破裂导致大出血,对于这些特殊部位的大出血,常规的传统止血装备无法发挥有效止血作用。针对以上止血难题,国内一研究团队提出了一种弹性展开结构的方法,本论文利用Ni Ti形状记忆合金优异的力学性能和超弹特性,
学位
人们生活中对油气资源的依赖与日俱增,所以油井的稳定性至关重要。新型的自膨胀封隔器逐渐取代了传统封隔器,大大提升了完井效率,降低了完井风险。作为其核心部件的原材料,吸水膨胀橡胶的开发及其吸水机理的研究尤为重要。开发出结构稳定、吸水能力强、强度高,可长期使用的吸水膨胀橡胶对油井的开采与开发具有非常重要的意义。丁腈橡胶是油气田中常用的橡胶之一,本文通过在丁腈橡胶以及氢化丁腈橡胶中加入不同的加工助剂,探究
学位
当今社会传统能源消耗严重,开发洁净无污染的氢能成为人们研究的热点。在全球“碳中和”的背景下,油气公司的绿色转型成为必然发展趋势。氢能与油气工业高度融合,中国石油计划在我国玉门油田布局可再生能源制氢产业与试验基地。研究发现光解水是用来产氢的一种有效手段,该技术清洁方便。ZnS形貌多样、价带和导带位置适宜以及光电性能优异,可用来光催化产氢。但是较窄的光响应范围和较短的载流子寿命限制了它的应用。本论文围
学位
智能化时代下,说话人识别技术可以为用户带来更具个性化的生活服务。目前,以深度学习为理论框架的说话人识别的研究取得了重要性的突破。然而,说话人识别系统的性能在实际应用中仍然面临着挑战。尤其是噪声问题,已成为阻碍说话识别技术未来商业化发展的重要因素。因此,本文围绕噪声环境下如何保持说话人识别性能的问题展开讨论,主要工作内容如下:(1)提出了一种基于边缘粒子滤波(RBPF)与深度置信网络(DBN)融合的
学位
随着城市建设的快速发展,施工机械施工时不慎将地下电缆挖断的事故频繁发生,严重影响居民生活和工农业生产,如何防止施工机械对地下电缆的破坏具有重要意义。本文提出了一种基于振动信号处理的地下电缆保护方法,根据施工机械工作时的地面振动信号,实现地下电缆的保护预警,本课题主要工作如下:(1)地面运动目标识别研究。本文首先分析了基于过零分析的地面运动目标识别方法,接着提出了一种基于LMD和多特征选择的目标识别
学位
腐蚀是造成金属材料失效的主要原因之一,而阴极保护技术作为腐蚀防护的有效方法被广泛应用。在硫酸盐还原菌(SRB)等微生物存在的条件下会导致阴极保护电位失效使得腐蚀持续发生。目前,研究阴极电位与微生物腐蚀之间的相互作用关系主要以大面积的电极材料为主,无法清晰的观察单一或少量微生物的局部腐蚀行为。因此,本文利用直径为100μm的铁丝设计并制作了微型电极,从微观角度研究了阴极电位与微生物之间的相互作用机制
学位
在工业装配领域,工人常常需要保持半蹲姿势或者全蹲姿势才能触碰到装配工件的重要部件,长时间保持这种姿态工作,则会增加膝关节的负担,轻度可能导致肌肉疼痛,严重可能导致职业性肌肉骨骼疾病(WMSDs)。为了降低肌肉骨骼类疾病的发生,本文设计一款被动式机械外骨骼,该外骨骼旨在为保持某些固定蹲姿工作的工人提供重力支撑,减轻膝关节的负担,从而分担部分肌肉力。首先,以人体下肢为分析对象,根据生物学需求建立人体坐
学位
随着海洋资源开发利用的深化和船舶海洋作业任务的不断细化,无人水面船(Unmanned Surface Vehicle,USV)作为一类小型、智能水面自航载体,得到了飞速发展。鉴于单艘无人水面船作业能力有限,海洋资源勘测、海上搜寻围捕等大区域任务往往需要多无人水面船协调控制来完成。良好的协调轨迹跟踪控制算法是无人水面船实现协调跟踪控制的基本保障,协调跟踪控制过程中对通信要求较高,但是一般的无人水面船
学位
当今,物联网技术的不断发展使得无线网络中的传感器节点广泛应用于日常生活中。这些无线网络传感器节点常部署在范围较大、位置分散、境况复杂的环境中,且使用电池进行供电。由于这种供电.方式存在着使用时间短、储电量有限、需要经常更.换等问题,并且若传感器节点的工作环境偏远或者恶劣,还会存在更换困难、危及生命安全等问题,因此能将环境能量转化为电能的能量采集技术有望成为解决这些问题的有效措施。由于压电-电磁复合
学位
为了实现高效的太阳能转化,在光催化制氢过程中有效利用全光谱的太阳光是一个巨大的探索难题。为了探究这一难题,本论文选取Cd S作为主催化剂,探究不同种类可以扩大光吸收范围的助催化剂,对复合体系进行全光谱光催化制氢机理分析。首先,通过Cd S与具有局部表面等离子共振效应(LSPR)的CsxWO3复合来获得全光谱光催化析氢的能力。实验中制备的CsxWO3/Cd S复合催化剂在全谱光下表现出最佳的光催化效
学位