基于卷积循环神经网络的商品评论情感分析算法研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:chiyulong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着自然语言处理技术的快速发展,用户情感分析已经成为这一领域重点的研究课题之一,在产品评价、产品设计、质量监控、舆情分析、信息预测等方面发挥了越来越重要的作用。基于卷积循环神经网络的深度学习方法作为一种新兴的自然语言处理技术,在机器翻译、文本分类、语言识别和文本生成等众多领域得到了广泛应用。而利用卷积循环神经网络对商品评论文本进行情感分析已经成为情感分析领域非常活跃的话题。目前,基于卷积循环神经网络的评论文本情感分析模型针对结构不规范、稀疏、主题不明确的商品评论进行情感分类时,存在每个词对应的词向量受限于单一词向量训练模型导致忽视文本关键词的问题,同时存在传统词向量只是基于词语的上下文信息计算向量值导致不能全面理解短文本语义的问题。因此,本文根据评论短文本的结构特征,借鉴注意力词向量、BERT预训练模型和卷积循环神经网络的设计思想,对商品评论情感分类问题展开研究。1.基于注意力词向量网络的评论文本情感分析方法为了使评论文本中的关键信息更容易被获取,提高评论文本情感分类精度,针对每个词对应的词向量受限于单一词向量训练模型导致忽视文本关键词的问题,提出一种基于注意力词向量的在线评论文本情感分析方法。该方法通过结合注意力机制的AC-GRU网络。该网络可以将爬取的用户评论文本转化为词向量引入注意力机制作为输入,然后经过卷积和池化,再通过GRU网络对评论进行情感分类。在自建商品评论数据集和公开数据集进行的相关实验表明,本文算法可以提高评论文本关键信息的获取能力,进而提升评论文本情感分类的精度。2.结合分布式爬虫与BERT的评论文本情感分析方法为及时获取网站商品评论数据,并且让词向量可以得到更加丰富的句子语义信息特征,提出一种结合分布式爬虫与BERT模型的评论文本情感分析方法。针对单机爬虫速度较慢的问题,采用基于Scrapy框架的分布式爬虫模型以及布隆过滤器的去重策略对购物网站商品评论进行爬取和存储。针对传统词向量只是基于词语的上下文信息计算向量值导致不能全面理解短文本语义的问题,提出结合BERT预训练模型的BERT-C-GRU网络。该网络使用BERT模型抽取评论文本语义表示向量,通过CNN和GRU网络抽取评论文本的局部特征再对评论文本进行情感分类。本文所提算法在自建用户评论数据集进行了实验,实验结果表明,该算法可以提高文本转化为词向量的特征表示能力,从而可以完整的表示出用户评论的语义,提高情感分类的精度。
其他文献
近年来,滚珠丝杠进给系统的优越性在机械领域得到了充分体现,随着经济的飞跃和科学技术的进步,滚珠丝杠进给系统也被广泛运用于国防工业部门并实现了创新发展,尤其是空中加油机、雷达等,滚珠丝杠进给系统的精度与效率均有了明显提升。其中,滚珠丝杠副往高速方向发展是为了适应机床高速切削的需求。与传统低速切削发生在零件表面的切削速度相比,高速切削机床的刀具切削速度高出5-10倍之多,进给速度、主轴转速也比较高。故
随着功能的要求机械零件的形貌越加复杂,这为该类零件的无损检测提出新挑战。柔性平面涡流传感器可以根据被测构件的形貌定制,或可以随着构件表面形貌的变化而改变,有望成为该类机械零件表面、近表面裂纹探测的新技术。本文通过有限元分析与试验验证方法,对具有串联拓扑结构科赫分形曲线激励线圈的信号拾取线圈最优搭配进行探索,主要研究内容如下:(1)分析了三维刚性涡流传感器激励线圈连接方式的拓扑结构,通过拓扑变换获得
网络技术迅速发展,互联网已经渗透到人们日常生产生活的每一步。随着互联网的重要性不断加强,安全问题日益尖锐。而网络安全问题在大数据背景下呈现出模式新、规模大、隐蔽性高的特点。因此,基于大数据特征的入侵检测模型研究在网络安全领域受到了广泛关注,该模型可应用于军事、工业及通讯等领域。本文针对现有入侵检测模型的不足,如过度依赖特征库、模型优化方式单一及不能适应现有大数据环境等问题,提出了基于大数据特征的入
随着机动车变得越来越普及,我国汽车保有量也直线上升,我国公路里程增长速度远远赶不上汽车保有量增长速度。交通拥堵已成为一个难以解决的问题,也带来了环境污染、噪声污染等问题。各种智能交通辅助设备层出不穷,交通数据呈现爆炸式增长,实时的交通状况预测也显得尤为重要。智能交通系统中的交通流预测是进行合理交通诱导和控制的基础,它能够为交通管理系统提供坚实的基础和数据支持。本文提出一种基于GRU神经网络和BP神
软件定义网络是由斯坦福大学课题研究组提出的一种新型网络创新架构,通过使用软件编程的方式进行管控和定义网络,其控制平面和数据平面分离、接口可编程等特点,为目前互联网体系结构研究提供了新的研究途径,极大地推动了下一代互联网的发展。但是,SDN集中式管控架构也会引入一些严重的安全问题,如单点故障、多控制器环境中的网络视图一致性问题以及恶意交换机发起的欺骗攻击等。区块链是分布式数据存储、点对点传输、共识机
随着现代科学和工业技术的迅速发展,无损检测作为提高产品质量、保证服役设备安全运行的重要技术手段,在现代工业设备的安全保障体系中发挥着至关重要的作用。航空叶片存在缺陷损伤会引起航空发动机的机械性能显著退化甚至结构的完全失效。开展航空叶片的定量评估技术研究可以发现航空发动机的早期失效和潜在故障,有利于飞行器剩余寿命的精准估计,对于保证飞行器安全服役具有重要的现实意义。本课题以航空发动机叶片为研究对象,
社团结构是网络的基本特征,分析社交网络中的社团结构和社团演化规律将有助于我们更好地了解社会结构的组成,对分析复杂网络的拓扑结构,了解和控制网络信息传播和网络舆情的演化具有重要作用。为了解网络个体用户传播行为和信息传播中的网络群体对社团结构的影响,发现网络信息传播和社团演化之间的关系,本文提出了一种基于传播的社交网络社团检测方法。利用社交网络本身所具有的拓扑结构和定义的网络信息传播模型以及网络用户在
应用机器视觉实现校园教室灯光智慧化是当下研究的热点,基于机器视觉的校园教室灯光主要存在如下问题:首先要获得众多校园教室灯光的状态数据,灯光无法点亮,导致教室图像获取困难;其次是在低照度情况下,摄像机难以对焦,图像中物体轮廓模糊,细节丢失,难以获得保留特征的图像数据;三是校园大教室中所处人员往往零散分布,教室灯光无法对点亮区域进行目标定位,做到有人位置开灯,空闲位置熄灯节能。针对以上问题本文主要工作
在信息来源丰富的大数据时代,机器学习技术迅猛发展,云计算以其存储量大,计算能力强等特点已经成为机器学习的理想平台,但也带来了越来越多的隐私问题。决策树模型作为广泛使用的机器学习分类模型,它可以在云端被训练和部署,从而向用户提供分类服务。然而,一方面直接把用户的查询数据发送到云端可能会泄露其隐私,同时用户得到的评估结果也可能涉及其敏感信息。另一方面,通过机器学习得到的训练模型属于模型所有者的资产,它
随着现代科学技术的进步,各种交通工具给人们的出行带来前所未有的快捷、方便。与此同时,人们对交通工具的依赖,致使交通工具的数量和使用频率急剧增加,有限的城市资源无法满足激增的交通需求,造成了严重的交通拥堵问题,阻碍了城市的进一步发展。针对上述问题,本文运用智能交通技术,基于预处理后的交通流数据进行有效的短时交通流预测,为出行者提供实时的路况信息,从而缓解交通拥堵给人们出行带来的不便。首先,为解决原始