基于细粒度情感分析的意见挖掘算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:PoolD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
意见挖掘是对评论文本的主观情感、意见目标以及意见词等信息的提取过程,是自然语言处理中的核心领域之一。该任务经过了从传统机器学习方法到神经网络方法,从人工构建特征到词嵌入向量的逐渐转变,主要包括粗粒度和细粒度两种级别。其中基于细粒度情感分析的意见挖掘任务是针对特定目标进行精准化意见抽取,具体划分为细粒度情感分类任务、细粒度意见词抽取任务和细粒度意见目标抽取任务。近几年,随着评论文本的复杂化以及用户观点的多维化,需要对粗粒度进一步细化。然而粒度的细化会导致模型捕捉关键位置信息的难度急剧增加,此外还会受到无关词对情感信息编码的干扰,因此如何对复杂评论文本进行精细化意见抽取成为了此类任务的一大难点,另外很多研究将关注点集中在细粒度情感类别预测上,忽略了意见词对情感属性的解释作用,导致意见挖掘任务不完整。针对以上问题,本文以基于特定目标如何进行精准化意见挖掘为出发点,提出细粒度情感分类与细粒度意见词抽取两种方法。本文主要贡献如下:(1)设计了一种融合句法信息的图卷积神经网络SYN_GCN模型。首先通过分析评论文本词汇与词汇之间的语法关系构建依存句法图。接着设计多层图卷积网络并且将依存图融合进去,其中图卷积操作可以使模型学习到节点本身的特征以及节点之间的关联性,而依存图则可以将有语法联系的任意两个节点用边连接起来作为信息传递的桥梁,从而使得意见词中包含的情感信息聚合到相应的目标实体中。最后引入局部上下文特征遮盖层对无用特征进行遮盖,使模型只关注于目标实体及其邻近位置上的局部特征,实现关键位置编码。实验结果表明,本文提出的SYN_GCN模型相比于其它模型效果进一步得到了提升。(2)设计了一种联合目标监督信号的意见词抽取JTS_CNNs模型。首先通过自编码器获取评论文本的表征信息,将该信息当作共享特征。接着设计指导学习机制,通过自编码器对共享特征进行编码得到意见词抽取和目标实体抽取两种模块的私有特征,然后计算意见目标抽取任务对意见词抽取任务的监督信号,利用该监督信号指导意见词抽取模块的特征学习。最后,为了使模型训练效率大幅度提升,本文采用了简单的卷积神经网络作为共享特征以及两个模块的特征提取层,也叫做编码层。实验结果表明,本文提出的JTS_CNNs模型相比于其它模型效果进一步得到了提升。
其他文献
目的 观察大黄牡丹汤对急性胰腺炎大鼠肺组织细胞凋亡及炎症反应的影响,基于PI3K/AKT信号通路探讨其作用机制。方法 96只SPF级Wistar大鼠随机分为空白组、模型组、奥曲肽组和大黄牡丹汤高、中、低剂量组,每组16只。除空白组外,其余各组采用经胰胆管逆行注射5%牛磺胆酸钠溶液造模。各组造模前1 h,造模后12、24 h各给药1次,大黄牡丹汤高、中、低剂量组分别予14、7、3.5 g/kg大黄牡
随着我国城市化进程的快速推进,城市轨道交通在满足乘客出行需求和缓解城市交通拥堵方面发挥了极大的作用。在城轨运营网络成型,且线路基础设施确定的情况下,若要进一步提高行车密度和释放线路运能潜力,缩短列车追踪间隔将是一种行之有效的手段。在传统列控系统中,行车许可由地面设备生成。而在新型列控系统中,车载设备可以通过车-车通信实时获知前车动态信息,借助人工智能等技术预测前车动态行为,在此基础上自主计算行车许
近年得益于国家政策支持和科技的突破发展,汽车产业迎来新一轮发展周期,更适应于社会需求的智能化、电动化汽车迅速推广开来。H公司是国内汽车电子行业知名企业,主要提供相关产品研发生产及智能解决方案服务。由于企业快速发展,采购业务规模不断增长,2020年度企业非生产性物料采购项目近4.5万项,金额逾4.2亿,但当前企业采购面临一些问题,包括存在业务过度分散化,超过七成业务为分散采购;采购对象局限化,主要为
钢轨焊缝在焊接时容易产生气孔、缩孔等缺陷,且钢轨焊缝在役期间需长期承受列车车轮碾压和冲击,这均使得钢轨焊缝处容易发生断轨。目前,铁路部门在钢轨健康检测方面,主要采用以钢轨探伤车为主的传统超声波检测,该检测方法用于检测钢轨内部缺陷,但对钢轨焊缝、轨腰和轨底等复杂部位的表面和近表面的探测效果差或无法检测。基于兰姆波(Lamb波)的结构健康监测(SHM)技术具有频率低、能量衰减小、易穿过焊缝区域、对损伤
零部件的入厂物流是动车组制造企业的重点关注对象,入厂物流的效率和成本对公司的运营至关重要。动车组制造企业在规划入厂物流时,不仅要考虑各个供应商的地理位置所带来的运输问题,更要考虑运输时间间隔所带来的库存问题。动车组零部件量多且种类多样,零部件的及时供应十分关键,企业不仅要关注运输成本,更要关注准时化供应下的库存成本,效率和成本同时得到优化,企业目标才能得到满足。如何安全、高效、低成本地利用有限的运
在半导体行业中,处于创业期的小型科技公司一般只负责设计芯片和采购生产性电子物料,并将物料交付代工厂由代工厂加工生产产品。H公司是一家人工智能领域的小型科技公司。在对H公司的调研中发现,H公司的客户订单规模较小,生产性物料的需求量也较低。在直接采购时,由于需求量小于最小订购量H公司会出现物料过量采购的问题,导致物料呆滞和库存积压。H公司开始将物料采购外包给代工厂希望缓解物料过量采购,但是采购外包且不
随着我国经济社会的不断发展,人民生活水平质量的提高,国家对生态环境建设尤为重视。但是目前随着农村居民生活条件的改善,各项基础设施的完善,闲置、可堆肥的土地减少,而且垃圾数量也猛增,垃圾种类也越来越丰富。农村垃圾清运工作也逐步受到国家和社会的关注。但是在以往的类似研究中,大多关注城市生活垃圾的清运,对农村垃圾清运工作较少。因此本文参照城市生活垃圾的研究,主要研究农村垃圾的清运工作。通过定性和定量的方
稀土掺杂光纤激光器输出功率不断增长,在连续波和脉冲系统中均达到了平均千瓦级水平。横模不稳定(TMI)效应是限制大功率光纤激光器近衍射极限功率提升的一个重要原因,而光纤激光器系统的平均输出功率也受到其他多种影响的限制,如受激拉曼散射(Stimulated Raman Scattering,SRS)、受激布里渊散射(Stimulated Brillouin Scattering,SBS)等。本论文针对
《红楼梦》中的饮食描写,在物质文化层面上,体现了曹雪芹高超的烹饪美学和贾府的南方生活习惯;在精神文化层面上,包含着很深的文化、艺术和哲学意蕴,这从螃蟹宴、鹿肉宴、怡红寿宴、栊翠庵品茶等饮食活动都可以看出来。
泄漏电缆是铁路通信系统的重要组成部分之一,在铁路隧道等特殊地段中会利用漏缆来实现无线覆盖。为避免漏缆脱落影响铁路正常运行,对其固定卡具的状态监测至关重要。传统人工巡检,即使用肉眼观测卡具是否出现损坏、松脱,效率低下,无法满足铁路系统实时监测的要求,故需寻求新的卡具缺陷识别方法。本文选取基于深度学习的目标检测算法开展卡具缺陷识别研究,通过在漏缆卡具数据集上训练不同的检测算法并分析实验结果,验证自动化