【摘 要】
:
在互联网中,用户原创评论广泛存在于各大社交媒体、电商网站中。这些评论中包含着巨大的信息和潜在的应用价值。例如,消费者可以通过其他用户的观点来指导消费;企业或商家们可以通过分析用户反馈指导商业决策。随着自然语言处理技术的发展,学者们提出了许多方法自动的从大规模评论数据中总结用户的观点。一条评论中完整的观点包括产品特征以及相应的情感倾向两个部分,分别对应着评价点抽取(Aspect Extraction
论文部分内容阅读
在互联网中,用户原创评论广泛存在于各大社交媒体、电商网站中。这些评论中包含着巨大的信息和潜在的应用价值。例如,消费者可以通过其他用户的观点来指导消费;企业或商家们可以通过分析用户反馈指导商业决策。随着自然语言处理技术的发展,学者们提出了许多方法自动的从大规模评论数据中总结用户的观点。一条评论中完整的观点包括产品特征以及相应的情感倾向两个部分,分别对应着评价点抽取(Aspect Extraction)和情感分析两个子任务。然而,现有的大多数方法集中在某一个子任务的研究,因此无法得到完整的观点,实用价值大大降低。尽管一些工作对两个任务联合建模,但仅仅是机械的将两个过程连接,忽略了任务的整体性。此外,Aspect级别的数据标注十分昂贵,限制了许多监督方法的应用。基于以上问题,本文分别对两个子任务进行了研究并提出了相应的模型,随后将两个模型融合,提出了弱监督的端到端观点挖掘模型。本文的研究内容归纳为以下三点:(1)无监督的评价点(Aspect)抽取的方法研究。主题模型是该任务的主流解决方法之一,本文使用效果更优的神经主题模型代替了传统的LDA风格主题模型,并结合任务特性,提出了多空间神经主题模型(Multi-Space Neural Topic Model,MS-NTM)。MS-NTM通过在多重概率空间分别构建隐变量,有效地降低了主题建模中的非主题语义的噪音干扰。(2)Aspect级别的情感分析任务的研究。本文分析了流行的注意力机制和门控机制的优缺点,提出了基于注意力门控的细粒度情感分析模型(Attentive-Gated LSTM,AG-LSTM),AG-LSTM将注意力和门控机制结合,能够在捕获关键特征的同时过滤噪声特征。同时,本文提出的注意力门控机制具有很强的扩展性和兼容性。(3)弱监督的端到端观点挖掘模型的构建。在MS-NTM和AG-LSTM的有效性得到验证后,本文将两个模型进行融合,提出了弱监督的端到端观点挖掘模型。实验结果表明,本文提出的模型在准确率上大大胜过了弱监督训练下的强基线模型,接近甚至胜过了有监督训练下的强基线模型。同时,由于弱监督和端到端的特性,本文提出的模型具有好的领域迁移性和实用性。
其他文献
长久以来,中国事业单位暴露出越来越多的弊病,政事不分、企事不分、职责不明的现象愈发严重。中国事业单位的分类革新已经是板上钉钉的事情,这一点是毫无疑问的。早在2011年,
精神疾病是一种高发疾病,具有患病率高、复发率高、致残率高等特点。据不完全统计,中国成人精神障碍的终生患病率高达16.6%,对家庭和社会造成了巨大的负担和影响。在众多的精
随机非线性离散时变系统的滤波问题是估计理论中的重要研究课题之一,相关估计方法被应用在军事、交通以及图像处理等众多领域。对非线性离散时变系统的性能进行分析,需明确其
作为计算机视觉领域的一个重要研究课题,图像语义分割的目标是将语义标签分配给图像中的每个像素,使彩色图像转化为语义标注图像。尽管深度学习方法的出现使得图像语义分割得到了明显改善,但仍存在一些问题:在某些复杂场景中,由于拍摄角度不同和光照不均匀,图像中包含许多不同目标相互重叠、低层视觉特征不明显等现象,因此常常出现一些因目标外貌特征相似而产生的语义混淆问题;除此之外,由于卷积神经网络中的下采样操作丢弃
随着科技的日益发展,数字图像越来越广泛地应用于人类生活的各个领域。计算机视觉领域中显著性检测技术变得越来越重要。图像的显著性检测基于视觉注意机制,旨在将人眼注意到
背景:慢性非特异性下腰痛(chronic non-specific low back pain,CNLBP)是世界范围内慢性健康问题中最常见、支出最高和造成功能障碍最多的疾患之一。多个临床指南一致推荐包
在当今的数字化信息时代,各种对于图像和影像采集、处理的系统应运而生.但是成像系统、传输介质以及存储设备的不完善,加之物体运动、噪声污染等原因,一定程度上导致图像的失真和降质,对于后续的处理带来不便.因此,对图像质量进行合理的评估具有非常重要的研究价值.本文首先用四元数表示彩色图像,设计两种评价指标,然后将全参考图像质量评价拓展到基于宽度学习的无参考图像质量评价.论文的主要工作如下:(1)提出四元数
社交网络、网页链接、城市道路交通网和大规模集成电路等均可抽象为顶点和边的数量在千万级以上的大规模图(数据),对这类大规模图的高效分析与计算需要在分布式平台上进行。然而,大规模图均衡划分是分布式处理图数据的核心问题,优良的大规模图划分结果可以充分利用集群资源、提升数据处理效率。已有许多研究者以线性规划、多级划分、启发式等方法对大规模图划分问题进行了研究,并提出了许多求解算法。但已有算法存在划分效率低
分工是探究人类历史发展的一个重要范畴,西方学者对分工的探讨最早可以追溯到柏拉图和色诺芬,我国学者对分工的探讨最早可以追溯到孟子。无论是西方还是我国的学者,由于受其
苏共二十大的召开和“秘密报告”的出台,引发国际共产主义运动的剧烈变动。英国共产党作为国际共产主义运动的分支力量,经历了建党以来最严重的危机时刻,一大批知识分子脱离