词性感知的多视点情感分析方法的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:liongliong443
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中幂式增长的在线体验数据给传统的数据分析方法带来了巨大挑战,基于深度学习的情感分析算法有效节省资源的同时还帮助用户快速准确从大数据中获取其他用户意见倾向。视点级的情感分析任务突破了粗粒度的篇章级和句子级分析过于理想的假设条件的限制,使得分析过程更加类人。其分析结果包含一条意见文本中所有视点项的情感倾向,这也是其他级别缺失的。因此,多视点的情感分析任务可以最大化获取文本中的有效情感信息,是目前情感分析领域的一条重要研究分支。本文聚焦于视点级别的情感分析工作,首先归纳了基于深度学习的多视点情感研究中存在的四项技术挑战,分别是:如何让模型根据词语对文本情感表达的贡献程度加以区分;如何建模输入文本和视点词之间的语义关系;如何应对特定词的“视点词敏感性”问题;如何缓解有标注数据集的局限性。其中有标注数据集的局限性是当前深度学习领域普遍面临的一项技术瓶颈,主要体现于样本数量的有限性和样本质量的偏差性这两点。在这样的背景下,本文分别提出了一系列基于词性知识辅助的多视点情感分析算法和基于视点词交互的多视点情感分析方法来应对以上四点挑战。本文发现一些词性常常隐含表达者的情感倾向,若将其作为先验知识引入到建模过程中会增强模型判断单词所含情感信息多少的能力,有利于解决第一、四点挑战。基于视点词交互的多视点情感分析方法旨在过滤无关情感特征,且清晰划分每个视点项的情感辐射区域。由此,第二、三点技术难点也会得以解决。最终将它们融合得到词性感知的多视点情感分析模型IPAN。实验结果显示,最终得到的词性感知的多视点情感分析模型和10余种基线模型相比具有强劲的竞争力。不仅如此,本文丰富的探究实验也证明了所提出的模型和其中涉及到的算法的有效性。
其他文献
无线通信面临的关键挑战是实现高频谱利用率、大数据量、宽覆盖、低时延的连接。非正交多址接入(Non-orthogonal multiple access,NOMA)作为未来无线网络的一种新兴技术,在提高频谱利用率的同时,还可以支持大规模用户接入。此外,无人机(Unmanned Aerial Vehicle,UAV)由于具有成本效益高、部署灵活和移动性强等突出特性,已经成为无线网络的重要组成部分。本课
图像风格迁移是将原始图像渲染合成为不同风格图像的计算机视觉技术,近年来,随着深度学习和生成对抗网络的兴起,图像风格迁移逐渐成为研究的热点。现有图像风格迁移方法仅仅学习全局图像的特征而忽视了图像中局部实例特征的重要性,此外还在多样性、迁移效率和速度方面存在限制,本文提出基于跨粒度学习的实时图像风格迁移算法改善现有方法存在的问题。为了保证风格迁移后图像中的局部实例更加真实,本文提出基于跨粒度学习的图像
无人机(Unmanned Aerial Vehicle,UAV)通信因其低成本和高机动性的特点在无线通信的覆盖、中继等领域得到了广泛的应用,已经成为无线通信研究的新热点。为了高效可靠地进行无人机无线通信系统的实际设计和性能评估,对无人机空地信道进行准确刻画进而建立准确、可靠且易于使用的无人机空地信道模型变得尤为重要。在目前无人机测量工作较少,缺乏大量实测数据的情况下,基于几何的随机性模型(Geom
随着“互联网+”时代的到来,在信息化技术不断推动下,传统企业为了抢先数字化产业市场获得更多经济效益将进行转型升级。低成本、高效率的软件外包服务得到了更多的关注和使用,但其自身具有的项目风险也一直是企业迫切需要解决的难题。因此,对软件外包项目的管理模式进行研究十分必要。本文将从发包方的角度,采用从整体到局部、层层递进的研究思路,对Y公司某外包项目进行分析,主要从项目团队、项目需求以及项目进度三个方面
在智慧城市建设大战略的指导下,智慧管廊作为智慧城市的重要组成部分,其发展与建设已成为当今基础建设的一个重要关注点。本文基于已有的智慧管廊云平台后台系统,提出了一种智慧管廊后台模块的系统优化方案。该方案对后台系统间的调用和安全架构进行了优化重构,提升了系统的整体性能。同时,对智慧管廊后台模块的热点功能,主要包括巡检计划、审批模块以及异常检测模块进行了功能优化,使其能够更好地适应当下的业务增长。本文的
近几年,随着深度学习的快速发展,小样本学习已经逐渐成为当前的研究热点,在医疗、稀有物种等领域具有非常好的场景和应用潜力。小样本识别旨在从一张或者只有少数几张图像中学习有关物体类别的信息,其最大的挑战是当前大多数小样本识别模型的准确率较低,仍然有较大的提升空间。为了有效地提高小样本识别的准确率,本文利用元学习的思想,对基于度量学习与数据增强的小样本识别算法进行研究。主要研究成果如下:(1)针对当前基
计算机断层扫描(CT)是一种多功能、高分辨率的成像方式,它能够得到人体不同部位和器官的横断面图像。自1973年第一台断层扫描机问世以来,CT对于改变临床诊断的面貌具有非常重大的意义,被越来越多地应用于筛查和诊断。考虑到正常剂量CT辐射会带来与导致遗传损伤和增加患癌概率有关的潜在健康风险,采用降低管电流的方法来降低辐射剂量。然而低剂量CT扫描会在重建图像中增加大量噪声和伪影,这会严重影响诊断精度。传
随着移动互联网和物联网各类新型业务和应用不断涌现,将带来数据流量的激增以及超过500亿量级的终端设备连接。超密集网络在室内外热点密集部署低功耗小基站,是解决5G移动网络数据流量爆炸式增长的有效方案。但由于通过基于有线光纤的回程连接密集部署,成本高昂,为了解决这个问题,第三代合作伙伴计划提出了接入回传一体化(IAB)体系结构。对于5G超密集网络,小小区的超密集部署与IAB节点的移动性会带来诸多待解决
数据时代之下,大数据技术渐渐成为数据时代的重要角色。大数据不仅是量的积累,更是质的飞跃。海量的、不同来源、不同形式、包含不同信息的数据可以容易地被整合、分析,原本孤立的数据变得互相联通。不过目前传统的数据产品在大数据场景下出现了一些局限性。如何针对大数据场景,如何处理不同的复杂数据源,这些都是目前横亘在用户和产品之间的鸿沟。如何才能让大数据变得亲切和易于理解,更好的服务用户,可视化无疑是最有效的途
全球互联网是由数万个内部结构各异的自治系统(Autonomous System,AS)构成,边界网关协议(Border Gateway Protocol,BGP)负责为这些自治系统传递并交换路由消息。BGP协议已经成为互联网重要的基础设施,保证BGP协议的安全对于维护网络空间安全具有重大的意义。但是,由于BGP协议在设计之初未考虑安全问题,导致BGP安全问题不断涌现。BGP前缀劫持是国内外研究人员