基于情感信息融合的情感分析方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:luocheng890924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,网络上出现了大量的文本和图片数据,这些海量的数据为自然语言处理和图像识别提供了丰富的训练集。在自然语言处理任务中,情感分析具有重要的研究意义,它可以为决策者提供一定的参考信息。例如:它可以帮助商家了解购物者对商品的满意度,也可以帮助政府人员对热点事件进行舆情把控。
  对于文本数据,计算机不能直接对它进行计算,所以解决情感分析问题的第一步是要将文本转换成向量,即词转向量。目前进行词转向量主要使用的是词嵌入方法,该方法以无监督的方式从语料中学习上下文信息,通过一个嵌入空间使得语义上相似的单词在该空间内距离很近。实验证明词嵌入能有效的获取词的语义信息,但是对有些语义相近、情感相反的词却不能区分开来,将其直接应用到情感分析任务来说是不合适的。因此本文提出了融合情感信息的情感分析方法,借助已标注的情感词典来获取词的情感信息,并结合词嵌入模型改进情感分析任务的效果。
  文中提出了两种改进方案:(1)第一种方案首先使用词嵌入方法获取词向量,并将其定义为词的语义向量;然后,利用情感词典和词对情感的影响程度生成词的情感向量;之后,采用两种不同的融合方式将语义向量和情感向量进行融合,最后把融合的结果输入到分类器进行情感分类。(2)第二种方案以预训练的词嵌入模型为基础,首先,通过该模型获取到与目标词语义相近的前k个词;然后利用情感词典将这k个词分为两部分,一部分词与目标词情感相近,另一部分与之情感相反;之后,利用这些词与目标词情感极性的异同与强度对目标词的词向量进行优化,使目标词的词向量靠近与其情感相近的词,远离与其情感相反的词;最后,使用优化后的词向量作为特征向量训练情感分类器。实验表明,上述两种方案都提高了情感分析的实验结果,另外,文中还将两种方案进行结合共同提高情感分析的性能,结合后的实验结果又有了进一步的提高。
其他文献
大数据时代信息种类和数量变得繁复而冗杂,传统协同过滤算法在应对这种“信息过载”问题力不从心。因此,大量的专家和学者提出了多种推荐算法来改善推荐效果,满足用户需求。其中建立信任网络,使用用户间信任度对用户进行推荐便是其中一种典型算法。本文工作针对信任网络,使用社会网络中用户的关联关系得出用户之间的信任度,基于用户间信任度聚类对目标用户做出合理的推荐。论文的主要工作和创新如下:(1)基于双重邻居选取策
学位
随着多种定位设备的普及,基于位置的服务(ocation ased Services,S)已经广泛存在。尽管有了一些关于频繁模式挖掘的理论,但是还没有研究室内环境的。因此,针对室内移动对象轨迹频繁模式挖掘的研究工作显得尤为重要和迫切,以更好地为用户提供更加优质的位置服务。本文借鉴参考现有的经验,同时考虑到室内空间与室外空间的差异性,针对室内环境下的移动对象,对其做如下研究:(1)为改善传统的频繁模式
学位
模幂算法作为公开密钥算法的核心操作,是侧信道攻击的主要目标。自第一次计时攻击公开后,攻击者利用侧信道攻击实现了对公钥密码体制中的模幂算法中秘密信息的恢复。因为密码设备释放的“泄露”物理信息与模幂算法有很大的关联,从而未受保护的模幂算法为侧信道攻击提供了各种可能性。随着侧信道攻击技术的20多年的发展,针对模幂算法抗侧信道攻击的安全性的研究更是一个非常重要的研究课题。迄今为止,对模幂算法的侧信道攻击方
学位
利用计算机技术代替人工挖掘出图像和视频中有价值的信息是计算机视觉一直追求的目标。分割任务包括图像分割和前景检测又称为前景分割是计算机视觉中的基本的任务之一。前者往往是针对静态图像的处理而后者是视频信号尤其是监控视频。本文首先从静态图像中的目标分割任务入手,设计了太赫兹图像中的目标分割算法,并在此基础上引申到基于视频的分割,提出了跨场景的前景分割方法,取得了如下成果:1.基于生成对抗网络的太赫兹图像
随着无线应用的快速发展,频谱成为一种稀缺资源。认知无线电技术被视为当前频谱资源利用率低的有效解决方案之一,它允许次用户以机会接入的方式使用空闲的频谱。在认知无线电网络中,为了保护主用户的正常传输,次用户必须在接入信道之前通过频谱感知检测信道是否空闲。为了提高频谱感知的准确性,合作频谱感知被提出,它允许多个次用户合作感知频谱。对于集中式的合作频谱感知,存在一个融合中心,通过“逻辑或”、“逻辑与”等融
随着移动设备的增加,无线通信承载的数据流量爆炸式增长和无线资源紧缺的矛盾日益突出。无线虚拟化技术作为5G网络中关键的技术之一,近年来得到了广泛关注。无线虚拟化的核心是通过隔离和切片技术共享物理基础设施和资源,从而降低网络成本,提高资源利用率。无线虚拟化有巨大的潜在前景,但它也面临着一些严峻的挑战。最重要的挑战就是资源分配,现有的基于拍卖的资源分配方案大都是解决社会福利最大化问题,即最大化赢家用户估
学位
呼吸监测已被广泛用于评估一般人的健康状况,提供慢性疾病线索,并跟踪患者康复的进展情况。连续且准确的呼吸量测量可以为疾病的进展提供快速有效的诊断线索,例如阻塞性气道疾病哮喘、慢性阻塞性肺病(Chronic Obstructive Pulmonary Disease,COPD)以及睡眠期间常见的阻塞性睡眠呼吸暂停(Obstructive Sleep Apnea,OSA)等。传统的呼吸量监测方法需要用户
学位
时态数据用于表示数据的时间属性,在医疗、交通、经济和电子商务等领域有着广泛的应用。由于时间测量不精确、设备误差等因素,时态数据往往具有不确定性。本文针对不确定时态数据Top-k查询进行研究,该查询根据用户设定的评分函数返回具有最高(或最低)分数的k个查询结果,这对于在海量数据中返回最符合查询条件的目标数据有重要意义。已有的研究工作主要在确定时态数据查询和不确时态数据表示,针对不确定时态数据的Top
学位
随着新一代无线通讯网络技术的飞速发展和移动终端智能通信设备的大量普及,基于位置的服务(Location-Based Services,LBS)已遍及于人们日常生活的方方面面,为人们提供了便捷高效的服务。LBS是基于用户所在的具体地理位置,为用户提供相应的请求服务。在LBS请求过程中,用户需要将个人身份信息和准确的位置信息作为请求内容提交给不可信的LBS服务器,服务器基于用户请求检索结果,再将检索到
学位
在移动通讯技术和定位技术飞速发展的时代背景下,出现了许多基于位置的应用,例如滴滴出行、美团外卖、物流等。路网环境下的移动对象已成为当前的热门研究课题之一,常见的查询有K近邻查询、范围查询等。目前大部分针对路网的研究主要考虑静止点之间或者一个静止点和一个移动点,很少涉及两个移动点。本文针对路网移动对象动态最短路径查询展开研究,该查询具有较高计算复杂度。主要原因在于:一方面大规模路网增加了最短路径计算
学位