【摘 要】
:
在互联网和信息科技高速发展的今天,人们已经能够随时凭借各类社交网络平台和电子商务平台发布自己的观点和想法。这使得互联网中涌现出海量的文本数据,这些评论文本中大都包含着情感信息,分析文本中蕴含的情感并提取出其中有价值的信息对于企业、政府乃至社会都有着重大的研究价值。基于此,文本情感分析成为了最受学者们关注的领域之一。传统的情感分析任务是在文档或句子级别上进行的,通常只能粗糙地表达出一个整体的情感极性
论文部分内容阅读
在互联网和信息科技高速发展的今天,人们已经能够随时凭借各类社交网络平台和电子商务平台发布自己的观点和想法。这使得互联网中涌现出海量的文本数据,这些评论文本中大都包含着情感信息,分析文本中蕴含的情感并提取出其中有价值的信息对于企业、政府乃至社会都有着重大的研究价值。基于此,文本情感分析成为了最受学者们关注的领域之一。传统的情感分析任务是在文档或句子级别上进行的,通常只能粗糙地表达出一个整体的情感极性,并不能够针对某一特定方面或对象做出判断,导致用户的实际需求难以得到满足。这对于分析粒度的细化要求就越来越高,因此,从方面级别的角度分析文本中蕴含的情感信息的细粒度情感分析任务便出现了。细粒度情感分析指的是对句子中包含的每个对象或方面的情感极性进行分析。例如在“这款耳机质量非常好但是外观不好看”这句话中,针对耳机质量来讲,用户表达出的是积极的情感倾向,但是从外观的角度,用户却表达出了消极的情感倾向。因此,依靠细粒度的情感分析可以得到用户对于实体对象更加全面的情感态度。以往的细粒度情感分析方法往往侧重于捕捉方面词和观点词之间的语义联系,而没有很好地考虑到句子的句法结构和单词之间的依存关系。因此,本文中提出了两个有效的基于深度学习的细粒度情感分析模型,它们有效地结合了句子中的结构信息并能够准确地判断出句子中多个方面的情感极性。此外,本文还将训练好的模型应用到了网络舆情智能分析系统中,进一步证实了方法的可靠性和应用性。本文的创新点和主要工作如下:(1)针对基于注意力机制的模型可能会给与情感极性预测不相关的单词赋予更高的权重的问题和句法信息缺失的问题,本文提出了一种基于图注意力网络和结构化注意力机制的细粒度情感分析模型。该模型能够准确捕捉到与方面词情感极性相关的上下文片段,并通过句法依存树来获取单词和句子之间的句法信息,有效地结合了语义关系、句法依存关系和单词间的长距离依存关系。在三个公开的数据集上进行了大量实验,实验结果证明了该模型可以对每个单词赋予正确的注意力权重并能有效克服句法关系缺失的问题。(2)针对模型可能会给具有强烈情感色彩的词赋予更高的注意力权重,导致一些关键但注意力权重较低的词语被忽略掉,从而使得模型中存在过量噪声信息的问题,对上一个模型方法做出了进一步的改进,提出了一种利用图卷积网络和分层的多头注意力机制的情感分析模型。该模型进一步考虑了句子之间的依存关系,可以充分利用句法信息排除与方面词无关的上下文词的影响,并且能够结合语义信息实现上下文和方面词之间的交互。该模型在三个公共英文数据集上进行了实验,实验结果表明该方法缓解了噪声信息对于模型的影响,进一步提升了细粒度情感分析任务的准确率。(3)在本文中提出的情感分析模型的基础之上,设计并实现了一个网络舆情智能分析系统,进一步验证了本文中提出的方案的有效性。首先该系统利用网络爬虫技术对新浪微博、新闻网站和百度贴吧的文本数据进行采集,然后对采集到的数据进行预处理操作,最后对预处理后的数据进行情感极性的判断。实验表明,该系统的各项功能都达到了预期的效果,并且系统的情感极性预测的全面性和准确性也能够满足用户的实际需求。
其他文献
由于人口数量不断增多,在一些公众场所内,容易聚集大量人群。当人群流量密集的场所中出现火灾、坍塌等紧急情况时,需要及时的对场所内的人员进行疏散。先前有学者通过组织一定数量的人员在某一特定场所内进行疏散演习,但此类方法需要耗费大量人力物力且不易复现。随着计算机仿真技术的发展,有学者开始在人群疏散领域中使用计算机仿真技术来模拟人群疏散过程,人群疏散仿真方法相比于传统的组织人员进行疏散演习方法可以节省人力
Leukemia is a type of blood cancer that affects both children and adults,and it is one of the leading causes of death all over the world.Acute lymphoblastic leukemia(ALL)is the most wellknown types of
近年来,在大规模突发事件中,情绪感染往往会导致踩踏、碾压等事故的发生,引起了公共安全领域的高度关注。随着信息通信技术的发展,人们可以通过信息-物理空间紧密相连。由于信息空间和物理空间人群具有异质性且会被复发性情绪二次伤害。因此,真实模拟信息-物理社会(Cyber-Physical Society,CPS)中人群情绪感染过程,对规避恐慌情绪蔓延、避免人群受到二次伤害以及为人群疏散提供指导非常重要。迄
In recent years,the Wi Fi sensor constrains the Human Action Recognition scheme to an immovable location when providing training samples,drastically reducing practical application.Furthermore,a locati
随着计算机技术和社交网络的飞速发展,日常生活中每时每刻都在产生海量数据,如何利用海量数据来实现智能任务已经成为当前的研究热点。在实际应用中,海量数据通常是以不同模态形式存在的,如文本、图像、视频、音频、3D模型等。虽然海量数据的存在形式不同,但是不同模态的数据可能具有高度的相关性甚至是描述同一事物。在当前基于多模态数据的研究中,利用不同模态数据相关性的跨模态智能及相关研究因其应用广泛而备受关注。跨
在“互联网+教育”时代,随着数据分析和信息科学的迅猛发展,在线课程在整个教育周期内得到了全面的推广和普及。学习者再也不受时间和空间的制约,可以随时随地被授予高质量教育,学习者的学习形式和受教育模式得以充分扩展。然而,在线课程中,由于学习者之间学习习惯和背景知识的差异,且师生之间缺乏沟通,导致难以实现教师的因材施教和学习者的个性化发展,进而很大程度上影响了学习者的学习效果。另外,日益庞大的学习者规模
随着教育信息化的发展,学生可获取的教育资源数量逐渐增多,多维教育、在线学习等学习途径日益普及。而如今面对海量的学习资源学生群体难以迅速找到满足自身个性化需求的学习资源,因此在教育领域研究人员也开始应用基于人工智能的个性化推荐技术实现智能教育时代的“因材施教”。教育推荐系统可以充分分析学生的历史数据,获取学生的隐性学习偏好并由此向学生推荐满足其个性化需求的学习资源。就目前现有研究分析,以往的推荐方法
智能化转型升级正在成为酒店业发展的新趋势。然而,很多酒店进行智能化转型升级并没有带来所预想的效果,反而面临着诸多的困境。虽然酒店在硬件设施上进行了智能化改造,但酒店的服务流程并未升级、人员服务模式并未转型、组织结构和人员配备未调整、培训内容未优化等,还是沿用了未转型时的模式。要突破智能化转型升级的困境,酒店需要在组织管理和人力资源管理等方面做出相应的调整,如要基于顾客满意的人机协同合作服务设计理念
The existence of deep learning’s "black box" makes it difficult to understand how the algorithms analyze patterns and make image-level predictions.A representation of the pixels contributing the most
由于环境光线昏暗或者设备自身问题,会导致获取的图像亮度较低,不仅影响人类视觉体验,还会制约以高质量图像为输入的计算机视觉应用性能,如目标检测、人脸识别等。与一般暗光环境下低照度图像增强研究相比,实现在复杂光照环境下低照度图像增强研究,要在考虑平衡不均匀光照问题的同时,还要考虑图像清晰度、噪声干扰等问题,这是具有挑战的。本文将对目前的低照度图像增强方法进行分析,并提出相关的改进方法。本文具体研究内容