【摘 要】
:
随着移动技术的发展以及网民数量的增长,互联网中的信息与日俱增,文本数据是这些信息最主要的表现形式之一。从海量文本数据中提取和使用有价值的主观信息是如今自然语言处理领域中非常受欢迎的研究课题。其中,对文本中隐含的主观情感倾向性进行分析研究,可以为用户推荐、舆情分析等领域提供有益的指导。现有的文本情感分析方法尽管取得了一定的成绩,但仍存在一些缺陷:依靠情感词典判断情感极性,其准确性过于依赖词典质量的好
论文部分内容阅读
随着移动技术的发展以及网民数量的增长,互联网中的信息与日俱增,文本数据是这些信息最主要的表现形式之一。从海量文本数据中提取和使用有价值的主观信息是如今自然语言处理领域中非常受欢迎的研究课题。其中,对文本中隐含的主观情感倾向性进行分析研究,可以为用户推荐、舆情分析等领域提供有益的指导。现有的文本情感分析方法尽管取得了一定的成绩,但仍存在一些缺陷:依靠情感词典判断情感极性,其准确性过于依赖词典质量的好坏,且不易于维护;使用机器学习算法提取情感特征时,特征工程的构造又极其复杂且大多忽略了文本的序列特征;常用的神经网络模型存在难以解决长期依赖和对上下文信息使用不足的缺陷。因此,本文在对这些方法总结和分析的基础上,对基于深度学习的文本情感分析模型构建及应用进行了深入的探索研究。主要工作和创新点如下:(1)构建T-BiLSTM情感分析模型:该模型的提出主要是针对现有的神经网络模型存在的缺陷。将时序卷积网络(TCN)处理时间序列问题的优势应用到文本处理上学习文本的序列特征,并利用双向长短期记忆网络(Bi-LSTM)学习文本上下文信息的优势提取文本双向语义依赖。通过残差网络的设计思路将两个网络层中提取的特征进行融合用于分类。经过实验,验证了该模型的有效性。(2)构建TCN-BA情感分析模型:考虑到自注意力机制在处理文本数据时可以对句子内部结构进行捕捉,将其引入到T-BiLSTM模型中。通过赋予不同权重给影响情感极性判别的向量,突出优势特征,从而提高模型识别情感极性的准确率。在相同实验环境下的两个数据集实验中,引入自注意力机制的TCN-BA模型与T-BiLSTM模型相比,准确率分别提升了1.54%和1.83%。(3)疫情期间微博文本情感分析:本文针对疫情期间的微博文本进行分析。根据与新冠疫情相关的关键词从微博平台上进行爬取数据,并对爬取到的数据进行预处理、标注和分析,构造了疫情期间微博文本数据集。将本文所提出的两种模型应用到该数据集上,实验数据证明两种模型的准确率和损失值表现均优于其他几组基准模型。
其他文献
在国家推出的“科技强国”战略背景下,人工智能和计算机视觉作为现代科技最前沿的计算机技术得以迅速发展。目标检测是计算机视觉领域中重要的研究方向之一,被广泛应用于社会的各个领域,例如:军事、医疗、交通及安全等。伴随着人工智能方法的不断改进与创新,基于深度学习的目标检测研究受到了学者们的青睐。基于深度学习的目标检测方法有泛化性能好、适应性强、鲁棒性好等优点,但是目前对目标检测方法的研究都只在检测速度或精
虚拟现实是近些年来兴起的一项全新的实用技术,实现的方式是通过计算机对虚拟环境进行模拟,使人沉浸于环境中并可以与环境中的物体进行交互。虚拟现实技术的出现正在慢慢的改变人们的日常生活,已发展成为当今最重要的方向之一。目前,有关于虚拟现实的研究方法和所涉及的相关理论已变得成熟,已经在多个领域得到了应用。虚拟装配是虚拟现实与传统装配结合的产物,在制造业中,装配具有非常重要的地位。最近几年虚拟现实发展速度极
作为一种原理简单、操作方便、制造成本低廉的3D打印技术,熔融沉积成型(Fused deposition modeling,FDM)在工业和生活中已随处可见,但成型件尺寸精度低、表面粗糙等不足限制了该技术的进一步发展和应用。此外,随着产品个性化定制需求的不断提高,利用工业级3D打印设备加工微小型工件的成本高,且适应性差。为了解决上述问题,本文设计和搭建了基于FDM与铣削的桌面级增减材复合加工机床,并
大数据技术的广泛普及加速了人类进入数据时代的步伐。基于位置信息的各种大数据业务虽然为用户提供了衣食住行等方面的个性化服务,但同时也导致了个人隐私泄露的风险。位置大数据的统计信息发布是根据划分区域内的统计量来进行数据发布的,如何在保证用户位置隐私的前提下,提高位置大数据的统计信息发布的服务质量是亟待解决的问题。将差分隐私模型与位置大数据的统计信息发布相结合,可以实现在任意背景知识情况下,对发布的位置
窄带物联网(Narrow Band Internet of Things,NB-IoT)作为实现万物互联的一个重要通信技术,旨在为低吞吐量、低功耗和远程通信的大规模物联网设备提供无缝连接。NB-IoT构建于蜂窝网络,只消耗大约180k Hz的带宽,可直接部署于GSM网络或LTE网络,实现网络的平滑升级,以降低部署成本。在传统的异构蜂窝网络中,由于宏基站和小基站之间存在功率方面的差异,大多数用户经常
物联网(IoT)在过去十年中获得了极大的普及,随着连接设备的增加,物联网越来越多样化。以物联网为中心概念的产业现在已经无处不在。物联网的最终目标是引入即插即用技术,为终端用户提供易用性、远程访问控制和可配置性等功能。从互联网出生之时,TCP/IP协议逐渐成为互联网最重要的基础设施,然而IPv4协议存在地址不足、移动性及安全性等问题,IPv6是解决IPv4问题的改良式方案,IETF提出了基于IPv6
科技的革新与提高、移动智能终端的快速升级以及定位技术的不断完善,使得LBS得到了迅猛发展,用户终端在享受便利的同时也面临着隐私泄露的风险。为满足车辆的高速移动、系统的储存负担等性能要求,提出一种符合兼容车联网环境的基于LBS的车联网隐私保护算法性能评价指标和可调节的评估策略。为解决现有车联网环境下位置隐私保护算法缺少一种具有普遍适用性性能评估方法的问题,满足隐私保护度和位置服务质量之间的自适应平衡
世界四大粮食中,马铃薯被专家称为可以拯救人类的粮食。其分布区域十分广泛,但目前在马铃薯的智能分选方面仍处于研究阶段,大部分地区依旧利用人工分选手段。在生产过程中,马铃薯品质会严重影响马铃薯深加工产业的实际效益,而对马铃薯进行品质分级,是进行工业化生产的重要前提之一。现有的机械分级方式大都容易对马铃薯的表面造成二次伤害,针对现有情况,开发出一种无损于马铃薯品质的快速分级方法,对目前来说尤为重要。本文
随着云存储与互联网技术的飞速发展,多媒体数据传输及保存不再成为限制语音交流广泛使用的瓶颈。然而,云端作为不可信的第三方平台,极易受到隐私泄露的威胁。如何保证用户在数据安全得到保证的前提下,如何从海量的语音数据中高效地实现密文语音检索,受到众多学者的广泛关注。论文主要利用混沌系统理论、能量规整谱系数(PNCC)、语音感知哈希、Mobile Nets V3模型等技术,对密文语音检索系统所涉及的语音加密
随着现代机械加工技术的不断进步,机械行业不再满足于单纯的“能加工”,而是要求高精度、高效率的加工过程,加工方式也逐步向着自动化、智能化方向迈进。铣削加工是重要的机械加工手段,加工过程中,铣削工艺系统的动刚度与切削颤振密切相关,对加工精度和工件表面质量有着重要影响。目前国内外学者通过有限元仿真和解析计算在一定程度上均得以实现动刚度的获取,然而在有限元建模时,所建模型难免与实际工况有所出入,而解析计算