【摘 要】
:
随着信息技术的不断发展,网络渐渐成为人们倾诉情感的重要场所,针对情感倾向的研究被人们广泛关注。在过去的情感分析研究中,较为传统的机器学习方法有KNN、朴素贝叶斯及SVM等算法,虽然这些传统算法的性能优良,但往往需要借助人力进行大量的特征标注,并且不具备较好的拓展性。而深度学习在最近几年被广泛地应用在各种自然语言处理的任务里。如CNN利用不同的卷积核提取局部特征进行情感分析,LSTM以及它的众多变体
论文部分内容阅读
随着信息技术的不断发展,网络渐渐成为人们倾诉情感的重要场所,针对情感倾向的研究被人们广泛关注。在过去的情感分析研究中,较为传统的机器学习方法有KNN、朴素贝叶斯及SVM等算法,虽然这些传统算法的性能优良,但往往需要借助人力进行大量的特征标注,并且不具备较好的拓展性。而深度学习在最近几年被广泛地应用在各种自然语言处理的任务里。如CNN利用不同的卷积核提取局部特征进行情感分析,LSTM以及它的众多变体解决了句子中单词之间的时间关系以及单词之间的交互性,可以更好地对文本进行情感分析。这些方法尽管具有较高的准确率,但对于句子的层次结构建模结果并不理想。语言虽然看起来是一个序列,但内部具有复杂的层次结构,这意味着即使语言序列看起来相同,但因其内部层次结构的不同而有语义的差别。因此有必要将语言的层次结构融入到模型的训练过程中,从而让模型具有更加强大的表征能力。本文以情感分析和文本相似为主要研究出发点,构建有序神经元LSTM模型和有序神经元LSTM自注意模型来进行文本分析。本文的主要工作:(1)传统的RNN模型总是将句子建模成序列,而现实中一句话中词与词之间的关联其实是一颗语法树的形式,RNN模型便没有建模这种层次结构的能力。换言之,LSTM以及普通的神经网络都没有用到神经元的序信息。使用改进的LSTM网络通过神经元经过特定排序,将层级结构(树结构)整合到LSTM中去,从而允许LSTM能自动学习到层级结构信息,从而能够表达更丰富的信息。增强对语言层次结构进行建模,提高了文本语义分析能力。(2)采用注意力机制更好地构造文本的时序信息结构,更好地对距离较远的相关文本情感信息进行学习,避免产生长依赖问题,即对于之前时间上的一些结点会产生感知力弱化的现象,降低对文本情感分析造成性能上的损失。(3)在独立组件(IC)层中结合了批归一化机制和Dropout机制技术,以能够提升模型的收敛速度和泛化性能。本文的创新点包括:(1)针对自然语言文本情感分析中忽略文本层次结构信息的问题,提出一种基于有序神经元LSTM的短文本相似性检测方法。解决忽略文本层次结构信息的问题,使模型能够获得更高抽象水平的层次表示,模拟语言构成效果,提高了文本语义分析能力。(2)提出了一种基于有序神经元LSTM自注意的情感分析方法。采用Attention解决短距离依赖的“局部编码”问题,从而对输入序列建立长距离依赖关系,避免产生长依赖问题,提高并行效率,从而优化模型,提高准确率。(3)结合Dropout和批归一化技术,降低任意一对神经元之间的交互信息和相关系数,提高收敛速度。
其他文献
随着后摩尔时代的来临,半导体产品发展呈现出了微小化、轻薄化、高密度化的变革特点,对半导体封装装备提出了更高的性能指标要求。X-Y运动平台是半导体封装装备中一种典型的核心运动部件,为了能有效适应半导体产品的变革趋势,需要实现X-Y平台在高速高加速条件下的高精度定位性能。然而,高速高加速的运动特性难免会激起定位阶段的残余振动,使其短时间内无法达到要求的定位精度,严重影响了运动平台的快速精密定位性能。另
温度是物理、化学、生物、医学和工业技术等许多领域的重要热力学参数。人们根据体积、压力、电压和电阻等参数的变化,发展了各种温度测量技术。然而,随着社会的进步,在腐蚀性强、可燃气体浓度高、磁场强等特殊环境中,对非接触式远程测温技术的要求越来越高。例如集成光电器件,需要一种响应速度快、抗强电磁场环境的温度计。在这种情况下,大多数普通的温度检测技术都不适用,因此新的非接触式温度测量技术越来越受到关注。基于
后聚合改性作为聚合物制备的一种手段已广泛应用于功能聚合物的合成领域,通过对非活化酯(聚甲基丙烯酸甲酯、聚甲基丙烯酸三氟乙酯等)的后聚合改性可以直接制备各种功能化的聚(甲基)丙烯酸酯聚合物。相对于利用不同有机小分子单体聚合制备功能化聚(甲基)丙烯酸酯的方法,后聚合改性利用酯转移或者氨解反应,将原料更便宜的小分子醇或胺与(非)活化酯反应可以直接制备,能够避免双键单体均聚或共聚反应带来的限制,而且实验操
从视频中提取的有效信息是人类做出决策的重要依据,如何使用工具自动提取视频有效信息一直人类所追求的。目标追踪技术一直都是机器视觉研究领域的重要研究方向之一,在自动驾驶、飞行控制、视频监控以及无人机侦察等多个现实场景中都有着大量的应用。视频目标跟踪的主要任务是在给定视频序列的第一帧中手动标记待跟踪的目标,然后在未知后续帧中目标位置的情况下准确快速地估计目标的位置。然而,在实际应用场景中,存在着很多干扰
目标检测是人工智能领域热门研究课题之一,在各个行业领域内应用广泛。在传统中学生物理教学电路系统实验过程中,需要对学生所连接的电路系统进行评测打分。在教学过程中,师资力量是有限的,由于学生众多,不可能及时对每个学生的实验结果进行实时打分,如果依次打分会造成极大的时间浪费。所以,为了使得对学生实验结果进行实时打分,减少教学时长与提高教学效率,开发一个实时在线学生物理实验打分平台非常有必要。在嵌入式平台
皮肤病是人类日常生活中最常见的疾病之一,对生活质量有重大不利影响。早期的计算机辅助诊断系统大多以皮肤镜作为拍摄设备。由皮肤镜拍摄的图像虽然有一系列优点,如清晰,光照一致,没有嘈杂的背景,但也具有价格昂贵,需要拍摄技术等缺点。而开发诊断系统,自动识别由智能手机拍摄的临床皮肤病图像,将有利于大多数人使用该系统和人们做一个初步的自我诊断。自动分类智能手机拍摄的临床皮肤病图像是一项具有挑战性的任务。智能手
如今,每个人的生活都离不开手机,随着移动互联网5G技术的发展,视频逐渐成为大家记录生活和社交交流的主要方式。但是,由于Android系统的开源特性以及网络传输开放和共享的特性,使得Android手机上视频存储和传输的安全性问题被广泛关注。视频图像与简单的文本消息不同,其具有数据量大、相邻像素间相关性强、时间和空间上冗余度高等特点。因此主流的一些文本加密标准如数据加密标准(DES)、高级加密标准(A
得益于现代计算机计算力的不断提升,与数据相关的计算机应用技术获得了飞跃发展,在大数据时代中数据库中存储了海量的数据,人们的关注焦点从获取并存储大量数据转移到了如何对数据进行挖掘技术以获取其中有用的信息。科学实验数据、医疗数据、人口统计数据、金融数据等领域产生了不少与数据挖掘相关的应用技术,如今发展数据挖掘相关的算法成为了学术界与工业界的重点研究对象。数据挖掘的各类算法可以根据不同的目的分为多种类型
随着5G的逐渐普及,互联网加速发展,网络信息呈指数性爆炸增长。面对海量的数据,用户如何从中找寻到自己所需要的信息,以及信息提供商如何让自己提供的信息被目标用户关注并收取都成为迫切需要解决的问题。为有效应对该问题,人们发明了推荐系统并取得了良好的效果。推荐系统的核心部分是推荐算法,本文通过查阅大量资料文献对推荐算法进行研究与分析,针对算法中存在的用户兴趣迁移、数据稀疏等问题,提出了一种新的基于时间遗
信息物理融合系统是一个将计算资源、物理环境和网络控制集成在一起的多层次的,高度复杂的、集成式的综合性系统。它通过网络通信,计算和控制等技术之间互相密切的结合,为各种工程系统提供信息网络服务和实时监控。CPS系统作为一个实时系统,具有高度的安全性、可靠高效等特点。信息物理融合系统必须通过传感器感知对物理环境的变化进行不间断的实时的感知,然后通过网络把这些感知的信息传递出去。CPS具有广泛的的应用前景