半监督深度学习及其在情感分析中的应用

来源 :山西大学 | 被引量 : 0次 | 上传用户:jiangchao1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统监督学习方法需要利用大量有标记的样本进行学习,但是得到具有较强泛化能力的模型往往需要大量的标记样本。在许多学习任务中,标记样本的获取需要大量的人力物力,相对而言无标记样本的获取却较为容易。半监督学习正是一种综合利用标记样本和无标记样本进行学习的方法。目前,半监督深度学习中的研究热点之一集中在一致性假设的应用。所谓一致性假设,是指在模型训练过程对样本进行数据增强,并保证数据增强前后的模型预测结果一致,以此提高模型的鲁棒性,然而该类方法在计算一致性损失的过程中,只考虑对每个样本添加扰动,却忽略了样本之间的连接,进而可能会丢失数据的结构信息。为应对以上问题,本文提出融合一致性正则与流形正则的半监督深度学习算法,并将其应用到情感分析中的情感分类任务中,具体的工作内容如下:(1)针对基于一致性半监督方法忽略数据结构信息的问题,提出融合一致性正则与流形正则的半监督深度学习算法。该算法在对模型施加一致性约束的同时,对样本进行构图并加入平滑性损失,优化模型在每个样本点邻域内以及样本点之间的平滑性。在图像与文本数据集上进行实验验证,结果表明该算法与之前半监督深度学习算法相比,模型精度得到提高。(2)半监督情感分析系统的设计与实现,该系统主要目的是利用半监督学习算法训练情感分类器,对用户输入的文本数据进行情感倾向性判断。系统将本文所提出的算法,以及半监督学习中多种经典算法,应用于情感分析中的情感分类任务中,并使用基于B/S架构的Django框架进行搭建。该系统主要功能包括文本预处理,特征提取,算法实现以及参考文献展示。同时,该系统对半监督学习在情感分析中的应用做了详尽的介绍。综上所述,本文通过对半监督深度学习中一致性正则方法的研究,提出融合一致性正则与流形正则的半监督深度学习算法,为半监督学习中的相关研究提供了新的研究思路,并且半监督情感分析系统的实现充分展示了该算法在现实任务中的良好应用。
其他文献
新型城镇化是现代化进程中不可或缺的关键一环,其作为国家的一项重要发展战略,在实现全面小康、推动经济高质量发展的道路上发挥着不可替代的核心作用。同时物流业在近年的发展中保持着强劲的增长势头,逐步成为我国经济发展的重要驱动力。新型城镇化政策涉及领域广阔,新型城镇化的蓬勃开展必将为物流业发展打开新的发展空间,因此有必要对新型城镇化背景下物流业的发展成效进行深入研究。关于新型城镇化与物流业的相关研究屡见不
随着山西省经济的快速发展、基础设施的不断完善,物流业迎来了迅猛发展的契机,相关部门和各个企业也越来越关注物流业的发展状况。经过多方的努力,山西省物流业正逐渐改变“散、小、乱、差”的局面,不断向现代物流业转变。但由于种种原因,山西省物流业仍存在诸多问题,如:物流成本一直居高不下,占山西省GDP的比重一直高于全国平均水平;物流企业的竞争力有限、信息化程度不高、资源整合的能力差等。究其原因,山西物流标准
谣言的传播过程往往存在一些随机扰动,这些扰动时刻影响着谣言的传播趋势,因此研究随机扰动下的谣言模型,对控制谣言的传播具有非常重要的意义.基于此,本文主要研究随机扰动下两类谣言模型的渐近行为.第一章,介绍了随机谣言模型的研究动态,并给出本文主要研究的内容.第二章,建立了下列随机谣言模型(?)首先,利用停时证明了该模型全局正解的存在唯一性;然后通过构造Lyapunov函数研究了该模型无谣言平衡点的p阶
交通基础设施是经济社会发展的先行资本。交通基础设施的建设和完善能够促进要素在空间范围内迅速流动,加快人力、物力、资本的自由流动速度,降低运输成本,提高流通速率。物流业的快速发展依赖于物流效率的提高,交通基础设施作为物流要素流通的载体,在一定程度上形成了物流业发展的合力和动力,所以研究我国交通基础设施对物流业发展的影响有着很强的现实意义。基于交通基础设施的外部性和网络状特性,不考虑空间效应会在一定程
机器自动情绪识别因其在人机交互中的潜在应用而受到越来越多的关注。目前,情绪识别可通过多种信息来实现,如面部表情、语音语调、身体姿态以及人体各种生理信号等。相比较而言,皮层脑电作为中枢神经生理信号,调节与情绪相关的递质分泌和大脑的边缘系统,能够客观反映人的情绪状态变化,从脑电信号中提取有效特征并进行情绪识别在人机交互和精神心理疾病监测中具有重要意义。论文针对维度情感模型的构建以及脑电信号情绪识别中特
5G网络发生故障可能影响全网稳定性和服务质量,其故障发现与修复是5G网络运维管理的关键之一。基于历史故障发生前的网元关键绩效指标(Key Performance Indicator,KPI)变化以及设备告警信息、指标统计特征、自动异常检测、指标关联特征、告警编码特征等,提出了5G核心网网元多维特征融合故障预警方法,构建了多维特征空间训练故障预警模型。最后,针对现网运行数据,选取了6类网元并进行了实
图像的深度估计是计算机视觉领域一个重要的研究课题。挖掘二维图像中的深度信息,可以帮助计算机理解场景的三维结构,在智能机器人技术、虚拟现实、增强现实、场景的三维重建、汽车自动驾驶等众多领域都有广泛的应用。相较于基于双目、多目的深度估计方法,基于单目图像的深度估计对设备和环境要求较低且易于实现,因此具有更加广泛的应用价值。然而,只通过单个视角的二维图像估计三维的立体信息,从几何计算的角度来看是非常巨大
人们生活水平的提高以及商品的种类的增加,使得消费者对于商品的要求也越来越高。其中,琳琅满目的商品种类和对商品五花八门的描述,使得对于商品识别的研究也有了越来越重要的现实意义。本文基于深度学习的方法对商品图像识别以及商品图像中的文本识别进行了相关研究,与传统的图像识别以及文本识别算法对比,利用基于卷积神经网络的图像及文本识别算法进行分析,提出本文研究方法。1)为了降低噪声对图像识别准确率的影响,本文
深度学习在图像识别、机器视觉、自然语言处理等领域取得了巨大的成功,解决了很多复杂的难题,使人工智能技术取得了革命性的突破。然而,复杂的深度模型日益出现“膨胀”的趋势,模型越来越大、越来越复杂,对计算力要求也越来越高。如何有效地减少复杂模型的参数量和推理时间成为目前人工智能亟待解决的关键问题。特别是深度模型在在线学习、增量学习等实时应用与移动手机、可穿戴设备等这些边缘人工智能设备上的实施与部署,如何
计算机断层成像(Computed Tomography,CT)的出现,极大地促进了医学影像技术的发展,对于各种疾病的诊断治疗,也具有十分重要的意义。因X射线的辐射对人体有潜在的致病风险,因此低剂量CT成为了当前研究的重点。稀疏重建,即用从稀疏角度下采集的投影重建图像,是实现低剂量CT的有效方法,然而,经典的解析法稀疏重建的图像中一般含有严重的条状伪影,导致无法进行正确的疾病判读。2006年以来,深