基于稀疏自编码和深度神经网络的多维信号预测模型研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:zhang1118168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来和人工智能技术的飞速发展,预测模型的研究已成为人工智能领域的一个重要分支,现已被广泛应用于智慧工业、智慧医疗、智慧金融等多个领域。近年来,基于机器学习算法的智能预测已开始应用于自然灾害监测、工业数据预警、医疗辅助诊断等领域,并取得了良好的效果。传统机器学习模型存在特征提取不充分、泛化能力不足等问题,从而导致模型的预测性能不佳。以深度学习算法为代表的深度神经网络凭借其高效的深层特征提取优势以及出色的泛化能力,在解决复杂预测问题时表现突出。本文从理论研究和实际应用角度出发,以稀疏自编码、长短时记忆等深度神经网络为理论基础,以一维滑坡数据和三维脑肿瘤医学数据作为研究对象,从多个维度提出了三种预测准确率高且泛化性能好的预测模型,并应用于滑坡易发性预测和脑肿瘤患者预后生存时间预测。本文主要的研究内容如下:(1)提出基于稀疏自编码网络和多分类器(Sparse Feature Extraction,SFE+)的预测模型。首先,构建一维数据的稀疏特征提取网络,在该网络输入层随机丢弃部分样本特征,使得网络不过度依赖于某些特征,缓解过拟合,从而提高模型的泛化性能。其次,在隐藏层中引入生命时间稀疏性,一定程度上解决数据非线性耦合问题,在众多随机特征中提取可用于预测的稀疏特征。最后,将提取出的稀疏特征通过支持向量机(Support Vector Machine,SVM)、逻辑回归(Logistic Regression,LR)和随机梯度下降(Stochastic Gradient Descent,SGD)分类器,即:构建SFE-SVM、SFE-LR和SFE-SGD预测模型,实现一维信号预测。构建的模型统称为SFE+模型。将SFE+模型应用于实际采集的石城县地质数据,预测滑坡易发性。实验表明,本文提出的SFE+网络可以有效提升模型的预测性能。滑坡易发性预测精度和预测率曲线面积(Area Under Curve,AUC)分别为:SFESVM(74.52%,0.809)、SFE-LR(72.98%,0.819)、SFE-SGD(72.68%,0.808)。因此,本文提出的基于稀疏自编码网络和多分类器的预测模型能较好地解决数据耦合问题,有效提取出可用于预测的一维数据稀疏特征,提高预测准确率。(2)提出基于一维卷积和长短时记忆网络(One-Dimensional Convolution and Long Short-Term Memory Network,1DCNN-LSTM)的预测模型。首先,构建由2个卷积层,1个LSTM模块和3个全连接层构成的网络,可以充分关联数据间的相关性,提取一维预测特征。其次,使用交叉熵损失函数和Adam优化器进行网络的优化,加快模型的收敛速度。最后,通过Softmax函数完成二分类,实现预测。将1DCNN-LSTM模型应用于石城县的滑坡易发性预测。实验表明,1DCNNLSTM模型的预测精度为74.65%,AUC值为0.875,均明显高于SVM、LR和SGD模型,并略高于上一章提出的SFE-SVM模型。由此可见,本文提出的1DCNN-LSTM预测模型有较强的特征提取能力,收敛较快,预测性能比经典分类器有显著提升。(3)提出基于主成分分析降维的一维卷积和长短时记忆网络(OneDimensional Convolution and Long Short-Time Memory Network Based on Principal Component Analysis Dimension Reduction,PCA-1DCNN-LSTM)的预测模型。相比于前两章所处理的一维特征而言,图像具有更高维的特征,需要更为复杂的网络来获取可用于预测的有效特征。本文提出的针对图像的PCA-1DCNN-LSTM预测模型是在1DCNN-LSTM的基础上结合了主成分分析特征选择模块,其能有效的筛选出特征子集,从而避免了冗余信息对预测模型的影响。此外,在网络中增加L2正则化和dropout,提高了模型的泛化能力。将PCA-1DCNN-LSTM模型应用于多模态脑肿瘤分割竞赛Bra TS2020(Multimodal Brain Tumor Segmentation Challenge 2020,Bra TS2020)数据集。首先,分割出多模态医学影像数据的目标区域。其次,利用pyradiomics软件从分割出的区域中提取出278个特征。最后,将所提取的特征经过PCA-1DCNN-LSTM预测模型,实现脑肿瘤患者预后生存时间的预测。实验表明,本文所提出PCA-1DCNN-LSTM模型的预测准确率为52.78%,高于几种传统机器学习模型(KNN:44.44%、SVM:47.22%、LR:30.56%)。因此,本文提出的PCA-1DCNN-LSTM预测模型能对高维特征降维,充分提取预测信息,提高预测准确率,扩展预测模型的应用范围。综上所述,本文基于深度学习理论,针对不同的信号特征,提出了三种预测模型,并应用于滑坡预测和脑肿瘤患者预后生存时间的预测,获得了较高的客观指标。本文提出的SFE+预测模型可以较好的解决非线性数据耦合问题,有效提升分类器的预测性能;提出的1DCNN-LSTM预测模型有较强的特征提取能力,对一维滑坡预测性能有显著提升;提出的PCA-1DCNN-LSTM预测模型可以以图像作为输入,从高维的特征中提取预测特征实现预测。将本文提出的三种预测模型应用于实际采集的滑坡地质数据和脑肿瘤多模态影像数据集,均获得了高性能的滑坡易发性预测和脑肿瘤预后生存时间预测。因此,本文提出的预测模型具有一定的理论创新性,并且在防灾减灾、智慧医疗等领域有应用价值。
其他文献
行人再识别(Re-ID)技术一直是计算机视觉和模式识别领域的关键任务。一般将该技术视为图像检索的子集,行人再识别是一种特定的识别技术,其旨在给定特有行人在跨摄像头视频或图像中定位该特定行人。该技术通常结合人脸识别、行人追踪等技术,结合应用于视频监控和智能安防领域。在基于伪标签预测的跨域行人再识别方法中,模型的性能较大程度上依赖于伪标签的质量,并且聚类产生的离群点包含了丰富的知识。急需解决的一个问题
随着科技的发展,人工智能的应用越来越广泛。当前,我国各超市蔬菜的购买、称量、结算过程中,时刻需要人工的参与;我国农产品品质优良、产量大,这也给农产品的市场管理带来了严峻的挑战。目前商户在蔬菜的交易过程中仍采用传统的人工分拣方式,这种方式会消耗大量的劳动力,增加劳动强度,影响经营成本。为了改善此状况,研究设计出一套蔬菜图像识别系统,帮助农民、蔬菜商家对蔬菜进行检测,进而完成分类、称量、结算等任务,这
农作物病害是影响农业经济作物产量和质量的主要危害之一。如何在农作物病害出现之初就能够对病害进行及时的检测与识别,提前防治病害,对农业生产丰收有着至关重要的作用。传统的病害识别方法完全依赖个人的工作经验和肉眼观察,具有识别效率低、主观性强、准确率低以及实时性差等不足。随着信息化技术的不断发展与提高,运用技术手段来辅助开展农作物病害检测与识别成为了一个迫切需求。近年来,深度学习技术方法凭借着其出色的泛
随着《中国制造2025》的全面实施,中国工业现代化进程稳步推进,智能制造已成为研究热点。机床工作过程中产生的切削颤振是制约高性能加工的一个关键问题,会导致工件表面光洁度下降,并且加速刀具磨损,降低机床寿命、可靠性和加工操作的安全性,造成加工成本提高。针对此问题,本文将一种基于深度学习的算法应用于切削颤振在线监测领域,并研发了一套基于神经网络处理器的嵌入式切削颤振在线监测系统。首先,研究了切削颤振在
真空离子镀膜设备是一种处理表面工程技术的设备,被广泛运用于各个领域之中。镀制薄膜的厚度精度是评价设备性能好坏的关键指标,而设备中的膜厚监控系统的控制性能直接决定了镀膜薄膜的厚度精度。目前,在镀制非规整膜系时,普遍采用基于晶体式膜厚监测仪的膜厚控制系统,由于使用的算法较为简单,导致镀膜的薄膜精度不高。因此,将智能算法运用于真空离子镀膜设备中的膜厚控制系统,对提高镀制薄膜的精度和质量,具有广泛的运用前
太赫兹传感技术具有可靠、快速、无标记等优势,在生物传感领域中具有巨大的应用前景与价值。然而当被测样品尺寸远小于太赫兹波长时,样品不能与太赫兹充分地相互作用,这导致原位太赫兹光谱对微量分析物的检测极其困难。超材料是由周期性排列的亚波长谐振单元组成的人造材料,其电磁响应可以通过改变谐振单元的形状、尺寸等参数控制。超材料能通过局域电场增强以提高光与物质相互作用的程度,因此超材料具有出色的检测能力。石墨烯
图像配准是建立同一场景的图像之间的对应关系,在计算机视觉、医学图像处理、材料力学以及遥感等领域有广泛应用。单应矩阵估计是图像配准任务中的关键问题。由于实际成像系统存在几何畸变,线性仿射变换模型不准确,匹配对点坐标构成的是矛盾方程,因此传统方法对于单应矩阵估计并不可靠。深度学习提取大样本的内在规律和多尺度高维特征,通过数据驱动的方式拟合出更可靠的估计模型。在图像配准任务中,光照变化、实际数据缺少标签
伴随社会的高速发展,对能源的需求也是与日俱增。化石能源的消耗,导致的空气污染、温室效应和能源匮乏等问题不得不引起人们的重视。另外,中国争取在2060年前实现碳中和的目标,对于清洁能源的使用提出了更高的要求。风作为一种清洁可再生能源,对风速进行精准预测对于提高风力发电效率,指导农业生产和保障大型比赛现场等具有重要意义。本文首先分析了某气象站2017年24个观测点全年的3小时间隔历史气象数据,对气象数
伴随着现代遥感科学技术的不断完善与发展,卫星所获取的影像数据的空间、时间和光谱分辨率也在不断提高,为我国农业、水域等领域提供了数据支撑。然而,目前单一卫星传感器获取的影像数据无法同时兼顾高空间分辨率和高时间分辨率。因此,国内外学者提出了许多遥感图像时空融合方法,来生成同时具有高空间分辨率与高时间分辨率的遥感图像。本文基于深度学习的理论,对遥感图像时空融合问题进行研究,内容如下:(1)本文中将现有的
远程庭审依托网络视频技术,具有突破时空限制的优势,与重大疫情防控期间刑事案件审理与秩序维护需要相契合。从实践来看,远程庭审运行潜藏多重风险,技术性要素欠缺与庭审规范化要求相背离,程序规范阙如使其与权利保障要求存在张力,线上审理形式对庭审实质化有所冲击,从而对社会审判需求呈弱回应性。为弥补社会需求旺盛而远程庭审制度供给不足之间的矛盾,应提升远程庭审对信息化技术的适应力,以权利保障与庭审实质化为着力点