深度信念网络优化设计及应用研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：GYQ865739853

【摘要】

：

【作者】

：

王龙洋

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2023年01期

【基金项目】

：

国家自然科学基金重点项目“城市污水处理过程优化控制理论及关键技术研究”（61034008）；国家自然科学基金“基于类脑计算的污水处理过程BOD软测量模型研究”（61603009）；科技部重大专项“水体污染控制与治理科技重大专项项目”（2018ZX07111005）；国家自然科学基金“深度应用

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

深度学习（Deep Learning,DL）基于多层网络结构来提取数据中的层次化特征,可使计算机通过简单概念构建复杂概念。与传统的机器学习不同,DL可在数据中抽取有效的特征表示,获得较高的处理性能,因此,它在多个领域获得了广泛的应用。深度信念网络（Deep belief network,DBN）受人脑认知推理过程启发产生,是迄今为止DL应用最为成功的深度模型之一,它由若干个受限玻尔兹曼机（Restricted boltzmann machine,RBM）顺序堆叠而成,其学习过程主要分为无监督预训练和有监督微调两个阶段,这种分阶段训练策略使其在学习深层结构上取得了巨大的成功,并逐渐成为学术界和产业界的研究热点。然而,DBN在学习算法和应用方面仍存在许多难以解决的问题,主要包括:1)在数据输入阶段,由于难以处理序列数据之间的自相关性,导致DBN预测值滞后于真实值,模型精度显著降低;2)在数据输入阶段,由于研究对象输入数据特征变量较多,变量间关系复杂且相互影响,造成输入层神经元过多,从而导致网络结构复杂性增加以及模型精度不高;3)在无监督逐层预训练过程中,特征的逐层压缩造成高隐含层信息损失,从而导致模型精度下降;4)在无监督训练过程中,超参数中的动量和学习率难以确定,初始权值随机初始化使网络收敛速度慢,且隐含层神经元之间耦合作用导致网络训练出现过拟合现象;5)在无监督训练阶段处理连续数据时,无法很好地逼近连续函数以及网络结构难以确定,导致模型精度不高的问题;6)DBN在现实空气质量预测应用中,大气环境中PM2.5存在着复杂非线性、随机性、非平稳性等特点,难以实现精准预测。由于DBN数据输入阶段以及无监督学习阶段的研究是DBN的重点,也是影响DBN学习性能的关键,因此,对其展开优化设计及应用研究具有重要的现实意义。论文的工作以及创新点如下:1)基于改进集合经验模态分解的深度信念网络模型设计（MEEMD-DBN-S A）针对DBN无法很好的处理序列数据之间的自相关性,导致预测值滞后于真实值以及预测精度不高的问题,设计了一种基于改进的集合经验模态分解（Modified ensemble empirical mode decomposition,MEEMD）的DBN模型。首先,设计一种MEEMD算法对输入样本数据信号进行分解,获取多个本征模态函数（Intrinsic mode functions,IMFs）组合,有效消除数据之间的自相关性;其次,建立一种基于模拟退火算法（Simulated annealing,SA）算法的DBN模型,通过优化模型结构建立IMF分量模型来进行有效预测;然后,将获得的DBN预测值进行重构相加,得到模型最终的预测结果;最后,将所设计的模型在大气CO2浓度预测以及污水处理过程总磷预测上进行了实验验证,实验结果表明,该模型能够缓解预测值滞后于真实值现象,提高预测精度。2)基于信息相关策略与最小顶点覆盖的深度信念网络模型设计（ICS-MVC-DBN）针对DBN研究对象输入数据特征变量较多,变量间复杂的关系相互影响,造成的网络结构复杂以及预测精度不高的问题,设计了一种基于信息相关策略（Information correlation strategy,ICS）与最小顶点覆盖算法（Minimum vertex coverage,MVC）的DBN模型。首先,采用最大信息系数（Maximal information coefficient,MIC）对输入数据的特征变量与网络输出变量进行相关性评估,删除相关性小的特征变量,实现重要性小的特征变量剔除;其次,基于MIC对剩余特征变量进行相关性评估,选出冗余变量,并保存其它变量为待选变量;然后,基于MVC算法对冗余变量进行选择,选择出最具有代表性的变量放入待选变量集合,从而完成冗余特征变量的剔除,接着将所有待选变量输入到DBN,完成模型的构建;最后,将所设计的模型在污水处理过程出水总磷预测以及混凝土抗压强度预测上进行了实验验证,实验结果表明,该模型能够降低网络结构复杂性,提高预测精度。3)基于逐层数据扩充的深度信念网络模型设计（LWDA-DBN）针对DBN在逐层预训练过程中,特征的逐层压缩造成高隐含层信息损失,从而导致预测精度下降的问题,设计了一种基于逐层数据扩充（Layer-wise data augmentation,LWDA）的DBN模型。首先,设计线性插值数据扩充方法对可见层输入样本数据进行数据扩充,生成虚拟数据,并把原始输入数据和虚拟数据一同作为可见层的输入,从而实现可见层输入的样本数量扩充;其次,采用线性插值数据扩充方法对可见层输出数据再次进行扩充,生成虚拟数据,并同时利用输出数据和虚拟数据对第一个隐含层进行预训练,从而在第一个隐含层获得相应的特征数据;然后,将获得的特征数据视作第二个隐含层的输入特征数据,继续进行数据扩充,生成更多丰富和多样性的特征样本,实现隐含层信息损失的补偿,并对第二个隐含层进行预训练,直到完成所有隐含层的预训练;最后,将设计的模型在大气CO2浓度预测,以及风速预测上进行了实验验证,实验结果表明,该模型能够通过降低信息损失来提高预测精度。4)基于变超参数与dropout算法的深度信念网络模型设计（VSP-DR-DBN）针对DBN无监督预训练存在着超参数中的动量和学习率难以确定、随机权值初始化引起网络收敛速度慢、隐含层神经元之间耦合作用而导致训练过拟合问题。设计了一种基于变超参数与dropout算法的DBN模型。首先,设计了基于变动量和变学习率的超参数调整策略来自动调整DBN无监督预训练阶段中的动量和学习率;其次,采用改进的权重初始化方法来对DBN的权值参数进行初始化,加快网络收敛速度;然后,基于dropout算法来降低隐含层神经元的耦合作用,并利用对比散度算法进行训练;最后,将所设计的模型在洛伦兹混沌序列,CATS人工时间序列数据集,风速预测数据集上进行了实验验证,实验结果表明,该模型能够自动调整超参数中的动量和学习率,提高了收敛速度和预测精度。5)基于自适应变异粒子群优化算法的深度信念网络模型设计（EDBN-AMP SO）针对DBN无法很好的处理连续数据以及结构难以确定的问题,设计了一种基于自适应变异粒子群优化（Adaptive mutation particle swarm optimization algorithm,AMPSO）算法的改进DBN模型。首先,采用高斯噪声变换对DBN进行改进,增强其处理连续数据的能力;其次,采用对比散度算法对网络进行训练;然后,设计了一种AMPSO算法对网络结构进行寻优,获得最佳网络结构;最后,将所设计的模型在洛伦兹混沌序列预测,污水处理过程出水氨氮预测,和非线性动态系统辨识数据集上进行了实验验证,实验结果表明,该模型能够有效处理连续数据和自动确定最佳网络结构,提高了预测精度。6)深度信念网络在空气质量预测上的应用PM2.5作为评估空气质量的重要指标,准确预测PM2.5浓度不仅有利于相关部门为居民的出行及活动提供空气污染等级预警,保障人们的生命健康,而且对大气环境的治理及保护具有非常重要的现实意义。文中针对大气环境中PM2.5存在着复杂非线性、非平稳性等特点,难以实现精准预测的问题,将前文设计的模型进行综合对比分析,选取出适用性好的ICS-MVC-DBN模型、VSP-DR-DBN模型应用到PM2.5预测中。为了客观真实的验证所设计模型的有效性,以杭州市PM2.5浓度数据为研究对象进行预测,实验结果表明,所设计的模型能够实现PM2.5的精准预测。

其他文献

两类流固耦合模型局部强解的存在性研究

流固耦合,即可移动或可变形固体结构与内部或周围流体的相互作用,是最普遍和最具挑战性的耦合或多物理问题之一.从学科上来说,流固耦合问题涉及到流体力学、材料力学、弹性力学、动力学等多学科知识;在技术领域上,流固耦合问题与生物、石化、航天、海洋、船舶、地质、道路桥梁、机械等多领域均有联系.因此,流固耦合问题的多交叉性使得其在诸多领域均有非常重要的应用.本文主要研究了两类流固耦合系统局部强解的存在性问题.

学位

π的随机近似以及一类偏微分方程解的渐近分析

本论文由两部分构成.第一部分主要研究基于单位圆上随机多边形的圆周率π的随机逼近问题,内容涉及第二章至第四章.第二部分主要研究一类不可压偏微分方程解的适定性和大时间行为,包含第五章和第六章.这两部分内容虽然具有一定的独立性,值得一提的是,它们所涉及到的基础知识与研究方法均为应用数学研究中常用的分析学工具,特别地,第一部分通过对期望与方差这两个重要数字特征进行积分估计以建立相关的收敛结果时,必不可少的

学位

面向高速履带车辆液电复合一体式缓速器的研究

重载履带车辆向着高速、高机动方向发展,制动能量巨大,大幅降低了摩擦类制动系统的使用寿命,急需为其匹配高效能、快速响应的缓速制动系统,以分担主制动器的制动载荷。而目前民用电涡流缓速器（简称:电缓）和液力缓速器（简称:液缓）制动功率密度较小,难以满足制动需求;军用高效能液缓又对辅助系统要求高,需额外匹配大流量油路和储能器等设备,增加了系统复杂程度,降低了整体可靠性。基于电缓与液缓制动互补的特点,论文创

学位

在役风力发电机主轴横向裂纹超声检测方法及衍射波量化技术研究

水平轴风力发电机是当前主流的风电机组。主轴在长期服役过程中,不仅遭受严峻自然环境带来的侵蚀,更是长期承受扭矩、弯矩及轴向推力等复杂应力作用。主轴与轴承配合部位出现的裂纹严重损害主轴机械性能,威胁风机服役安全。超声检测作为一种无损检测技术,为风机主轴的运行安全提供了保障。本文主要围绕在役风机主轴表面开口横向裂纹的超声检测问题,开展端面检测方法和裂纹量化表征技术研究。风力发电机主轴属于大型轴类,具有复

学位

竹叶碳苷黄酮对皮肤衰老的干预作用及机制研究

竹叶碳苷黄酮（BLF）是指从以毛金竹为代表的刚竹属（Phyllostachys Sieb.et Zucc.）品种的竹叶中分离纯化所得到的具有中国本土资源特色和自主知识产权的植物总黄酮制剂。现有研究和应用已知,BLF具有良好的美白、抗氧化、防辐射等护肤功效,但目前缺乏对其延缓皮肤衰老作用的系统评价和机制阐述。本研究拟通过体外皮肤细胞衰老模型和小鼠背部皮肤光老化模型,阐明BLF干预皮肤衰老的作用和机制

学位

金属氧化物半导体层级复合结构及其传感增强机制研究

近年来,现代工业和技术极大地提高了人类社会的生活水平。然而,现代技术也给我们的日常生活带来了副作用,已经严重的影响了我们的日常生活和健康。此外,通过检测呼出气体的种类和含量进行疾病诊断已经引起了广泛的关注,因为它在无创、实时和潜在的廉价诊断方面具有关键的优势。因此,当前各种各样的传感器被设计和开发出来用于监测环境空气质量和人体健康,预防一些危险情况的发生。在诸多的传感器中,金属氧化物半导体（Met

学位

婴儿配方乳粉脂质母乳化研究

婴儿配方乳粉是以母乳为“黄金标准”来研发的,是非母乳喂养婴儿的主食,营养成分母乳化是婴儿配方乳粉生产的关键技术,其中对蛋白质研究相对成熟,而脂质因成分复杂,一直是行业公认的研究热点和难点。本研究针对目前我国母乳脂质数据库缺失、婴儿配方乳粉脂质母乳化程度低和脂质易氧化及产品速溶性不理想等行业共性问题,通过对浙江省不同泌乳期母乳中脂质组成和脂肪酸组成及位置分布进行分析,初步建立了成熟母乳脂质数据库,依

学位

Hilbert空间R-对偶理论与半直线上伸缩不变系的一些问题

受Gabor分析中Ron-Shen对偶原则及Wexler-Raz双正交关系的启发,2004年,Casazza,Kutyniok与Lemmers首次在一般Hilbert空间中引入了R-对偶的概念.到目前为止,R-对偶的研究已远远超出Gabor分析的范围,在数学上有其独立的意义,已成为抽象空间标架理论的一个重要研究方向.另一方面,过去三十余年,直线上的小波与Gabor标架的研究已取得丰硕的成果,而半直

学位

甘露糖赤藓糖醇脂对食源性致病菌浮游态和生物膜态的抑制机理及其应用研究

食品安全一直是社会各界关注的热点问题,而细菌性感染则成为导致食物中毒事件发生的关键因素之一,因此挖掘安全高效的食品抗菌剂具有重要意义和应用价值。甘露糖赤藓糖醇脂（Mannosylerythritol lipid-A,MEL-A）是一种天然的新型糖脂类表面活性剂,具有多种理化特性和生物活性,但其对食源性致病细菌如革兰氏阳性菌的抗菌活性鲜有报道,极大限制其在食品微生物安全领域的应用发展。本学位论文以常

学位

miR-216a-TSPAN1-ITGA2调控通路在胰腺癌中的建立

胰腺癌（pancreatic cancer,PC）是一种恶性程度极高的消化道肿瘤,在恶性肿瘤引起的死亡率中排名为第七,其发病率呈现逐年上升趋势。直至目前,患者的5年生存率仍然达不到30%,所以展开胰腺癌的形成和进展机制研究极为重要。TSPAN1（Tetraspanins 1）属于四跨膜区域超蛋白家族（transmembrane4-superfamily,TM4SF）的一员,研究发现TSPAN1在胰

学位

深度信念网络优化设计及应用研究

与本文相关的学术论文