深度学习在回归预测中的研究及应用

来源 :山东农业大学 | 被引量 : 0次 | 上传用户:SQUIRRELXX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工神经网络是通过对人脑神经元的信息处理机制进行模拟而构建的一种机器学习模型,具有自学习、自适应、高容错性等优势。但是随着人工神经网络隐藏层的层数增加,梯度弥散现象严重,导致多隐藏层的人工神经网络的优化成为难题。2006年,Hinton等人提出的贪婪逐层无监督预训练策略,使得深度神经网络的训练成为可能,从而开启了深度学习的时代。深度学习利用多隐藏层的结构,对低层特征进行高度抽象,从而实现特征的自动提取。本文针对适用于回归预测的深度学习算法展开研究并将其应用于小麦蚜虫的短期预测中。主要研究内容如下:(1)逐层无监督预训练策略在深度学习的预训练过程中发挥着重要的作用,但样本标签所提供的监督信息是无法替代的。面对数据量较少的回归预测问题,无监督学习的优势并不明显。将堆叠降噪自动编码器的特征提取模块改为有监督学习,提出基于有监督预训练的堆叠降噪自动编码器,充分利用样本标签提供的监督信息,弥补数据量不足的劣势。通过在UCI回归数据集进行实验,实验结果表明改进的堆叠降噪自动编码器回归预测误差更小,泛化能力更强。(2)超参数的设置对深度学习模型的预测性能有很大的影响,而目前对于超参数的设置缺乏明确的理论指导。本文在网格搜索算法的基础上,从提高时间效率和预测准确性两个方面对网格搜索进行改进,提出了分块网格搜索和分块变网格搜索。为了验证改进的超参数优化算法的有效性,在UCI回归数据集上进行实验。Concrete数据集上的实验结果表明:使用分块网格搜索和分块变网格搜索对超参数进行优化的时间性能远远优于网格搜索,并且SDAE3模型的预测能力优于SDAE2模型。对Slice数据集进行实验,SDAE0模型的均方误差为66.19,而使用分块网格搜索对超参数进行优化得到SDAE2模型的均方误差降低到2.98。Housing数据集的实验结果表明,使用分块网格搜索和分块变网格搜索对超参数进行优化的得到DBN2和DBN3模型的预测结果均优于支持向量回归以及局部支持向量回归(LSVR)模型。(3)小麦蚜虫是危害小麦产量和品质的主要虫害之一,通过对小麦蚜虫的发生情况进行及时准确的预测,可以提早预防,降低损失。本文将深度信念网络与局部支持向量回归进行结合,提出了DBN_LSVR模型,并将其用于小麦蚜虫发生情况的短期预测。其中深度信念网络主要用于小麦蚜虫的特征学习阶段,局部支持向量回归主要用于回归模型的构建。通过在小麦蚜虫数据集上进行实验,实验结果表明,DBN_LSVR模型对百株蚜量的预测误差为649.2,对发生程度的预测准确率达到83.33%。通过与LSVR、DBN等模型进行对比,实验结果表明,DBN_LSVR模型对小麦蚜虫发生情况的预测优于其它对比模型,为小麦蚜虫以及其它虫害的预测预报提供了一种可行的方案。
其他文献
社会经济的快速发展带来了全世界范围内的汽车保有量的迅速增加,同时伴随而来的还有不断增加的道路交通事故。让各国苦恼的就是在这些交通事故中,恶性交通事故发生率总是居高
作为一种新兴的商业计算模型,云计算实现了计算能力、存储空间和信息服务等像水、电、煤气一样可以由用户按需取用,灵活计费。云计算通过运用虚拟化技术,实现了对大量物理资源的
随着自然语言处理的研究在近年来的不断深入,机器翻译的发展也得到了长足的进步。但对于小语种的翻译仍很少见,本文以研究统计机器翻译理论为出发点,针对维语-汉语之间的统计机
网络技术的发展给互联网上大量传递的数字作品的安全性带来了极大威胁。加密技术的产生与发展在一段时期内对数字作品起到了很好的保护作用,但是由于经过加密的文件其内容明显
近年来,互联网尤其是移动互联网规模和技术发展迅猛,智能移动设备如智能手机、平板电脑等大量普及,智能手机用户数量剧增。移动应用作为智能手机的重要组成部分,改变了用户的生活
无线电频谱资源是一个国家重要的战略资源,随着对无线电频谱资源的需要增大,能够被普通用户使用的频谱资源越来越短缺。动态频谱接入(DSA)作为认知无线电的一种重要应用,它能
装箱问题是一个经典的组合优化问题。简单地说,装箱问题就是将若干不同尺寸的物体互不重叠地放入有一定容量的箱子中以达到某种最佳目标。装箱问题被广泛应用于计算机科学领
传统的无线传感器网络(Wireless Sensor Network, WSN)只是传输一些简单的数据,而无线多媒体传感器网络(Wireless Multimedia Sensor Networks, WMSNs)的传感器节点能够感知音
电子商务的蓬勃发展,使得互联网+思维模式日益风靡,现在越来越多的商家也推出了自己的电子商务销售平台。经过对国内外图书电子商务平台发展近况的深入分析后,本文设计和实现
通常,特征基因选择的目标是找到紧凑的特征子集用以构造一个模式分类器,以提高分类的性能。特征基因选择不仅能为我们找到与疾病相关的重要基因,提高肿瘤分类能力,同时也降低了临