融合主成分分析与并行混合的卷积神经网络

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:zhang3862066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:针对卷积神经网络在小样本易产生过拟合,性能较差等问题,提出融合主成分分析(Principal Component Analysis, PCA)与并行混合的卷积神经网络(PCA Parallel Mixing CNN, PCA-PMCNN)模型。该模型首先利用主成分分析非监督预训练初始化卷积神经网络,学习得到含有训练数据统计特性的初始滤波器集合,以解决首层滤波器集无法充分训练的问题;其次,引入局部对比度标准化概念及概率最大化采样规则,以减小下采样对特征的损失,增强特征描述的鲁棒性;最后,采用线性修正函数(Rectified Linear Units, ReLU)代替非线性激活函数,以保证特征稀疏,提高训练效率。实验结果表明该模型对行人目标具有较好的识别率,对行人重叠、姿态变化、复杂背景等具有较好的鲁棒性。
  关键词:卷积神经网络;主成分分析;局部对比度标准化;概率最大化下采样;并行混合
  中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)25-0199-02
  Convolution Neural Network Combining Principal Component Analysis and Parallel Mixing
  MA Wen-kai
  (School of Information Engineering, Jiangxi University of Science and Technology, Ganzhou 341000, China)
  Abstract: Convolution neural network is prone to overfitting and poor performance in small samples, we proposed a convolution neural network model combining principal component analysis and parallel mixing. The model first initializes the convolution neural network with the principal component analysis unsupervised pre training, and learns the initial filter set containing the statistical characteristics of the training data to solve the problem that the first layer filter sets can not be fully trained; Then, the concept of local contrast normalization and probability maximization sampling rule are introduced to reduce the loss of feature and enhance the robustness of feature description; Finally, Rectified Linear Units (ReLU) is used to replace the nonlinear activation function to ensure sparse features and improve training efficiency. The experimental results show that the model has better recognition rate for pedestrian targets, and is robust to pedestrian overlap, attitude change and complex background.
  Key words: convolution neural network; principal component analysis; local contrast standardization; probability maximization sampling; parallel mixing
  人工神經网络过多的参数设置,加剧了过拟合情况的发生;网络深度设计过深,易造成梯度发散,使得网络模型的解极易陷入局部最优。与人工神经网络相比,深度CNN特征具有鲁邦性强、抗旋转以及对光照变化不敏感等优点。LeNet5通过共享权值以及下采样层,减少了网络参数,降低了特征维数,但网络深度较浅,分类效率与识别能力有待提高。Alex-Net增加了卷积神经网络模型的深度,并扩充了神经网络模型中卷积核数量;文献[1]通过线性修正单元(Rectified Linear Unit, ReLU)来加速梯度收敛速率文献[2]采用全连接聚类以增强对图像中的非一致性动态模糊的鲁棒性。文献[3]采用Dropout层,增加样本训练的随机性,防止过拟合。
  1 本文算法
  1.1 主成分分析非监督预训练
  卷积神经网络的输入为N张大小为[m×n]的图像,卷积滤波器的大小为[k1×k2]。获得图像[Ii]的图像块数据[Xi],则主成分分析学习到初始化卷积神经网络的滤波器组[W1l]可表示为:
  [W1l=mk1k2qlXXT] (1)
  主成分分析非监督训练能够提取输入图像局部块的主成分信息,这些信息能够最大限度地代表图像的局部特征。
  1.2 并行混合CNN模型
  人类通过双目视神经来观察客观世界,双目视神经获取的视觉信息通过膝状体和信息混合以供大脑分析。将同幅图像采用不同的编码形式输入到深度学习网络中,神经网络通过学习能够获取到不同维度的特征信息,因此,本文提出了并行混合CNN模型,两条CNN数据流分别使用不同的输入数据,以增强对图像特征的描述力,如图1所示。   2 实验环境与结果分析
  在Caltech256公开数据集上进行测试实验。训练Caltech256数据集时,Dropout ratio参数为0.5;初始学习率为0.005,采用多项式减小的方法控制学习率,其减小幂值为0.5;将Batch size设置为20,;迭代次数设置为20万次。表1列出了Caltech256数据集上不同深度网络模型的分类精度,可以看出,PMCNN的分类精度在Top1上也有了提高。
  3 结论
  本文结合人类视觉原理,融合主成分分析与并行混合的神经网络结构,提出PCA-PMCNN模型,在提高图像分类精度的同时,保证网络更具有鲁棒性;进行局部对比度标准化,对数据中存在噪声的目标图像鲁棒性更强,从而保证卷积神经网络对复杂背景有更强的鲁棒性;引入概率最大化下采样的方法,既能提高图像特征的抗干扰能力,又能减少图像信息的损失,提高图像信息的利用率能有效避免训练陷入局部最優,使特征更加稀疏;在公开数据集上的实验表明,本文模型在保证网络深度的基础上,设置多条特征数据流进行信息混合,提高特征的可判别能力。
  参考文献:
  [1] Ren S, He K, Girshick R, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis
其他文献
目的完善《药品管理法》,加强医疗机构药品监管。方法通过相关政策、文献研究及监管实践,了解修订完善《药品管理法》的迫切性,阐明医疗机构药品监管存在的问题,重点论述相关
目的测定氯芬待因片中双氯芬酸钠和磷酸可待因的含量。方法采用RP-HPLC法,色谱柱为C8,乙腈-0.4%乙酸铵溶液-三乙胺(30:70:0.2)系统为流动相,检测波长为250nm。结果双氯芬酸钠、磷
摘要:随着大数据技术的不断发展,数据分析越来越受到人们的关注,Spark 作为大规模数据处理的快速通用的计算引擎,由于它的高速性而被各大商家应用于实际生产过程中。本文通过隐马尔科夫模型(HMM),选择在实际生产过程中,在进行海量的数据分析过程中出现的异常进行分析,以实际任务执行时的:内存溢出、垃圾回收异常、序列化异常为指标,根据实际出现异常时的提示,来确定HMM状态空间、确定相应的观测值、计算相关
摘要:目前高校图书馆信息化发展过程中面临的严重的Web应用安全问题,分析了常见网络安全问题的表现形式和产生原因,立足高校图书馆网络安全防护实践,总结传统的安全防护策略,最后介绍应用WEB应用防火墙来提高安全性。  关键词:图书馆网络安全; 网络攻击;Web应用防火墙  中图分类号:G25 文献标识码:A 文章编号:1009-3044(2018)33-0051-02  1 引言  随着最近几年信息技
案例提示:种韭菜的农民本来想尝试一下新农药实现增产增收,却不料韭菜的叶子却从绿变黄,几乎全部绝收,厂家的电话号打过去是空号,零售商和批发商又打起了“太极”。
摘要:面向移动终端的处理器性能评估需要具有代表性的测试程序,本文通过分析安卓应用阶段性的微架构无关特征,选取能够代表整个应用的程序片段,为最终生成代表性测试程序提供可靠依据。本文所提出的微架构无关特征包括指令混合比、关键路径长度、寄存器传输、指令/数据的空间局部性/时间局部性、分支行为、串行指令分布7大类,总计227个微架构无关特征维度。同时在Gem5中加入了特征参数的统计代码,通过基于固定Cyc
目的总结病毒载体疫苗非临床生物分布研究的关键点,提高疫苗生物分布研究水平。方法依据文献、指导原则和实验室经验,分析实时荧光定量聚合酶链式反应(Q-PCR)和取材组织选择、
目的以科学发展观为指导,为新型食品药品检测机构建设提供参考。方法分析了新型食品药品检测机构的含义、加强科研工作的重要性以及如何加强各级药检机构的纵横联系。结果与
目的建立安神补心六味丸中原儿茶酸含量的测定方法。方法采用HPLC法,色谱柱:Kromasil菲罗门C18;流动相:甲醇-0.1%冰乙酸(10∶90);检测波长:260nm;柱温:25℃;流速:1.0mL.min^-1。结果
当我们休完元旦假期。走上工作岗位。2010已悄然成为过去。当我们还未来得及感叹一下岁月易逝之时。今天已无需选择地站在了2011的门槛上。