基于深度学习的图像生成与识别若干问题研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:itolbaxk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度神经网络在图像生成和图像识别等计算机视觉应用领域取得了许多突破。然而由于目前深度学习理论不够完善,深度神经网络在计算机视觉任务的应用上仍然存在许多问题。首先,对于深度神经网络泛化能力的成因仍在探索之中,而模型在实际测试中的性能取决于其泛化能力;其次,深度神经网络的训练过程不稳定,尤其是生成对抗网络(Generative Adversarial Network,GAN),这对其在具体任务中的应用形成阻碍;最后,深度神经网络的训练需要依赖大量数据,一定程度上限制了其应用场景。基于上述背景,本文基于深度学习并结合近年来学界提出的相关前沿方法,研究了计算机视觉中若干经典任务:图像修复、小样本学习和图像分类。本文的主要研究工作如下:1)本文提出了一个应用于图像修复的渐进式生成网络(Progressive Generative Network,PGN),它将语义图像修复任务视为一个课程学习问题。对于存在大区域破损的语义图像修复任务,一次性修复整个破损区域可能比较困难,PGN将修复过程分为几个不同的阶段,每个阶段的目标是完成整个课程的一个子课程,然后使用LSTM框架将所有阶段串联在一起。通过引入这种课程学习策略可以提升模型的泛化能力,PGN可以逐步修复自然图像中的大面积损坏区域,并产生良好的图像修复结果。此外,由于整个修复过程是在一个前向传递中执行的,因此该方法的速度相当快。在巴黎街景和Image Net数据集上的大量实验证明了本方法的优越性。2)本文提出了基于深度学习的协同图像修复(Deep Image Co-Inpainting,DICI)框架。在图像修复训练过程中数据集的某些图片可能会产生不一致的重建损失干扰训练,影响图像修复的效果。受到协同蒸馏的启发,DICI引入了两个图像修复模型,包含两个生成器和两个判别器。其中,两个生成器采用图像级别协同蒸馏,输出一致的图像修复结果,缓解外部干扰;两个判别器之间采用特征级别的协同蒸馏,产生一致的判断,避免判别器训练过程中的灾难性遗忘;两个生成器和两个判别器之间采用交叉训练,提升稳定性。本文尝试了五种不同的DICI实现方式,并在四个数据集上和现有方法对比,以验证DICI的有效性和优越性。3)小样本学习研究如何使用少量样本训练深度神经网络,本文提出一个基于挖掘-评估课程网络(Miner-Evaluator Curriculum Network,MECN)的小样本学习框架。由于小样本任务采样的随机性,不仅会产生遗漏现象,也无法保证质量。针对此问题,MECN设计了两个辅助模块:a)小样本任务挖掘器根据元学习器的反馈采样困难的小样本任务;b)小样本任务评估器根据小样本任务的噪声水平对其进行重新加权。这两个模块相互协作并且相互补充,它们共同为元学习器提供任务级别的课程,以便提高元学习器的泛化性能。为了评估MECN,本文采用了两个具有挑战性的数据集(mini Imagenet和tiered Imagenet),在有监督和无监督的小样本学习环境下进行了大量的实验,本文还精心设计了大量的消融实验,以验证本方法的有效性。4)本文提出了一个称为对抗协同蒸馏网络(Adversarial Co-distillation Network,ACN)的图像分类框架,通过生成额外的分歧样本来改进协同蒸馏。ACN由两部分组成:一个是由GAN组成的生成对抗模块,用于生成分歧样本;另一个是由两个分类器组成的协同蒸馏模块,用于学习分歧样本。这两个模块以迭代和对抗的方式进行训练。为了保证分歧样本的质量以及ACN的稳定性,本文进一步设计了“弱残差连接”和“限制对抗搜索”。在不同数据集上对不同结构的深度神经网络进行了大量实验,证明了ACN的有效性。
其他文献
随着高端制造业的不断发展,纳米位移测量技术在保证高精度、高分辨力的同时,对大量程、多维度、多参数测量需求也日趋迫切。尤其是以纳米数控机床、高端光刻机等为代表的超精密加工设备,更是要求系统工作台在X和Y二维方向同时实现大量程纳米级的位移测量。目前,实现平面二维位移测量的方法主要有两种:其一,采用两套单自由度传感器正交安装的形式,通过组合测量方法实现平面二维位移测量;其二,直接通过单一传感器实现平面二
在过去的三十年中,特征选择作为一种维数约减技术,一直是机器学习领域的研究热点之一。传统的特征选择算法由于仅基于特征与类属性之间相关性,可能导致预测分类模型缺乏可解释性、可操作性和鲁棒性。因果特征选择是发现类属性的贝叶斯网络(Bayesian network,BN)的子结构,即马尔科夫毯(Markov blanket,MB),该MB由类属性的父母(直接原因),孩子(直接结果)和配偶(直接结果的其他直
工业控制网络系统是实现工业生产自动化的关键,是衡量国家工业水平的重要指标。随着物联网、大数据、智能技术的发展,其安全运行已成为国家安全战略的重要组成部分。可信计算已经成为国际信息安全领域的一个重要分支,吸引了全球众多学者的关注和研究。本文的主要工作和贡献有:(1)首先分析了工业控制网络系统的安全现状和安全需求,研究了可信工业控制网络系统的实现技术,提出一种可信工业控制网络系统体系结构。划分可信工业
近些年来,由于汽车自动驾驶技术能较好地解决因驾驶行为不当、疲劳驾驶、疏忽大意或违章行驶等人为失误引起的交通安全问题,其已成为全球汽车行业关注的焦点。同时,传感、信息以及人工智能等相关技术的迅速发展,为自动驾驶技术的实际应用提供了良好的软硬件基础。无论是政府还是企业都在大力推动汽车自动化技术的发展和应用。但由于受到技术成熟度和成本等因素的制约,自动驾驶技术仍处于不断发展阶段。本文基于自动驾驶汽车的预
自20世纪后期,量子计算与量子通信便成为计算机科学、通信、数学和物理的一个交叉和前沿学科.与经典的数字通信情形一样,为了实现量子计算和量子通信,就必须解决量子纠错问题.1996年,Calderbank、Shor以及Steane同时独立地给出了如何运用数学工具构造量子纠错码的第一种系统而有效的方法,并建立起经典纠错码与量子纠错码之间的桥梁.这极大地促进了量子纠错码的蓬勃发展.此后,便引发了人们对量子
随着信息技术的不断发展,纠错码理论在信息安全中发挥越来越重要的作用。根据实际需求选取特定的编码是纠错码理论的一个关键问题,其中用到的循环码是纠错码理论研究的一个热点。循环码不仅可以通过高效的电路实现,而且在移动通信、雷达、航天等领域有广泛的应用。常循环码是循环码的推广和发展,不仅继承了循环码的良好特性而且有灵活的参数,然而相对于循环码的理论研究而言,常循环码理论还需要进一步完善和发展。尤其是常循环
有源相控阵雷达(Active Phased Array Radar,APAR)的独特优势在于每一个天线单元均配备有一个发射/接收组件(Transmit/Receive Module,TRM),从而具有可靠性高、功能性强等诸多独特的优点,因此在军事航天等领域中受到越来越多的重视。正因如此,APAR在实际工况中会由于内部器件热功耗以及外部环境温度的变化产生明显的阵面热变形,进而造成雷达主瓣增益损失、副
三叶木通(Akebia trifoliata(Thunb.)Koidz.)是木通科(Lardizabalaceae)木通属(Akebia)攀援式常年生落叶藤本植物,在我国作为药用和野果食用已有千年之久。三叶木通叶绿体基因组、三叶木通全长转录组及三叶木通果实(八月瓜)的代谢组学相对匮乏,严重阻碍了三叶木通在食品和分子生物学领域研究的开展。随着种植面积的扩大,微生物导致的果实染病现象日益凸显,对这一新
稀土硼化物具有高熔点、高硬度、低功函数、低蒸发率、耐离子轰击能力强与物理化学性质稳定等特点,是一类优良的电子发射材料,在电子束加工仪器、粒子束加速器、精密电子分析仪器以及动态真空系统的电子器件等领域有广泛应用。目前针对稀土硼化物阴极的研究主要集中在通过实验制备掺杂稀土硼化物单晶,寻找合适掺杂成分从而提高其电子发射性能这一方面,而对于其功函数、电子结构与掺杂改变电子发射性能的机理研究尚少。本文以轻稀
近些年来,国民经济的快速发展使得汽车保有量急剧增加,引发了众多能源环境问题和交通问题。无人驾驶系统和智能交通系统是解决这些问题的可行方案,该领域的相关技术是当前的研究热点并已取得一定突破,但受到技术瓶颈和法律法规等因素的限制,仍难以在实际场景中得到全面应用,需要不断完善和提高。自主泊车技术是无人驾驶技术的重要构成部分,泊车环境的复杂化导致泊车难度增加,使得对泊车技术应用的诉求逐渐强烈。另外,泊车工