【摘 要】
:
图像分类作为理解图像内容的重要手段之一,在金融、公共安全、交通等领域都有成功的应用,其重要性不言而喻。面对海量的图像数据集,采用人工的方式对图像的语义属性标记不便
论文部分内容阅读
图像分类作为理解图像内容的重要手段之一,在金融、公共安全、交通等领域都有成功的应用,其重要性不言而喻。面对海量的图像数据集,采用人工的方式对图像的语义属性标记不便于检索和分类,从而产生了图像信息分析不准确等问题。而随着有关GAN框架的提出,GANs便成为深度学习领域里比较重要的一个模型,也是人工智能研究的一个重要工具。并提出了多种基于GAN框架的改进模型。尤其是Triple-GAN把GAN的框架从二人博弈发展到三人博弈,即在判别器和生成器的基础上加入了分类器,从而使Triple-GAN可以解决发生器和判别器不能同时达到最优及生成器不能控制生成样本的语义等问题。但Triple-GAN在图像分类中仍然存在以下问题:第一,由于Triple-GAN在分类器中需要标记部分样本标签,而Triple-GAN仍然采用手动的方式对样本进行标记,造成了手动标记工作量过大且标记不均匀等问题。第二,Triple-GAN目前仍然沿用KL散度分布构造目标损失函数,而KL散度在分布不交叉时,会出现梯度消失,所以在Triple-GAN中也同样存在GAN中类似的问题,如梯度消失,训练不稳定等问题。本文主要的创新点将分为两个方面:(1)针对Triple-GAN中存在的第一个问题,本文提出采用随机森林分类算法改进Triple-GAN的分类器。通过随机子空间、Bagging建立随机森林决策树,在建立决策树的过程中,使叶子节点自动标记标签。同时确保在训练中,通过随机森林算法的预测分析,使每个训练样本能够定位到叶子节点上,最后将叶子节点标签和训练样本形成的标签对输入到判别器中。实现了标记的过程从手动标记向自动标记转变,分类效率明显提高。(2)针对Triple-GAN存在的第二问题,本文提出引用LSGAN理论模型思想,对Triple-GAN目标损失函数进行改进。利用最小化卡方分布及参数变量构建目标损失函数。将样本分布控制在稳定的置信空间,同时调节生成样本的方向。使得生成样本始终控制在位于决策边界正确一侧,从而达到训练稳定的效果。通过以上两个方面的优化和改进,构建Triple-GAN改进模型—Improved Triple-GAN模型,使用MINIST、cifarl0和cifarl00数据集分别在Improved Triple-GAN模型与Triple-GAN模型进行了实验。实验结果表明Improved Triple-GAN模型与Triple-GAN模型相比,Improved Triple-GAN模型解决了手动标记繁琐的问题,同时避免了梯度消失和训练不稳定的情况。从而使得Improved Triple-GAN模型比Triple-GAN模型的更加稳定,训练结果更为理想。
其他文献
在大学办学自主权诉求日益加强与去行政化呼声不断的当下,高校教师参与治理的重要性越发凸显,亟待我们对高校教师参与治理的丰富内涵展开探讨。基于大学的组织特征与民主协商
近年来,大数据处理己成为各个行业的讨论和研究热点。负载均衡是分布式大数据集群计算中非常关键的策略,它影响到集群的处理效率和作业的完成时间。Hadoop作为目前广泛使用的
随着移动互联科技的日益更新,新一代信息化技术已经渗透到企业的日常工作中,传统的办公模式已无法适应现代企业对资源信息的快速响应和准确处理的要求。为达到平日更有效、高
近年来,随着高速列车、航空航天、工程机械与海洋工程等领域的快速发展,对高精度齿轮的需求量日益增多,并且对其性能提出了更高的要求。因为成形磨齿技术具有效率高、通用性强、精度高等优点被广泛使用,越来越多的成形磨齿机被大量使用。但是国内对数控成形磨齿机的研究较少,还需对其关键技术展开深入研究。本文以内齿轮数控成形磨齿机作为研究对象,对磨削头及其关键部件进行了有限元分析,依据分析结果对磨削头核心部件砂轮架
随着全景视频的技术发展,越来越多的人接触到全景视频的概念,全景视频也相应的越来也火热。然而全景视频无线传输对带宽要求更高,受限于有限的带宽资源和各个全景视频用户的
水下接驳技术是一种通过接驳基站(DOCK)对自主式水下航行器(Autonomous Underwater Vehicle,AUV)进行能源补给和信息传输,提高AUV的续航能力的技术。技术的关键在于接驳过程中对AUV精确导航。本文在研究了国内外的接驳导航方案的基础上,深入展开了面向AUV中末端接驳的多传感器融合定位技术研究。现有的接驳导航主要采用超短基线(Ultra Short Baseline,U
传统的团队形成问题已经得到了较为深入的研究,然而随着各种社交平台的流行以及网络通信的迅速发展,团队形成渐渐转移到线上进行,因此社会化网络中的团队形成再次调动起了众
3D点云具有高密度、高精度特性,其坐标信息包含了大量的语义特征。而对3D点云语义分割是目前解决无人驾驶、高精度地图构建的有效手段。目前,3D语义分割的数据主要来源为点云数据,点云数据存在数据量大、密度不均匀、不规则的问题,如何解决这些问题,直接影响到点云特征提取及最终的3D点云语义分割。基于KNN近邻提取特征模型是基于点云学习的先进方法,但是基于KNN近邻提取特征模型在点云近邻计算上及训练过程中都
六硼化镧(LaB_6)是一种稀土类六硼化物,属于Cs Cl型立方晶系,具有高导电率、高发射电流密度以及化学稳定性良好等一系列优异性能。这些性能使其在军工、航天以及大功率电子发射仪器领域具有广阔的应用市场。本论文以La Cl_3?7H_2O、KBH_4、Mg作为原料,通过固相反应法制备LaB_6粉体;之后通过SPS技术烧结LaB_6多晶体靶材;在获得LaB_6多晶体靶材的基础上,通过电子束沉积制备L
基于稀土离子窄的发射谱带,长的发光寿命,大的斯托克斯位移以及高的量子产率等优良特性,稀土配位聚合物在光、电、磁等方面具有优良的性质,而发光稀土配位聚合物常应用于白光发射、生物成像、防伪、阴阳离子及小分子的检测等各个方面,这让人们对发光稀土配合物的研究更加感兴趣,特别是将这些发光稀土配合物通过掺杂或是接枝的方法而获得复合发光材料。一方面,以水杨酰胺基团作为稀土配合物的末端基,不仅可以有效敏化稀土离子