基于深度神经网络的弱监督学习方法在图像领域的研究

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:Kaspersky_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年以来,深度神经网络飞速发展,在机器学习的各个应用领域都取得了令人瞩目的成就。特别是在图像领域,完全监督学习的相关理论和模型不断优化,日益成熟,其在各类图像识别任务均取得巨大的成功。但是,随着图像领域中各类应用任务越来越复杂以及各类任务所需要的数据量越来越大,人工标注工作所需的人力物力成本也越来越高。同时,更多真实场景数据集不断涌现,其中图像的复杂性和多样性更加显著,这不仅导致了完全标注相关信息越来越困难,而且标注的过程极易出错,难以保证标签的精确性。因此,保障图像识别效果的同时,如何减少对数据标签的依赖并降低数据标注的成本成为了深度神经网络发展过程中亟待解决的问题。针对以上问题,本文将在图像领域进行基于深度神经网络的弱监督学习方法研究,其相比于完全监督学习方法来说,完成同样的图像识别任务,其对数据的标注要求更低,标签不需要完全与任务相匹配,形式上更简单。该研究中的关键问题是如何充分利用数据中已有的信息,如何减小标注工作量以及如何将外部经验和规则与模型充分结合。具体地,本文以基于深度神经网络的弱监督学习方法为主要的研究目标,通过分析已有模型和方法的优势和不足之处,在图像相关应用领域探索有效的弱监督学习建模方法,并提高相关任务的实现效果。本文提出了三种基于深度神经网络的弱监督学习方法,主要的内容和贡献概括如下:(1)提出了一种基于多尺度证据的弱监督学习方法。通过卷积神经网络的金字塔特征层次结构提取输入图像的多尺度证据,仅使用全局图像级别标签进行弱监督学习,可以同时实现图像多标签分类和单点目标定位两项任务。方法应用了一种全新设计的损失函数,有效地解决了不同尺度类别依赖激活图上的活跃区域不平衡的问题。提出了一种基于超像素的弱监督边界框生成算法,通过生成的边界框,有效地辅助实现模型的弱监督单点目标定位。实验结果表明,提出的网络结构可以高效地利用图像中的多尺度证据,提升图像多标签分类和单点目标定位的效果。同时,相关实验表明,全新设计的损失函数可以进一步提高模型的分类和定位效果。(2)提出了一种基于图卷积网络的弱监督学习方法。探索了如何利用图像中的标签依赖帮助提高模型的分类和目标定位效果。方法中图卷积网络的节点向量使用了 一种全新设计的初始化方法,破除了现有初始化方法对自然语言中词向量迁移的依赖,通过矩阵分解的方法,对训练集中的标注信息进行学习,实现对节点向量的有效初始化。实验结果表明,提出的网络结构可以有效地利用图像中的标签依赖关系,提升图像多标签分类和单点目标定位的效果。同时,相关实验表明,全新设计的节点向量初始化方法可以进一步提高模型的分类和定位效果。(3)提出了一种基于空间划分的弱监督学习方法。该方法摆脱了现有方法对候选区域的依赖,并且可以实现端到端的训练,仅使用全局图像级标签,通过全新设计的互约束学习过程,就可以直接显性地输出待检测目标的边界框,实现弱监督的目标检测。方法通过在现有弱监督学习网络的基础上添加了边界框生成网络和参数化分区模块两个可微分模块,将原始模型改造为端到端的检测网络。实验结果表明,改造后的网络不仅可以有效地显性输出目标边界框,并且在图像多标签分类和目标检测两项任务上效果均优于原始模型。
其他文献
矿山测绘作为矿山企业煤矿资源开发与生产中最为关键的一个环节,其测绘成果往往会对矿山企业的正常生产秩序产生影响,所以各大矿山企业要将测绘信息技术合理应用其中,帮助企
以高中语文文学名著阅读教学中的审美教育为主题展开论述,首先对高中语文文学名著阅读教学中的审美教育价值进行了分析,然后重点从巧妙设计导语激发审美兴趣、启发深入品析培
本文从延怀盆地的地质构造特征出发,依据近期各断层的滑动速率,由震级—时间可预测模型,计算了各断层的未来地震危险性。结果表明,未来延矾盆地北缘断裂的地震震级最大,预测
前人通过种族视角、艺术视角、后殖民主义批评视角等多种视角对兰斯顿·休斯的《黑人谈河流》这首诗进行了深入的研究和探讨。鉴于隐喻在诗歌中的应用非常普遍,诗歌隐喻来
<正>由安徽省种子管理总站、安徽省农技推广总站以及安徽农业大学相关专家组成的专家组,对中科院合肥物质科学研究院技术生物所培育的稻米新品种"科辐粳9号"现场测产,在稻虾
使用SCL-90临床症状自评量表,选取天津、湖北共9所中等职业学校459名教师为被试进行测试。结果表明:中等职业学校教师心理健康状况水平低于全国成人常模,高于普遍中学教师;54
<正>由合肥和安机械制造有限公司申请的专利(公开号CN 104130472B,公开日期2016-01-27)"一种抗撕裂耐低温高压橡胶胶管专用填料及其制备方法",涉及的填料配方为:线形低密度聚
高中语文阅读教学的审美教育不仅是一种素质教育,更是学生的一种情感教育。一直以来,教育界都在倡导对学生实现全面的素质教育,也希望在高中语文教学课堂上审美教育能够得到
本文论述了花色素的结构、性质和用途,并介绍通过花青素鉴定法来识别葡萄酒品质的优劣。