【摘 要】
:
目前,在计算机视觉领域,主流的卷积神经网络(Convolutional Neural Network,CNN)算法专注于目标的识别和定位,且大多数采用轴对齐包围盒定位目标,而为了对图像做更深刻的语义
论文部分内容阅读
目前,在计算机视觉领域,主流的卷积神经网络(Convolutional Neural Network,CNN)算法专注于目标的识别和定位,且大多数采用轴对齐包围盒定位目标,而为了对图像做更深刻的语义理解,需要获取目标的方向信息。而很多基于CNN的对目标方向估计的研究,直接对指示目标方向的方向角θ进行回归和预测,而角度值在0°和360°附近存在数值上的大跳变,会对网络引入误差,因此,本文提出一种针对图像目标方向估计的新方法,采用卷积神经网络对目标方向角θ的两个单调连续的方向分量(sinθ,cosθ)进行回归。由于方向角的两个分量之间存在平方和为1的函数约束,即在神经网络中又引入了新的问题——输出约束问题,事实上很多应用有都存在输出约束问题。针对此问题,本文具体分析出现输出约束的情况,将其分为输出在值域上具有范围约束的弱约束和输出分量间具有确切函数约束的强约束,并针对每种约束,提出一般性方法改造传统CNN,构建约束性卷积神经网络(ConstrainedConvolutional NeuralNetwork,CCNN),来解决这类带有输出约束的问题,提高网络模型的适应度。方法有输出转换法和在Loss层增加约束误差法。输出转换法为采用符合条件的转换函数对输出进行转换来满足所需的约束条件,增加约束误差法则是直接将约束误差纳入神经网络的误差反向传播中,参与对权值的修正和计算,旨在建立能包含约束信息的权值参数矩阵。在输出设计为方向分量的目标方向估计网络中,具体使用提出的两种方法,分别构建约束性卷积神经网络,研究网络具体架构设计,单位化转换函数设计,以及改动后的误差反向传播推导等,给出详细方案,并进行两者的对比实验以及未考虑输出约束的传统方法的对比实验,包括对单类目标和多类目标的实验。通过单类目标方向估计对比实验,本文提出的两种方法的CCNN在提高方向分量估计精度和降低约束误差上,均优于未考虑输出约束的传统CNN。输出转换法CCNN能直接提高方向分量估计精度,完全解决约束误差的出现,在两个方面的优势均很突出。而增加约束误差法CCNN能够在不影响原输出损失的下降速度和幅度的前提下,较稳定地降低方向分量约束误差,进而提高整体估计精度,但增加约束误差法之于输出转换法,更具有普适性,在输出约束关系复杂,无法找到合适的输出转换函数的情况下也可以使用,适当降低约束误差。在对多类目标同时进行目标识别和方向估计时,两种CCNN未对目标识别性能造成影响,在方向估计上表现出的规律和单类的相同。因此,针对输出具有约束的实际问题,本文提出的通过输出转换法构建CCNN,若存在完全符合约束问题的合适的转换函数,能够大幅度减小输出误差,提高估计精度,并且直接避免约束误差的出现。而通过增加约束误差法构建CCNN,更具有普适性,可以应用于所有约束问题,能够较稳定地降低输出约束误差,进而影响输出估计误差,一定程度上也可以提高估计精度。
其他文献
随着经济全球化节骤的加速,制造业企业之间的相互竞争渐趋白热化。供应链本身节点企业较多,各个企业的利益诉求点和功能以及在供应链之中的作用机制也不尽相同。轨道装备行业
步入二十一世纪以来,世界发生深刻变革,新兴经济体国家群体性崛起,世界多极化趋势加速发展,以美国为主导的国际秩序逐渐被打破,国际格局正发生历史性的深刻变化和调整,国际潮流不可逆转。以“百年未有之大变局”为研究课题,有利于准确把握和分析当前国际形势,更好把握世界变局和中华民族变局,对实现“两个一百年”奋斗目标具有重大战略意义,促进中华民族伟大复兴中国梦的实现。随着时代的发展,世界格局的演变,无论是对世
随着集成电路产业飞速发展,传统半导体制造技术已逼近物理极限。将光子学器件与微电子技术相结合实现光互连,是当前国内外科学家努力探寻的关键技术之一。满足硅基光电集成的关键点在于解决硅是间接带隙半导体这一弊端,实现高效稳定的硅基光源。近年来,在硅基薄膜中引入合适的杂质作为发光中心,从而获得满足光互连的光电子发光器件是学术界关注的前沿热点。本论文针对全硅基材料发光效率低这一关键问题,在硅基薄膜中引入过渡金
由于金融危机的蔓延,导致一些世界领先的企业和公司倒闭,公司治理的概念受到了工业界和学术界的广泛关注。公司治理机制在公司实体到期和存续中的作用已成为全球公司治理结构的重要组成部分。该研究考察了公司治理机制对加纳公司绩效的影响。本研究以加纳非金融行业28家上市公司为研究对象,旨在探索上市公司良好的公司治理机制对公司业绩的影响,从而推动加纳的经济增长和发展。本研究使用了具有代表性的面板数据,以2008-
当今时代,以计算机、互联网、万维网等为代表的信息技术革命彻底改变了人们信息共享、互联互通等交互方式,各种各样的社会信息网络(社交网站)应运而生,如:Facebook,YouTube,Flicker,LiveJournal,Twitter,豆瓣网,新浪微博,抖音等。社会信息网络兼有信息网络和社会网络的特性,既反映了用户间社会关系,也逐渐成为用户间进行信息交互的主要载体,人们可以随时随地分享新闻、图片
图像分割作为图像处理的重要部分,可以应用于医学图像分析和产品监测等许多领域。图像分割的方法有许多种,基于水平集方法的图像分割模型,是学者们近年来研究较多的一个课题,由于它具有可以灵活处理图像的拓扑结构改变、数值计算简单等优点,使其在图像分割领域的应用越来越广泛。但目前基于水平集方法的图像分割模型仍存在许多问题,如分割准确度和精度较低、对初始轮廓敏感等,导致最后得不到我们想要的分割结果,所以该理论和
乏核燃料的处理是核电发展急需解决的重要问题,传统的乏燃料后处理工艺存在一些技术和安全问题。离子液体由于高的萃取效率、辐射稳定性和安全性,作为高放射性核素的分离用溶
植物繁育系统是当今进化生物学研究中最为活跃的领域,其中交配系统是核心。同一植株不同的交配系统会产生遗传组成不同的散布体,散布体的萌发特性代表着与环境的适应性机制。
问题标签作为社区问答系统中关键的推荐因素,如何有效且高效地对新问题和有回答的问题进行标签的推荐,成为很多社区问答系统亟待解决的难题。传统的社区问答系统,利用分词技
短波通信是一种重要的通信方式,在航空、军事、广播、应急通信等领域有着重要的应用。作为无线发射机的重要器件,短波功放的工作状态对短波通信系统影响巨大。由于短波功放的工作功率相对较大,提高功放的工作效率非常重要。但功放的工作效率和它的线性度往往是一个矛盾对立的存在。新一代的短波通信标准中,非恒包络调制的使用对短波功放提出了更高的要求。预失真技术是一种能补偿功放放大的非线性的技术,提高功放的线性度后可大