子类敏感卷积神经网络研究:目标检测与姿态估计

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zooton2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉中的重要基础研究课题之一。其应用领域十分广泛,包括智能安防、智能家居、智能交通、医学图像等。随着近几年深度学习的飞速发展,目标检测的性能已经取得了重大的突破,在众多公开数据集上超越了传统方法。姿态估计也是基础课题之一,特别是头部姿态估计,可以应用在三维人脸建模、人机交互协作、虚拟现实等领域。自动驾驶技术的发展更离不开上述两个技术:行人、车辆检测、行人行走路线预测等。传统的目标检测是利用滑动窗口进行区域选择,该策略没有利用先验知识,导致时间复杂度很高,产生许多冗余窗口;其手工设计的特征对于目标的变化不够鲁棒。基于卷积神经网络的方法很好的解决了上述两个问题。但是现有技术在一些常用数据集上却没有很好的表现,主要原因在于对于遮挡、截断等复杂情况下的目标检测不够精准。同时,具有较高精度的基于区域提名的方法一般速度都很慢。本文提出了一种利用子类信息的卷积神经网络的精确快速的目标检测方法,在保证检测精度的同时,提升原有检测方法的速度。其速度和精度在多个数据集上达到了很好的平衡。头部姿态估计研究如何从图像推断头部朝向的问题,即求出俯仰角、偏航角、翻滚角三个姿态角。本文利用子类信息,提出了一种快速精确的能同时进行人脸检测和姿态估计的深度学习框架。人脸检测借鉴了基于区域的目标检测框架Faster RCNN,并融入了子类信息。同时子类信息还提升了头部姿态估计的性能。具体地,把估计问题同时看作分类问题和回归问题:首先把数据库中的姿态通过聚类生成不同的姿态类(即子类),然后对每个类别训练一个回归器来精修最后的姿态角度值。其中检测中的分类和估计中的分类及回归都是在同一个网络下训练和测试。该方法运行速度达到10fps,是目前提出的所有方法中最快的一种。实验证明提出的方法在常用的数据库中都取得了相当或更好的性能。
其他文献
1958-2012年间的《国语》研究分为多个方面,学者们分别从历史、文献、语言、文学、思想等各个方面对《国语》展开研究。总体来看,研究比较充分的为文学,还有待进一步深入研究
1927年大革命的失败,给大批参加过革命的知识分子以强烈的挫败感,他们迫切希望自己转型为无产阶级。在这种背景下,大批男性作家创作出“革命加恋爱”的小说,表面上是在书写女
以河南巩义市为研究对象,将GIS分析法与社会调查法相结合,通过分析1975—2010年巩义市村落终结的特征,划分了山区迁移型、项目影响型和城镇扩张型3个村落终结类型,并分析了各
就在人们欢庆欧元的第一个10岁生日后不久,在百年不遇的全球金融危机的冲击下,2010年春天人们突然发现,以希腊债务危机为导火索,欧元正经历自创立以来最为严重的危机。尽管在欧洲
报纸
由于英汉两种语言的诸多不同,在进行翻译时通常需要适当的词类转换。本文以商务英语为例将名词、动词、形容词、副词、及介词的转译作了简单归纳并介绍了典型例句。
以‘徐稻4号’为材料,构建OsCaMs的瞬时表达载体,利用生物信息学和RT-PCR方法设计OsCaMs定量引物5个,鉴定参与ABA诱导的OsCaMs基因并分析其生理功能,为进一步揭示ABA信号转导
关于控制权一直是资本市场关注的热点问题。股权流通使得企业存在控制权转移的风险,但也为企业在选择股东资源上带来了一定的便利。在国家政策的推动下,民营企业通过引入国资背景的企业,成为混合所有制企业的现象越来越普遍。同时目前对于控制权转移的研究重点,绝大多数侧重于股东财务资源所带来的控制效果,忽略非财务资源在公司控制权转移上所起到的重要作用。本文采用案例研究法对非财务资源在控制权转移事件中所起到的作用进
随着集成电路的飞速发展,芯片的规模不断增大,复杂度不断提高,验证的难度、工作量和重要性也随之急剧增加。验证贯穿整个芯片设计流程,一般情况下,其工作量占到整个设计研发过程的70%-80%,成为了影响芯片上市时间和研发费用的关键因素。数字IC芯片验证主要分为数字前端的功能验证和数字后端的时序验证。本文主要研究的是数字IC验证中的核心——前端功能验证。论文分析当前主流的验证语言SystemVerilog
目的:本研究旨在探讨鼻内镜下眼眶减压术对于眼肌肥厚型甲亢突眼的临床治疗效果。方法:本研究回顾性分析了2014年9月-2017年9月在笔者医院眼科接受鼻内镜下眼眶减压术的23例(
目的探讨保留皮肤的乳腺癌改良根治术Ⅰ期假体植入乳房重建的可行性。方法对15例Ⅰ、Ⅱ期乳腺癌患者行保留皮肤的乳腺癌改良根治术后,同期于胸大、小肌间植入硅胶假体重建乳