复杂环境下场景目标分类与检测方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lincystar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社会的不断发展,整个世界的图像数据规模也是爆发式增长。如何从海量的图像数据中快速、有效地提取出有用的信息已经成为计算机视觉领域的研究热点。图像分类与目标检测是计算机视觉领域最重要的问题之一,同时它们也是图像分割、视频目标跟踪和人体行为分析等其他高层视觉研究的基础。基于此,本文对复杂场景下的图像分类和目标检测算法展开研究,主要工作包括以下两部分:(1)研究了基于词袋模型的图像分类相关理论,对图像分类中的核心问题特征编码进行了系统的阐述,着重研究了稀疏编码算法在图像分类中的应用。为了克服传统稀疏编码图像分类算法的缺点,如提取单一类型特征、缺少图像的空间结构信息和特征编码时无法充分利用特征拓扑结构信息。本文提出了一种基于多尺度特征融合Hessian稀疏编码的图像分类算法。首先对图像进行空间金字塔多尺度划分,然后在各个子空间层将方向梯度直方图特征和尺度不变特征转换进行有效的融合,接着详细推导了Hessian能量函数并在传统稀疏编码的目标函数中引入Hessian能量函数作为正则项,最后利用支持向量机进行图像分类。在多个公认数据库上的实验结果表明,本算法与现有的分类方法相比,具有更高的分类准确率。(2)为了进一步提高分类和检测算法的准确性,本文对基于深度学习的多目标检测展开研究。在系统的研究了Faster-RCNN和GoogLeNet检测框架后,提出一个新的卷积神经网络进行多目标的检测。主要工作是使用GoogLeNet的inception模块替换掉Faster-RCNN中传统的多卷积层提取特征部分,给出了整个检测框架详细的实现方法。最后,使用复杂的行车记录仪图像数据验证本网络模型的有效性。
其他文献
软件定义网络一方面通过数控分离思想式改变了传统网络控制和转发紧密耦合的工作模式,提高了网络管理的灵活性和开放性。另一方面通过基于控制器本身的北向接口使网络具有强
黄瓜(Cucumis sativus L.),我国主要栽培的蔬菜作物之一,白粉病与枯萎病、霜霉病是危害黄瓜的三大主要病害。microRNAs(miRNAs)是一类长度20-24nt的内源非编码小RNA,通过互补配对原则降解或抑制mRNA,从而调控植物生命过程的相关生理活动。植物在生物胁迫和非生物胁迫下可以应激表达miRNA,并作用于逆境相关靶基因,使植物在生理反应上产生对胁迫的适应性。实验室前期以
当今互联网信息的传输越来越多以图像的方式进行,图像在传输过程中的安全性问题显得尤为重要。图像安全传输最直接有效的方式便是加密图像。数字图像加密的主要目的是把给定
随着虚拟化技术的快速发展,现如今基于虚拟化技术的云计算平台的建设也愈加完善。越来越多领域的人们开始使用云平台去完成他们的任务部署,大型的基础设施提供公司通过云平台
随着我国经济发展和城镇化进程加快,消费者住房需求也在不断扩大。近几年房地产行业迅速发展,但也出现“房地产泡沫”“炒房不住”、房价飙升等现象。因此,稳定房价、稳定房地产市场已成为国家和政府宏观调控的重要目标。然而,稳定房地产市场需要控制房地产项目的开发规模与建设资金的投入,防止开发商过度开发。银行借款是房地产企业最主要的融资渠道之一,而房地产又属于高风险行业。对于商业银行而言,在发放房地产项目贷款时
高速公路承担着重要的交通运输任务,是我国交通运输网的重要组成部分,所以对于高速公路的性质研究是非常有必要的。作为沥青路面最常见的破坏形式,沥青路面的车辙问题更是得到了广泛的研究。在人们以往对车辙的研究过程中,最开始采用的方法大多为理论推导和实际试验法,但是随着科学技术的发展,沥青混合料的计算机模拟也开始渐渐兴起。在沥青路面的计算机模拟研究中,大多数人均采用有限元法来对沥青混合料进行模拟研究,将沥青
棋类运动在国内外都有着悠久的历史,由于其用具简单,趣味性强,使其成为极其流行的智力运动。近年来,在高科技的引领下,许多相关科技人员在计算机棋类博弈、下棋机器人等领域
在Web 2.0时代,面向Web服务的计算模式和架构得到广泛应用。随着Web服务数量的不断增加,用户在面对数量庞大的Web服务时,难以筛选出既满足需求并且高质量的Web服务。因此,如
标准一致性测试是根据某项标准所要求的专门特性来测试目标系统,以便确定该系统的一致性实现程度。标准一致性条款和实现一致性声明是一致性测试的切入点,对一致性测试至关重
手势识别是人机交互的一个重要分支,已经广泛应用于生产生活中,改善了生产作业方式,提升了生活质量。针对手语识别的研究对聋哑群体的交流也有着重要意义。在手势识别中,手势