基于计算机视觉的场景辨识研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:junfeng_19860313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景辨识隶属目标识别的范畴,在计算机视觉应用领域具有广泛应用前景。场景辨识类似于人脸辨识属于“一对多”的模式识别问题,但是其面临的挑战在于场景图片成像环境复杂。由于不可控因素影响,图像存在尺度、视角、照明的剧烈变化,也有可能因为时间跨度过大导致背景显著变化,以及出现季节、天气、运动目标等干扰因素。因此,场景辨识是一个非受控自然环境中具有复杂动态变化性的目标识别问题,该类问题在计算机视觉领域还不能得到很好解决。本文从不同的视角研究了几种场景辨识的方法,主要工作如下:(1)基于人工特征提取技术,通过局部特征点匹配的原理实现场景辨识。针对传统的单点图像匹配技术错配严重的问题,提出了一种基于LDB描述子和局部空间结构匹配的快速场景辨识方法。该方法继承了二值特征描述子的快速和节约储存空间特性,利用多点匹配取代单点匹配,排除了大量错配点,提升了匹配准确率。该方法在实时性和鲁棒性方面达到了较好的平衡,在湘潭大学标志性建筑数据集中取得了优于传统匹配方法的结果。(2)将场景辨识看作物体分类问题,利用深度神经网络实现场景辨识。深度网络通过层次化的特征学习,摆脱了传统人工提取特征的局限性,本文利用AlexNet网络,对扩充的湘潭大学标志性建筑数据集进行学习和测试,验证了该方法能大大提高场景辨识的成功率,可靠性优于特征点匹配类方法。(3)基于可判别特征表达学习的场景辨识。为了使学习的图像特征表达具有更强的可判别性,本文研究了基于孪生卷积神经网络的场景辨识方法。通过孪生卷积神经网络的特征表达学习,达到使同一场景的图像对在特征空间上分布紧凑,而不同场景的图像对在特征空间中间隔较远的目的。该方法在公开的具有光照大幅变化特点的街景数据集上进行了测试,在只需少量配对训练样本的前提下,孪生卷积神经网络取得了优良的学习效果,很好地解决了光照大幅变化下的场景辨识问题,辨识效果优于采用深度网络分类来解决该类场景辨识问题的方法。本文研究的场景辨识方法,在解决尺度、视角、照明的剧烈变化场景辨识问题时进行了多方面的尝试,获得的结果具有积极的借鉴意义,相关方法也值得进一步深入研究与分析。
其他文献
瞬时感受器电位香草酸受体l(trannsient receptor potentialvanilloid 1,TRPV1)是一种非选择性阳离子通道,主要表达在感觉神经元上,属于瞬时感受器电位(transient receptor p
Jouissance(原乐)是法国精神分析学家拉康的欲望理论的一个核心概念,而伦理学向度是他的这个概念的关键所在。在拉康看来,原乐不是一般意义上的快感满足,而是欲望主体对快感
声腔史和戏曲史上颇受关注的二黄腔源头问题,因涉及面广且缺乏可靠的证据而一直未获解决,以致多说并存。事实上,在清中晚期,北京、陕西等地往往将产于湖北的西皮调称为二黄腔
本文以央视“两会”品牌节目《见证履职》为话语实例,结合费尔克拉夫和梵·迪克的话语分析路径及方法,辅以新闻生产的视角,从话语文本分析、话语实践分析、话语情境分析和社
雷公藤内酯醇(TPT)是雷公藤的主要活性单体,用于治疗类风湿关节炎(RA)。该研究在体外用不同浓度(0,10,50,100 nmol·L-1)TPT干预RA患者的滑膜成纤维细胞(RASFs)后,用qRT-PCR
目的饲喂不同的饲料,对土鳖虫若虫增重的影响。方法选择45~60日龄的土鳖虫幼虫300g,随机分为3组,每组100g。在土鳖虫生活土配方等条件相同的情况下,实验1组饲喂麦麸,实验2组饲
在以原则为导向的《企业会计准则》制订背景下,注册会计师,特别是执行证券期货业务的注册会计师在具体的执业过程中,均涉及大量的专业判断。然而,由于相关法律法规配套不成熟
"文王受命"、"文武受命"、"武王末受命"、"王受命"、"(我)受命"皆指周受天之命代商统辖疆土、治理民众。"文王受命"、"文武受命"西周早期就已出现,前者流行于西周早期,《程寤
目的在大肠癌高危病人中检测粪便脱落细胞P53基因突变,为从分子基因水平研究并建立一种适于人群筛查与早期诊断大肠癌的新方法作初步临床研究。方法对临床高度怀疑为大肠癌患
<正>笔墨在中国画中体现着的特点,是学习中国画结构模式的依据和标准,尤其是其结构布局在今天的现代设计思维中有着现实的指导意义。中国画的发展源远流长,从史前无意识的岩