基于视觉和几何特征的街景图像语义分割

被引量 : 0次 | 上传用户:yanhe100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字图像已成为信息传递的有利载体,广泛应用于社会生活的各个领域。对图像中的场景进行分析和理解是计算机视觉的目标之一。街景与人们日常生活紧密相关,对这类图像进行语义分割和理解具有广阔的前景,但也充满挑战。目前的图像分割算法大多是针对某一类图像进行的,且图像场景比较简单,包含的对象类别较少;同时,一般的图像分割算法对图像的旋转、缩放和亮度等信息比较敏感,势必会造成因上述信息的变化而产生不同的分割结果,从而产生误分割。近年来,把图像分割和图像的识别与理解结合起来,对输入图像进行语义分割的研究非常活跃,但是当图像中同时存在多类不同形状和大小的对象时,如何有效地获取不同语义对象之间的边缘信息,依然是个具有挑战性的问题。街景图像内容丰富,包含多种对象类别,相当复杂,对这类图像进行语义分割,具有非常重要的研究价值和实际应用价值。本文针对街景图像,提出了利用空间极值点作为分水岭分割算法的种子点,对输入图像进行分割,然后结合图像识别技术,利用高阶马尔科夫随机场模型,对图像进行标注,完成输入图像的语义分割。首先,构建输入图像的高斯金字塔,获得不同尺度下的版本,提取出其空间极值点,作为分水岭分割算法的种子点。根据图像分割的两个基本原则,对分水岭分割算法的输出图像进行去除噪声区域和合并满足相似性判决阈值的区域,得到无监督初始分割结果。其次,针对单纯利用图像的视觉特征不能得到较好的对象边缘的问题,本文除了采用外貌特征、形状特征和上下文特征等视觉特征外,还利用了包含丰富结构信息的相对于摄像头的高度、距摄像头轨迹最近距离、与图像平面之间的夹角、追踪到的点密度等五种几何特征,以获取语义对象之间的边缘信息;另外,在语义识别的过程中,通过在马尔科夫随机场模型中引入高阶项,以初始分割结果作为该高阶项的输入,进一步增强语义对象之间的边缘响应。本文的研究重点主要包括:(1)如何获取在一定程度上满足人眼视觉感知特性的无监督初始分割结果;(2)应用外貌、形状和上下文等三种视觉特征和相对于摄像头的高度、距摄像头轨迹最近距离、与图像平面之间的夹角、追踪到的点密度等五种几何特征进行图像边缘检测和识别;(3)在马尔科夫随机场模型中加入高阶项以加强图像识别效果。实验结果表明,利用空间极值点作为分水岭分割的种子点,具有很强的鲁棒性,同时,这种算法提取出的种子点不随图像尺度变化而变化。在马尔科夫随机场中,加入了高阶项之后,能够较好地保持对象间的边缘,获得了较好的语义分割效果。
其他文献
基于学科素养的课程教学改革成为教师关注的话题。化学是一门基础学科,探索化学核心素养的培养具有重要意义。本文从课堂教学、实验教学、课后作业三个方面探索了如何培养学
在江苏省沿江开发战略和物流业振兴规划背景下,常州港如何在夹缝中生存,首先需要明确港口发展定位、优化港口布局。文章通过分析常州港现状发展条件以及发展机遇,明确了港口
电压质量是电力系统电能质量的重要指标,无功潮流的合理分布,可以直接提高系统的电压质量。通过电力系统无功优化控制可以改善电网的无功潮流分布,从而降低系统的有功网损和
教师信念是教师对关于教与学的真实的坚定不移的看法,包括教师对教学、课程、学生、教师角色等的认识。教师的职前经验及在职经验都会对教师信念产生影响。教师信念与课堂教学
<正>投资要点1、中国为全球第二大种业市场。2、技术升级变迁中。2016年我国种子市场总规模1230亿元,近十年复合增速9.42%,为全球第二大种业市场。玉米和水稻占据国内种业市
期刊
<正>中国网络媒体最近十年变化的核心,是从重视人与内容的关系转变为越来越重视人与人之间的关系。无论是QQ、微博、微信、易信,还是YY、陌陌,这些产品极大地拉近了人与人之
目的建立SD大鼠的卡氏肺孢子菌肺炎(PCP)的实验动物模型,观察肺组织病理变化特点和卡氏肺孢子菌(Pc)的超微结构特征,探讨其致病机制。方法地塞米松皮下注射诱导sD大鼠PCP,肺印片吉姆
睡眠是人体生命活动中重要的生理过程,睡眠质量的好坏对人们的健康起着决定性的作用。目前,我国人口老龄化正在逐步成为社会发展的必然趋势,而睡眠问题是老年人群身体和生活
目的:观测RhoA/ ROCK信号通路对小鼠脑脉络丛Klotho(KL)蛋白表达的影响。方法:24只昆明小鼠,随机分为三组,即正常对照组,一氧化氮合酶(Nitric Oxide Synthesis, NOS)抑制组(L