基于卷积神经网络的场景理解方法研究

被引量 : 0次 | 上传用户:z58119366
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景理解是计算机视觉的一个重要研究问题,在机器人导航、自动驾驶、环境检测、基于内容的图像搜索等多个应用场景中,具有广泛的应用价值。在理论方面,场景理解研究如何让机器能够像人一样理解图像的语义信息,是早期视觉研究提出的几个重要任务之一,至今仍然没有得到较好的解决。场景理解包括场景标注、物体检测及识别、以及最终对于场景本身的语义理解等。场景理解的一个难点是如何获得图像对于平移、旋转、尺度变化具有一定不变性的语义特征。基于视觉认知机制提出的卷积神经网络能够在有监督模式下,基于大量样本学习到具有一定鲁棒性的特征,近年来在计算机视觉、语音识别等多个领域获得了突出效果。然而作为特征提取工具,卷积神经网络的模型选择往往花费大量时间。虽然卷积神经具备局部平移不变性,其对于尺度变化还不具备较好的鲁棒性,学习到的中高层特征也不能得到较好的语义解释。本文利用卷积神经网络作为特征提取工具,通过研究卷积神经网络具有多尺度信息的模型,初步解决场景理解中交通标志检测和场景标注任务。在具体任务中,本文对卷积神经网络的模型选择和参数选择进行了研究。实时的目标检测需要从图像中迅速获得包围框。而卷积神经网络对包围框位置和尺度准确性的要求比较高。在交通标志检测问题中,本文首先使用SVM将RGB图像转化为灰度图像,再使用固定卷积核的卷积神经网络获得多个尺度下的包围框,并使用多阶段的卷积神经网络对包围框进行识别。在德国交通标志检测数据集上,我们在指示类标志中获得了第二名,而在警告类标志中获得了第三名。在场景标注中,本文使用多尺度卷积神经网络对场景进行基于像素的标注。使用多尺度卷积神经网络充分利用了不同尺度下的语义信息。在卷积神经网络标注后,本文使用全连接条件随机场消除部分不准确的标注。我们在斯坦福背景数据集上获得了79%的平均像素准确率,处理速度为平均每张图片2秒的时间。
其他文献
在当下中国的语境中,中产阶级或中间等级往往被人们直观地理解成“白领+小老板”,很少有人会将中产阶级与资产阶级联系起来,这其实是历史语境的不同所造成的理解差异。实际上在中
目的 观察孟鲁司特钠联合匹多莫德治疗毛细支气管炎的效果.方法 120例毛细支气管炎患儿随机分为观察1组、观察2组和对照组.观察1组除常规治疗外给予孟鲁司特钠口服,观察2组在
近年来经济下行背景下,小微企业融资难融资贵的老问题遇到新情况。本文在对福建省莆田市小微企业经营及融资情况进行问卷调查的基础上,剖析经济下行背景下小微企业融资难融资
乡镇干部思想政治教育作为思想政治教育和干部教育的一项任务,对其实效性研究具有十分重要的意义。淮北市是安徽省、江苏省、河南省和山东省交界处的一个地级城市,作为中东部
1金秋梨“金秋梨”是湖南黔阳农技工作者从砂梨系统中选出的新品种。1999年被定为湖南重点推广的品种之一(据《湖南省农业产业化发展规划》),曾在1994年成都全国星火科技精品展示会上获金
目的:合成抗乙型肝炎病毒(HBV)药阿德福韦酯。方法:以腺嘌呤和三氯化磷为起始原料,分别合成9-(2-羟乙基)腺嘌呤(4)和对甲苯磺酸二乙氧基磷酰基甲酯(6),4与6在NaH作用下缩合后
随着城市和建筑中垂直交通方式的频繁运用以及社会中需要特殊关爱的老年人群数量的增加,人类越来越多地依赖楼梯.楼梯不可缺少,扶手的作用更不可低估.遗憾的是许多楼梯未能正
公务员激励机制是公务员制度的重要组成部分,完善公务员激励机制是提高公务员素质、提升政府效能的迫切要求。然而目前的公务员激励机制存在诸多弊端。公务员的绩效考核是激
<正>WANG ZHENMING:THE BACKGROUNDCITYOF THE RISE OF COMPLEX王震铭:城市综合体兴起的背景城市综合体在国内大量开发、迅猛发展,不仅在一线城市,甚至经常看到二三线城市都