基于机器人视觉的场景图像分类的应用研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:wingkong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步,家庭服务机器人将拥有更加广阔的市场前景。对于工作在环境复杂中的机器人,快速有效的场景识别能够让机器人很好地感知和理解场景环境,这是机器人要实现自主导航和探索环境的先决条件。知道机器人当前场景语义(情景)类别不仅仅能帮助机器人的导航,同时也大大提高了其理解场景和更好地服务于人类的能力。本论文主要针对的是视觉场景分类(VPC)问题,其中提到使用在有自主能力的机器人平台上收集到的视觉信息来预测地方的场景类别。由于场景图像具有随机的、多种多样的、复杂的等特点,且对复杂环境中多类物体的识别技术仍不成熟,因此如何设计有效的场景图像处理方法成为机器视觉领域仍然极具挑战性和探索性的热点问题。支持向量机算法是在严谨的理论基础之上建立起来的,在解决样本很小、不是线性而且维数又高的模式识别问题中有它特有的优势,在识别准确率和处理时间上都表现出优越性。近年来,SVM已被成功地应用于模式辨识、分类、以及回归分析等研究领域。然而,现有的支持向量机应用研究忽视了一个问题,那就是如何将专家逻辑经验与SVM方法有效结合起来。在实际的工程应用中,我们通常对某些待分析的数据信号拥有一定的先验知识。因此,研究一种新的把支持向量机和专家先验知识有效结合起来的模糊支持向量模型,是SVM算法面向工程应用领域一个急需解决的重要问题。本文结合场景图像分类的实际应用背景,研究了SIFT特征提取算法和模糊SVM算法的一些相关问题。论文的主要工作及研究如下:首先,本文介绍了图像场景分类一些相关的背景知识,以及对其进行研究的意义;分析了视觉机器人、图像场景分类、支持向量机和视觉字典容量获取等的研究现状。其次,本文罗列了图像场景分类的流程设计。阐述了SIFT (Scale-invariant feature transform,尺度不变特征转换)特征和CTH (Census Transform Histogram,统计变换直方图)特征提取的详细过程;并且通过对比,简单分析了K-均值聚类和AP聚类算法分别对应的优缺点:K-均值聚类算法需要人为设定聚类中心数目,而且会因为初始聚类中心的不同会导致聚类结果的不同。而AP聚类算法则是通过算法的迭代自动来获取聚类中心,而且在整个迭代过程,经过44次就趋于稳定。因此,本文直接选用AP聚类算法来生成视觉字典、并且获取到视觉字典的容量。此外,还分析了AP聚类算法中的两个参数对聚类结果的影响。第三,本文对场景图像特征的提取方法进行了深入研究,给出了SIFT特征的获取和CTH特征获取的两种特征描述方法。分别详细讲述了这两种方法的具体原理和过程,包括经典的SIFT特征提取、改进的SIFT特征提取以及使用均匀网格法提取SIFT特征;统计变换算法、统计变换直方图算法和提取CTH特征向量的步骤。然后在第五章实验对这两种特征描述方法的分类效果进行比较。最后,介绍了PCA-SIFT算子的获取以及对获取PCA-SIFT算子后对数据的预处理。第四,本文首先对提取到的特征矩阵数据进行了预处理。然后介绍了聚类算法的设计部分,以及用AP聚类算法获取视觉字典容量的流程,最后使用SVM分类器实现图像的场景分类。使用AP聚类算法得到了视觉字典容量和识别率之间存在的一条关系曲线。然后改变AP聚类算法的参数—参考度P,分析了不同参数对场景分类结果的可能影响。并利用IGP (In-Group Proportion,类内比例)准则来评价AP聚类的性能。第五,进行了实验仿真,并且对实验的结果作了详细的解析。最先,使用AP聚类算法获得了视觉字典容量与识别准确率间的关系曲线。实验数据说明:利用AP聚类可以快速生成视觉字典和获取其容量,并且实现分类的准确率也很高,可以达到80%以上。本文还给出了几个重要的参数对实验结果的影响,通过IGP的值选择参考度的值,验证了AP聚类的有效性和得到的视觉字典容量的合理性。最后,对比了SIFT特征描述和CTH特征向量描述这两种特征提取方法,对场景图像分类的不同效果,通过数据证明了CTH特征可以更准确而且快速地实现图像场景分类。第六,对本文所做的工作做出了总结,并给出了后续的研究建议和方向。
其他文献
臭氧因其独特的物理性质被广泛的应用于生活、工业生产、医疗保健等众多领域。臭氧的产生主要有电解法、紫外线照射法、放射化学法和介质阻挡放电法,其中介质阻挡放电法因其独特的优势被现代科研工作人员广泛的采纳。现阶段,DBD型臭氧发生器的供电电源大多采用串并联谐振式逆变电源,通过调节施加在臭氧发生器上的正弦或准正弦激励的幅值和频率来调节发生器的放电功率,进而调节臭氧发生器的产量。但DBD型臭氧发生器放电的效
工业发酵是在密闭的容器中进行,利用夹套进行加热和冷却,其温度控制具有很大的应用价值。但这种被控对象往往存在严重的积分纯滞后现象,采用常规的控制算法难以达到所要求的控制
数据挖掘是知识发现(KDD)过程中的核心部分,数据挖掘是从大量数据中发现有趣模式,即从数据库海量的数据中找出隐含的、未知的、但却是非常有用的信息。关联规则是数据挖掘重
随着世界经济的长期持续发展,商品供应日益丰富,顾客和用户的消费品位不断提高,对产品和服务的多样性需求有增无减,追求个性化的趋势愈演愈烈,这就要求企业在整合其资源时具有高度
针对典型的工业过程对象,本文首先阐述了常规的PID控制器参数整定方法。然后从鲁棒控制的三个基本问题,即模型不确定性信息、鲁棒稳定性和性能指标、鲁棒控制器的设计入手,利
为了提高企业的综合实力和生产效率,企业自动化和信息化成为必然。在此基础上,本文研究了监控系统在电镀行业内的具体应用。某集团深孔电镀车间由于种种原因,系统自动控制方
冷轧带钢属于高附加值钢材品种,是汽车、机械、建筑、电工电子等行业必不可少的原材料。板带精度越高,液压压下量就越大,对轧辊主电机的功率要求也就越高,为简化设备,提高控制精度
嵌入式USB主机技术作为一项USB领域新的发展技术,最近两年,得到越来越多的关注,目前,USB主机的角色大多数情况下都是由PC机担当,随着USB设备数量的不断扩大以及USB设备形式的
目前,计算机视觉在工业生产和高科技应用中越来越显示其举足轻重的作用:遥感图像分析、文字识别、医学图像处理、多媒体技术、智能交通系统、国防、图像数据库、工业检测、安
开放式数控系统是先进制造技术的重要应用领域,具有兼容性好、易于扩展、开发维护方便、适应性好的优点,是现代数控技术的发展方向。随着CAD/CAM技术在足底矫形器制造业中的应