基于生物视觉学习机制的神经网络及其在机器人视觉上的应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:okdangdang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人发展经历几十年,从早期实现机械控制到现在已具有简单识别能力的智能机器人,但机器人的视觉与人的视觉依然相差很远,大多数带摄像系统的机器人只能识别颜色。虽然目前图像的处理技术,如编码、压缩、分割、降噪等方面的研究已有了长足的进步,但图像的智能处理技术仍然进展缓慢,已有的图像识别、匹配算法的性能远不能达到“类人”的性能。因此,各个发达国家都进行具有真正视觉和智能的机器人研究。如果希望图像识别技术能有较大程度地提高,仿生学是一个很好的捷径。由于生物视觉系统的复杂性以及对图像处理、图像识别的高效性,很多研究者着力于研究动物甚至人类大脑的视觉系统。 针对以上问题,本文在以下几个方面进行了工作与创新性的探索。 (1)对自主发育机器人进行了带有实时视觉特征学习的探索,在研究了增量获取图像特征和自主发育算法的基础上,把视觉特征抽取和自主发育结合在一起,通过一定的简化,形成能在简单的机器人平台上实现的带有实时视觉特征学习的机器人视觉发育的简化系统。 (2)提出一种具有实时特征学习的、模拟生物视觉多尺度交叠感受野的神经网络(NeuralNetworkSimulatingMulti-scaleOverlappingReceipt-field,NNSMOR),通过无监督的学习获得对外界图像的视觉特征,对不同位置和尺度的感兴趣目标,都可找到它在场景中的位置。 (3)把NNSMOR网络的视觉学习结合有监督学习的识别分类算法,实现机器人对目标的识别和认知,把它应用在机器人视觉上,工程上实现了机器人对感兴趣的目标进行实时跟踪。 (4)引入基于显著性特征的注意力选择(Saliency-BasedVisualAttention)机制,作为多尺度交叠神经网络学习和观察的预处理模块,并在此基础上对原有的NNSMOR网络结构作了进一步改进,在实验中证明改进后的模型比原有视觉学习、认知网络模型比有更大的优越性。 (5)把基于显著性特征的注意力选择和NNSMOR网络的特征提取结合,在两阶段学习的基础上提出了一种带有学习认知的机器人自主注意力选择(Saliency-BasedAutonomousRecognition,SBAR),为自下而上和自上而下相结合的两元注意力选择构架的研究提供了一个新的探索方向。 提出的方法中的(1),(2),(3)部分已编成C++在复旦一号机器人和实验室中简单机器人上应用,第(4),(5)部分也有Matlab的演示。
其他文献
目标识别是一个典型的图像模式分析、理解与分类计算问题,一直以来都是模式识别、机器视觉等领域的研究重点。基于人的生物特征的识别技术作为目标识别领域的一个分支,由于其广
传感器绝对辐射定标是实现遥感数据定量化的前提,是资源卫星遥感信息应用建模的基础,主要包括传感器辐射定标、大气订正和目标信息获取三个部分。 本文实现了一种适合野外工
作为电力系统的核心组成部分,输电线路是电力系统的重要设施,其安全性与可靠性关乎到整个电力系统的安全与稳定。输电线路常发生外力破坏、线路覆冰等问题,线路巡视维护工作量大
研究背景:Rad是Ras相关的小G蛋白RGK家族的一员,最早在糖尿病人的骨骼肌中被发现。一般认为这个蛋白可能与糖尿病和肥胖的发生相关。近期研究表明,与健康人相比,心衰病人心脏中的
原发性高血压是一种严重危害人类身心健康的疾病,环境和遗传因素共同作用导致了血压的升高。肾素血管紧张素醛固酮系统是一种调节血压的重要系统。经研究发现,该系统中的基因
随着隐身技术和反隐身技术的发展,电大目标雷达散射截面(RCS)的测量和计算方法也在不断发展。在测量方面,由于直接测量电大尺寸的目标所需费用较高,所以越来越多的人开始采用缩
副猪嗜血杆菌(Haemophilus parasuis,HPS)是一种多形性的革兰氏阴性短杆菌,属巴斯德杆菌科、嗜血杆菌属,是一种存在于猪上呼吸道的共栖菌,可引起以多发性浆膜炎、关节炎、脑膜炎为
现场可编程门阵列(FPGA)是八十年代中期出现的新型可编程逻辑器件,通过编程,可以把一个通用的可编程逻辑器件配置成为用户需要的硬件数字电路,从而大大加快电路产品的研发周期,
在卫星广播、移动通信系统以及光通信系统中,微波滤波器和耦合器扮演着十分重要的角色。随着单片微波集成电路的宽带化发展,特别是片上系统的研发和应用,滤波器和耦合器也相
LTE协议的出现以及移动终端对于多模制式的需求,对硬件的计算能力、灵活性和功耗提出了较高的要求,粗粒度可重构架构在处理数据密集型算法时效果显著,同时具有较高的灵活性,能够