基于视知觉机制的物体原型表征与应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:yizhonglishi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体表征和识别是模仿人类视知觉能力的一个重要课题,但任务艰难。为了取得更好的效果,我们需要从人类的视知觉机制上有所借鉴。人类视知觉是源自于数亿年的进化而产生的复杂系统。人工智能和计算机视觉领域在模拟人类视觉的应用(如物体识别)上,虽然在近年来取得了不少进展,但仍然难以同人类视知觉的能力相匹敌。这就需要我们从神经生理学和认知心理学对人类视知觉机制的揭示中获取灵感。本文结合了认知心理学模式识别理论中的成分识别理论和视觉拓扑理论等学说的观点,设计出一种更符合人类认知原理的、更具有可理解性的原型表征和训练框架:首先借鉴成分识别理论的观点,从二维混合高斯函数出发,用高斯成分来拟合物体的边缘图像,使得物体的表征成分化;进而给出在两幅训练图像之间匹配对应成分的算法,并以此为基础,设计出从多个样本图中挖掘频繁出现的成分和成分结构的聚类算法,从而将指定物体的样本库中的成分和成分结构信息融合到一个物体原型之中。不同于计算机视觉传统的自底向上的识别方法,这种原型机制借鉴了视觉拓扑理论,用图或树的结构描述了物体的大范围拓扑或结构信息,因此被应用于识别时具备了更符合人类认知特性的自顶向下的知觉特征。为了验证原型的可理解性与是否更符合人类的认知特点,本文还在生成原型之后对其进行重构,即根据原型中所融合出的信息来反向构建出成分图像,以给出一个可视化的训练结果之表示。在原型建立完成后,还初步探索了原型在识别过程中的应用:从原型所重构出的模板图像进行粗匹配,到考虑更高级的、带有自顶向下的识别特点的成分层面之识别。本文给出了成分层面识别的形式化框架描述,把该问题转化成了一个基于能量函数的最优化问题,并初步设计了一些搜索策略来完成物体候选位置的检测。
其他文献
随着计算机和互联网的发展,在自然语言处理领域,以双语名实词对齐为基础的应用日益增多。除了在机器翻译方面的应用的之外,双语名实体词对齐在术语提取、信息检索、翻译词典
随着互联网技术在社会各个领域的不断渗透,互联网在人们生活中的重要性日益增强。蜜罐技术是发现攻击,了解攻击的很好的手段。  传统黑客的攻击目标一般都是互联网上的服务器
军队装备维修教学一直受装备机件庞大,不易教学,设备机件成本高,实习器材匮乏等因素的困扰;而实装教学训练保障投资大,特别是新装备、精密机件要求高,无法实施工作状态下的实拆实装
并行多线程程序设计方法现在已经越来越普及,尤其是在实时系统中,已经成为提高系统实时性的关键技术之一。然而,对共享数据的同步访问机制又在一定程度上降低了程序的并发执行程
随着大规模集成电路的飞速发展和广泛应用,其设计手段的进展缓慢成为技术发展中急需解决的瓶颈问题,迫切要求IC-CAD工具自动设计系统进入更高的层次。而系统功率的增加以及能源
实时信号的处理消费了全世界大部分的计算能力。可编程并行处理越来越多地应用到广泛多样的信号处理中(例如科学计算、视频处理、无线电、医疗、通讯、译码、雷达、声纳和成
随着Internet重要性的日益提高和网络结构的日益复杂,越来越有必要对网络中的流量情况进行深入的了解、分析,以利于发现网络瓶颈,优化网络配置,并进一步发现网络中可能存在的潜在
在全球化的趋势下,教育教学的地位日趋重要,传统的教育教学方式由于其局限性已经无法满足现阶段不断提高的课程学习需求。本文通过对各个高校和培训机构中网络化课程的建设所
随着分布式数据库系统发展,传统的C/S访问模式会对数据库服务器产生瓶颈效应,因此引入移动agent进行分布式数据库访问系统设计,这样可以减少对网络带宽的依赖。另外随着移动设备
中间业务属于新兴的银行业务,主要是为客户提供多种金融服务。银行开办中间业务既可以树立良好的公众形象,也可以取得可观的经济效益,它是银行发展的重要发展方向。随着中间业务