视觉认知模型在图像特征提取上的应用研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:myna5726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的理解和识别一直都是数字图像处理研究的热点和难点:要实现对图像的理解,最重要的是提取能够准确描述图像的特征。而使用现有方法提取的图像特征进行图像识别时,无论是从识别的时间还是正确率来看,都比不上哺乳动物的视觉系统。因此,研究经过长期进化的生物视觉系统的工作原理和结构,并将其应用到对图像的特征提取上,是解决该问题的有效途径之一。本文研究了Serre、Mutch和Karklin三人分别提出的三种视觉认知模型(以下简称模型1、模型2和模型3)的原理和实现方法,将其应用到图像的特征提取,并对这三种模型提取的图像特征在图像理解和识别方面进行比较分析。  本文首先使用了三种视觉认知模型对灰度图提取图像特征,然后输入SVM对特征分类。通过比较这三种视觉认知模型对图像的分类结果,发现模型1和模型2的计算复杂度较低,可用来对整幅图像提取特征;而模型3的计算复杂度要远高于前两种视觉认知模型,只能用来对特定大小的图像块提取特征,而不适合处理图像集中的大量图像。  基于上述发现,本文使用模型3对自然图像进行分割:首先将自然图像分块,利用视觉模型3计算各个图像块所对应的隐含变量,在隐含变量空间中进行聚类,再将聚类结果映射回图像,从而实现图像的分割。实验中将基于视觉认知模型3的图像分割结果与Normalize Cut算法的结果进行了对比,发现在处理纹理信息丰富多目标图像时,基于模型3的分割算法能得到更好的结果;并且基于模型3的算法的计算量要低于Normalize Cut,且对图像的尺寸没有要求。  本文的创新之处在于:  1.将三种视觉认知模型应用于图像的特征提取,对所提取特征在图像分类上的应用效果进行比较分析;  2.首次将视觉认知模型3应用在对自然图像的分割上,并于Normalize Cut算法比较。
其他文献
移动IPv6作为下一代网络建设的重要组成部分,为用户提供了强大的移动通信支持,已经成为当前网络研究中的一个热点。随着手机、手提电脑等便携式移动通信终端设备的广泛应用,
无线定位技术是各种基于位置服务的基础。目前大多数基于射频信号强度匹配定位算法均采用信号不随时间变化的静态射频指纹(Radio Map)模型,或未有效利用目标连续运动信息,从而
随着数字化技术的发展和三网融合的加剧,IPTV技术正在得到广泛的应用。TS流技术作为IPTV中的关键技术之一,也得到了越来越多的关注,所谓TS流是根据ITU-T Rec H220.ISO/IEC DI
随着电子商务在世界范围内应用的日益广泛,网上交易的数据安全等课题已经成为电子商务领域的重要组成部分。安全套接层协议SSL是Internet上使用最为广泛的进行保密通信的安全
伴随着经济的发展,科学技术的进步及生活水平的不断提高,人们对健康、保健的追求,使得中国的医疗体系发生着巨大的改变。传统意义上的医疗模式是建立在以医院为中心的基础上,而现
视频监控技术一直是人们关注的热点之一,随着网络和计算机的普及,监控探头大量出现在住宅区、公路、银行等场所,为人们的财产安全保驾护航,为公安机关侦破案件提供重要的线索
网页已经成为人们在工作和生活中必不可少的工具之一。除了向用户提供信息之外,网页还担负着用户和互联网之间的交互任务,是用户访问互联网的最主要的接口。在愈来愈强调用户
随着汉语自然语言处理任务的不断深入,汉语句子研究也逐步从句法层面,进入到了语义层面,汉语句子的句法语义分析逐渐成为汉语自然语言处理过程中一个重要的任务。经过多年发
无线Mesh网络(Wireless Mesh Network)简称WMN,是一种具有自组织多跳特性的宽带无线网络。在无线Mesh网络中,任何无线设备都可以同时作为AP和路由器,网络中的每个节点都可以
随着技术的进步和处理器结构的发展,高性能通用微处理器的TLB(TranslationLookasideBuffer)成为系统性能的瓶颈。为加快TLB的访问速度,TLB通常采用全相联结构。全相联的组织模