视觉认知模型在图像特征提取上的应用研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户：myna5726

【摘要】

：

图像的理解和识别一直都是数字图像处理研究的热点和难点:要实现对图像的理解,最重要的是提取能够准确描述图像的特征。而使用现有方法提取的图像特征进行图像识别时,无论是

【作者】

：

邵帅

【机构】

：

北京师范大学

【出处】

：

北京师范大学

【发表日期】

：

2011年期

【关键词】

：

视觉认知模型特征提取图像分割 Normalize Cut算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像的理解和识别一直都是数字图像处理研究的热点和难点:要实现对图像的理解,最重要的是提取能够准确描述图像的特征。而使用现有方法提取的图像特征进行图像识别时,无论是从识别的时间还是正确率来看,都比不上哺乳动物的视觉系统。因此,研究经过长期进化的生物视觉系统的工作原理和结构,并将其应用到对图像的特征提取上,是解决该问题的有效途径之一。本文研究了Serre、Mutch和Karklin三人分别提出的三种视觉认知模型(以下简称模型1、模型2和模型3)的原理和实现方法,将其应用到图像的特征提取,并对这三种模型提取的图像特征在图像理解和识别方面进行比较分析。　　本文首先使用了三种视觉认知模型对灰度图提取图像特征,然后输入SVM对特征分类。通过比较这三种视觉认知模型对图像的分类结果,发现模型1和模型2的计算复杂度较低,可用来对整幅图像提取特征;而模型3的计算复杂度要远高于前两种视觉认知模型,只能用来对特定大小的图像块提取特征,而不适合处理图像集中的大量图像。　　基于上述发现,本文使用模型3对自然图像进行分割:首先将自然图像分块,利用视觉模型3计算各个图像块所对应的隐含变量,在隐含变量空间中进行聚类,再将聚类结果映射回图像,从而实现图像的分割。实验中将基于视觉认知模型3的图像分割结果与Normalize Cut算法的结果进行了对比,发现在处理纹理信息丰富多目标图像时,基于模型3的分割算法能得到更好的结果;并且基于模型3的算法的计算量要低于Normalize Cut,且对图像的尺寸没有要求。　　本文的创新之处在于:　　1.将三种视觉认知模型应用于图像的特征提取,对所提取特征在图像分类上的应用效果进行比较分析;　　2.首次将视觉认知模型3应用在对自然图像的分割上,并于Normalize Cut算法比较。

其他文献

基于分层快速移动IPv6切换的研究

移动IPv6作为下一代网络建设的重要组成部分,为用户提供了强大的移动通信支持,已经成为当前网络研究中的一个热点。随着手机、手提电脑等便携式移动通信终端设备的广泛应用,

学位

移动IPv6切换延迟F-HMIPv6IPv6组播MLD

时变信号环境下的无线定位技术研究

无线定位技术是各种基于位置服务的基础。目前大多数基于射频信号强度匹配定位算法均采用信号不随时间变化的静态射频指纹(Radio Map)模型，或未有效利用目标连续运动信息，从而

学位

室内无线定位射频指纹定位粒子滤波空间相关性模型动态射频指纹模型

流媒体服务器TS流封装的实现及流控的研究

随着数字化技术的发展和三网融合的加剧,IPTV技术正在得到广泛的应用。TS流技术作为IPTV中的关键技术之一,也得到了越来越多的关注,所谓TS流是根据ITU-T Rec H220.ISO/IEC DI

学位

流媒体服务器MPEG-2-TSPCRUDPRTP流控

基于OpenSSL的SSL协议设计与改进

随着电子商务在世界范围内应用的日益广泛,网上交易的数据安全等课题已经成为电子商务领域的重要组成部分。安全套接层协议SSL是Internet上使用最为广泛的进行保密通信的安全

学位

SSLOpenSSLKRBKRI密钥恢复安全报文

基于ARM的生命体征实时远程监控平台的实现

伴随着经济的发展，科学技术的进步及生活水平的不断提高，人们对健康、保健的追求，使得中国的医疗体系发生着巨大的改变。传统意义上的医疗模式是建立在以医院为中心的基础上，而现

学位

医疗监控设备生命体征实时远程监控监控平台嵌入式操作系统

基于3G的移动视频监控系统的设计与实现

视频监控技术一直是人们关注的热点之一,随着网络和计算机的普及,监控探头大量出现在住宅区、公路、银行等场所,为人们的财产安全保驾护航,为公安机关侦破案件提供重要的线索

学位

无线视频监控第三代移动通信Android实时传输协议多媒体

网页表观的视觉感知与学习

网页已经成为人们在工作和生活中必不可少的工具之一。除了向用户提供信息之外,网页还担负着用户和互联网之间的交互任务,是用户访问互联网的最主要的接口。在愈来愈强调用户

学位

视觉感知网页表观人机交互用户体验支持向量机

汉语事件描述单元的自动识别

随着汉语自然语言处理任务的不断深入,汉语句子研究也逐步从句法层面,进入到了语义层面,汉语句子的句法语义分析逐渐成为汉语自然语言处理过程中一个重要的任务。经过多年发

学位

事件描述单元自动识别句法语义分析

无线mesh网络多路径路由协议的研究与设计

无线Mesh网络(Wireless Mesh Network)简称WMN,是一种具有自组织多跳特性的宽带无线网络。在无线Mesh网络中,任何无线设备都可以同时作为AP和路由器,网络中的每个节点都可以

学位

无线网状网路由协议多路径稳定度熵路径不相交

高性能通用微处理器TLB性能优化技术研究

随着技术的进步和处理器结构的发展，高性能通用微处理器的TLB(TranslationLookasideBuffer)成为系统性能的瓶颈。为加快TLB的访问速度，TLB通常采用全相联结构。全相联的组织模

学位

片上多核处理器TLB结构性能优化变页技术超页提升策略程序性能

视觉认知模型在图像特征提取上的应用研究

与本文相关的学术论文