基于潜在语义的场景分类与识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:m634606037
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类和场景识别,是指将大量数字图像进行分类,并进一步检测出该图像的场景意义,用以代替人的视觉判读。在国防安全、智能车辆、医疗监护、智能机器人和视频压缩等诸多领域都具有广泛的应用前景和市场价值,是计算机视觉中极具挑战性的前沿课题之一,近年来吸引了国内外众多科研人员的兴趣。因而本课题的研究具有重要的理论意义和广泛的现实意义。   本文主要围绕图像分类和场景识别展开研究。重点研究了图像特征的分析提取,基于潜在语义的图像分类,并在此基础上使用关联规则实现图像的场景意义识别。   本文首先深入研究了比例不变特征的基本概念、核心思想、特征值的描述方法、提取方法与步骤,分析了其固有的优势和存在的不足。然后针对其存在的不足,分别从提取方法和描述形式两方面介绍了两种新的变体:主元分析比例不变特征和快速近似比例不变特征。   在图像方面,借用传统的文本分类思想,采用了潜在语义概率模型,将图像特征提取出来,二维的图像信息映射成视觉关键词集合,既保存了图像的局部特征又有效地压缩了图像的描述,使得自然语言处理的各种技术和方法能十分有效地应用于物体识别领域。并且,针对词元聚类问题,采用基于网格密度的聚类,它的指导思想是,只要一个网格的点的密度大于某个阈值,就把它加到与之相近的聚类中。   在场景识别方面,先针对特征匹配的问题,改进了常用的KD-Tree,使用了PCA,根据各维数之间的协方差,求出它们的主成份奉献率,再按主成份奉献率进行维数优先级排序,并在该基础上增加了KD-Tree各节点的权重。再通过使用类似于Apriori的算法,根据训练图像建立起关联规则库。接着,使用规则库对目标图像的进行场景识别。   最后,本文运用软件框架和设计模式的基本理论和思想,设计并实现了一个图像分类和场景识别的系统框架,里面包括了完整的图像分类识别过程,其中涉及图像采集、图像预处理、特征检测、提取与匹配、特征聚类、图像分割、复杂的数学计算、关联规则分析等一系列步骤,既可以作为科研实验之用,也可以方便地扩展为其它应用。  
其他文献
科学研究和工程实践中许多优化问题都可归结为一个多目标优化问题。多目标优化问题起源于许多实际复杂系统的设计、建模和规划.这些系统所在的领域包括工业制造、城市运输、
工作流技术是进入90年代以后计算机应用领域的一个新的研究热点。对工作流技术进行深入的研究对于提高企业的信息化程度、运行效率以及竞争能力都有着重要的意义。工作流技术
随着互联网技术的蓬勃发展,即时通讯技术发展迅速。即时通讯技术以其双向互动的交流方式吸引了大量用户。在企事业单位中,即时通讯更是为企事业人员的交流带来了极大的便利。XM
基于人工智能的计算机动画自动生成(AGCA)研究,是研究自然语言故事剧本到最终动画生成的过程。具有智能的动画角色研究是动画自动生成系统研究的重点,智能动画角色情感研究是智能
进入二十一世纪,人类已步入信息化时代,对电子化、信息化应用的需求也越来越迫切,信息资源的价值和地位也愈发明显。然而人们驾驭信息的能力却没有得到同等的提高,尤其是企业和政
随着越来越多的学生选择出国深造,对世界范围内的大学进行排名比较显得越发重要。而且近年来我国高等教育得到高速发展,到底我国高校建设目前处于何种水平,以及我国高校距离世界
讲故事作为人类传递信息和交流感情的重要手段,一直随着人类社会的发展而不断涌现出新的表现形式。近年来,随着计算机科学技术和人工智能理论的发展,人们开始系统的研究和探索如
随着Internet的迅速增长以及IPv4地址空间的耗尽,IPv6作为下一代网络互联协议,对IPv4的取代不可避免的成为必然。邻居发现协议(Neighbor Discovery Protocol)是IPv6协议的一个重
无线Mesh网(Wireless Mesh Networks,无线网状网)是一种多跳网络,具有自组织、自配置等特点,它的网络具有可扩展性、健壮性,高带宽和高信道利用率等优势,使得它成为一种下一代无线
进入21世纪,信息技术以自工业革命以来最快的发展速度、最强的渗透能力,广泛应用到经济、军事、文化和社会生活的各个领域中。软件作为信息的载体,其质量尤其是可用性、可靠性、