特征提取算法的研究与改进

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ccnuzgq1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别领域中,如何利用已有样本进行训练并提取特征,使各类样本具有异于它类样本的特征成为迫切需要解决的问题。目前虽有许多成熟的特征提取方法,但在某些情况下这些方法的性能并不理想,有改进的必要。根据样本的类别个数,可以把模式识别分为两种:两类样本问题和多类样本问题。基于核的最小平方误差方法(KMSE)和Fisher判别分析方法(FDA)分别广泛应用于这两种问题的特征提取过程中。本文对这两种方法进行了分析和研究,并对它们进行了相应的改进。我们通过分析KMSE模型的结构得知此模型不具有唯一解。为了从KMSE模型的解空间中选择最优解,我们引入了一个衡量解向量优劣的准则。此准则不仅能够近似的说明通过KMSE提取到特征的可分性,而且不受解向量模的影响。利用引入的准则作为限制条件,我们给出了一种新的KMSE模型求解方案,并通过在Essex人脸数据库上的实验进行验证。KMSE模型的另一个缺点是特征提取效率与训练样本的个数成反比。在得到一个样本的特征提取结果之前,KMSE模型必须计算与所有训练样本同等个数的核函数。为了提高特征提取效率,基于判别向量可以由一部分关键样本线性表示的假设,我们构造了改进的KMSE模型。在此模型中,我们只需计算与关键样本相同个数的核函数即可完成特征提取。而关键样本只占训练样本的很少一部分,因此改进的KMSE模型具有较高的特征提取效率。我们为此模型设计了两个算法,并通过六个样本集上的实验验证了它们的有效性。除了应用于两类样本问题的KMSE模型,我们还分析了能够有效的对多类样本进行降维的FDA方法。已有的FDA方法要么忽略了判别向量之间的相关性,要么具有较高的计算复杂度。本文提出了一种能够快速计算正交判别向量的方法,并设计了两个算法来实现这一方法。在类内散布矩阵可逆的情况下,通过此方法计算得到的判别向量是相互正交的,文中利用定理证明了这一结论。我们通过人脸识别实验、手写体数学识别实验以及七个UCI数据集上的实验验证文中提出方法的有效性。
其他文献
随着企业信息化步伐的加快,企业对于自身信息安全的需求也在逐渐的加强。使用公钥基础设施(PKI)是解决此类问题的关键基础。但是,在我国PKI的发展还远远不能满足企业的需求。
随着移动终端设备的迅速普及以及移动通信技术的不断发展,移动互联网已经全面进入人们的日常工作和生活。同时,基于位置服务(Location Based Service,LBS)也越来越受到人们的重视,
僵尸网络是一种极具威胁性的恶意程序,它可用于大规模网络攻击和网络经济犯罪,对政府、企业和个人的信息安全都构成严重威胁,其复杂的网络布局和通信协议使得针对僵尸网络的防范
在信息技术迅速发展的今天,数据库面临着严峻的安全问题。访问控制是解决数据库安全问题的一种重要方法。本文结合数据库安全和操作系统安全,将基于角色的访问控制方法、文件
Flash是以流控制技术和矢量图形技术等技术为代表的一种多媒体形式。通过将矢量图、位图、音频、动画、交互动作有机地、灵活地结合在一起,Flash这种多媒体形式能够制作出美
随着互联网行业的快速发展,如何快速高效处理大规模实时数据成为当前研究重点。可持续Top-K查询算法主要是用于流数据的应用上,基于某种函数关系实时选取得分最高的K项。这种算
人脸分析是近年来计算机视觉与模式识别领域里的热点研究问题之一,因为它在身份认证、视觉监控、人机交互、娱乐动画、以及多媒体等领域有着广泛的应用前景。人脸分析的研究
随着软件技术的发展,软件测试受到越来越多的重视。在软件测试中,测试数据的选择是进行结构测试的一个难题,测试数据直接关系到错误能否被预期测出。对于测试数据自动化生成
随着计算机和网络的普及,越来越多的人们通过网络进行交流,即时通讯软件已经成为网民最常用的网络工具之一。目前比较流行的即时通讯软件如:QQ,MSN和雅虎通等,这些主流的即时通讯
对于遍布全球各地的各类企业而言,企业应用数量与规模的增长总是伴随着旨在提供信息交换渠道的计算与网络础架构的不断扩建。企业内部会有多种为了不同目的而建置的信息系统,