基于中心化权重的主成分分析技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:fuyaomama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据分析、模式识别、机器学习等领域中,主成分分析是经典的特征提取算法之一。不论是一维主成分分析还是二维主成分分析,它们都是以欧式距离的平方作为相似度的度量,这样导致过分偏爱距离较远的点,算法鲁棒性较差。虽然大多数现有的鲁棒主成分分析和有关基于F范数的二维主成分分析方法可以减轻图像分析和模式识别领域中对异常值的敏感性。但是,现有方法不光没有保留优化目标中的数据结构信息,也不具有广义性能的鲁棒性。为了解决上述问题,本论文提出了两种新的基于中心权重的模型,即中心主成分分析(C-PCA)和广义中心二维主成分分析(GC-2DPCA)。针对现有的主成分分析方法没有充分利用数据的结构信息,本文提出基于中心化权重的主成分分析,即C-PCA。该算法利用了类似于线型核主成分分析(L-KPCA)的思想,采用了中心化权重度量相似性,能够更好的保留数据的结构。同时该算法是基于l2范数的最大化样本间协方差的优化模型,利用奇异值分解方法得到C-PCA的重构权重矩阵,接着利用中心化矩阵得到C-PCA的识别权重矩阵。在带有噪声的Extended Yale B、CMU-PIE、AR人脸数据库上进行实验,其结果彰显了该算法的高效性。C-PCA比起现有一类的主成分分析方法确实提升了分类性能,但是它还是保留了不够稳健的重构错误的权重矩阵。针对C-PCA的缺陷,本文提出了基于l2,p范数的二维主成分分析模型,其拥有着稳健的泛化性能,依然保留了旋转不变性,并采用了一种全新的非贪心迭代算法来求解该模型,优化的时间将更短,收敛的速度将更快,得到更优的目标函数值。GC-2DPCA仍然保留了C-PCA使用相似信息来学习数据内部结构的特性,也会得到两个不同而有紧密联系的权重矩阵。在此基础上,GC-2DPCA将充分利用l2,p范数的优势,更进一步探索数据内部之间的联系,从而达到更稳健的泛化模型。通过将GC-2DPCA应用到含有噪声的Extended Yale B、CMU-PIE、AR人脸数据库上进行图像重构和图像识别,可以得出,该算法的识别效率相对提高4.9%和重构错误相对降低5.8%。
其他文献
作为一种流行的人体生物识别技术,步态身份识别因其在安防监控和人机交互等领域中广阔的应用前景和经济价值,引起了研究人员的广泛关注。现有的步态身份识别技术大多依赖于专用的设备,由于受设备自身条件和使用环境的限制,无法全面满足不同应用场景的识别需求。利用Wi-Fi信号进行人体行为感知具有成本低、非入侵、普适性好等优势,可以用来弥补专用设备的不足。本文研究基于Wi-Fi信道状态信息(Channel Sta
计算机视觉作为目前深度学习应用最为热门的研究方向之一,主要包含图像分类,目标检测,语义分割等子问题。近年来,由于卷积神经网络的发展,图像分析相关模型的性能得到了突飞猛进的提升。同时由于网络结构的不断进化,模型所需要的计算开销也呈现爆炸式增长。在保证模型性能的基础上降低模型所需参数、提高模型运行速度具有重要的研究意义和应用价值。蒸馏学习是近年来提出的模型轻量化方法,该方法通常将庞大臃肿的模型中的知识
在解决复杂的大规模图处理任务时,需要频繁交替使用图查询与图分析,然而目前在理论上图查询与图分析尚未统一,造成查询与分析结果的可靠性无法保证,进而导致查询与分析的优化方法有限。所以如何统一图查询与图分析,设计包含图查询与图分析的统一理论框架对于高效解决大规模图处理任务十分重要。本文基于SPARQL图查询语言,建立统一的图查询与图分析理论基础,包括其语法及语义,并研究讨论其基础理论性质,即表达性与复杂
随着科技发展,诸如全球定位系统之类的位置获取设备的部署迅速增长,目前已经产生了庞大的轨迹数据,其中包含许多有价值的信息,并且已经被用于许多实际应用中,比如城市计算和智能交通系统。对这些轨迹数据的分析处理成为关键,本文提出了一种基于轨迹分段的新颖轨迹总结方法。它是一种综合了轨迹异常检测、轨迹聚类和轨迹分段的多角度分析方式。本文的基于分段的轨迹总结框架包括五个阶段。首先,执行基于搜索窗和相对距离比的异
车载自组织网络(VANETs)是移动自组织网络中的一种,它支持车对车(V2V)和车对基础设施(V2I)通信。自组织性、分布式网络和高度动态的拓扑是VANETs的三个重要特征。VANETs的特点及其在道路安全中的应用引起了工业界和学术界的浓厚兴趣,它在改善交通管理系统,控制交通流量以及改善用户驾驶体验方面有着重要研究意义。然而在这些应用部署前必须先解决网络中信息安全和用户隐私保护问题。聚合签名认证协
如今,越来越多的应用和系统都由神经网络(深度学习)所驱动,影响着或者将影响人类日常生活中的许多方面,比如推荐系统、人机交互甚至是安全防护等领域,具体场景包括信用账户评估、垃圾邮件过滤、车牌识别等等。但是神经网络本身也有缺陷,即便是基于深度神经网络的图像分类器也容易受到微小的、难以察觉扰动的影响。恶意生成的对抗样本,虽然不会对人类肉眼的识别过程造成较大的影响,但它却会利用神经网络的不稳定性,误导模型
知识图谱的表示学习旨在将实体和关系投影到低维连续的向量空间中,从而使知识图谱与机器学习模型兼容。知识图谱补全是预测实体之间缺失关系的任务,知识库中有大量的关于实体描述的重要文本信息,而现有的基于卷积网络结构的知识图补全模型只仅仅考虑表明实体之间关系的知识三元组,而没有考虑到实体的文本描述。为此,论文提出了基于门控卷积神经网络的文本增强嵌入模型(GConvTA),将三元组的结构向量与实体描述编码得到
线条画是一种简单有效的形状可视化工具,它使用简单的线条表示图像的主要信息。线条画的特点主要包括连续性与艺术性两个方面。连续性是指画家在绘画时使用连续的线条进行绘制;艺术性是指画家在绘画时有自己独特的风格,而不是单纯地临摹物体的边缘,绘制的线条画具有一定的艺术性和吸引力。针对目前方法生成的结果中存在的线条不连续的问题,提出了一种基于边缘切向流和显著性图的连续性增强的线条画生成方法。通过沿边缘切向流进
目标跟踪技术,指在第一帧框选出感兴趣的目标,随后在一段图像序列中的每一帧图像实时地跟踪感兴趣的运动目标,是计算机视觉中的一项重要技术,在视频监控、安全监控、自动驾驶和人机交互等方面有着广泛的实际应用。其中主动目标跟踪是利用带移动平台的相机,通过图像反馈控制相机运动自动跟踪感兴趣的目标并使其始终保持在视野中心,相比于静态相机跟踪,能够具有更广泛的视野,并更好的关注目标。但是这种只使用一个相机而忽略来
高尔基体从内部结构上可以被细分为三个组成部分:高尔基体顺面网络,高尔基体堆和高尔基体反面网络。高尔基体驻留蛋白质是每个组成部分功能的主要承担者,蛋白质亚高尔基定位预测是确定高尔基体驻留蛋白质在高尔基体内部的位置,有助于深入了解高尔基体内部的工作机制。本篇论文中我们首次将高尔基体堆作为高尔基体定位考虑到蛋白质亚高尔基的定位预测中,构建了第一个包含有三种类型高尔基体驻留蛋白的基准数据集。在对蛋白质序列