【摘 要】
:
当今,高维度的数据集被广泛应用于各个科学和工程领域的研究中。为了有效的分析这些数据集中的向量并实施各种智能算法,往往需要在保持原向量大部分信息的前提下,减少向量的维度。在众多的降维方法中,主成分分析是最常见、应用最广泛的一种数据分析与降维技术,在理论发展和实践应用上被不断地丰富。传统主成分分析方法对原始向量的协方差矩阵进行特征值分解,从而得到用于降维的变换矩阵。然而,在原始向量的总数低于向量的维度
论文部分内容阅读
当今,高维度的数据集被广泛应用于各个科学和工程领域的研究中。为了有效的分析这些数据集中的向量并实施各种智能算法,往往需要在保持原向量大部分信息的前提下,减少向量的维度。在众多的降维方法中,主成分分析是最常见、应用最广泛的一种数据分析与降维技术,在理论发展和实践应用上被不断地丰富。传统主成分分析方法对原始向量的协方差矩阵进行特征值分解,从而得到用于降维的变换矩阵。然而,在原始向量的总数低于向量的维度等情形下,原始向量的协方差矩阵可能不满秩。此时,通过特征分解求得的变换矩阵不是唯一的,并且无法保证由这些特征向量构成的变换矩阵是酉的。另外,传统主成分分析及其扩展版本,如基于不同核函数的核主成分分析等,都需要巨大的计算能力。在计算效率要求很高的工程应用中,难以执行主成分分析算法。针对以上问题,本文开展了以下工作:(1)研究了原始向量协方差矩阵不满秩时主成分分析的特性。首先,给出了主成分分析过程中特征值分解不唯一的分析与证明,这意味着在执行主成分分析时可以得到不同的变换矩阵。在此基础上,还给出了协方差矩阵特征分解的广义形式。同时,推导出了保证变换矩阵是一个酉矩阵的充要条件。此外,由于主成分分析求解变换矩阵的问题通常被表述为优化问题,故本文还推导了该优化问题的拉格朗日函数一阶微分等于零向量的充要条件,并进一步推导出该优化问题的拉格朗日函数二阶微分条件是正定矩阵的充要条件。最后,给出了数值仿真结果来验证理论分析的普适性。(2)由于传统主成分分析执行过程中存在变换矩阵可能不唯一、计算量巨大等问题,本文提出了一种特殊的主成分分析方法,即基于球坐标系的主成分分析方法。在该方法中,由笛卡尔坐标系所表示的向量被转换到球坐标系中进行表示。然后,在球坐标空间中将变化量较小的部分角度坐标和径向坐标设置为它们对应的均值,并选取余下未处理的角度坐标或径向坐标构成数据的主要成分,以达到降维的目的。同时,处理后的球坐标系中的向量也可以方便的反变换回到笛卡尔坐标系中表示。此时,由于球坐标系中表示向量的自由度减少,笛卡尔坐标空间中向量流形的维度也下降了,并由此能够计算降维后向量的重构误差。通过复杂度对比分析,显示了与传统主成分分析、核主成分分析等方法相比,本文提出的方法具备更低的计算复杂度。计算机数值模拟结果也表明,基于球坐标系的主成分分析方法比传统主成分分析方法具有更低的恢复数据重构误差,且所需计算能力显著降低。(3)研究了基于球坐标系的主成分分析方法在信号降噪上的应用。本文选取来自真实场景下的公开数据,利用心电信号及不同水平的加性高斯白噪声来构建实验所需的数据集,并使用基于球坐标系的主成分分析方法进行信号降噪。实验过程中使用了信噪比、均方误差、相关系数及平滑度等评价指标来衡量降噪效果。同时,还提出了联合球坐标系的主成分分析与经验模态分解的降噪方法,并和经典的小波分析方法进行对比。实验结果显示了提出的新方法能有效抑制噪声。
其他文献
鄂尔多斯盆地区油气储量十分丰富,现有的勘探数据表明,该地区具有特殊的地质条件,对致密油成藏以及富集形成具有十分有利的条件。延长油田致密油勘探开发尚处于初期阶段并且
桁架结构作为空间结构的一种常见形式,广泛的应用于航空航天领域。本文以我国先进空间平台为研究对象,以桁架结构的局部损伤监测为目的,在空间桁架结构理论与量化评估理论的
贵金属纳米材料由于其独特的物理和化学特性而受到广泛的关注。不同于块状金属,纳米材料由于较小的尺寸,大的比表面积和大量的表面原子、缺陷和台阶,使其在诸多领域显示出优异的性能。纳米材料的性能也与其组成、结构和形貌等具有密切的关系。由于双金属之间存在集团效应、电子效应和几何效应等,使其在催化、电催化、表面增强拉曼散射(SERS)、光热理疗和生物传感等领域表现出显著优于单金属的性能。然而,纳米材料较小的尺
随着民间借贷活动的日益盛行,为保证交易安全,设立民间借贷让与担保成为一种趋势。实务中,民间借贷纠纷层出不穷,相同案件的判决结果往往出现不同。2015年9月实施的《最高人民法院关于审理民间借贷案件适用法律若干问题的规定》第24条(下称《民间借贷司法解释》第24条)对按照民间借贷纠纷审理的情形做出了规定,但是对让与担保的性质和效力认定没有进行明确,导致在司法实践中对同类案件的审判结果不能统一。本文认为
利用人工注水保持地层压力来开发油田是油田开发史上的一个重大转折。为了更大化地保持稳产和较高的采收率,注水方式从笼统注水转化为分层注水及精细分层注水。在注水过程中,储层中的物性参数一直处于动态变化的状态,原因在于地层流体的注入和采出使得地层孔隙压力发生改变,由有效应力原理知总应力不变,有效应力便会重新分布,储层岩石发生膨胀或者压缩变形,孔隙度和渗透率也随之改变,这种现象即为流固耦合效应。在分层注采过
传统的电阻率测井仪器测量频率单一,地层参数信息采集少,忽略了岩石的介电频散信息。已有的复电阻率测井仪器测量频率只有两种,阵列感应测井采用不同频率的电信号,只是为了满
矿产行业是关系世界各国经济命脉的支柱行业,同时亦是一个高危行业。井下运输的主要方式是采用矿井轨道机车进行运输,然而由于井下环境的复杂性和危险性,运输事故频发。若要
本文基于某型无人直升机桨叶后缘调整片胶接结构的剥离性能进行研究,探讨增强剥离强度的有效方法,在不影响直升机结构布局和飞行性能的原则上,设计二次加固方案,使调整片不会
现今,信息科学的进步越来越要求存储系统具有低开销、高可靠的存储特点。Erasure Code技术能较好地解决该问题,但目前已存在的通过Erasure Code技术实现的纠删码工具(如Jerasure等)主要是运行在Linux平台的,少数支持Windows平台的纠删码工具(如ISA-l)大多使用C语言实现,环境配置较复杂,这给Windows用户带来了一定的局限性。因此,设计并实现一个可用于Windo
世界范围内燃油汽车保有量逐年增加,在消耗大量石油资源的同时,加剧了空气污染问题。电动汽车以其零排放、高能效等技术优势,近年来得到迅速发展。但相关研究表明,爆发式增长