稳健加权主成分及因子聚类方法的研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:wyt_2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析方法是一种十分经典有效的分类方法,但当数据中出现异常值或者存在高度相关性时,传统聚类方法的结果会失真.而主成分分析和因子分析是能够处理数据中高度相关性的方法,因此常将两种方法和聚类分析结合起来使用;但传统主成分聚类、因子聚类方法忽略了不同主成分、不同因子对聚类的重要性差异.而加权主成分距离聚类分析方法既可以处理数据之间的相关性,同时又考虑了不同主成分对聚类的差异.稳健主成分、稳健因子分析可以有效抵抗离群值,又可以处理数据中的高相关性.因此,本文将稳健主成分、稳健因子分析与加权主成分距离聚类分析相结合,既能够处理数据中的高度相关性,又能有效抵御异常值的影响,且又能考虑到不同主成分、不同因子对聚类的重要性差异.本文的研究内容主要包括以下两个方面:一、基于稳健主成分聚类分析方法和加权主成分距离聚类分析方法,提出了一种可行的稳健加权主成分聚类方法.该方法集稳健主成分聚类与加权主成分距离聚类方法的优点于一身,既可以减少异常值的影响,又考虑了不同主成分对聚类的影响.并在不同异常值比例下,证明了该方法的稳健性,并通过数值模拟和实例分析,进一步说明了所提方法的表现效果.二、基于稳健因子分析和加权主成分距离聚类分析方法,提出了稳健加权因子聚类方法,该方法以FAST-MCD方法为稳健估计方法,又考虑了不同因子本身的差异.并通过数值模拟,在不同的异常值比例下,证明所提方法的有效性.
其他文献
MnZn铁氧体陶瓷由于具有高磁导率、高磁化强度和低损耗等优良的电磁特性,在飞速发展的5G微波通讯技术中发挥着重要的作用,同时新应用对MnZn铁氧体的表面金属化提出了更高的要求。当前国内外对铁氧体表面金属化普遍采用水电镀和真空镀膜两种技术,这两种方法存在着重金属污染或者结合力不高及成本偏高等问题,因此迫切需要发展低成本高质量的金属化方法。Ti的氧化物种类丰富,性质各异,作为功能性材料有着广泛的应用。
学位
本文主要研究以下非线性椭圆系统其中λ,μ,ν是正常数且满足0<λ<(?),2*=2N/N-2是Sobolev嵌入临界指数,非线性项.f满足以下Berestycki-Lions条件:(f1)f∈ C(R,R)是一个奇函数,(f2)(?)f(s)/s=0,(f3)(?)f(s)/s2*-1=0,(f4)存在常数ζ>0使得F(ζ)>ζ2/2,其中F(ζ)=∫0ζ f(t)dt.由于非线性项f仅满足Ber
学位
头发是人类的一个重要器官,是面积最大以及最容易让人注意到的器官之一。头发有提供隔热、保护皮肤免受有害的紫外线辐射等各种作用,研究头发中的细胞器分布及各部位化学性质有着重要的意义。红外光谱方法是一种很重要的表征手段,红外吸收峰位置对化学环境、分子内和分子间的相互作用非常敏感,可以对头发的结构和化学性质进行系统的研究。在红外光谱的研究中有两种主要手段,分别是傅里叶变换红外显微光谱技术(FTIR)和红外
学位
在许多事物发展变化的过程中,经常会受到外界的干扰,使得在短时间内发生较大的变化而产生脉冲现象,这种存在突变现象的变化规律一般可以用脉冲微分系统来描述.某些时候,人们在某些固定时间点观测判断物体的状况,根据不同的情形施加不同的干扰,如人们通过观测鱼塘中鱼的数量是否达到一定数量来决定是否进行捕捞等.在数学上可描述为带逻辑判断的脉冲微分系统,对这类具备应用背景的带逻辑判断脉冲受控系统的最优控制问题的研究
学位
随着我国经济的迅猛发展,作为我国基础性行业的电力行业同样也得到了快速的发展。作为传统高污染行业,电力行业引发的环境污染已引起各方的关注。环境污染问题单纯依靠市场机制简单调节是远远不够,政府需要出台相关的环境政策弥补市场机制的不足,推动绿色经济的发展。中国政府近年来制定了一系列环境规制政策和举措,并鼓励电力行业开展科技创新,以期实现企业的可持续发展。这些环境政策的效果如何,是否对企业技术创新产生作用
学位
调度问题既存在于实际工业生产中,又存在于交通运输、通讯网络等领域中,有着广泛的应用背景.传统的调度问题通常假设机器可以一直被使用,在短期调度环境中,这种假设是合理的.然而,机器长期运行会导致机器过度磨损,甚至出现安全事故.因此,需要对机器设备进行预防性维护以提高生产效率,保证生产安全.基于此,本研究主要考虑了三类需要周期维护的恒速机调度问题,具体研究内容如下:首先,研究了加工时长均相等的最小化时间
学位
多相多组分的相平衡计算是油气藏数值模拟和岩浆流模拟研究中的重要问题之一,针对其设计合理有效的算法具有重要的意义。光滑粒子动力学方法(smoothed particle hydrodynamics,SPH)因其无网格特性以及粒子携带物理信息与其一起运动,有利于处理这类相平衡问题。本文采用光滑粒子动力学方法和梯度下降法,对气液两相相平衡问题进行数值模拟。本文首先从相场中的双阱势函数推导气液两相密度方程
学位
本文主要研究模糊集理论在不动点问题、广义多目标博弈问题和平衡问题中的应用.首先研究模糊映射不动点的存在性和有限理性条件下模糊不动点集的稳定性.其次从本质稳定的角度研究一类广义模糊多目标博弈平衡解集的稳定性.最后,研究具模糊映射的对称向量拟平衡问题解的存在性和良定性.全文分为5章,具体内容如下:第一章,主要论述模糊不动点、模糊博弈以及平衡问题的研究背景与研究现状,并说明本文的主要研究内容和创新点.第
学位
投资作为上市公司重要的财务决策,对上市公司的生存和发展起着关键作用。然而,现阶段中国上市公司投资效率较低,普遍存在非效率投资,极大地影响上市公司的盈利前景和市场价值。因此,如何抑制非效率投资就成为相关研究的重点方向。而股权质押在本质上是一种抵押借款,股东将其持有的股票质押给质权人,获得一定的融资,这也是上市公司加杠杆的一种方式。很多控股股东会在股权质押以后,利用手中的控制权对公司的投资决策进行干预
学位
现实生活中数据的缺失给统计分析带来了比较大的挑战,当数据存在缺失时,如何进一步挖掘数据的信息具有重要的研究意义.完整数据下可加模型的统计推断研究已经相对完善,本文在响应变量随机缺失的情况下,研究了可加模型的稳健估计及其线性成分识别问题,主要研究内容包括以下两个方面:响应变量随机缺失下可加模型的稳健估计方法.首先,将插补方法、B样条近似和复合分位数回归相结合,得到可加模型中非参数函数的估计.其次,在
学位