多集相关特征抽取方法研究及应用

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:wys9802110814
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多集数据是同一事物的多种数据表示,能够从不同角度描述同一事物的多种统计信息,如何有效抽取高维多集数据的低维特征已经成为模式识别领域的研究热点和关键问题。实际应用中的多集数据通常是带有大量噪声和冗余信息的非线性高维数据,多集相关特征抽取方法作为一类重要的面向高维多集数据的特征抽取方法,在国内外已经受到广泛关注,但是仍然存在协方差偏离问题、局部近邻关系失真问题、半监督平衡困境、全监督情况下的“小样本问题”等,难以有效处理这种实际数据,这很大程度地限制了它的适用范围和识别性能。为此,本文深入研究柯西估计、跨集合近邻互补、自平衡学习、指数矩阵等,从而提出一系列新的多集相关特征抽取方法,为一些实际应用提供了有效的解决方案。本文的主要创新性工作和研究成果如下:(1)提出了鲁棒多集相关特征抽取方法。实际应用中采集的原始样本含有大量噪声和冗余信息,这会导致多集相关特征抽取方法的样本协方差矩阵偏离真实协方差矩阵,这种偏离削弱了相关特征的相关性保持和散布结构约束,从而影响相关特征的类分离性。为此,本文利用柯西估计对样本协方差矩阵的奇异值进行校正,从而构建了更接近真实协方差矩阵的鲁棒协方差矩阵,然后通过最大化不同集合之间的鲁棒相关性和约束集合内的鲁棒散布,形成了鲁棒多集相关特征抽取方法,该方法对原始样本的噪声和冗余信息具有强鲁棒性,能够抽取具有良好类分离性的相关特征。大量实验结果不仅直观展示了相关特征的类分离性,而且显示了该方法在轴承故障诊断应用和图像识别应用中的优越性。(2)提出了近邻一致多集相关特征抽取方法。针对集合内局部近邻关系的失真问题,本文提出了近邻一致多集相关特征抽取方法,该方法利用不同集合之间的近邻互补性,在一致相关子空间中构建每个原始样本的跨集合近邻一致中心和所有集合的跨集合近邻一致散布,进而获得了更真实的局部近邻结构,然后通过最小化跨集合近邻一致散布和最大化所有集合的成对相关性,提高了相关特征与其跨集合近邻一致中心之间的聚集性,使相关特征尽量保留了原始高维样本的固有局部近邻关系,从而有效增强了相关特征的内在几何结构保持和类分离性。针对轴承故障诊断应用和图像识别应用设计了大量的性能评估实验,分析了该方法的准确率、样本随机的鲁棒性、维数对准确率的影响以及近邻参数对准确率的影响等。(3)提出了半鉴别多集自平衡相关特征抽取方法。为了利用部分类标签来有效改善相关特征的类分离性,本文提出了半鉴别多集自平衡相关特征抽取方法,该方法利用基于所有样本的集合间相关性和基于部分类标签的集合内鉴别散布,构建了一种新颖的半监督自平衡相关优化模型,实现了鉴别散布和全局相关性之间的自平衡学习,有效增强了集合间和集合内的结构弹性。然后通过一系列理论推导,实现了该模型的优化求解,该方法能够充分利用少量的类标签信息抽取具有良好类分离性的相关特征。在目标图像、可见光人脸图像和手写体数字图像上的大量实验结果显示了该方法良好的图像识别性能。(4)提出了指数多集鉴别相关特征抽取方法。针对全监督情况下的“小样本问题”和跨集合鉴别散布的缺失问题,本文通过在集合内鉴别散布的基础上进一步整合跨集合鉴别散布,构建了所有集合的鉴别整合散布,并且利用矩阵分解提出了一种指数策略,从而形成了基于指数鉴别整合散布和指数相关性的指数多集鉴别相关特征抽取方法。该方法利用指数矩阵的运算特性将矩阵的求逆运算转化为矩阵的减法运算,保证了“小样本问题”的解决,并给出了相应的理论证明和一些直观分析。该方法更好地揭示了所有集合的全局鉴别结构,能够从少量的原始样本中抽取具有良好类分离性的相关特征。在五种可见光图像数据集、两种红外图像数据集和路透社多语言文本数据集上设计了大量评估实验,实验结果显示了该方法拥有良好的识别性能。图[41]表[24]参[178]
其他文献
随着神东矿区开采范围不断扩大、开采深度逐步增加,出现了许多有别于浅部开采特点的现象和问题,使得矿压监测与管理、水害、瓦斯等面临新的挑战,给矿井灾害预测与防控提出了新的课题。针对我国西部矿区地质环境特点,在结合神东矿区煤层赋存条件、开采特征等基础上,加强矿区地应力特征及其对煤层底板采动破坏控制机理等相关研究,对我国西部煤炭资源的安全高效开采具有重要意义。本文以神东矿区保德煤矿为研究对象,应用构造地质
学位
人工地层冻结法作为一种富水软弱地层的特殊加固技术,已在我国地铁隧道建设工程中得到广泛应用。在地铁隧道人工冻结法施工的解冻期,由于冻结壁的融化,地层会产生不同程度的融沉现象,这必然会对工程周边环境造成不良影响,轻则延长施工工期,重则威胁周边构筑物安全。有鉴于此,本文采用理论分析、离心模型试验、数值模拟和现场实测相结合的研究方法,对地铁隧道水平冻结施工期地层三维融化温度场和融沉变形规律进行研究,其主要
学位
技术价值是工业遗产的核心价值之一,需要通过一定的特征要素呈现出来,从而被识别和感知。矿业遗产是工业遗产中蕴含技术价值最为显著的一类,其特征要素也更为丰富和突出,可作为研究的突破口。矿业遗产技术价值应围绕矿业生产中的一系列技术展开,包括技术本身承载的或通过技术反映出来的价值。矿业遗产技术价值特征要素可被归纳为四个方面,包括物质要素、技术及工艺流程、生产人员和管理体系、生产活动对当时社会的影响等。上述
期刊
针对我国煤矿安全开采中存在“采掘失衡”、“掘支失衡”的难题,提出了一种迈步式锚支护一体化装备;针对锚支护装备动力系统存在多变量耦合、多工况负载、多谐波脉动的运行特点,提出了基于流量负反馈的泵阀协同复合控制策略;搭建了迈步式锚支护一体化装备实验平台,并进行实验研究,得出装备在行走工况、支护工况、钻锚工况下的永磁同步电机(PMSM)转速、液压系统流量、压力等变化曲线及控制规律。论文的主要研究内容如下:
学位
人工冻结法以封水效果好和绿色环保等优点被广泛应用在深厚表土层矿山井筒工程和城市地下工程中。冻结壁在其与构筑物之间相互作用力和地应力的复合作用下通常处于三向不等的复杂应力状态,深部井筒开挖过程引起冻结壁内部应力重分布,是典型的加卸载过程,常规三轴试验得到的冻土力学参数不能全面反映复杂应力状态和应力路径对深部冻土强度特性、变形破坏特征和能量耗散特性的影响。论文以矿山冻结工程人工冻结砂土为研究对象,利用
学位
镉(Cd)和砷(As)是国际公认的致癌潜在有毒元素,在土壤中迁移转化后易在作物中积累,并通过食物链在生物体内富集,对人类健康造成严重危害。在土壤修复过程中,由于Cd和As存在相反的化学性质,这两种污染物的生物有效性往往无法同时降低,而且目前市场上的土壤稳定化材料价格昂贵。因此,研发经济高效的稳定化材料用于修复镉砷污染土壤,降低镉砷在作物中的积累迫在眉睫。煤矸石作为一种煤基固废,含有大量的硅酸盐、硅
学位
我国是世界范围内主要的煤炭生产大国,就我国煤矿目前情况而言,主要采取井下开采的方式。由于工业生产装备水平不高,工业技术相对落后,造成矿工职业病的防治变得极其困难,因此,对矿工的健康状况进行早期判断是职业病防治的重要前提。传统的应用场景中,矿工的职业健康主要依靠经验丰富的医生通过体检报告中的各项体征信息来分析与评估,但存在研究分析的医学数据复杂冗余信息较多,难以判断出数据属性之间潜在的联系等问题。针
学位
京津冀地区是一个水资源缺乏严重的地区,面积约占全国的2.3%,人口总数约为全国的8%,国民生产总值约有全国的8.5%,但水资源却仅有全国的0.7%左右,京津冀地区高速发展,水资源问题是一个亟待解决的问题。一个地区的水资源作为一个变量,受到多种因素影响,其中气候变化是影响水资源变化的一个重要原因。本研究在统计1956~2019年京津冀地区65年降雨、气温、蒸发等数据的基础上,利用Mann-Kenda
学位
生物油蒸汽重整制氢可有效提高生物质利用效率,实现可再生氢能源开发和环境保护间协调发展,是环境工程领域中实现双碳目标的重要研究课题。在生物油及其模型物蒸汽重整研究中,钴(Co)基催化剂具有廉价易得、C-C和C-H键断键能力强和水气变换反应高活性等优势。然而,Co基催化剂在高温水热和复杂氧化/还原反应氛围中面临活性金属烧结和表面积碳等失活问题。为研发高活性、抗失活和经济环保Co基催化剂,本文选用天然黏
学位
我国的绿色煤炭资源总量约占煤炭预测总储量的10%,且煤炭资源的回收率相对较低,面对复杂的开采条件,每年全国煤矿所发生的顶板安全事故起数常年占据各类安全事故之首,工作面顶板安全问题依然较为严峻,而分岔煤层或近距离煤层下行开采时,下分层再生顶板的安全问题较单一煤层开采更加复杂,如何确保下位煤层回采过程中再生顶板的安全,是分岔煤层或近距离煤层回采所面临的主要难题。针对分岔煤层下分层回采诱发再生顶板冒漏、
学位