高维数据降维算法的研究与设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xiong100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息的飞速发展,需要被处理的数据的维度和规模在迅速增加,直接对获取到的数据进行应用很难取得满意的效果,高维的数据常常会导致维度灾难的问题,有效的对数据进行降维越来越受到学者们的关注。在大量的维度约减算法中,线性判别分析(Linear Discriminant Analysis,LDA)受到了更多的关注,它通过最大化类间散度矩阵和最小化类内散度矩阵同时求解来解决目标函数。然而,传统的LDA算法还存在一些不足,这些不足在很大程度上限制了 LDA算法的应用范围。时间序列数据由于具有时间特性,传统的降维方法难以直接应用于降维。在最近几十年中,一些利用深度学习知识实现的时间序列分类算法被设计提出,而且在许多实际应用中都有着不错的表现。这些时间序列算法大多数都将关注点放在了序列的特征提取上,没有考虑维度约减在序列的特征提取和分类等应用中的作用。综上所述,研究提出并实现有效的高维数据降维算法和时间序列降维算法,具有重要的理论与现实意义。论文的选题出自国家自然科学基金中的项目,创新研究并实现新的高维数据降维算法和时间序列降维算法。为了能提升高维数据维度约减算法的效率,本文作者提出了一种有效的高维数据降维算法。算法主要解决的问题以及创新如下:1)当训练样本的维度过高时,线性判别分析算法会陷入小样本问题,无法对类内散度矩阵求逆,从而求解失败。通常情况下,大多数的LDA算法都是通过预降维方式克服数据的小样本问题,然而这样会大量的损失数据的判别信息。本文提出一种两步的LDA算法,可以在不损失数据判别信息的前提来处理小样本问题。2)LDA算法由于采用L2范数求解,而且求解过程很依赖于数据的均值信息,因此对数据中的噪声和异常值非常敏感,严重影响降维结果。为了能提升LDA算法对异常值的鲁棒性,本文提出一种基于中值的权重均值代替原有类内均值,而且不需要反复的迭代过程进行优化。3)目前绝大多数的LDA算法都缺少对数据局部结构信息的保留,或者仅仅保留类间或者类内的局部几何信息,当数据变得比较复杂时往往很难有稳定的降维效果,本文通过完全的嵌入类间和类内的局部结构信息,提升算法对多模态数据的处理性能。通过对大量时间序列降维和分类算法进行研究与分析,本文中提出了一种新的时间序列降维和分类的算法。算法主要工作及创新如下:1)为了能够简化时间序列处理的过程,作者提出了基于全卷积神经网络的时间序列降维和分类算法,可以大量减少多余的处理步骤。2)通过注意力机制实现序列的位置嵌入,克服了全卷积网络在处理时间性问题上的不足。通过膨胀卷积的引入,可以同时对多变量时间序列的时间维度和变量维度进行降维,在节约了大量计算资源的同时可以有效的提取序列的特征。3)提出的算法在大量的时间序列数据集上进行验证,可以看出本文提出的模型可以有效提升时间序列降维和分类算法的性能。虽然本文提出的两种算法可以高效的实现对传统高维数据和时间序列数据的降维,但是所提出的算法仍有很大的研究空间。上述的两个算法都需要训练数据提供类别标签,但是这在实际中往往是不太容易的,因此作者在接下来的研究中会考虑在保持算法性能的同时只使用部分的类别标签。
其他文献
南北两极地区自然环境独特,地理位置相距甚远,导致两极地区微生物资源也表现出巨大的差异性、独特性和丰富性。在极地地区生活的微生物必须在基因组成、基因表达调控以及代谢方式上进行进化,形成独特的生理生化特征和代谢调控方式,以适应极其严苛的极地环境。与此同时,也可能会带来新的代谢产物的生成。基于此原因,南极北极地区一直被认为是极端微生物的潜在和重要资源库,也是结构新颖、生物活性显著药用分子的重要来源,为天
房价的不断上升和人民收入差距的不断拉大,使得中低收入群体购房困难,提供保障性住房是政府解决中低收入家庭住房问题的重要举措,也是政府的基本职责之一。保障性住房的供给
连铸二冷区尾端凝固坯壳厚度对于后续的轧钢具有重要意义,因此坯壳厚度成为检测目标,为后续合理安排冷却的优化设计提供重要依据。此时坯壳厚度检测具有复杂的检测环境,传统工艺测厚无法满足检测需求。而电磁超声换能器具有非接触、无需耦合剂的优点,恰好满足了钢坯检测的环境要求,因此使用EMAT检测连铸坯壳厚度。研究电磁超声横波检测表面温度为500℃铸坯的坯壳厚度,分析此温度下的换能机制。本文以坯壳厚度为30mm
随着物联网、工业互联网的兴起,异构网络种类和网络设备数量迅速上升,网络设备接入因特网的需求也在增长。异构网络中存在多种不同的物理层和链路层协议标准,一般在网络层使用IP协议接入因特网。然而,作为异构网络互联的桥梁,现有IP协议存在一些不足。定长、定界、定序的语法限制使得IPv4地址空间不足,也使得IPv6在某些资源限制网络中无法直接应用,过长的地址及协议头中的冗余字段会降低数据传输效率。灵活IP是
钢管厂热镀锌车间,钢板从镀锌池中出来后经过外吹环喷嘴吹净多余锌粒时,会产生的强噪声严重影响到工厂周边居民正常生产生活,并且噪声污染影响工人工作环境,危害身心健康,降低作业人员的生产效率,因此对射流噪声的产生机理以及降低射流噪声有重要学术意义。本文结合“某钢管有限公司热镀锌车间外吹环噪声治理”工程项目,主要研究内容有:首先选择5种不同紊流模型,分别进行迭代,找出最优的Realizable k-ε模型
当前,我国已进入经济发展的快车道,经济成就举世瞩目。这些成就离不开市场经济的主体——企业的贡献,而企业的持续健康发展离不开良好的制度保证。我国五部委联合发文明确要
铸造是机械制造工业的重要部分,其中砂型铸造在铸造生产过程中会产生大量废弃旧砂,给环境带来的危害巨大。随着铸造行业的迅速发展,绿色生产已逐渐成为当前发展目标,如何实现铸造旧砂低成本、高质量地回用对绿色清洁生产起到关键作用。目前砂型铸造中应用较多的旧砂再生方法包括干法再生、湿法再生、热法再生、化学再生等,其中湿法再生脱膜率高、再生砂质量好、适应性广等,是比较理想的一种方法,但当前湿法再生设备普遍存在结
微谐振器是微机电系统(MEMS)中一种典型的非线性动力学器件,它具有功耗小、灵敏度高、动态响应快、驱动效率高等优点,受到国内外学者的广泛关注。本文应用分数阶微分动力分析的理论,建立了微谐振器分数阶动力学分析的一般模型,此模型能有效表征系统材料粘弹性特性和内部热阻尼。基于此模型,分析了系统各个参数对系统运动特性的影响。最后,研究了系统混沌控制的问题。本论文的主要研究工作和结论如下:1.根据微谐振器系
本次翻译实践报告以《艺术博物馆图像》为翻译材料,原文以纽约大都会艺术博物馆、维多利亚和阿尔伯特博物馆和史密森尼三家艺术博物馆为例,对比了三家博物馆建设情况。此文本的中译本对国内博物馆的建设发展具有一定的借鉴意义,对博物馆学的研究和发展有一定的参考和学习价值。该文本为信息型文本,原文中含有大量术语,专业性强,句式流畅,语篇衔接连贯。笔者以交际翻译和语义翻译理论为指导对文本进行了翻译,处理词汇、句子和
我国高磷铁矿资源丰富,但磷含量较高不仅增加了炼钢脱磷负荷和成本,且严重制约了钢渣资源的循环使用,使其无法充分利用。传统的脱磷方法未能实现大规模工业化应用,脱磷技术一直是困扰国内外科研工作者的难题。本文基于前期白云鄂博矿磷的赋存状态及白云鄂博矿预还原烧结工艺对脱磷影响的研究,围绕铁精矿预还原烧结气化脱磷工艺,深入研究预还原烧结过程磷的迁移行为及烧结料层各带温度压力分布规律,为预还原烧结脱磷提供数据支