【摘 要】
:
现如今信息爆炸的时代存在大量的高维数据,如何从高维数据中快速获取有辨别性的信息,成为目前研究的一个重要课题。这一课题的常用方法是使用降维技术。现有降维算法通过理论和实践的不断创新取得了不错的成绩,但仍存在一些不足。1、实际样本中噪声分布不均匀,样本自身差异性往往被忽略;2、样本数据维度和特征维度的结构捕捉往往不完整;3、捕捉邻域关系的图矩阵往往由于噪声影响不够准确。针对以上不足,论文提出了三种新的
论文部分内容阅读
现如今信息爆炸的时代存在大量的高维数据,如何从高维数据中快速获取有辨别性的信息,成为目前研究的一个重要课题。这一课题的常用方法是使用降维技术。现有降维算法通过理论和实践的不断创新取得了不错的成绩,但仍存在一些不足。1、实际样本中噪声分布不均匀,样本自身差异性往往被忽略;2、样本数据维度和特征维度的结构捕捉往往不完整;3、捕捉邻域关系的图矩阵往往由于噪声影响不够准确。针对以上不足,论文提出了三种新的降维方法,包括一种特征提取方法,两种特征选择方法。具体工作如下:首先,针对现有的基于主成分分析的特征提取算法没有考虑样本自身差异性,且不能联合地提取样本的重要信息,提出自步稀疏最优均值主成分分析算法。模型以L2,1范数定义损失函数,将均值作为需要优化的变量,提高对异常值的鲁棒性;以投影矩阵的L2,1范数为正则化项,实现特征选择;其次考虑到训练样本的差异性,利用自步学习机制的思想实现对训练样本由“简单”到“复杂”的学习过程,提高模型分类性能。其次,针对现有的无监督特征选择算法没有同时考虑样本维度和特征维度的重要性,且对噪声样本不具有鲁棒性,提出基于自表示的对偶图正则鲁棒特征选择算法。模型结合自表示特性,同时考虑样本自表示和特征自表示,并以L2,1范数定义损失函数,从而对噪声具有鲁棒性;其次利用样本自表示和特征自表示的表示系数建立样本图和特征图,得到样本图拉普拉斯矩阵和特征图拉普拉斯矩阵,同时保持样本和特征维度的局部几何结构,提高分类和聚类任务的性能。最后,针对现有的特征选择算法往往采用图拉普拉斯矩阵来保持样本流形结构,且忽略全局与局部结构相结合等问题,提出基于组低秩的鲁棒特征选择算法。模型将标签信息作为先验信息,引入基于类的低秩表示,使得变换后的某类样本尽可能保留在同类子空间中,以代替原始图拉普拉斯矩阵的方式,避免噪声对保持局部几何结构的影响;其次将回归投影矩阵定义为两个低秩矩阵的积,保持局部几何结构的同时捕捉样本的全局结构,并且利用回归投影矩阵的L2,1范数实现特征选择,有效提高模型在分类任务上的性能。在不同原始公开数据集,以及含噪声数据集上的实验表明,相较于现有算法,论文提出的几种算法都具有较好的性能,且具有一定程度的实用意义。
其他文献
百年未有之大变局下,中法产业链合作的战略意义日益突显。本文首先从宏观层面,基于对中法全球价值链的实证分析,发现中法大部分产业均在向全球价值链上游地位攀升且互补空间较大。为探索中法产业链合作的重点领域方向,尝试从中微观层面对法国优势产业及代表性企业进行梳理,为下一步深化中法务实合作提供参考。当前,以扩大中法产业链合作为抓手,形成双边务实合作的双赢局面,既有助于中国丰富高科技来源渠道、稳固全球价值链地
中华绒螯蟹(Eriocheir sinensis),又名大闸蟹、河蟹,淡水蟹,是我国经济价值较高的名优水产品之一,因其鲜甜细嫩的感官特征深受消费者的喜爱。然而,目前国标中中华绒螯蟹品质分级主要通过大小、可食率和肥满度等指标;现有文献中中华绒螯蟹滋气味成分已做定性定量分析,但未据此给出感官品质评价方法。因而,中华绒螯蟹的品质评价和分级还停留在“食之有味,评之无据”。针对这一科学问题,本论文选择全国产
文章通过构建国家数字经济发展水平综合指标测度体系与测算行业数字化比率得到全球价值链分工框架下行业层面的数字经济渗透指标,系统分析数字经济发展对全球价值链上游度的影响效应与作用机理,并考察制度质量的调节效应。研究表明,数字经济发展不同维度显著提升了全球价值链上游度,这一结论在使用历史数据工具变量和动态面板方法克服内生性影响后依旧稳健。进一步研究发现,"技术创新能力"与"资源配置效率"已逐步成为数字经
智能可以看作是知识积累和知识运用的综合能力反应,主要是认识客观事物、掌握客观规律,以及运用知识去解决实际问题的能力。人工智能就是用人工系统来模拟人的问题求解、推理、学习等方面的能力。人工智能经过近半个世纪的发展,形成了多个研究发展方向,其中智能计算方法是智能科学当前研究的重要方向之一。在过去几十年的时间里,智能计算得到了广泛的研究和迅猛的发展,并在信号处理、模式识别、系统辨识、发酵控制、生物信息学
目的:脉络膜新生血管(Choroidal neovascularization,CNV)是多种严重致盲性眼病的主要病理学特征,其中以年龄相关性黄斑变性(Age related macular degeneration,AMD)最为常见。表观遗传调控在CNV的发生发展中可能起重要作用,但具体机制尚未完全明确。RNA编辑是一类重要的表观遗传学机制,本研究希望能够通过认识CNV发生发展过程中RNA编辑的
目的:目前药物化疗仍然是结直肠癌(CRC)的主要治疗方式之一。耐药是阻碍化疗疗效的主要因素,然而目前对于化疗耐药的机制仍知之不多,研究CRC耐药机制具有重要的理论和临床价值。RAB22A是本课题组前期发现的一个新的候选癌基因,但其在肿瘤耐药中的角色尚不清楚,本研究采用体外实验并结合临床标本分析,阐明RAB22A在CRC耐药中的作用,并探讨其分子机制,以期为CRC的化-疗耐药机制提供新的理论依据,并
微生物油脂可以代替动物和植物油脂为生产生物柴油提供廉价原料,但培养产油微生物的高碳源成本和低油脂产量等问题限制其发展。尽管使用木质纤维素原料代替常见的淀粉质碳源能降低培养成本,但原料水解糖液中复杂的混合糖和发酵抑制物常常影响微生物的生长和油脂积累。本论文基于实验室保藏的产油酵母Trichosporon dermatis ZZ-46,开展其诱变育种、共发酵葡萄糖/木糖及利用木质纤维素水解混合糖液产微