【摘 要】
:
由于无监督特征选择算法不需要先验类别信息,广泛应用在机器学习与模式识别领域中。现有的大多数的无监督特征选择算法聚焦于各种形式的数据重建,并通过丢弃贡献低的特征来最小化重建误差。近些年来在特征选择方面的文献表明选择的特征应该保留几个重要的信息。这些信息包括但并不仅限于判别性信息和局部几何结构信息。判别性信息可以通过聚类的方式得到,局部几何结构可以通过嵌入图的学习来保持样本之间的局部关系,比如两两样本
论文部分内容阅读
由于无监督特征选择算法不需要先验类别信息,广泛应用在机器学习与模式识别领域中。现有的大多数的无监督特征选择算法聚焦于各种形式的数据重建,并通过丢弃贡献低的特征来最小化重建误差。近些年来在特征选择方面的文献表明选择的特征应该保留几个重要的信息。这些信息包括但并不仅限于判别性信息和局部几何结构信息。判别性信息可以通过聚类的方式得到,局部几何结构可以通过嵌入图的学习来保持样本之间的局部关系,比如两两样本之间的相似度图,KNN图、局部线性嵌入等。许多模型选择在数据的原始特征空间中计算样本间的相似性,然而样本的原始特征空间中往往存在大量的噪声和冗余。因此,直接在原始特征空间中计算得到数据内在结构是不合适的。本文先提出了基于鲁棒矩阵分解和自适应图的无监督特征选择模型(unsupervised feature selection based on robust matrix factorization and adaptive graph,MFAGFS)。该模型可以在一个统一的学习框架下执行鲁棒矩阵分解、特征选择以及局部结构学习。通过鲁棒矩阵分解可获得聚类标签。聚类标签和局部结构信息用来引导特征选择过程。再从特征选择的结果中自适应的学习地学习数据局部结构。通过局部结构学习和特征选择这两个基本任务地相互作用,MFAGFS可以精确捕获数据的结构信息以及选择出具有判别性的特征。更进一步,为了实现优秀的簇分离,改进矩阵分解的形式。通过在转换空间中进行正交矩阵分解实现正交基聚类,并在矩阵分解过程中使用具有鲁棒性的l2,1作为损失函数。提出了基于正交基聚类和自适应图的无监督特征选择模型(unsupervised feature selection based on Orthogonal basis Clustering and adaptive graph,OCAGFS)。为了验证本文所提出来的两个模型的性能。将MFAGFS以及OCAGDFS在公开的数据集上进行对比实验。实验结果表明,本文所提的两种方法与其他方法相比较,性能均具有不同程度的提高。
其他文献
自福岛核事故发生以来,严重事故的分析与缓解成了核能界广泛关注的一个热点议题。为了进一步提高核电站的安全性,各国研究人员对严重事故管理导则(Severe Accident Management Guidelines,简称 SAMGs)中现有的卸压和补水策略进行了大量的验证工作。而全厂断电叠加小破口冷却剂丧失等复合型超设计基准事故的现象更为复杂,所以有必要对其进行进一步的模拟和验证。另一方面,严重事故
负载调度是并行系统高效、可靠运行的一项重要任务。本文从可分负载这一特殊但应用广泛的数据类型入手,结合并行处理概念,研究在任意网络中的多源可分负载调度问题。通过网络实现节点间通信,共享网络中所有节点的计算资源,以便在尽可能短的时间内完成负载处理。虽然可分负荷调度问题已经研究了几十年,但大部分提出的方法只能在少数特定的网络拓扑中得到该问题的最优解。本文基于可分负载理论的最优性原理提出一种新的分析方法,
[目的]已有研究报道人心脏c-Kit+细胞的外泌体有血管生成或细胞保护作用,我们前期研究发现缓激肽(Bradykinin,BK)可以促进人心脏c-Kit+细胞的增殖和迁移,但是缓激肽是否对人心脏c-Kit+细胞的外泌体有调控作用未见报道。本课题旨在研究缓激肽诱导的人心脏c-Kit+细胞外泌体对血管生成作用的影响。[方法]收集缓激肽处理和未处理的人心脏c-Kit+细胞培养基,检测其对人脐静脉内皮细胞
居民生活品质提升体现在住宅热湿环境营造方面,可分为三个维度:一是对温湿度敏感性增强,尤其是对于空气湿度的关注提升;二是对健康的追求,包含住宅新风系统和污染物过滤排除系统;三是趋向于选择暗装、多功能集合的热湿处理设备。相比于传统房间空调器,地板辐射供冷供暖末端在节能、舒适、美观方面优势明显,在长江流域地区应用广泛,但是在应用过程中,辐射末端存在一些弊端:响应慢、不能承担潜热负荷、新风量不足、夏季存在
固态电解质作为全固态电池的核心组成部分,其性能的好坏直接决定全固态电池的电化学性能。在诸多氧化物固态电解质中,Li7La3Zr2O12(LLZO)材料在离子电导率和稳定性的提升以及合成工艺的控制上有很大的发展空间,具有重大研究意义。本课题以四方相LLZO为研究对象,运用密度泛函(DFT)对不同掺杂模型进行电子结构、锂离子迁移计算,理论上筛选得到性能较好的材料,再通过实验探究LLZO材料的不同制备工
在气液相界面处,由于传质导致的Marangoni对流往往能对气液传质过程产生增强作用,而当液相主体和气液相界面存在强烈运动时,Marangoni对流可能会被削弱或抑制。本文以气泡和降液膜为研究对象,对存在运动相界面的气液相间传质过程进行了数值模拟,考察了 Marangoni对流本身的流动模式和其对传质过程的影响。流体力学计算CFD模型通过建立VOF方法和Level Set方法耦合的多相流模型,消除
城市历史环境作为城市历史与文化的物质载体,是城市中的不可再生资源与魅力因素。对城市历史环境进行保护并促进其发展,一直以来都是建筑界与规划设计领域所致力的目标。一方面基于当下中国城市增量转存量发展的社会背景,另一方面随生活变迁建筑更新或补足的需求不可避免,对城市历史环境中的建筑改扩建进行研究具有重要的现实意义。如何将建筑改扩建设计很好的融入城市历史环境,过往的相关研究已较为丰硕,但多从宏观视角讨论设
随着智能医疗影像技术逐步在临床使用,基于交互式分割的智能辅助肺结节筛查能够缓解影像科医生的工作压力,改变医生在重复、单调的阅片工作中容易出现疲劳、漏诊等现象。还可辅助医生提供精确的定量分析,降低阅片主观性,提高医生对肺结节诊断的一致性。对提升医疗服务效率和建设精准医疗服务体系具有重要借鉴和示范作用。在云PACS系统将成为未来发展方向的背景下,通过走访重庆两家三甲医院,实地调研影像科医生需求后,设计
组蛋白去甲基化酶JMJD2D(也称作KDM4D)属于JMJD2(KDM4)蛋白家族的一员,与其他成员相比结构较为独特,只有JmjC域和JmjN域,不含PHD域和Tudor域。一般情况下,JMJD2D可以对H3K9me3和H3K9me2进行去甲基化修饰,进而激活目的基因的表达。肝脏作为人体最大的腺体器官,发挥了极为重要的功能,当肝脏受到损伤时,能够利用强大再生能力来补偿肝脏体积的减小和功能受损。本研
目的:通过网状meta分析评价不同干预措施治疗局灶节段性肾小球硬化(Focal segmental glomerulosclerosis,FSGS)的疗效性及安全性。方法:通过检索中国知网(CNKI)、万方、维普、Embase、中国生物医学文献数据库(CBM)、pubmed、web of science、cochrance library 等中外文数据库中有关治疗FSGS有效性的随机对照试验(Ra