基于图的半监督特征选择算法研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:winterryliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,数据逐渐复杂化,致使原始样本数据特征多样性,在众多的特征中存在着一些不相关特征、冗余特征以及噪音的影响,不仅增加了模型的计算消耗,而且极易导致模型过拟合,从而影响了学习模型的性能。为了减小冗余特征、数据噪音带来的影响,降低维数灾难问题,特征选择技术在机器学习各个领域引起研究人员的持续关注和广泛的应用,本文针对性的提出了两种特征选择算法,分别用于解决大样本数据和高维数据下的特征选择问题。本文的主要工作包括以下两个部分:1、针对处理少标签、高维度特征的基因诊断任务中的不足问题,提出基于Hessian正则的自适应损失半监督稀疏特征选择框架(AHFS)。首先分析Hessian矩阵产生的零空间特性,可以较好地利用数据流形固有的局部几何特性,有利于学习函数值随测地距离线性变化的函数。同时,多数半监督特征选择算法采用l2范数作为损失函数来度量预测标签误差,但具有显著损失的异常值将导致模型表现比较敏感,鲁棒性较差,而使用l1范数作为损失函数,可以在一定程度上缓解对异常值的敏感度,但是又会对小损失比较敏感。为了克服基于l1范数和l2范数损失函数的缺点,采用自适应损失来度量预测标签的误差,通过自适应近邻分配策略,得到最优Hessian矩阵,增强特征选择模型的鲁棒性。此外,使用l2,1范数作为隐式正则项约束投影矩阵W,可以获得更多的稀疏回归系数,提升特征子集区分性。2、针对具有大样本量下高维度特征的视频语义识别任务数据,提出一种基于自调整图的半监督特征选择算法(SAGFS),与传统的直接依赖于初始拉普拉斯图的半监督特征选择算法不同,SAGFS学习一个新的稀疏相似图来替换原始相似图,促使所提出的模型对初始数据不敏感。另一方面,在学习新的相似图时,新图可以根据输入训练数据的局部几何结构和特征选择的过程进行自调整。通过最佳稀疏相似图的嵌入,SAGFS结合了图正则,使得几何结构可以被嵌入到流行学习。然后,通过简单且高效地线性回归函数测量软标签矩阵的损失误差,可以同时获得最佳的投影矩阵和软标签矩阵。此外,利用l2,p范数以及引入参数?,以便获得高效的特征选择的行稀疏投影矩阵。最后,基于视频语义识别任务相关的数据集进行实验,实验结果表明了SAGFS算法的优越性能。
其他文献
本文在二维磁光阱中,利用“暗线”屏蔽中心原子与光的作用,来减少辐射效应以增大原子的密度。本文旨在获得较高的光学深度(OD),同时获得较高的实验占空比。本文通过“暗线”
自扫描隧道显微镜(Scanning Tunneling Microscopy,SIM)问世以来,它就不断地向人们拓展对表面原子级结构的理解。它实现了实空间直接的原子结构的成像,展现了原子尺度下物理
量子纠缠是量子力学中最奇妙的特性,在量子计算、量子通信、量子隐形传态、量子密集编码等量子信息中有着重要的应用。目前,纠缠原子与光场相互作用的量子特性已经被广泛研究
强光作用于离散的非线性波导时会发生耦合作用、离散衍射效应和介质非线性效应,当这三种效应相互平衡时就会形成一种在传输过程中不发生形变的自陷光束,又称离散光孤子。数学
抗病毒药物中核苷(酸)类似物药物疗效显著,其机制之一为通过底物竞争抑制影响DNA聚合酶催化的单核苷酸聚合能力,从而阻止病毒DNA的复制,控制感染者体内的病毒载量。拉米夫定
随着时代发展,很多领域如航空航天、通讯、汽车工业、计算机等对材料性能要求逐渐提高,急需研究和开发出新型材料。国内外研究发现非正分配比例的Ni2Mn Ga具有超弹性和大的磁
结直肠癌(Colorectal cancer,CRC)是全世界最为高发的恶性肿瘤之一,在中国结直肠癌的发病率和死亡率分别位于恶性肿瘤的第三位和第五位,且有逐年上升的趋势。CpG岛甲基化是结直肠癌发生发展过程中重要的表观遗传学事件之一,特别是关键抑癌基因和错配修复基因启动子区因CpG岛甲基化造成的功能失活是引发肿瘤的关键环节。CpG岛甲基化表型简称CIMP(CpG Island Methylator
磁流体力学(MHD)是一门以导电流体的流动特性与电动力特性为研究目标的综合学科。因其具有流体力学与电动力学的综合学科背景,所以在很多领域中得到了广泛研究与应用,如空间天气
目的:通过热敏灸联合醒脾养儿颗粒治疗小儿脾胃气虚型厌食症,观察其治疗的有效性,为临床治疗小儿厌食症提供新的思路。方法:将符合纳入标准的62例脾胃气虚型厌食症患儿,随机分为治疗组(热敏灸联合醒脾养儿颗粒)和对照组(醒脾养儿颗粒),均治疗1个月,观察两组在治疗前、治疗1月症状、体征及血红蛋白、微量元素Zn改善情况,最后运用软件进行统计分析。结果:治疗1月后,两组总有效率比较P<0.05,差异有统
受激辐射损耗显微术(Stimulated emission depletion microscope,STED)是一种远场超分辨成像技术,能够在生物学,材料学等学科中为研究者提供直观,无损的研究方法。STED一般由