基于协同表示的子空间学习算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:leaffan1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集技术和存储技术的快速发展,处理海量的高维数据成为科学研究的必要工作。因此,如何从复杂的高维数据中学习到简单有效的低维特征变得尤为重要。在众多特征提取方法中,基于子空间的特征提取方法是其中最重要的一类方法,其核心问题是如何设计目标函数以取得期望的特征子空间。得到数据的低维表示后,分类方法的选择是另一个重要的问题,因为不同的分类方法具有不同的特点,使用相同的特征也会展现出不同的分类能力。基于表示的分类方法在近些年来成为计算机视觉与模式识别领域的研究热点之一,由于它们对特征有着独特的假设,所以一般的特征提取方法并不适用,因此找到更适合于这些分类方法的特征提取方法来最大限度地挖掘它们的分类潜力具有重要的研究意义。本文认为特征提取方法与分类方法是相互依赖的,所以以基于协同表示的分类方法(CRC)作为研究对象,提出了若干个基于协同表示的子空间学习算法。具体的研究成果和贡献如下:(1)提出了基于多核局部约束的协同表示分类方法(MKLCRC)以及基于多核局部约束协同表示的子空间学习算法(MKLCR-DP)。CRC假定数据是满足子空间假设的,但这种假设在现实场景中一般不成立。提出的MKLCRC借助于局部线性约束,增强了局部样本在表示中的作用,提高了协同表示的判别性。又受到多核降维思想的启发,将多核学习与特征提取融合进统一的框架之中,使数据在特征子空间中更好的满足子空间假设。而后为了使特征子空间与MKLCRC相匹配,提出了MKLCR-DP。MKLCR-DP依据MKLCRC中的子空间假设设计了相应的目标函数,使得数据在特征子空间中具有最小的类内重构残差,以及最大的类间重构残差。在优化MKLCR-DP的目标函数时,采用了迹差优化的方式求解。在不同的人脸数据库上的实验结果验证了所提方法的有效性。(2)提出了基于领域自适应的协同表示分类方法(DACRC)以及基于领域自适应协同表示的共享子空间学习算法(JD2-CRC)。CRC假设训练样本和测试样本具有一致的分布,当分布不一致时CRC的分类能力就会严重下降。提出的DACRC认为分布的差异会导致特征之间的相关性较弱,但不同分布上相同的类中包含潜在的共享信息。因此,利用一组投影矩阵消除分布间的差异性,将不同分布的特征投影到一个共享的特征子空间中,然后利用一个共享字典来捕捉潜在的共享信息。为了学习到有助于DACRC分类的投影矩阵和字典,提出的JD2-CRC根据类重构残差设计了相应的目标函数。在求解JD2-CRC时,根据协同表示的闭解形式解除了优化变量间的耦合关系,然后使用梯度下降法迭代优化。大量的实验结果验证了所提方法的优势。(3)提出了基于类特定的协同表示分类方法(CCRC)以及基于类特定协同表示的多子空间学习算法(MDA-CRC)。现有的相关方法在计算投影矩阵时,都只考虑了CRC中的协同表示的判别性,而忽略了CRC分类规则中的类特定性。这使得相关方法忽略了不同类对特征子空间的需求是不同的,导致得到的全局投影矩阵对于某些类来说并不是最优的。提出的CCRC认为每个类都对应一个特征子空间,在这个特征子空间中最易于区分新样本是否属于这个类。为了找到这组投影矩阵,提出了MDA-CRC。MDA-CRC将计算投影矩阵的问题看作二分类问题,并且认为计算每个投影矩阵时都应该只考虑对应类的类内关系和类间关系。在求解投影矩阵时,采用了一种加速的迹差优化算法,以降低迭代时的时间复杂度。实验结果验证了多子空间学习策略的有效性。(4)提出了基于鲁棒边缘样本的协同表示分类方法(RMCRC)以及基于边缘协同表示的深度子空间学习算法(MEN)。针对现有的相关方法在训练集较大时难以有效地利用全部的训练样本从而导致分类能力受限的问题,提出了一个解决方案。受到协同表示机制的启发,发现鲁棒边缘样本在协同表示中发挥着重要的作用。因此,RMCRC使用鲁棒边缘样本集以代替原始训练集,在保留原始训练集的表达能力的同时有效地去除了样本间的冗余。而RMCRC的分类能力非常依赖于鲁棒边缘样本以及子空间假设,所以提出的MEN利用生成式模型生成虚拟的边缘样本,使得RMCRC在分类时使用的鲁棒边缘样本集更可靠。为了保证数据在特征子空间中满足子空间假设,使用了以Triple loss作为损失函数的嵌入网络,并且在构造三元组时采用了基于协同表示的三元组挖掘方法。在若干个数据集上的实验验证了所提方法的有效性。
其他文献
老年黄斑性病变(AMD)已经成为发展中国家或发达国家中老年人群不可逆转性失明的主要原因,约80%的严重视力损伤是由AMD引起的。视力障碍会导致自理能力变差、情绪抑郁等情况,严重影响到中老年人的生活质量。地图状萎缩(GA)和脉络膜新生血管(CNV)是晚期AMD最主要的两种表现形式。了解AMD的病理特征和症状有助于引导病人适时求医并防止进一步的视力下降。目前,频域光学相干断层成像(SD-OCT)和光学
学位
蛋白质负责执行生命活动中的大多数功能,是生命科学领域研究重点。蛋白质需要形成特定的结构来完成相应的功能。该结构一般通过形成蛋白质的氨基酸残基中原子的三维坐标表示。蛋白质的三维结构一般通过X-ray晶体衍射、核磁共振和冷冻电镜等湿实验手段测定。然而,相比蛋白质测序试验,通过湿实验测定结构往往耗时耗力,这就导致了蛋白质序列数据和蛋白质结构数据之间形成了巨大鸿沟。因此,通过计算手段从蛋白质序列预测蛋白质
学位
砷(As)和锑(Sb)属于同族变价(+3和+5)金属元素,均为优先控制污染物。常以分子形态存在的三价砷和锑,不仅毒性高于其五价形态,且更难被有效去除。此外,在锑矿、金矿、铜矿等矿区的水体和土壤中,存在砷锑共同污染的现象。因此,砷锑共存条件下砷锑去除行为的共性和差异,以及砷锑之间的竞争行为值得关注。铁、锰是地壳中含量最为丰富的两种变价过渡金属元素,铁、锰氧化物对砷、锑的地球化学循环起着重要的作用。基
学位
滇紫草乌饭是尤纳尼(Unani)和阿育吠陀(Ayurvedic)医学系统中的传统草药之一,常被当地人用于制作滋补剂和解热剂,还被用来治疗哮喘、高血压和咽喉疾病等。滇紫草乌饭的提取物具有抗菌、抗氧化、抗炎、抗肿瘤和保护免疫系统等活性,但是这些活性与其化学成分之间的关系却极少有被研究报道。被誉为“食用菌之王”的松茸是一种纯天然的名贵大型真菌,它不仅营养丰富可以作为菜品食用,同时还具有很高的药用价值,例
学位
低剖面端射天线在机载、车载、弹载等无线通信系统中具有广阔的应用前景,是近年来的研究热点。八木天线作为可以实现端射的一种天线形式,因其结构简单、生产成本低廉、且较易实现低剖面等优势,被广泛地应用。随着上述通信系统的发展,除了要求天线低剖面以外,也对其性能指标提出了更多的要求,如小型化、大偏角、多频段、高增益、波束可切换等。基于这个背景,从八木天线的基础理论出发,通过微带以及顶盘加载两种形式降低了八木
学位
随着现代通信技术的发展,通信系统对圆极化天线提出了更高的要求。然而,目前大部分圆极化天线进行相位调控的目的还仅限于获得理想的圆极化特性,逐渐跟不上现代通信系统日益增加的应用需求。本文基于相位调控技术研发了一系列性能优异的圆极化天线,满足了圆极化天线在不同通讯环境下的额外需求。本文的主要工作与创新点如下:1.基于相位调控的圆极化滤波天线:①提出了基于相位调控的圆极化滤波天线新方案。该方案通过相位调控
学位
锂-氧气电池因其超高的理论比容量而受到科研界的广泛关注,但其存在较为严重的充放电极化和较差的循环稳定性等问题,从而极大地限制其商业化进程.因此设计出有效的正极催化剂是解决锂-氧气电池面临的这些棘手问题的必要手段.通过对不同充电状态的废旧锂电池正极进行回收制得三种不同锂含量的多元金属氧化物LixMO(x=0.79,0.30,0.08;M=Ni/Co/Mn),并分别用作锂-氧气电池正极催化剂.系统研究
期刊
高光谱成像技术可以获取“连续波段”、“波段数众多”和“纳米级光谱分辨率”的图谱合一立体数据,其具有丰富的图谱信息且能以高分辨光谱分辨率区分出不同的物质类别,广泛应用于对地观测、地物覆盖分析、资源探测、环境监测和智慧农业等领域。高光谱遥感图像智能分析主要包括融合、解混、目标检测、特征提取与分类识别等关键技术。如何充分利用高光谱数据蕴含的丰富空间和光谱信息实现地物的高精度精细化分类是高光谱遥感图像处理
学位
随着电子商务的发展成熟以及大数据技术的普及应用,电商平台之间的价格竞争矛盾日益突出。为了将价格竞争引向服务竞争,平台逐步采用基于顾客行为的差异化服务(Behavior-based service discrimination,简称BBS)策略。然而,BBS究竟能否调节竞争平台之间的价格竞争矛盾,亦或者造成价格与服务的双重激烈对抗,相关理论研究存在不足。在此背景下,本文以博弈论为研究方法,以消费者效
学位
期刊