基于TL1的稳健降维算法研究及其应用

来源 :首都经济贸易大学 | 被引量 : 0次 | 上传用户:sevinlee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,人们获取大规模数据越来越容易。然而,数据采集的过程由于受到多个因素的影响,如硬件设备、环境因素、异常操作等,采集到的数据不可避免地含有一些噪声,这些噪声远离真实分布,利用经典的降维算法分析这类含有噪声的数据时,难以提取稳健特征。为了克服数据中含有噪声的问题,通过用各种对噪声不敏感的范数替换对噪声敏感的范数,多种稳健降维算法相继被提出,如基于L1范数的主成分分析和线性判别分析等。为了一般化L1范数,Lp范数((27)(27)20 p)被提出用来作为降维算法的度量。当(27)(27)10 p时,基于Lp范数的降维算法似乎比基于L1范数的算法更稳健。然而,Lp范数不满足Lipschitz连续性和有界性。此外,近几年随着多视角数据越来越丰富,基于多视角数据的降维算法本身就能在一定程度上提高稳健性。针对Lp范数存在的不足,本文提出了一种新的稳健度量,并将其应用于主成分分析和线性判别分析;针对多视角学习的优势,考虑到每个都视角的数据中都可能带有噪声的情形,提出了一种稳健多视角学习算法,进一步扩展了稳健降维算法。本文的主要工作可总结为以下四点:(1)通过阅读文献发现,TL1与Lp范数((27)(27)10 p)在一定程度上具有相似性,且TL1也有一个需要调节的正参数a。研究发现,通过调节a可以使得TL1尽可能与相应的Lp范数接近,说明a与p似乎具有一定的对应关系。同时,TL1具有Lipschitz连续性和有界性。然而,TL1通常被用作惩罚项而不是度量,于是,我们在本文中考虑将TL1作为度量。显然,TL1是一种稳健度量。因此我们提出了基于TL1的主成分分析(TL1PCA),它用TL1作为最大化散落程度的度量,不仅提高了模型的稳健性同时改善了目标函数的连续性。但是,TL1PCA的优化模型是非凸非光滑的,求解困难。为此,我们设计了一满足收敛的迭代算法并阐明了其收敛性。实验结果表明TL1PCA比基于L2范数、L1范数和Lp范数的PCA有更强的稳健性。(2)但TL1PCA只使用于向量型数据。当TL1PCA应用到矩阵型数据时(如图像数据),需要将矩阵型数据转化成向量型数据,从而导致空间结构信息的丢失。但经典的二维主成分分析采用F范数作为度量,对噪声敏感。针对这一问题,并结合TL1在一维主成分分析中的成功,本文提出了基于TL1的二维主成分分析(2DPCA-TL1),它本质上是TL1PCA在矩阵型数据上的推广。与经典的二维主成分分析相比,2DPCA-TL1稳健性得到了明显的提高;与TL1PCA相比,2DPCA-TL1不仅利用了数据中的空间结构信息,而且还提高了模型的性能和计算效率。我们在多个含噪声的真实图像数据集上进行了实验,结果表明2DPCA-TL1显著提高了二维主成分分析的性能,从而说明了该算法的有效性。(3)TL1PCA和2DPCA-TL1提高了模型的稳健性,但两者都是无监督算法,没有利用数据中的标签信息。针对这一问题,本文提出了基于TL1的一维线性判别分析(TL1LDA)和二维线性判别分析(2DLDA-TL1)。TL1LDA和2DLDA-TL1不仅提高了模型的稳健性,同时还利用了数据中的标签信息,因此它们理论上比TL1PCA和2DPCA-TL1具有更好的表现。与TL1LDA相比,2DLDA-TL1还利用了数据中的空间结构信息,因此2DLDA-TL1理论上比TL1LDA具有更好的表现。对于这两个算法的求解,我们结合对TL1PCA和2DPCA-TL1的研究,将TL1LDA和2DLDA-TL1融合到同一迭代算法进行求解。实验结果表明TL1LDA和2DLDA-TL1分别比TL1PCA和2DPCA-TL1的表现好,2DLDA-TL1比TL1LDA和2DPCA-TL1的表现都好,而实验结果也与理论分析相吻合。(4)上述工作针对单视角学习算法进行了深入研究。但随着数据采集技术的发展,多视角数据越来越丰富,而基于多视角数据的算法本身就能在一定程度上提高稳健性。考虑到多视角可能带有噪声的情形,而目前大多数多视角学习算法本质上采用L2范数或F范数作为度量,结合L1范数在稳健单视角算法中的成功运用,本文提出了一种基于L1范数的稳健多视角判别分析(L1-Mv DA-VC),并在L1-Mv DA-VC的基础上进一步提出了基于TL1的稳健多视角判别分析TL1-Mv DA-VC。除了利用了多视角数据,L1-Mv DA-VC和TL1-Mv DA-VC还利用了标签信息。为了进一步增强算法的稳健性,我们引入了视角的结构性信息。由于TL1-Mv DA-VC的优化问题求解困难,我们重点针对L1-Mv DA-VC的优化模型构建了一种简单有效的迭代算法,并证明了算法的单调性。实验结果表明了L1-Mv DA-VC的有效性。
其他文献
改革开放40年以来,我国经济社会发展取得了巨大成就,人民生活水平不断提升,各地区的经济发展速度也屡创新高。同时,由于各地区经济基础和资源禀赋存在差异,地区经济发展不平衡的问题仍然比较突出。为了推动区域经济的发展,我国成立了长三角、珠三角、环渤海经济圈以及成渝经济区。其中,京津冀地区作为环渤海经济圈中的核心区域,长期以来,面临着北京承载过多非首都功能,区域发展差距过大,产业结构失衡,环境污染严重等诸
学位
黄河流域生态保护和高质量发展战略的实施,不仅有助于缩小我国东中西部及南北差距,而且也有助于构建新发展格局,加快中国的现代化进程。当前,对于黄河流域的研究多集中于空间分异、区域经济协调发展、生态环境(保护)与经济增长(发展)等三个方面,关于产业集聚促进黄河流域经济增长的研究则较少。因此,在空间异质性视角下,明确黄河流域产业集聚与经济增长的内涵,对产业集聚及区域经济发展的事实与特征进行测度,分析机理并
学位
随着市场化进程的加速,商业保险在推动经济发展,维护社会稳定方面扮演着越来越重要的角色。保险具有经济补偿、资金融通和社会管理的功能,是市场经济条件下风险管理的基本手段。一方面,商业保险业作为社会保障体系的重要组成部分,相比于社会保险更能满足人民群众多层次的保障需求,在帮助家庭降低未来不确定性、及时恢复生产生活秩序、维持社会稳定的过程中发挥了重要作用。另一方面,商业保险作为金融市场重要的融资工具,其发
学位
资源是设计财政政策和影响长期增长的一个基本要素,因为它们提供了足够的政府收入,增加了政府支出,影响了公共借贷。因此,了解财政变量对资源暴利的反应对于制定和形成经济政策至关重要,这些政策能够捕捉和管理这些不稳定的收入,促进长期和可持续的经济增长和发展。本文通过分析资源租金的财政效应,对资源与经济增长的关系进行了实证分析。我们的具体目标是确定非资源税收入、政府支出和公共借贷如何对增加的资源收入作出反应
学位
城市区域是指在一定的空间范围内由众多城市通过紧密的经济与交通联系形成的具有特定形态、结构和功能的一体化空间组织。本文聚焦于城市区域空间演化的过程与机制,着重探讨中心城市、都市圈和城市群之间的互动关系,从空间结构理论、演化阶段理论和演化动力理论等三个方面构建城市区域空间演变的理论框架与一般演化模型,提出形态与过程假说、门槛效应假说和融合机制假说,然后以长三角城市区域、珠三角城市区域和京津冀城市区域等
学位
以单宁酸为稳定剂合成单宁酸功能化铜簇(TA-CuCNs)。,由于TA-CuCNs在不同pH条件下发生质子化和去质子化,TA-CuCNs呈现激发依赖的荧光发射[1]。考察TA-CuCNs对四种革兰氏菌株(革兰氏阳性菌:金黄色葡萄球菌、枯草芽孢杆菌,革兰氏阴性菌:大肠杆菌、铜绿假单胞菌)的抑菌活性。结果表明TA-CuCNs的单宁酸功能基团和铜簇单元协同抑制革兰氏阳性菌的生长[2]。30μg mL-1
会议
现代区域发展必将是经济实体之间相互作用与博弈的结果,而区域发展不平衡问题在世界各国普遍存在,这也是中国经济发展的客观现象之一。自新中国成立以来,中国区域发展贯穿了一条由低水平均衡到非均衡发展、由非均衡到协调发展、再到强调高质量发展转变的主线,呈现出明显的阶段特性。受全球产业分工格局深度调整、国内外环境日趋复杂、地区热点时有起伏、不稳定性和不确定性明显增加等多重因素的影响,中国区域发展呈现更加复杂的
学位
外商直接投资(FDI)一直是整个非洲区域,特别是撒哈拉以南非洲(SSA)国家的主要发展动力之一。外国直接投资通过投资的跨国转移,实现了对东道国的外溢作用,促进了东道国生产效率和治污效率的提高。然而,在外商直接投资大量流入SSA国家的同时,该区域的二氧化碳(CO2)排放水平也在不断上升,原因就在于东道国对外商直接投资的环境监管不力。在发展中国家,地方政府倾向于以放松环境规制和监管力度,以吸引更多的外
学位
出口韧性在贸易高质量发展过程中扮演重要角色。文章通过真实出口贸易变化与预期出口贸易变化的比较测算2020年1月~2021年12月出口韧性,采用Mann-Kendall趋势检验、Kernel密度估计、标准差椭圆探究其时空特征,利用地理探测器分析时空分异的驱动因素。结果显示:自新冠疫情蔓延以来,中国经济基本盘承受住了超预期冲击因素的影响,出口贸易总体实现稳定增长,出口表现较强韧性。相比于出口恢复力,出
期刊
中国经济经过30多年的高速增长后,支持其高速增长的要素得到了充分释放,经济增长率逐渐下降,经济结构失衡、创新驱动不足以及经济质效偏低等问题愈发凸显,中国经济进入了转变发展方式、优化经济结构和转换增长动力的重大关口。基于中国当前所处关口以及社会主要矛盾的转变,站在新的历史方位上,以供给侧结构性改革为主线,以促进产业转型升级为重要抓手,推动经济高质量发展成为当前和今后一段时期确定发展思路、制定经济政策
学位