多视图学习中的特征提取方法研究及其应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:longyilang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据感知技术的发展,获取同一个目标对象描述的方式越来越多,每种方式获取的特征,常称为一个视图。目前多视图数据已广泛存在于生物科学、社交网络、图像识别、汽车工业和机器人工业等领域。为了更高效地利用多视图数据蕴含的丰富互补信息,机器学习领域发展出了相应的多视图学习方式。现有工作已表明,将多个视图的数据按特定的策略融合成单一数据,进而用于后续分类或回归等任务,具有更好的学习效果。本文围绕多视图数据的特征提取开展研究,旨在达到降维和信息融合的目的。重点从典型相关分析(Canonical Correlation Analysis,CCA)入手,通过分析CCA及其变异算法的优缺点,作为基础,开展相关研究。目前大多数多视图降维算法广义上可归类为子空间学习。而子空间学习的基本原理可视为隐变量生成模型。与之对应的是投影模型,因此CCA属于后者。本文除了改进CCA外,也将结合投影模型提出相关特征提取和信息融合的新方法。具体工作如下:1.CCA自1936年提出以来,已广泛地应用于多视图的特征提取和信息融合。当用于多视图分类学习时,CCA常以无监督方式提取特征供后续分类学习所用。正是因其没利用给定的判别信息,所提取的特征通常缺乏显著的判别性。为此,各种利用判别信息的CCA及其变体被相继提出。而相应的目标函数往往非凸,在一定程度上影响了问题求解及后续的分类效果。据我们所知,目前尚无凸判别型CCA模型被提出。本文受几何平均度量学习(GMML)方法启发,提出了一个凸判别型的CCA,称为凸判别相关分析(CDCA)。CDCA将学习两个视图的投影矩阵转化为一个测地线凸的度量学习问题,从而在获得一个全局的闭合解的同时,直接获得判别性融合特征,改善了分类性能。2.多视图学习通常涉及两个重要原则:即一致性和互补性。一致性来源于不同视图的共享信息,而互补性来源于每个视图的独有信息。大多数多视图降维方法仅关注其中一种,得到的低维表示可能存在信息冗余或信息不全等问题。本文提出了一个新的多视图特征提取框架,称为多重结构化稀疏投影(MSSP),能够同时提取共享的和独有的信息。MSSP由两部分组成:一是所有视图投影的组合特征判别项,对此选择线性判别分析(LDA)和度量学习实现。二是对联合投影矩阵的多重结构化稀疏的正则化项,以同时保证一致性和互补性。组合投影矩阵由所有视图的投影矩阵组成,每个视图的投影矩阵列组稀疏,如此建立了多重结构化的稀疏表示,从而自适应的提取共享信息和独有信息。
其他文献
随着高速铁路的快速发展,对铁路轨道的平顺要求越来越高。波磨是钢轨的一种纵向不平顺现象。国内对钢轨波磨的检测主要依靠手工检测,费时费力,常用的如波磨仪等接触式检测设备随着使用时间的增加,其检测精度及可靠性会大大降低,无法有效而准确的检测出钢轨波磨。近年来,随着信息技术的发展,计算机视觉和三维结构光技术得以在工业应用上不断创新,将计算机视觉和三维结构光技术应用于铁路检测领域,可以快速准确地得到检测结果
民诺莫司汀作为新一代的分子靶向性抗肿瘤药,对慢性淋巴细胞性白血病、非何杰金淋巴瘤、多发性骨髓瘤、非小细胞肺癌、乳腺癌等具有明显的生物活性,是一极具研发潜力的新药,
武夷山国家公园,是我国首批开展国家公园体制试点之一,它的建设对于保护我国唯一一个人文与自然双世遗地、世界人与生物圈保护区,具有十分重要的意义。2016年,国家发改委批复《武夷山国家公园体制试点区试点实施方案》,明确国家公园范围内限制工业开发,避免工业发展带来的污染。今后生态环境保护的难点重点越来越集中于农户生产生活行为,而“庄稼一枝花,全靠肥当家”,肥料作为农户生产的关键要素,施用是否科学,直接关
金属离子印迹作为分子印迹技术的重要发展方向之一,以其专一识别性、抗干扰性、抗外界恶劣条件等优点,在痕量重金属离子分析检测领域得到了广泛关注。本文采用表面印迹方法,
宏观上看,各地的三级医院进一步加大对患者满意度的关注度是势在必行之举。就秦皇岛市而言,以R医院为代表的本地医院面临着巨大的外部竞争压力,提高患者满意度以满足本地及周边群众就医就诊需求,已成为该医院的当务之急。因而,通过系统分析找出R医院自身在医疗服务中的差距和不足,思考其对满意度造成的影响,既是进一步提高质量落实国家相关政策文件要求的需要,也是提升R医院自身在本地,甚至是京津冀地区医疗服务的行业竞
目的本研究利用CRISPR/Cas9技术,进行基因编辑ADAM9序列,抑制其基因表达,旨在研究ADAM9在小鼠酒精性肝纤维化中的作用及调控的分子机制研究。方法(一)ADAM9-sg RNA3转染大鼠肝星状细胞HSC-T6:将本实验室前期筛选的有活性的ADAM9-sg RNA3质粒转染大鼠肝星状细胞HSC-T6,经过嘌呤酶素筛选,提取转染成功的细胞DNA进行PCR扩增、电泳、胶回收,然后进行测序,以
近年来,随着移动互联网的高速发展,无线数据业务流量呈指数式爆炸增长,人们对于更高质量的通信服务诉求也变得愈发强烈。大规模MIMO(Multi-Input Multi-Output,MIMO)作为第五
肿瘤的发生是基因突变和表观遗传修饰改变共同作用,逐渐积累的结果,且近来研究认为表观遗传修饰改变在肿瘤发生过程中起的作用更大。并且许多研究表明,癌症其实也是一种代谢异常疾病,脂代谢的异常是其一个重要的原因。针对表观遗传调控的乳腺癌代谢重编程的机制还处于发展阶段,对于探究其中的关系对临床治疗乳腺癌具有重要意义。近几年,随着对乳腺癌不同类型的基因表型研究,发现表观遗传修饰对乳腺癌的发生转移发展与有着密切
随着新技术的发展,对于微传感器,微执行器和微系统新的器件结构和新的应用,也被称微机电系统(MEMS),出现了对于计算机辅助工程与设计系统不断增长的需求。刻蚀工艺仿真作为ME
输电线路覆冰引发的冰灾事故是常见的自然灾害,严重危害了电力系统的安全稳定运行和供电可靠性,使社会经济遭受巨大损失,同时给人民生活带来严重影响。近十年来,由于冬季冰雪气候日益频繁,输电线路覆冰事故仍然频发。交流短路和直流短路融冰法是当前在实践中应用最广泛的融冰技术,但其都存在各自的不足,致使其应用存在局限性。本文研究一种典型的新型融冰方法一高频激励融冰方法,此方法具有融冰效率高,发热均匀,融冰时间短