核典型相关分析中某些问题的研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:l1otus
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
典型相关分析(CCA)的目标是提取两组随机变量之间的线性相关关系,其基本思想是最大化两个变量到低维子空间中线性投影的相关系数.然而CCA存在一定的局限性,无法提取变量间的非线性关系.核典型相关分析(KCCA)是CCA的非线性推广,现有研究大都聚焦于中心化KCCA,即数据需要在特征空间中进行中心化.在许多应用中,例如生物信息学中的基因表达、计算机视觉中的人脸识别,中心化会导致部分有趣特征信息的丢失.因此本文提出非中心化KCCA,并探讨中心化KCCA与非中心化KCCA之间的关系,实验结果表明其正则化相关系数总是呈交错关系.KCCA的解可以通过奇异值分解(SVD)获得.在集中式系统中,SVD的计算相当简单.当矩阵分布在多台设备网络上时,复杂性多归因于数据的实时到达.对于数据实时更新的问题,矩阵可看作增加了秩一扰动.本文提出增量KCCA,在求解过程中对秩一扰动矩阵进行SVD更新,实验结果表明增量KCCA得到的奇异值以及核典型相关得到了很好的近似.KCCA求解过程中涉及特征系统,而特征系统内存需求大以及计算复杂度高导致我们无法求解大规模问题.因此学者们为KCCA提出了各种近似方法,其中大多数是基于核矩阵的低秩近似.本文主要讨论基于Nystr(?)m采样KCCA(NKCCA)算法,通过数值实验发现随着变量数增加,NKCCA的精度会降低.此外在MNIST手写数据集上进行数值实验,与使用随机傅里叶特征近似的KCCA(RKCCA)结果进行对比,发现NKCCA近似精度总是高于RKCCA.当近似维数远远小于观测点数量时,NKCCA仍然可以保持较高的近似精度.
其他文献
本文以对比分析理论、第二语言习得理论作为指导,采取学科内两种语言交叉研究的方式,对国际中文敬语教学进行系统地梳理总结。通过对比分析以及问卷调查的方式,分析以韩语为母语的学生学习汉语敬语时所存在的主要问题及原因,并结合调查结果及具体教学实践经验提出相关教学建议,以期能在一定程度上为对韩汉语敬语教学提供一些参考。全文主要分为五个部分。第一部分是绪论,主要对文章的研究内容、研究方法、研究综述等进行了概述
学位
《六十种曲》作为“现存明代汇刻传奇最丰富而重要之总集”(傅惜华语),兼有文人案头本与舞台演出本的双重性质,具有很高的研究价值。道具是戏曲创作和戏曲演出中的重要组成部分,对戏曲研究具有重要意义。故对《六十种曲》道具进行研究是可行并具有价值的,既能为《六十种曲》研究增添新的内容,又能将戏曲的文本研究与舞台研究紧密联系起来,还有助于当代剧作家借鉴前人的道具设计进行戏曲创作。本文以“《六十种曲》的道具研究
学位
作为计算机视觉领域的研究热点,图像生成任务具有巨大的理论研究价值与实际应用潜力,其中,场景图像生成由于需要同时考虑多个物体以及物体间复杂的交互关系,更具挑战性。然而,当前大多数方法均从复杂的文本描述、场景图、场景布局中生成场景图像,往往需要用户或是详细阐述物体属性及关系,或是构造专业性较强的结构场景图,或是固定物体间的布局关系,因而用户友好性不足。为了给用户提供便捷化的场景图像生成方式,本文基于知
学位
单幅图像去雨在计算机视觉领域中是一项具有挑战性的任务,且在恶劣有雨环境中获得的图像会影响后续高级视觉任务的性能,因此提出一个高质量的模型来解决图像去雨问题至关重要。本文首先提出一个新颖的密集特征金字塔网格网络(DFPGNet)来解决单幅图像去雨问题。不同于以往的特征金字塔方法,本文提出的密集特征金字塔网格(DFPG)模块采用多路径和多尺度方法,使得DFPG能够融合五个来自不同路径和不同尺度的特征并
学位
当今世界,随着科技的发展,数据量爆炸性增长。一方面是生活产生的数据增加,一方面是数据处理是会使数据维度增加。比如,在购物系统中,若是商品种类中有一万种不同的物品,经过独热编码后将变成一万多种特征。大量的数据,大量的特征一方面,使得大规模模型的算法有了更好的精度,神经网络机器学习等依托于大量的数据在处理各种问题中展现了其优越性,但是另一方面,也对算法有了更多的要求。过大的数据量使得模型训练变得及其缓
学位
本文从对比语言学的观点出发,探讨了中韩数量结构中的结合方式、意义对应关系、感情色彩等的共同点和差异点。本文以汉韩名量词和动量词为研究对象,运用对比语言学、文献研究法以及归纳分析法等理论、方法探究汉韩量词数量结构的特点。本文以21世纪世宗语料库(2011)、《韩中辞典》、《汉语量词大词典》、CCL语料库为语料对汉韩量词进行搜集、分类、对比研究。由于韩国语中存在大量汉字词,两种语言的使用存在不少共同点
学位
夜间车辆检测是智能交通领域的一项重要任务。夜间光线的不足会导致交通事故发生的概率大幅增加,也使得交通部门难以对实时交通状况进行准确监控,因而夜间车辆检测任务的研究,对于未来交通系统的先进化发展具有重要推动意义。现有的夜间检测存在夜间数据匮乏与算法针对性不足等问题。具体而言,良好的训练数据能够为算法的优越性能提供保障。然而,现有的夜间车辆数据集的数据大多光照良好,且场景单一,几乎不包含极暗情况下的样
学位
新冠肺炎爆发初期,多个国家采取非药物干预措施控制疫情传播。在这些非药物干预措施中,广泛采用隔离措施,并通过居家和就地隔离命令执行。了解隔离措施的有效性可以为正在进行的COVID-19大流行和未来疾病爆发期间的决策和控制规划提供信息。本文主要回顾了新冠肺炎疫情爆发的早期阶段,并对隔离措施的实施进行了一系列预测性研究。传染病数学建模是一种工具,可以研究疾病传播的机制、预测传染病的进展情况以及评估控制流
学位
Moment in Peking是林语堂于1938年用英文创作的中国小说,反映了从清末到抗日战争的中国历史现实,涉及到时代变迁的方方面面。小说展现的宗教哲学、风俗习惯、文学艺术等风貌弘扬了中国文化的博大精深;一些重要历史事件和历史人物的描绘在弘扬中国文化的同时向海外宣传了中国社会的动荡和抗日战争的残酷。张振玉是翻译林语堂作品数量最多,影响最广的译者之一,他的《京华烟云》不仅受到读者和出版社的喜爱,
学位
运动事件与人类感知密切相关,对于运动事件的表达与习得研究一直是国内外学者关注的重要话题。其中的研究多数以母语者为主要研究对象,探究不同语言的类型归属问题、对比语言表达的差异性以及语言类型对于语言使用者思维方式的影响。在二语研究方面,尽管近些年有关二语学习者运动事件表达的研究逐渐丰富,但关于运动事件中的方向性研究备受忽略。迄今为止,关于中国学习者如何加工运动事件中的方向性尚无明确结论。汉语和英语在方
学位