基于流形学习的降维技术及其应用研究

被引量 : 0次 | 上传用户:dfcy007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化技术的飞速发展和广泛应用,我们接触到的将会是异常复杂的海量信息,它们不仅具有较高的维数而且还是非结构化的。此外,这些复杂的维数较高的数据很难被人们进行直观地理解,而且也给当前的机器学习和数据挖掘算法带来了新的挑战,使它们无法被这些算法有效地处理,还严重影响着算法的执行效率和准确率。降维方法已经是处理这些具有复杂结构的高维数据的一个有力工具和手段,在模式识别等众多领域起着至关重要的作用。众所周知,数据降维技术经过几十年的发展,现在已经取得了长足的进步和可喜的成绩。但是仍然存在一些值得研究工作者继续深究和探讨的问题,比如在线性和非线性降维领域存在的一些具有挑战性和艰巨性的问题。在2000年的时候,以Science上发表的三篇文章为切入点,使流形学习算法成为一个研究热点。本文从广义流形学习算法的两大分类,即线性流形和非线性流形降维算法出发,介绍了这两个大类中的一些常用的典型流形学习算法,并给出了它们各自的算法思想和具体实现步骤,以及算法本身的优缺点,为后面进行算法的具体研究和改进开拓了思路并提供了理论基础。本文的研究重点是:(一)研究了一种基于黎曼流形的测地距离逼近的降维算法(TRIMAP),详细阐述了改进的TRIMAP,给出了新的图上距离的定义,这个创新点考虑到了不同类的大小以及各自的疏密程度对距离计算的影响,后又给出了算法详细地实现步骤,并将改进后的算法在ORL人脸数据集中进行了大量的实验,经过实验的对比可知,改进是合理而且有效地;(二)在前面介绍的TRIMAP算法的基础上,对该算法的误差函数进行了深入的思考和研究,TRIMAP算法采用近邻点对的原始距离与投影后距离之间的误差和作为参考标准,但是这种误差函数并没有考虑到图上距离与投影距离的对比关系,即这两个距离之间是一种什么比例的时候,可以找到最佳投影。本文中又针对这个问题提出了一个创新点,就是加一个对比参数,以充分体现两者的关系,为找到最佳投影提供便利。对算法使用MATLAB语言设计相关的程序,并在标准图像库中进行验证。大量的实验结果表明,本文提出的方法是有效的、可行的。
其他文献
中小企业在推动国民经济增长、缓解就业压力、优化经济结构、增加对外贸易等方面扮演越来越重要的角色,推动中小企业的发展已然成为我国当前一项刻不容缓的战略任务。然而由
近年来,动漫产业发展势头迅猛,前景诱人。在很多国家如美国、英国、日本、韩国,动漫产业已经成为主要的经济产业。动漫产业已经从一个鲜为人知的动画产品成为新经济形式下家
简述砚山县发展粮食产业的资源优势,取得的成效,采取的增粮措施,分析存在问题,提出各级党委要高度重视粮食生产,认真落实各项工作措施;加强基础设施建设,提升粮食产业化生产和经营水
针对全极化SAR图像在监督分类中存在的人工标注样本费时费力以及多种极化特征未能综合利用等问题,提出一种基于协同训练与集成学习的极化SAR图像半监督分类方法。该方法以支
《知不足斋丛书》是清代私家丛书中收书种类多、底本选择精、校勘质量高的丛书之一。其底本选择的标准主要有:流传既久的钞本;时贤稿本;旧板散亡的刻本;名家校本。
随着经济的发展, 企业文化作为软实力已经成为提升企业核心竞争力的关键因素, 而进行企业文化建设和不断对其优化的一项重要内容就是企业文化的测评.以核能发电企业为案例,
采用量子粒子群求解声压和质点振速组成的非线性相关方程组,实现多目标声源方位的估计.为提高精度,应用最小二乘法对测量结果进行拟合并建立预测模型,通过卡尔曼滤波对方位轨
在美国次贷危机逐步波及实体经济的背景下,企业信用环境日趋恶化,各个企业对于信用风险控制的意识和重视程度也逐渐加强。因此,借助先进的信用风险评估技术对日常交易的客户
水下文化遗产具有重要的历史和考古价值。而水下文物主动调查方式面临着诸多挑战,我国的水下考古区域调查应引起水下考古工作者的关注,以促进水下考古学学科的发展。
随着大功率LED的应用越来越广泛,LED热阻的测试与评价非常重要。本文基于动态电学法,研制成功单通道大功率LED热阻测试仪。通过实验研究,证明所研制的热阻测试仪具有很好的重