基于机器学习的成分数据补全研究

来源 :数学学习与研究 | 被引量 : 0次 | 上传用户：zhuzubiao

【摘要】

：

【作者】

：

高雪云

【出处】

：

数学学习与研究

【发表日期】

：

2019年7期

【关键词】

：

估计量估计值重构偏差数据量机器数据方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　一、引言
　　給缺失数据填补一个合理的估计值，可以减小由数据缺失而导致的估计量偏差，结合一定的方法，为数据的缺失值寻找一个或多个尽可能相似的值进行填补，得到完整的数据，由于填补值毕竟是“假信息”，因此，利用不同的信息进行填补，所要追求的只是确定填补方法的有效性和合理性，使估计的填补值尽可能地接近原始的缺失数据值.
　　二、基于核空间非线性距离敏感重构的主动学习
　　在大数据时代，机器学习问题中可能涉及的数据量规模是非常庞大的，完全标注所有数据是不现实，也是不必要的.在这一部分，我们将提出一种有效的主动学习算法.该算法可以选择出那些最重要的、最有信息含量的数据点进行标注，使得数据标注更加有效.然后，我们进一步推广了胡尧等人的工作，提出了一种基于核空间非线性距离敏感重构的主动学习算法，能够自动学习数据分布的非线性关系，通过非线性重构进一步扩大标注点的表达能力，从而减少所需要标注的数据点的规模[1].
　　（一）主成分分析（PCA）原理及其应用
　　在实际问题研究中，多变量问题是经常会遇到的.变量太多，无疑会增加分析问题的难度与复杂性，而且在许多实际问题中，多个变量之间是具有一定的相关关系的.
　　为了解决这些问题，最简单和最直接的解决方案是削减变量的个数，但这必然又会导致信息丢失和信息不完整等问题的产生.为此，人们希望探索一种更为有效的解决方法，它既能大大减少参与数据建模的变量个数，同时也不会造成信息的大量丢失.主成分分析正式这样一种能够有效降低变量维数，并已得到广泛应用的分析方法.
　　（二）奇异值分解（SVD）与主成分分析（PCA）的关系
　　PCA的全部工作简单点说，就是对原始的空间中顺序地找一组相互正交的坐标轴，第一个轴是使得方差最大的，第二个轴是在与第一个轴正交的平面中使得方差最大的，第三个轴是在与第1、2个轴正交的平面中方差最大的，这样假设在N维空间中，我们可以找到N个这样的坐标轴，我们取前r个去近似这个空间，这样就从一个N维的空间压缩到r维的空间了，但是我们选择的r个坐标轴能够使得空间的压缩使得数据的损失最小.
　　还是假设我们矩阵每一行表示一个样本，每一列表示一个feature，用矩阵的语言来表示，将一个m×n的矩阵A的进行坐标轴的变化，P就是一个变换的矩阵从一个N维的空间变换到另一个N维的空间，在空间中就会进行一些类似于旋转、拉伸的变化.
　　Am×nPn×n=A～m×n.
　　而将一个m×n的矩阵A变换成一个m×r的矩阵[2]，这样就会使得本来有n个feature的，变成了有r个feature了（r

其他文献

我国财政政策与货币政策的相机抉择及其经验

财政政策与货币政策发挥着不同的作用，通常根据宏观经济形势的变化，实施相机抉择的使用，形成不同的搭配模式，以便达到更好的效果。为了有效地发挥政策的作用，宏观经济政策需要具有

期刊

财政政策货币政策平衡结构

嬗变中建构——中国共产党执政有效性的历史考察

有效性作为政党永恒追求的主题,是由政党执政内在逻辑规律决定的。回顾中国共产党执政有效性的历史进程,可以看出,党正是在遵循政党执政一般规律的同时,不断探索具有自身特色

期刊

中国共产党执政有效性

多功能特质和开放性结构--关于广播电视报内容改革的思考

随着我国市场经济体制的不断完善,传媒间竞争日趋激烈,作为广播电视延伸和派生物的广播电视报同样面临兴与衰的的重大抉择.基于此,本文从广播电视报所具备的多功能特质入手,

期刊

广播电视报改革多功能特质开放性结构

浅谈中学语文古代诗歌的教学

中学语文的古诗教学,不仅要让学生识得古字,懂得其意,更要借助联想和想象的方法让学生理解诗意,感悟诗韵,真正进入古诗的美妙世界.

期刊

古诗教学中学语文教学阅读教学联想力

谈机械制图教学中空间思维的培养

[摘要]机械制图是机械专业学生必须掌握的一门专业基础课，其主要内容是平面与立体之间的转换，作为初者，可能习惯在平面上思考问题，乍学起来会不适应，感到抽象，难学。要解决二维平面与三维空间这一对矛盾，学好机械制图课，就必须建立起空间思维的思维方式。　　[关键词]机械制图思维方式培养　　　　机械制图是机械专业学生必须掌握的一门专业基础课，其主要内容是平面与立体之间的转换，作为初者，可能习惯在平面

期刊

机械制图思维方式培养the machine graphics mode of thinking development

奥瑞姆自理模式在肺癌根治术护理中的应用

目的观察分析在肺癌根治术患者临床护理中应用奥瑞姆自理模式的方法及效果。方法 50例肺癌根治术患者,随机分为干预组与对照组,各25例,对照组给予传统护理,干预组给予奥瑞姆

期刊

奥瑞姆自理模式肺癌根治术护理应用

锐意进取为推进我国成人继续教育的改革创新做贡献——在中国成协2014年工作会议上的讲话

一、2013年中国成协工作的简要回顾2013年是我们全面贯彻党的十八大精神,教育改革发展取得重要成效的一年,也是中国成协的换届之年。一年来,中国成协在第五届理事会的领导下,

期刊

积极进取成人继续教育中国改革创新第五届理事会教育改革政府部门研究成果

贯彻十七届四中全会精神加强和改进机关党建工作

机关党建是党的建设的重要组成部分。贯彻十七届四中全会精神,加强和改进机关党建工作,我们必须不断创新机关党建工作理念,注重建设学习型机关,积极发展党内民主,加强机关自

期刊

十七届四中全会机关党建

几何分布数学期望的两种简便计算方法

几何分布数学期望的常规计算方法涉及级数求和与逐项求导等方法,技巧性强,计算烦琐.本文利用一个引理和几何分布的无记忆性,给出了两个简便的计算方法.

期刊

几何分布数学期望无记忆性

普外科急腹症的临床观察与护理体会分析

目的分析研究普外科急腹症的临床观察以及护理体会。方法选取患有外科急腹症的患者78例,对78例患者相关临床资料给予回顾性分析。结果 78例患者通过及时、有效的治疗以及护

期刊

护理体会临床观察普外科急腹症Nursing experience Clinical observation General surgery acute

基于机器学习的成分数据补全研究

与本文相关的学术论文